eBooks

Interaktionsarchitektur, Sozialtopographie und Interaktionsraum

2016
978-3-8233-9070-1
Gunter Narr Verlag 
Heiko Hausendorf
Reinhold Schmitt
Wolfgang Kesselheim

Interaktion ist ohne konkreten Raum- und Ortsbezug kaum denkbar. In der institutionellen Kommunikation kommt diese Raumbindung besonders prägnant zum Ausdruck, weil sich hier charakteristische Räume ausdifferenziert haben, in denen die Kommunikation ihr soziales Zuhause gefunden hat: Gottesdienst im Kirchenraum, Unterricht im Klassenzimmer, Ausstellungen im Museum oder die Produktion von Radiosendungen im Aufnahmestudio. Dieser Zusammenhang von Interaktion und gebautem Raum steht im Zentrum des Sammelbandes: Wie wird durch und mit Architektur Interaktion möglich und erwartbar gemacht (Interaktionsarchitektur)? Wie bringen die Beteiligten in ihrer Nutzung der Architektur ihr Alltagswissen über soziale Räume zum Ausdruck (Sozialtopographie)? Wie fließen diese Ressourcen in die Herstellung eines je konkreten Interaktionsraumes ein? Mit diesen Fragen ist ein vielversprechendes interdisziplinäres Forschungsfeld aufgespannt, das in empirischer, theoretischer und methodologischer Hinsicht erschlossen wird: mit Fallanalysen zu den genannten Räumen, mit Beiträgen zur Theorie und Methodologie und mit interdisziplinären Experten-Kommentaren.

Heiko Hausendorf / Reinhold Schmitt Wolfgang Kesselheim (Hrsg.) Interaktionsarchitektur, Sozialtopographie und Interaktionsraum STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE STUDIEN ZUR DEUTSCHEN SPRACHE 72 Herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Band 72 STUDIEN ZUR DEUTSCHEN SPRACHE FORSCHUNGEN DES INSTITUTS FÜR DEUTSCHE SPRACHE Heiko Hausendorf / Reinhold Schmitt Wolfgang Kesselheim (Hrsg.) Interaktionsarchitektur, Sozialtopographie und Interaktionsraum Redaktion: Mechthild Elstermann und Norbert Volz Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. © 2016 · Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Gedruckt auf säurefreiem und alterungsbeständigem Werkdruckpapier. Internet: www.narr.de E-Mail: info@narr.de Satz und Layout: Sonja Tröster Druck und Bindung: Laupp & Göbel, Gomaringen Printed in Germany ISSN 0949-409X ISBN 978-3-8233-8070-2 INHALT Vorwort ..................................................................................................................... 7 Reinhold Schmitt/ Heiko Hausendorf Sprache und Raum: Eine neue Forschungsperspektive, ihre Ursprünge und ihr aktueller Entwicklungsstand ................................................................... 9 I. INTERAKTION UND ARCHITEKTUR: THEORETISCHE KONZEPTE Heiko Hausendorf/ Reinhold Schmitt Interaktionsarchitektur und Sozialtopografie: Basiskonzepte einer interaktionistischen Raumanalyse....................................................................... 27 Heiko Hausendorf/ Wolfgang Kesselheim Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur. Text- und Interaktionslinguistische Überlegungen zur Raumanalyse .................... 55 II. VIDEOAUFZEICHNUNGEN ALS ANALYSEDOKUMENTE: MÖGLICHKEITEN UND PERSPEKTIVEN Wolfgang Kesselheim Videobasierte Raumforschung als interdisziplinäres Forschungsfeld: Ein exemplarischer Einblick in unterschiedliche methodische Zugänge ........................................................................................... 89 Lorenza Mondada Zwischen Text und Bild: Multimodale Transkription .................................... 111 Heiko Hausendorf/ Reinhold Schmitt Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven ................................................................................................. 161 Reinhold Schmitt Der „Frame-Comic“ als Dokument multimodaler Interaktionsanalysen............................................................................................ 189 Inhalt 6 III. FALLANALYSEN ZUR REKONSTRUKTION VON INTERAKTIONS - ARCHITEKTUR, SOZIALTOPOGRAFIE UND INTERAKTIONSRAUM Heiko Hausendorf/ Reinhold Schmitt Vier Stühle vor dem Altar. Interaktionsarchitektur, Sozialtopografie und Interaktionsraum in einem „Alpha“-Gottesdienst ................................. 227 Ulrich Dausendschön-Gay/ Reinhold Schmitt Warten im Klassenraum als institutionelle Praktik ........................................ 263 Eva-Maria Putzier Am Experimentiertisch: Position und Positionierung im Chemieunterricht ........................................................................................... 303 Wolfgang Kesselheim Schauraum/ Spielraum: Eine standbildbasierte Fallstudie zur Rolle des gebauten Raums in der Interaktion.................................................. 335 Lorenza Mondada/ Florence Oloff Im Radiostudio arbeiten: Vielgestaltige Handlungen in einem flexibel architekturierten Raum......................................................... 361 IV. INTERDISZIPLINÄRE KOMMENTARE Lars Frers Zwischen Normalität und Differenz - Wahrnehmungshandeln in der Standbildanalyse....................................................................................... 407 Michael Guggenheim Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien ................................................................................................ 419 Achim Hahn Interaktionsarchitektur aus der Perspektive der phänomenologisch-hermeneutischen Architekturtheorie ............................. 433 VORWORT Der vorliegende Band stellt das vorläufige Endresultat einer langjährigen Kooperation dar, die mindestens bis zu den ersten „Arbeitstreffen zu Fragen multimodaler Kommunikation“ am Institut für Deutsche Sprache in Mannheim (IDS) im Jahre 2003 zurückreicht und in den letzten Jahren ihren neuesten Ausdruck in einer Reihe von Workshops des Universitären Forschungsschwerpunktes Sprache und Raum (SpuR) der Universität Zürich gefunden hat. Aus diesen Workshops ist der vorliegende Band in seiner aktuellen Form hervorgegangen. Sie sollen deshalb kurz skizziert werden. Auf den größeren Rahmen der Entwicklung von „Multimodalität“ hin zu „Interaktionsarchitektur und Sozialtopografie“ gehen wir gesondert ein (siehe dazu den unmittelbar anschließenden Beitrag von Schmitt und Hausendorf). Den Auftakt zur Erforschung der Rolle der Architektur für die Interaktion stellte ein vom 25.-27. März 2013 an der Universität Zürich organisierter Workshop dar, auf dem wir erstmals auf Raum und Räumlichkeit nicht nur als Ressource der Interaktion fokussiert haben, sondern auch eigenständig im Hinblick auf die Erfassung der Natur dieser Ressource. Es hat sich schnell herausgestellt, dass dabei kein Weg vorbeiführt an Architektur, breit verstanden als gebauter, gestalteter und ausgestatteter (‘möblierter’) Raum. Das „natürliche Zuhause von Sprache“ (the natural home of speech), das Goffman (1964, S. 135) beschworen hat, ist eben in sehr vielen Fällen auch und gerade eine architektonisch irgendwie vorbereitete und durch und durch strukturierte Umgebung der Interaktion. Besonders auffällig wird das im Fall institutionalisierter Kommunikation, weil die Interaktion dabei nicht zufällig in Räumen („Gebäuden“, „Sälen“ und „Zimmern“) stattfindet, die als gebaute Manifestation der fraglichen Organisation verstanden werden können („Klassenzimmer“, „Hörsaal“, „Kirche“, „Museum“, ...). Institutionalisierte Kommunikation stand deshalb von Anfang an im Mittelpunkt unseres Interesses, und sie prägt auch die empirischen Beiträge zu diesem Band. Auf den im ersten Workshop erreichten Grundlagen (die im online publizierten Arbeitspapier „SpuR01“ dokumentiert sind: www.spur.uzh.ch/ research/ publications.html) konnte dann bei einem zweiten Workshop zurückgegriffen werden, der im Herbst gleichen Jahres (24.-27. November 2013) wieder an der Universität Zürich stattgefunden hat. Der erste Workshop diente weitgehend der gemeinsamen Orientierung in einem noch vergleichsweise unerschlossenen analytischen Gelände, wobei wir aber bereits eine Reihe externer Architektur-Expertinnen und -Experten einbezogen hatten, um die Diskussion der theoretischen Konzeption interaktionsarchitektonischer und sozialtopografischer Fragestellungen in einen größeren Rahmen zu stellen. Beim Vorwort 8 zweiten Workshop haben wir dann auf diesem Hintergrund die fallanalytischen Umsetzungen der ausformulierten Konzepte vorangetrieben. Beispielhaft zeigen sich die Ergebnisse dieser fallanalytischen Weiterentwicklung in den Arbeitspapieren „SpuR03“ und „SpuR04“. Der dritte Workshop, der vom 23.-24. März 2015 erneut an der Universität Zürich stattfand, konnte schließlich dazu genutzt werden, die schriftlich vorliegenden Erstversionen der Fallanalysen im Kreis der Autorinnen und Autoren inklusive der Architektur-Expertinnen und -Experten intensiv zu diskutieren. Aus diesen Diskussionen sind die vorliegenden Beiträge in ihrer hier publizierten Form hervorgegangen. Wir danken allen Beiträgerinnen und Beiträgern für ihre intensive Kooperation und insbesondere den beteiligten Expertinnen und Experten für die Bereitschaft zu intensiver Diskussion und Lektüre, deren Ergebnisse sich in den in diesem Band vorgelegten Kommentaren niedergeschlagen haben. 1 Wir sind davon überzeugt, dass die hier vorgelegten Beiträge aufgrund der intensiven Vorgeschichte ein für einen Sammelband ungewöhnlich hohes Maß an Kohärenz für sich in Anspruch nehmen können - auch wenn sich in den Diskussionen des Öfteren gezeigt hat und auch in den abgedruckten Endversionen in einigen Beiträgen gut dokumentiert ist, dass die hier erstmals vorgestellten Konzepte von „Interaktionsarchitektur“ und „Sozialtopografie“ (anders als das schon eingeführte Konzept des „Interaktionsraums“) nicht schon zum common sense der neueren Interaktionsanalyse zählen dürften, sondern in ihren Implikationen z.T. umstritten sind. Das haben wir bewusst nicht zu kaschieren versucht. Die genannten Workshops wären nicht möglich gewesen, wenn es nicht seit 2013 an der Universität Zürich den philologieübergreifenden universitären Forschungsschwerpunkt Sprache und Raum (SpuR) geben würde, der unsere Aktivitäten durchgängig und großzügig finanziell und ideell unterstützt hat. Die für die in diesem Schwerpunkt angesiedelte Forschungsgruppe Interaktionsräume konstitutive Kooperation mit der Abteilung Pragmatik des Instituts für Deutsche Sprache findet ihren formellen Ausdruck in einer 2014 verabschiedeten Kooperationsvereinbarung zwischen der UZH und dem IDS. Zürich und Mannheim, im Frühjahr 2016 Heiko Hausendorf, Wolfgang Kesselheim und Reinhold Schmitt Literatur Goffmann, Erving (1964): The neglected situation. In: American Anthropologist 66, 2, S. 133-136. 1 Unser Dank gilt an dieser Stelle auch Silke Steets, die am ersten Workshop teilgenommen hat. REINHOLD SCHMITT/ HEIKO HAUSENDORF SPRACHE UND RAUM: EINE NEUE FORSCHUNGSPERSPEKTIVE, IHRE URSPRÜNGE UND IHR AKTUELLER ENTWICKLUNGSSTAND 1. Einleitung Der vorliegende Sammelband ist das Ergebnis einer langjährigen Zusammenarbeit zwischen der Universität Zürich und dem Institut für Deutsche Sprache - vertreten durch die beiden Autoren - und vielen anderen an der vorliegenden Publikation Beteiligten. Wir wollen einleitend in diesem Band aus einer wissenschaftshistorischen Sicht zum einen diese Zusammenarbeit als Ursprung der aktuellen Forschungsperspektive vor dem Hintergrund der Entwicklung der multimodalen Interaktionsanalyse im deutschsprachigen Raum Revue passieren lassen. Zum anderen wollen wir die aktuellen Interessen und die zukünftigen Perspektiven des raumanalytischen Forschungszusammenhangs skizzieren, wie sie sich aus der Kooperation inzwischen etabliert haben. Die Sprache-Raum-Thematik ist dabei unmittelbar mit der Entwicklung der linguistischen Multimodalitätsforschung im deutschsprachigen Forschungskontext verknüpft, sodass wir auf eine Entwicklungslinie Bezug nehmen können, die durch die seit 2003 regelmäßig im IDS stattfindenden „Arbeitstreffen zu Fragen multimodaler Kommunikation“ und die Publikationen der Ergebnisse dieser Treffen gut dokumentiert ist. Die einzelnen Etappen dieser Entwicklung lassen sich deshalb entlang der entsprechenden Publikationen verfolgen, die alle in der IDS-Reihe „Studien zur Deutschen Sprache“ (SDS) erschienen sind (Schmitt (Hg.) 2007; Mondada/ Schmitt (Hg.) 2010; Hausendorf/ Mondada/ Schmitt (Hg.) 2012; Schmitt 2013). 2. Multimodale Interaktionsanalyse Zentrale Voraussetzung für die Entwicklung einer multimodalen Interaktionsanalyse sind die Prägnanz und die Wucht der visuellen Anteile an der Interaktionskonstitution. Die Möglichkeit, Interaktion nicht nur zu hören und die Mechanismen des Hörbaren zu rekonstruieren, sondern Interaktion auch zu sehen und die Mechanismen des Sichtbaren analytisch zugänglich zu machen, hat das Forschungsfeld der Interaktionsanalyse schlagartig verändert und neu strukturiert. Reinhold Schmitt / Heiko Hausendorf 10 Die wichtigste Erkenntnis dieser Veränderung besteht in der tatsächlichen Komplexität von Interaktion. Bezogen darauf erscheinen etablierte Konzepte zur Analyse der verbalen Dimension von Interaktion aufgrund der Sichtbarkeit dessen, was sie bei der Analyse - durchaus motiviert - ausgeschlossen hatten, plötzlich sehr holzschnittartig. Angesichts der faktischen Komplexität von Interaktion und wegen der sichtbaren Verankerung verbaler Strukturen in räumlich-situativ strukturierten Handlungszusammenhängen entstand folgende Notwendigkeit: Die verbal definierten, empirisch basierten Konzepte müssen modalitätsspezifisch angereichert, modifiziert, gänzlich umgearbeitet oder zugunsten neuer Konzepte aufgegeben werden, die bei ihrer Entwicklung den komplexen multimodalen Konstitutionszusammenhang von Interaktion von vornherein in Rechnung stellen. Zum jetzigen Zeitpunkt wird die aktuelle Entwicklung der empirischen Untersuchung von Interaktion durch ein Kontinuum koexistierender Zugänge bestimmt, die sich vor allem bezüglich der theoretisch-methodisch-konzeptionellen Bedeutung von Verbalität und der damit verbundenen Gegenstandskonstitution unterscheiden. 2.1 Klassische Konversationsanalyse Untersuchungen auf der Grundlage der klassischen Konversationsanalyse arbeiten nach wie vor mit Audioaufzeichnungen und gestalten ihre Gegenstandskonstitution so, dass Phänomene und Strukturen im Mittelpunkt des Erkenntnisinteresses stehen, die auf der Grundlage einer monomodalen und letztlich autonom gesetzten Ausdrucksressource, der Verbalität, untersucht werden können. 2.2 Multimodale Konversationsanalyse In der modalitätsspezifisch erweiterten Konversationsanalyse werden singuläre visuelle Ausdrucksressourcen bei der multimodalen Erweiterung verbal definierter Konzepte integriert. Dies geschieht auf der Grundlage audio-visueller Interaktionsdokumente. Das Erkenntnisinteresse wird auch hier weitgehend von Strukturen verbaler Kommunikation bestimmt. Es geht dabei beispielsweise um Fragen, wie verbale Mechanismen der Interaktionskonstitution (also etwa die Turn-Taking-Organisation) durch Blickverhalten, Gestikulation oder Mimik mitbestimmt werden. Sprache und Raum: Eine neue Forschungsperspektive 11 2.3 Multimodale Interaktionsanalyse Der Ansatz der multimodalen Interaktionsanalyse ist wie der der multimodalen Konversationsanalyse auf Videoaufzeichnungen angewiesen, lässt sich aber im Unterschied zur multimodalen Konversationsanalyse den Gegenstand nicht durch die bereits weitgehend bekannten verbalen Ordnungsstrukturen vorgeben. Das Erkenntnisinteresse bezieht sich vielmehr auf die Rekonstruktion interaktiver Ordnungsstrukturen unabhängig von der Frage, welche Ressourcen bei ihrem Zustandekommen jeweils eingesetzt wurden. Zwischen diesen drei Formen interaktionsanalytischer Rekonstruktion, die ihre gemeinsame methodologische Grundlage in der ethnomethodologischen Vorstellung einer „Vollzugsrealität“ besitzen, besteht einerseits eine große Durchlässigkeit, andererseits gibt es auch deutliche Unterschiede. Letztere beziehen sich vor allem auf die theoretisch motivierte Art der Gegenstandskonstitution und auf die erkenntnisorientierende Rolle von Konzepten, die für die Analyse verbaler Interaktion entwickelt wurden. Die relative Eigenständigkeit der Zugänge, ihre jeweiligen Schwerpunktsetzungen bei der Analyse von Interaktion, die Rolle, die Verbalität dabei spielt, sowie die Unterschiede in Methode, Theorie und der Bestimmung des Gegenstandsbereichs sind nochmals in folgender Grafik verdeutlicht: 1 Im Unterschied zu den beiden stärker verbal orientierten Zugängen ist für die multimodale Interaktionsanalyse charakteristisch, dass alle Formen interakti- 1 Die grafische Darstellung ist entnommen aus Schmitt (2015). Reinhold Schmitt / Heiko Hausendorf 12 ver Praxis, ungeachtet der bei ihrer Konstitution eingesetzten Ausdrucksressourcen, gleichwertige Untersuchungsgegenstände sind. Das führt im Einzelfall (nicht grundsätzlich! ) zur methodisch motivierten Fokussierung von Visualität als bislang weitgehend vernachlässigter Konstituente von Interaktion. Die Ausdrucksressourcen der Interaktion werden dabei als egalitär angesehen, ohne dass damit der besondere Status der Ressource Sprache ignoriert werden soll. In den Erkenntnisbereich der multimodalen Interaktionsanalyse fällt dann auch die Klärung der Fragen, in welcher Weise sich die Architektur von Räumen auf Interaktion auswirkt, welche Formen von Interaktion ermöglicht und welche eher verhindert werden und welches sozial geprägte, raumbezogene Wissen sich in konkreten Formen der Raumnutzung manifestiert. Diese Fragen haben ihre erste konzeptionelle Bearbeitung in den Begriffen „Interaktionsarchitektur“ und „Sozialtopografie“ (Hausendorf/ Schmitt 2013) gefunden. Da sich die multimodale Interaktionsanalyse am Prinzip der methodischen Adäquatheit orientiert, steht die Entwicklung solcher Methoden und Konzepte im Vordergrund, die der interaktiven Komplexität durch die analytische Berücksichtigung aller Ausdrucksressourcen in ihrer sequenziellen und simultanen Vollzugscharakteristik und dem zwischen den einzelnen Ressourcen bestehenden Zusammenhang explizit Rechnung tragen. Im multimodalen Erkenntniszusammenhang entsteht also grundsätzlich die Notwendigkeit, konversationsanalytisch etablierte Konzepte nicht fraglos zu nutzen, sondern sie hinsichtlich ihrer Angemessenheit für Erkenntnisinteressen zu reflektieren, die sich an der hör- und sichtbaren Komplexität von Interaktion und ihrer strukturimplikativen räumlichen Umgebung orientieren. 3. Etappen raumbezogener Interaktionsforschung Als ein mit der visuellen Qualität von Interaktion und der Rolle visueller Wahrnehmung als Ressource untrennbar verbundener Aspekt wurde deutlich, dass Interaktion ein soziales Unternehmen ist, das immer im Raum stattfindet, zu seiner Konstitution unweigerlich Raum benutzt, hervorbringt und verändert. Dies gilt beispielhaft für Situationen, in denen sich Beteiligte in speziell für bestimmte Zwecke der Interaktion arrangierten Räumen zusammenfinden, für den gemeinsamen Spaziergang zweier oder mehrerer Teilnehmer in der Natur, sowie für Situationen, in denen ein Einzelner mit seinem Mobiltelefon mit situativ nicht präsenten Interaktionspartnern kommuniziert. Auch die letztgenannte, scheinbar raumfreie Interaktionssituation am Telefon wird dadurch mitstrukturiert, dass der Mobilfunkbenutzer hin- und herläuft, stehen bleibt, gestikuliert, den Kopf schüttelt, kurz: sich so verhält, als wäre Sprache und Raum: Eine neue Forschungsperspektive 13 sein interaktives Gegenüber mit ihm in der Situation zusammen. Das Verhalten des Mobiltelefonbenutzers holt gewissermaßen das interaktive Gegenüber in einen gemeinsamen Raum hinein, in dem dann freilich alles, was für die Interaktion relevant werden soll, auch hörbar gemacht werden muss. 3.1 Arbeitstreffen zu Fragen multimodaler Kommunikation Den langfristigen Ausgangspunkt für die vorliegende Publikation zur Interaktionsarchitektur bilden die seit 2003 im IDS stattfindenden halbjährlichen Arbeitstreffen zu Fragen multimodaler Kommunikation (Schmitt 2004, 2010; Mondada/ Schmitt 2007), die die Entwicklung des multimodalen Ansatzes in der deutschsprachigen linguistischen Interaktionsanalyse wesentlich mitgeprägt haben. Die über Jahre hinweg praktizierte gemeinsame Analyse sehr unterschiedlicher audiovisueller Interaktionsdokumente hat bei allen Beteiligten ein methodisches und theoretisches Bewusstsein für die Komplexität multimodaler Interaktion gefördert, das sie für sich alleine so nicht erreicht hätten. Angesichts der Komplexität der Daten, des Fehlens etablierter methodischer Analyseverfahren und mangelnder konzeptioneller Hilfestellung für die multimodale Gegenstandskonstitution war die kollektive Analyse sehr unterschiedlicher Videodokumente eine zentrale Notwendigkeit. Ohne diese kontinuierliche vollzugsanalytische Synergie, die sich auf der Basis hinreichend übereinstimmender wie divergierender Perspektiven und Positionen speiste, hätte keiner der oben genannten Bände entstehen können. Ebenso wichtig für die schrittweise Herausbildung des multimodalen Analyseansatzes war die Tatsache, dass die Arbeitstreffen ohne Zeitdruck, ohne thematische Vorgaben und ohne anfängliche Produktorientierung stattfanden. Nur so konnten die Strukturen der analysierten Daten in ihrer multimodalen Bedingtheit und feingesponnenen Verflechtung einzelner Ausdrucksressourcen hinreichend zur Geltung gebracht werden. Und nur so konnte sich die thematische Fokussierung in der oben beschriebenen Engführung auf räumliche Relevanzen der Interaktion und auf Raum als interaktive Ressource herstellen und in der beschriebenen Abfolge die systematischen Sammelbände motivieren. 3.2 Koordination (2007) Ausgehend von der Erkenntnis der grundlegenden Multimodalität von Interaktion entstand der erste, thematisch fokussierte Sammelband mit dem Schwerpunkt Koordination (Schmitt (Hg.) 2007). Mit dieser Fokussierung wurde eine in der Analyse von Interaktion bis dato weitgehend vernachlässigte strukturelle Anforderung an die Beteiligten zum Gegenstand systematischer Reinhold Schmitt / Heiko Hausendorf 14 Analyse, die sich auf sehr unterschiedliche Aspekte der Interaktionskonstitution bezieht. Koordination ist die Voraussetzung der gemeinsamen Herstellung personalräumlicher Strukturen als Basis des verbalen Austauschs. Koordination fokussiert das zeitlich-räumliche Alignment einzelner Teilnehmer mit dem der anderen sowie die selbstbezogene Abstimmung einzelner Ausdrucksressourcen wie Verbalität, Gestikulation, Blick, Körperpositur etc. Der Sammelband Koordination hatte das Ziel, in einer Vielzahl sehr unterschiedlicher Situationen Verfahren der Koordinierung der Beteiligten zu rekonstruieren, um deren vielfältiges Varianzspektrum aufzublättern und die strukturelle Qualität koordinativer Anforderungen und ihre Bearbeitung bei der Interaktionskonstitution als eigenständiges Forschungsfeld zu skizzieren. Von den auch am vorliegenden Band Beteiligten haben Lorenza Mondada, Wolfgang Kesselheim, Heiko Hausendorf, Ulrich Dausendschön-Gay und Reinhold Schmitt Beiträge zum Koordinationsband geleistet. 3.3 Multimodale Situationseröffnung (2010) Die Aufarbeitung koordinativer Anforderungen bei der Interaktionskonstitution in sehr unterschiedlichen sozialen Situationen und interaktionsstrukturellen Kontexten führte zur Konsequenz, die Multimodalität der Interaktionskonstitution in fokussierter Weise und unter unmittelbar vergleichbaren Bedingungen zu untersuchen. Bei der Entwicklung dieses Erkenntnisinteresses spielte zudem die Möglichkeit der exemplarischen und systematischen Reflexion verbaler Konzepte und verbaler Gegenstandskonstitution eine wichtige Rolle. Dies führte zur Entscheidung, Situationseröffnungen als multimodale Herstellung fokussierter Interaktion zu untersuchen (Mondada/ Schmitt (Hg.) 2010). Bei der Untersuchung von Situationseröffnungen in kontrastiv-produktiver Weise konnten somit die in der Konversationsanalyse bei der Rekonstruktion verbaler Ordnungsstrukturen von Gesprächseröffnungen entwickelten Konzepte reflektiert werden. Mit der Untersuchung verbaler Eröffnungen von Interaktion hatte einst die Entwicklung des konversationsanalytischen Ansatzes begonnen, so dass die Gesprächseröffnung inzwischen als der wohl am besten untersuchte Aspekt der Interaktionskonstitution überhaupt angesehen werden kann. Im Vergleich zum Koordinationsband traten bei der Analyse von Situationseröffnungen aus multimodaler Sicht der Raumbezug und die Raumnutzung der Beteiligten wesentlich stärker in den Vordergrund. Es wurde vor allem deutlich, dass die Etablierung eines gemeinsamen Interaktionsraums eine für die Aufnahme verbaler Aktivitäten konstitutive Voraussetzung darstellt, deren Art und Weise sich unmittelbar auf die Möglichkeiten Sprache und Raum: Eine neue Forschungsperspektive 15 des verbalen Austauschs auswirkt. Verbalität - so eine der zentralen Einsichten - kommt in der Regel erst dann zum Einsatz, wenn die Beteiligten hierfür bereits durch den Einbezug räumlicher und körpergebundener Wahrnehmungsressourcen die Voraussetzungen geschaffen haben. An diesem Band waren von den hier vertretenen Autorinnen und Autoren Lorenza Mondada, Florence Oloff, Ulrich Dausendschön-Gay, Heiko Hausendorf und Reinhold Schmitt beteiligt. 3.4 Raum als interaktive Ressource (2012) Die zentrale Bedeutung von Raum für die Interaktionskonstitution in der Phase der Situationseröffnung führte als Konsequenz zur systematischen Fokussierung der verschiedenen Arten und Weisen, in denen Interaktionsbeteiligte Raum als Ressource für ihre Interaktion nutzen. Als erstes Ergebnis dieser analytischen Bemühungen entstand der Band Raum als interaktive Ressource (Hausendorf/ Mondada/ Schmitt (Hg.) 2012). Dieser dritte Band in der SDS-Reihe fokussiert Raum anhand der empirischen Grundlage sehr unterschiedlicher Situationen und interaktionsstruktureller Kontexte. Er ist darin vergleichbar mit der Ausrichtung des Koordinationsbandes. Das wesentliche Ziel des Bandes war es, erste Orientierungslinien zu ziehen in das zum Zeitpunkt der Fertigstellung des Bandes sowohl in theoretischer als auch methodisch-methodologischer Hinsicht noch relativ offene Forschungsfeld „Raum in der Interaktion“. Damit wurde nicht der Anspruch erhoben, bereits einen systematischen Überblick zu geben. Dafür bedarf es weiterer systematischer Anstrengungen, innovativer Gegenstandskonstitutionen und Fragestellungen, um die Vielfalt und den Aspektreichtum zu erhellen, in denen ‘Raum als interaktive Ressource’ für die Interaktionskonstitution eine Rolle spielt. An dem Band waren Lorenza Mondada, Heiko Hausendorf, Reinhold Schmitt, Wolfgang Kesselheim und Florence Oloff beteiligt. 3.5 Körperlich räumliche Aspekte der Interaktion (2013) Die Reihe systematischer Publikationen mit zunehmend explizit raumbezogenem Erkenntnisinteresse wurde mit der Monografie Körperlich-räumliche Aspekte der Interaktion (Schmitt 2013) weitergeführt. Dieser Band verortet sich sowohl in der analysepraktischen Konzentration wie auch hinsichtlich seiner theoretisch-konzeptionellen Grundlagen als explizite Weiterführung der vorgängigen drei SDS-Bände. Dies gilt insbesondere für den Band Raum als interaktive Ressource (Hausendorf/ Mondada/ Schmitt (Hg.) 2012), dessen thematische Fokussierung auf räumliche Relevanzen der Interaktionskonstitution Reinhold Schmitt / Heiko Hausendorf 16 fortgesetzt wird. Thematischer Schwerpunkt ist hier die Frage nach der interaktionskonstitutiven Relevanz speziell des körperlich-räumlichen Verhaltens der Beteiligten, die Bedeutung ihrer Bewegungen im Raum und die Frage nach den Implikationen, die mit eingenommenen Positionen im Raum und mit den dabei realisierten Formen von Ko-Orientierung und Koordination verbunden sind. Neben der analytischen Fokussierung auf körperlich-räumliche Grundlagen der Interaktion wurde hier auch erstmalig eine für die aktuelle Diskussion wichtige konzeptionelle Vorstellung „Sozialtopografie“ skizziert. Sie stammt ebenso wie das Konzept „Interaktionsarchitektur“ aus den gemeinsamen Diskussionen zwischen Heiko Hausendorf und Reinhold Schmitt. Die Schwerpunkte „Koordination“, „multimodale Situationseröffnungen“, „Raum als interaktive Ressource“ und „Körperlich-räumliche Aspekte der Interaktion“ verstehen wir als zentrale Vorarbeiten für die aktuelle Fokussierung auf die interaktionsvorgängige kommunikative Bedeutung architektonisch gestalteter Räume, auf das kulturelle Wissen, das wir hinsichtlich adäquater Raumnutzung haben, und auf die konkrete Interaktion, die in diesen Räumen stattfindet. 4. Das aktuelle Interesse am Zusammenhang von Raum und Interaktion Während in den skizzierten Forschungsphasen - und generell in der Interaktionsraumanalyse der letzten etwa zehn Jahre - immer die interaktive Ausnutzung räumlicher Ressourcen im Mittelpunkt stand, haben wir uns in unseren aktuellen Forschungen stärker mit der Natur dieser räumlichen Ressourcen beschäftigt. Unseres Erachtens ist es die zwangsläufige Konsequenz einer Konzeption von „Raum als interaktiver Ressource“, die Ressourcenhaftigkeit des Raumes eigenständig zu fokussieren und diese Qualität zwingend als interaktionsvorgäng und -unabhängig zu postulieren. Unter einer solchen Perspektive richtet sich der Blick dann auf das, worauf Interaktionsbeteiligte in ihrer Interaktion zurückgreifen können, wenn sie einen gebauten und gestalteten Raum betreten bzw. sich in einem solchen Raum zusammenfinden. Besonders offenkundig wird die Reichhaltigkeit dieser im weitesten Sinne architektonischen Ressourcen, wenn es um Interaktionsereignisse geht, die einen hohen Grad an Institutionalisierung aufweisen und die entsprechend ein eigens für sie gebautes und gestaltetes soziales Zuhause gefunden haben. Das gilt z.B. für die Vorlesung und den Hörsaal, den schulförmig organisierten Unterricht und das Klassenzimmer oder den Gottesdienst und den Kirchenraum. Sprache und Raum: Eine neue Forschungsperspektive 17 So ist es kein Zufall, wenn wir den Blick auf die Architektur bislang vor allem am Kirchenraum und seiner Ausstattung erprobt und fruchtbar gemacht haben. Den Ausgangspunkt bildete dabei eine kleine Serie von Standbildern aus der Videoaufzeichnung eines sogenannten Alpha-Gottesdienstes 2 (Hausendorf/ Schmitt 2014): Die vier Standbilder zeigen unterschiedliche Etappen im Verlauf der Eröffnung und der ersten Aktivitäten dieses Gottesdienstes. Wichtig für die Entwicklung unseres raumanalytischen Erkenntnisinteresses war, dass wir den Sprung in das für Konversationsanalytiker und Interaktionsforscher ungewohnte und deshalb „kalte Wasser“ gewagt und uns intensiv auf eine Analyse des ersten hier abgebildeten Standbildes eingelassen haben. Auf diesem ist offenkundig im Altarbereich (noch) keine Interaktion dokumentiert, und es wird (noch) nicht mit dem Anspruch der Inklusion aller Anwesenden gesprochen und zugehört. Man kann zwar sehen, dass sich am rechten Bildrand eine Person nach rechts wendet. In dem Fall, dass sie sich auch einer anderen Person zuwendet, ist klar, dass dieses Interaktionsangebot nicht an alle Anwesenden gerichtet ist. Was uns an diesem Standbild interessiert hat, ist der Beginn der Geschichte der vier Stühle vor dem Altar, von denen im Verlauf des Gottesdienstes auf unterschiedliche Weise Gebrauch gemacht wird (auf den nächsten beiden Bildern dokumentiert), bevor sie dann in die Sakristei gebracht und „wegge- 2 Der Alpha-Gottesdienst ist eine moderne Form mit Musik, Diskussionen, Sketchen und gemeinsamem Essen. Reinhold Schmitt / Heiko Hausendorf 18 sperrt“ werden (letztes Standbild). Uns hat interessiert, welche Art von Interaktion durch die dokumentierte Architektur (gebauter, ausgestatteter und gestalteter Raum) möglich und erwartbar gemacht wird (siehe genauer den fallanalytischen Beitrag Hausendorf/ Schmitt in diesem Band sowie - wesentlich detaillierter und methodologisch ausführlicher Hausendorf/ Schmitt 2013). Wir nennen das die „interaktionsarchitektonischen Implikationen“, die sich in basalen Strukturen insbesondere von Sichtbarkeit, Begehbarkeit, Besitzbarkeit, Begreifbarkeit und Zugänglichkeit bemerkbar machen. Schon mit Blick auf diese Interaktionsarchitektur stellen die vier Stühle vor dem Altar eine analytische Herausforderung dar: Hier gerät offenkundig der gebaute und ausgestattete Raum mit dem u.a. durch leichtes Mobiliar (wie die vier Korbstühle) gestalteten Raum in Konflikt. Dies ist ein Gegensatz, der für die soziale Charakteristik des in dem so hergerichteten Raum dann stattfindenden Interaktionsereignisses (Alpha-Gottesdienst) von großer Bedeutung ist (wie wir in unserem empirischen Beitrag zu diesem Band zeigen). Wichtig für die Analyse der Interaktionsarchitektur ist, dass dabei von der später stattfindenden Interaktion zunächst bewusst abstrahiert wird. Was mit den vier Stühlen tatsächlich passiert, ist also eine andere Frage - auf die dann die Standbilder eine Antwort geben, auf denen Personen zu sehen sind, die das interaktionsarchitektonische Potenzial der vier Stühle auf sehr unterschiedliche Weise in Anspruch nehmen: So nutzt der als „Sprecher mit Mikrofon“ erkennbare junge Mann den äußeren linken Stuhl der Stuhlreihe als eine Art Stütze und Verankerungsmöglichkeit. Die beiden Frauen, die auf den mittleren zwei Stühlen Platz genommen haben, schöpfen hingegen die Besitzbarkeit der Stühle aus. Sie lösen, könnte man sagen, das interaktionsarchitektonische Versprechen der Stühle ein. An dieser Stelle tritt neben die Interaktionsarchitektur die Sozialtopografie, insofern beobachtbar wird, welche der vielen Potenziale des gestalteten Raums tatsächlich realisiert werden: Die beiden Frauen beispielsweise dokumentierten durch ihr Verhalten ihr Wissen um die Benutzbarkeit der Stühle und ihre spezifische Qualität für die Darstellung einer Wartesituation (als Teil des für den Alpha-Gottesdienst wichtigen „Anspiels“). Diese Bemerkungen verstehen sich als Illustration der empirischen Fruchtbarkeit von Standbildanalysen, in denen die Architektur des Raums in ihrer strukturimplikativen Kraft zur Geltung gebracht werden soll. Über die Ressourcenqualität für die Interaktion hinaus bekommt der Raum dabei ein analytisches Eigengewicht. Wir verstehen diese analytische „Etappe“ als wichtige und notwendige Ergänzung unserer bislang praktizierten interaktionsfixierten Interaktionsraumanalyse. Nur so lässt sich ermessen, wie stark in Sprache und Raum: Eine neue Forschungsperspektive 19 und mit Interaktion an raumbasierte Ressourcen angeknüpft werden kann: schon dadurch, dass und wie die Interaktionsbeteiligten im Raum ihren Platz einnehmen und sich so selbst in den sozialen Strukturen des Raums im Verhältnis zu weiteren Anwesenden positionieren. 5. Forschungsergebnisse online Neben den systematischen Sammelbänden spielen die auf den Internetseiten des universitären Forschungsschwerpunkts Sprache und Raum (SpuR) zum Download bereitgestellten Arbeitspapiere eine wichtige Rolle bei der Entwicklung unserer raumanalytischen Perspektive (www.spur.uzh.ch/ research. html). Während die Sammelbände schrittweise und aufeinander bezogen relevante Aspekte multimodalitätsbezogener Erkenntnisinteressen vorbereitet haben, präsentieren die Arbeitspapiere („SpuRen“) zentrale Ergebnisse der in der Zwischenzeit entstandenen raumanalytischen Perspektive. Die Arbeitspapiere haben die wichtige Funktion, Einblicke in grundlegende theoretischkonzeptionelle, methodisch-methodologische und empirische Schwerpunktsetzungen zeitnah zu ihrer Entstehung und ohne die Restriktionen einer auf die Ergebnisse solcher Schwerpunktsetzungen bezogenen Verlagspublikation zu ermöglichen. Sie sollen Produkte aus der Forschungswerkstatt vorstellen und in die Diskussion einbringen, ohne dabei durch zeitaufwändige Anforderungen einer publikationsfertigen Buch- oder Zeitschriftversion behindert zu werden. Durch die Online-Publikation der Arbeitspapiere ergibt sich zudem der Vorteil, auch umfangreiche Detailanalysen und Ausarbeitungen konzeptioneller Vorstellungen zu ermöglichen, die in herkömmlichen Publikationsorganen schon vom notwendigen Umfang her nicht möglich wären. Wir nutzen an dieser Stelle also die Gelegenheit, nicht nur Ergebnisse von Erkenntnisprozessen, sondern auch die Prozesse selbst einer interessierten Leserschaft zur Verfügung zu stellen. Oftmals sind gerade die Rekonstruktion komplexer fallspezifischer Strukturen, ihre methodologische Reflexion und das Nachdenken über die Möglichkeiten ihrer falltranszendierenden Theoretisierung für die Entwicklung des gesamten Ansatzes ausgesprochen wichtig. In diesem Sinne gehen die bisher vorliegenden vier Arbeitshefte jeweils eigenständigen, für die Konturierung raumanalytischer Fragestellungen relevanten Aspekten nach und bereiten deren Theoretisierung und Konzeptualisierung vor. Sie setzen somit wichtige Impulse für die zukünftige Gegenstandskonstitution und dabei systematisch zu bearbeitende Aspekte. Reinhold Schmitt / Heiko Hausendorf 20 5.1 SpuR01: Interaktionsarchitektur und Sozialtopografie Die für die Analyse des Zusammenhangs von räumlichen Voraussetzungen, Raumwissen und konkreter Interaktion wichtigen konzeptionellen Überlegungen bilden den Gegenstand der Startnummer der Reihe „SpuR, Arbeitspapiere des universitären Forschungsschwerpunktes Sprache und Raum“. Im ersten Arbeitspapier (SpuR 01) stehen die Konzepte „Interaktionsarchitektur“ und „Sozialtopografie“ und ihre Abgrenzung vom eingeführten - und im konversationsanalytischen Zusammenhang bereits etablierten - Konzept des „Interaktionsraums“ im Mittelpunkt (Hausendorf/ Schmitt 2013). Mit diesem Arbeitspapier werden erstmals konzeptionelle Vorstellungen präsentiert, die für die aktuelle und weitere Arbeit von zentraler Bedeutung sind. 5.2 SpuR02: Können Räume Texte sein? Im zweiten Arbeitspapier wird der Status der Architektur ausgehend von einer textlinguistischen Position diskutiert (Hausendorf/ Kesselheim 2013). Entgegen einer verbreiteten Metaphorik (von der „Lesbarkeit des Raums“) schlagen die Autoren vor, zwischen der Lesbarkeit eines Textes und der Benutzbarkeit eines Raums und entsprechend zwischen textuell konstituierten Lesbarkeitshinweisen und architektonisch konstituierten Benutzbarkeitshinweisen zu unterscheiden. Damit kann der Beitrag von Interaktionsarchitektur und Sozialtopografie im transdisziplinären Forschungsfeld des ‘spatial turn’ verortet und der linguistische Zugewinn für architekturtheoretische, architektursoziologische und sozialgeografische Ansätze verdeutlicht werden. 5.3 SpuR03: Vier Stühle vor dem Altar Gegenstand des dritten Arbeitspapiers ist eine detailliert ausgearbeitete und umfangreiche Fallanalyse aus dem bereits thematisierten Alpha-Gottesdienst (Hausendorf/ Schmitt 2014). Darin wird das Gesamtprogramm der raumbezogenen Erkenntnisperspektive, so wie sie sich aus dem Forschungsschwerpunkt entwickelt hat, exemplarisch und ohne Rücksicht auf Umfangsbeschränkungen ausgearbeitet und präsentiert. Durch diese fallanalytischen Darstellungen ziehen sich von Beginn an kontinuierliche Reflexionen der eigenen De-facto-Methodologie und ihrer Implikationen und etablieren dadurch wichtige Aspekte für die systematische, zukünftige Bearbeitung. 5.4 SpuR04: Freiraum schaffen Das vierte Arbeitsheft hat einen methodisch-methodologischen Schwerpunkt und greift damit die reflexive Perspektive des dritten Arbeitsheftes auf Sprache und Raum: Eine neue Forschungsperspektive 21 (Schmitt/ Dausendschön-Gay 2015). Empirisch geschieht dies auf einer anderen Grundlage, nämlich der Interaktion im schulischen Klassenzimmer. Im Zentrum stehen dabei methodische Fragen der adäquaten Berücksichtigung visuell wahrnehmbarer Aspekte und ihre Methodisierung beim konkreten fallanalytischen Einsatz. Dabei sind beispielsweise die „segmentale Standbildanalyse“ als besonderes Analyseverfahren und der „Frame-Comic“ als gegenstandsadäquates Sekundärdokument für die Analyse von Standbildfolgen entstanden. Auch für die Entwicklung und Reflexion dieser neuen Analyseverfahren und Sekundärdokumente war die uneingeschränkte Möglichkeit der detaillierten reflexiven Auseinandersetzung eine zentrale Voraussetzung. 6. Workshops und Kolloquien Der Motor, der die Etablierung des raumanalytischen Ansatzes vorangetrieben hat, waren die schon erwähnten Arbeitstreffen (Abschnitt 3.1). Diese Arbeitstreffen haben wir in den vergangenen Jahren gezielt durch interdisziplinär zusammengesetzte Workshops und Kolloquien ergänzt (siehe das Vorwort zu diesem Band). Solche Workshops bieten einen geeigneten Rahmen, erste Ergebnisse und Forschungsfragen einer kleinen Öffentlichkeit von (externen) Experten und Praktikern zu präsentieren. All diese Aktivitäten sind Teil unserer Bemühungen, die bislang entwickelte und sich weiterentwickelnde raumanalytische Perspektive von Anfang an möglichst breitgefächert als eigenständigen, neuen Zugang zur Analyse raumgebundener Interaktion in unterschiedlichen Feldern und Bereichen zu positionieren. Wir tun dies in der Überzeugung, dass die Kenntnisse um interaktionsarchitektonische und sozialtopografische Implikationen vor allem die Rekonstruktion interaktionsräumlicher Strukturen nachhaltig beeinflussen wird. Damit gibt es auf der Grundlage der neu entwickelten Konzepte, Methoden und Sekundärdokumente die Möglichkeit, sich ergänzend zum konversationsanalytischen Vorgehen verbalen Aktivitäten von der Interaktionsarchitektur und der Sozialtopografie her noch einmal neu zu nähern. Ohne die Rolle der Verbalität in ihrer Bedeutung für die soziale Sinnkonstitution zurückzustufen, wird es auf diese Weise möglich, sie als das zu rekonstruieren, was sie als zentrales Mittel der Kommunikation immer schon ist: Sie ist in ihrer Realisierung eingebettet in das „räumliche Zuhause“ der Interaktion, die sie mitmanifestiert, und ist in ihrer spezifischen Form immer schon reflexiv auf dieses „natürliche Zuhause“ (Goffman 1964) bezogen. Reinhold Schmitt / Heiko Hausendorf 22 7. Zitierte Arbeiten aus dem Forschungsschwerpunkt Goffmann, Erving (1964): The neglected situation. In: American Anthropologist 66, 2, S. 133-136. Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2012): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr. Hausendorf, Heiko/ Kesselheim, Wolfgang (2013): Können Räume Texte sein? Linguistische Überlegungen zur Unterscheidung von Lesbarkeits- und Benutzbarkeitshinweisen. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 2). Zürich. www. zora.uzh.ch/ 84555/ 1/ SpuR_Arbeitspapiere_Nr02_Aug2013.pdf (Stand: August/ 2013). Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopografie. Umrisse einer raumlinguistischen Programmatik. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 1). Zürich. www.zora.uzh.ch/ 78153/ 1/ SpuR_Arbeitspapiere_Nr01_Mai2013.pdf (Stand: Mai/ 2013). Hausendorf, Heiko/ Schmitt, Reinhold (2014): Vier Stühle vor dem Altar. Eine interaktionistische Fallstudie zur Raumnutzung in einem „Alpha-Gottesdienst“. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 3). Zürich. www.zora.uzh. ch/ 99117/ 1/ SpuR_Arbeitspapier_Nr03_140702.pdf (Stand: Juni/ 2014). Hausendorf/ Schmitt (i.d.Bd.): Vier Stühle vor dem Altar. Interaktionsarchitektur, Sozialtopographie und Interaktionsraum in einem „Alpha“-Gottesdienst. Mondada, Lorenza/ Schmitt, Reinhold (2007): Vergleichende Analysen von Situationseröffnungen / Analyses comparées d’ouvertures. Ein deutsch-französisches Kooperationsprojekt. In: Sprachreport. Sonderheft März 2007, S. 27-30. Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2010): Situationseröffnungen: Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr. Schmitt, Reinhold (2004): Bericht über das 1. Arbeitstreffen „Multimodale Kommunikation“. In: Sprachreport 1/ 2004, S. 31-34. Schmitt, Reinhold (Hg.) (2007): Koordination. Analysen zur multimodalen Interaktion (= Studien zur Deutschen Sprache 38). Tübingen: Narr. Schmitt, Reinhold (2010): Bericht über das 1. Arbeitstreffen „Videobasierte Unterrichtsanalyse“. In: Sprachreport 1/ 2010, S. 33-36. Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 68). Tübingen: Narr. Schmitt, Reinhold (2015): Positionspapier: Ko-Konstruktionen aus Sicht der multimodalen Interaktionsanalyse. In: Dausendschön-Gay, Ulrich/ Gülich, Elisabeth/ Krafft, Ulrich (Hg.): Ko-Konstruktionen als interaktive Verfahren. Bielefeld: transcript, S. 43-51. Schmitt, Reinhold/ Dausendschön-Gay, Ulrich (2015): Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 4). Zürich. www.spur.uzh.ch/ research/ publications/ SpuR_Arbeitspapier_Nr04_150711.pdf (Stand: September/ 2015). Sprache und Raum: Eine neue Forschungsperspektive 23 Gliederung 1. Einleitung ..................................................................................................................9 2. Multimodale Interaktionsanalyse ..........................................................................9 2.1 Klassische Konversationsanalyse ........................................................................10 2.2 Multimodale Konversationsanalyse ....................................................................10 2.3 Multimodale Interaktionsanalyse ........................................................................11 3. Etappen raumbezogener Interaktionsforschung ...............................................12 3.1 Arbeitstreffen zu Fragen multimodaler Kommunikation................................13 3.2 Koordination (2007) ...............................................................................................13 3.3 Multimodale Situationseröffnung (2010)............................................................14 3.4 Raum als interaktive Ressource (2012)................................................................15 3.5 Körperlich-räumliche Aspekte der Interaktion (2013) ......................................15 4. Das aktuelle Interesse am Zusammenhang von Raum und Interaktion ...............................................................................................................16 5. Forschungsergebnisse online................................................................................19 5.1 SpuR01: Interaktionsarchitektur und Sozialtopografie ....................................20 5.2 SpuR02: Können Räume Texte sein? ...................................................................20 5.3 SpuR03: Vier Stühle vor dem Altar......................................................................20 5.4 SpuR04: Freiraum schaffen ...................................................................................20 6. Workshops und Kolloquien..................................................................................21 7. Zitierte Arbeiten aus dem Forschungsschwerpunkt.........................................22 I. INTERAKTION UND ARCHITEKTUR: THEORETISCHE KONZEPTE HEIKO HAUSENDORF/ REINHOLD SCHMITT INTERAKTIONSARCHITEKTUR UND SOZIALTOPOGRAFIE: BASISKONZEPTE EINER INTERAKTIONISTISCHEN RAUMANALYSE 1. Vorbemerkungen Wir beschreiben in diesem Beitrag mit den beiden Konzepten ‘Interaktionsarchitektur’ und ‘Sozialtopografie’ zentrale Grundlagen unseres interaktionistisch-raumanalytischen Verständnisses. Die beiden aufeinander bezogenen konzeptionellen Vorstellungen haben sich aus unserer Beschäftigung mit der Relevanz des Raums als interaktiver Ressource entwickelt und stellen den Übergang zu einer notwendigen Klärung der Ressourcenqualität des Raums dar. Insofern kommen die Konzepte nicht aus dem Nichts, sondern sind die logische und notwendige Konsequenz gemeinsamer raumbezogener Interaktionsanalysen der letzten Jahre (vgl. dazu den Einleitungsbeitrag von Schmitt und Hausendorf i.d.Bd.). Interaktionsarchitektur und Sozialtopografie sind der erste konsequente Versuch, auf der Grundlage methodologischer Reflexion und methodischen Vorgehens empirisch zu klären, was wir eigentlich immer mitmeinen (müssen! ), wenn wir von Raum als interaktiver Ressource sprechen - und was wir analytisch tun müssen, wenn wir ernsthaft an der Ressourcenqualität des Raums interessiert sind. ‘Interaktionsarchitektur’ steht dabei für die Frage, wie die Architektur von Räumen Interaktion (wenn auch nicht determinieren und verhindern, so doch) ermöglichen und nahelegen kann und wie man diese interaktionsarchitektonischen Implikationen empirisch rekonstruieren kann. Unter ‘Architektur’ verstehen wir dabei heuristisch all das, was - vom gebauten Raum (aus Stein, Beton, Holz, …) - über den gestalteten Raum (Innenarchitektur, Möblierung) - bis zum ausgestatteten Raum (z.B. Technik, Dekoration) reicht. 1 Insbesondere zwischen der Gestaltung und der Ausstattung von Räumen gibt es fließende Grenzen. Man sieht das etwa mit Blick auf den Status des Mobiliars, das mehr oder weniger fest verankert sein kann wie die Sitzrei- 1 Dieser weite Begriff von Architektur entspricht dem Terminus ‘built environment’, wie ihn Lawrence/ Low (1990, S. 454) verwenden, um aus anthropologischer Sicht einen ebenso detaillierten wie umfassenden Überblick über unterschiedliche Ansätze zur Beschreibung von Wechselwirkungen zwischen architektonischen Erscheinungsformen und sozialen Verhaltensweisen zu geben. Heiko Hausendorf / Reinhold Schmitt 28 hen in einem Hörsaal oder auch mehr oder weniger frei beweglich sein kann wie die Klappstühle, die in einem Kirchenraum vor den fest montierten Sitzreihen aufgestellt worden sind. (Be-)Bauung, Gestaltung und Ausstattung sind für uns deshalb nicht mehr als Stichworte für das, was uns am Raum im Hinblick auf seine interaktionsarchitektonischen Implikationen interessiert: sinnlich wahrnehmbare (also sensorisch und motorisch erfahrbare) und entsprechend empirisch dokumentierbare Erscheinungsformen von Architektur, die es - auch im Hinblick auf ihren Grad an Statik und Dynamik der Verankerung im Raum - zu beschreiben gilt (im Folgenden kurz: architektonische Erscheinungsformen). Architektonische Erscheinungsformen (gebauter, gestalteter und ausgestatteter Raum) sind dabei immer schon Ausdruck und Manifestation gesellschaftlich wie kulturell vermittelter und geprägter Interaktionsorientierungen, die Raumnutzern vertrautheitsabhängig im Sinne handlungspraktischer Wissensgrundlagen zur Verfügung stehen. Die Frage nach der Interaktionsarchitektur eines Raums ist also eng mit dem verbunden, was am Raum unter sozialgeografischen (inklusive semiotischen, kulturwissenschaftlichen, soziologischen und ästhetischen) Gesichtspunkten interessant ist. Wir fassen das unter dem (aus der Sozialstrukturanalyse bekannten) Begriff der „Sozialtopografie“ (Schmitt 2013a; Hausendorf/ Schmitt 2013), die in konkreten Raumnutzungen Anwesender als kognitive Ressource (als sozialtopografisches Wissen) wie selbstverständlich ausgenutzt und in konkreten Raumnutzungen auch sichtbar (und für uns analysierbar) gemacht wird. ‘Interaktionsarchitektur’ und ‘Sozialtopografie’ sind Stichworte für Konzepte, die in der linguistischen wie konversationsanalytischen Interaktionsanalyse nicht eingeführt sind. Sehr lange haben wir Räumlichkeit als Aspekt von Anwesenheit mehr oder weniger vernachlässigt (im Gegensatz etwa zu Zeitlichkeit: vgl. Hausendorf 2010). Im Zuge der Neubelebung von Videoaufzeichnungen als Grundlage der linguistischen Interaktionsforschung hat die Aufmerksamkeit dann primär der multimodalen Konstitution räumlicher Ressourcen gegolten, also dem Interaktionsraum als dem mit und durch Interaktion geschaffenen/ genutzten Raum - und nicht dem unabhängig von Interaktion dokumentierten Raum. 2 Da sich das Konzept ‘Interaktionsraum’ inzwischen in der multimodalen Konversationsanalyse als theoretischer Rahmen für die Analyse situierter Interaktion etabliert hat und zudem nicht im Zentrum unseres aktuellen Erkenntnisinteresses zählt, können wir uns hier mit einigen Verweisen 3 begnügen. 2 Programmatisch, methodologisch und methodisch kommt diese Analyse des strukturierten Raums (‘structured space’) den hier vorgeschlagenen Konzepten sehr nahe. 3 Zum ‘Interaktionsraum’ siehe beispielsweise die Beiträge Mondada (2007), Müller/ Bohle (2007), Schmitt/ Deppermann (2007) sowie Schmitt (2013a). Interaktionsarchitektur und Sozialtopografie 29 Eine bemerkenswerte Ausnahme innerhalb der Konversationsanalyse stellt die Fallstudie einer polizeilichen Vernehmung durch C. Le Baron und J. Streeck dar (Le Baron/ Streek 1997), weil sich die Autoren in dieser Studie nicht auf die Analyse der Interaktion während der Vernehmung beschränken, sondern auch den noch leeren Verhörraum für sich genommen im Hinblick auf seine eingebauten räumlichen Implikationen („built in spatial features“), seine Bedingungen und Beschränkungen („constraints“) anhand der Architektur (inklusive Möblierung) des Verhörraumes rekonstruieren (vgl. ebd. Kap. 2: „built space“, S. 4ff.). Das Interesse der Interaktionsanalyse hat bislang (von Ausnahmen wie Le Baron/ Streeck 1997 abgesehen) weniger den räumlichen Ressourcen selbst gegolten als vielmehr der Art und Weise ihrer interaktiven Relevantsetzung. Hier setzen unsere Überlegungen an: Architektonische Erscheinungsformen gibt es auch ohne Interaktion (interaktionsvorgängig und -nachträglich, also interaktionsüberdauernd), und sozialtopografisches Wissen manifestiert sich auch in der Raumnutzung schon einer einzelnen Person. Es gibt also, wie wir noch ausführen werden, ein Kontinuum an raumgebundenen Erscheinungsformen zwischen der Interaktionsarchitektur auf der einen Seite und dem Interaktionsraum auf der anderen Seite. Diesen Zwischenbereich bezeichnen wir als Sozialtopografie des Raums (Kap. 5). 4 Was den Stand der derzeitigen Analysen betrifft, gilt es zu berücksichtigen, dass wir zurzeit vorwiegend mit Daten arbeiten, die für die Zwecke der Interaktionsraumanalyse (also für die Analyse von Interaktion) erhoben worden sind. Aus der Beschäftigung mit diesen Daten ist das Interesse an Interaktionsarchitektur und Sozialtopografie „from the data themselves“ (Schegloff/ Sacks 1973) hervorgegangen. Mit den ausgewählten Daten konzentrieren wir uns zurzeit - auf Interaktion, die in speziell für den Vollzug bestimmter handlungspraktischer Anforderungen her- und eingerichteten, gesellschaftlich relevanten Funktionsräumen stattfindet, - auf fokussierte Interaktion (im Gegensatz zu nicht-fokussierter Interaktion sensu Goffman 1963), - dabei auf den Typus der institutionalisierten, d.h. im Hinblick auf einen speziellen gesellschaftlichen Funktionsbereich organisierten Interaktion, sowie - auf Interaktion in (Groß-)Gruppen, also auf Interaktion mit mehr als zwei Teilnehmer/ innen (‘multi party interaction’ im Gegensatz zur Interaktionsdyade). 4 In den Worten von Le Baron/ Streeck (1997, S. 6): „Participants (and analysts alike) may recognize that built spaces and artifacts are symbolically preordained, that they constitute a material culture, that they divulge information about potential use.“ Heiko Hausendorf / Reinhold Schmitt 30 Auch wenn diese Datenauswahl nicht auf Verabredung und eben auch nicht mit dem Ziel der Interaktionsarchitekturanalyse herbeigeführt worden ist, ist sie gleichwohl nicht zufällig und willkürlich. Speziell der Zusammenhang von Institutionalisierung der Interaktion einerseits und Ausdifferenzierung von architektonischen Erscheinungsformen als materialem Ausdruck dieser Institutionalisierung andererseits erscheint uns heuristisch sehr aufschlussreich für die Programmatik von Interaktionsarchitektur und Sozialtopografie. 5 Wir wollen im Folgenden zunächst darauf eingehen, wie sich die Programmatik der Interaktionsarchitektur von der Tradition der Multimodalitätsforschung unterscheidet, aus der sie hervorgegangen ist (Kap. 2). Sodann gilt es, den Fluchtpunkt der Interaktionsarchitekturanalyse zu bestimmen: Aus interaktionstheoretischer Perspektive geht es darum, architektonische Erscheinungsformen möglichst als Lösungen für interaktive Probleme zu rekonstruieren (Kap. 3). Eine wichtige methodologische Implikation der Zuwendung zur Interaktionsarchitektur betrifft dabei die Unterscheidung von tatsächlich vollzogener Interaktion zu möglich und wahrscheinlich gemachter Interaktion: Während die Multimodalitätsforschung tatsächlich vollzogene Interaktion zum Gegenstand hat, beschäftigt sich die Interaktionsarchitekturanalyse mit dem, was durch Architektur interaktiv erwartbar gemacht worden ist (Kap. 4). Dazu gehören Erwartbarkeiten im Hinblick auf das, was durch Architektur sichtbar, greifbar, bewegbar, begehbar, verweilbar und so weiter gemacht wird. Wir sehen in diesen Erwartbarkeiten interaktionsarchitektonische Basisimplikationen, die mit der Situierung der Interaktion zu tun haben. Es gehören dazu aber auch stärker wissensabhängige Erwartbarkeiten im Hinblick auf konkrete Raumnutzungen innerhalb sozialer Praktiken und Handlungszusammenhänge, die mit der oben eingeführten Sozialtopografie zu tun haben. 6 Auf das Verhältnis von Interaktionsarchitektur und Sozialtopografie ist deshalb näher einzugehen. Das ist auch deshalb notwendig, weil es die methodologisch wichtige Frage berührt, wie viel an Verfremdung oder 5 Der hier postulierte Zusammenhang von Gesellschaft und Architektur ist schon früh gesehen und thematisiert worden - dabei wohl nicht zufällig von Anfang an mit Bezug auf Religion (vgl. die klassische Studie von E. Durkheim (1965, zuerst: 1912) und weitere Hinweise bei Lawrence/ Low 1990, S. 456f.). In neueren architektursoziologischen Ansätzen haben diese Überlegungen ein aktuelles Echo gefunden (vgl. dazu die weiterführenden Hinweise im Beitrag von Hausendorf/ Kesselheim i.d.Bd.). 6 Le Baron/ Streeck (1997, S. 2) sprechen dazu von einer sozial-symbolischen Ordnung („socialsymbolic order“), die durch Räume für Interaktion zur Verfügung gestellt wird. Räume sind in dieser Hinsicht symbolisch vor(her)bestimmt und vorstrukturiert („symbolically preordained“), und sie können als solche bestimmte Aktivitäten und Beziehungen bestimmen (wenn auch in flexibler Weise), die dann womöglich interaktiv realisiert werden („..., it [= the interrogation room, H.H./ R.S.] prescribes (albeit loosely) certain kinds of activities and relationships that may be eventually realized through social interaction“ (ebd., S. 4). Interaktionsarchitektur und Sozialtopografie 31 Vorwissen in unsere Raumanalysen jeweils eingehen (müsse und sollte). Hier erlaubt die Unterscheidung von Interaktionsarchitektur und Sozialtopografie eine differenzierte Auskunft (Kap. 5). Mit der Analyse von Interaktionsarchitektur begeben wir uns als Linguisten und Interaktionsanalytiker auf Neuland. Das lässt sich schon an der Frage ermessen, wie die genuinen Daten der Interaktionsarchitektur- und Sozialtopografieanalyse beschaffen sind 7 und welche Verfahren ihrer Analyse sich zurzeit als besonders erfolgversprechend abzeichnen (vgl. dazu die Beiträge im methodologischen Teil dieses Sammelbandes). Wie in den empirischen Fallanalysen deutlich wird, kommen wir mit unseren Raumanalysen auch wieder zurück zur Interaktions(raum)analyse, wobei sich die Sozialtopografieanalyse als Mittler zwischen Interaktionsarchitektur- und Interaktionsraumanalyse bewährt. Gleichwohl fühlen sich die Beiträge in diesem Band - wie ihre analytische Ausarbeitung zeigt - in unterschiedlicher Weise und Enge den beschriebenen konzeptionellen Grundlagen verpflichtet. Man kann sie in einem Kontinuum verorten, das sich zwischen den beiden Polen „eigenständige Relevanz“ bis hin zur „impliziten Thematisierung/ Mitbehandlung interaktionsarchitektonischer und sozialtopografischer Aspekte bei der Interaktions(raum)analyse“ spannt. Dies ist kein Versehen, sondern gewollt. Es spiegelt unsere Orientierung wider, unsere Vorstellung interaktionistischer Raumanalyse als eigenständigen Ansatz im Forschungsfeld der linguistischen Interaktionsanalyse zu etablieren, sie jedoch nicht als Alternative und Konkurrenz zu bereits etablierten Ansätzen zu verstehen. Unsere raumanalytischen Vorstellungen stellen schon deswegen keine Konkurrenz zu klassischen Ansätzen - wie beispielsweise der Konversationsanalyse - dar, weil damit Fragestellungen formuliert und Gegenstände konstituiert werden, die (noch) außerhalb des konversationsanalytischen Erkenntnisinteresses liegen und mit den dort geltenden methodologischen Grundlagen und methodischen Verfahren auch nicht (mehr) bearbeitet werden können. In diesem Sinne verstehen wir unseren raumanalytischen Ansatz als notwendige Ergänzung, der jedoch - das sollte man nicht übersehen - Auswirkungen auf die Schwerpunktsetzung und den Gebrauch etablierter Konzepte hat, die im konversationsanalytischen Forschungskontext zur Anwendung gelangen. 2. Raum als interaktive Ressource und Interaktionsarchitektur Interaktionsarchitektur steht für eine Konkretisierung der innerhalb der Multimodalitätsperspektive gewonnenen Einsicht in den Raum als interaktive Ressource. Im Mittelpunkt des Raum-als-Ressource-Konzeptes (Hausendorf/ 7 Als einen ersten Schritt zur Beantwortung dieser Fragen haben wir inzwischen eine auf methodologischem Erkenntnisinteresse basierende Datenkonstitution für raumanalytische Untersuchungen durchgeführt (Schmitt i.Vorb.). Heiko Hausendorf / Reinhold Schmitt 32 Mondada/ Schmitt (Hg.) 2012) steht der Nachweis, dass und wie im Interaktionsvollzug (innerhalb einer dokumentierten Interaktionsepisode) Aspekte der räumlichen (inklusive architektonischen) Umgebung interaktiv relevant gemacht werden können, so dass sie Teil des ‘Interaktionsraums’ werden. Diese Raum-als-Ressource-Analyse ist zwingend auf die Analyse von Interaktion (und entsprechend auf die Dokumentation von Interaktion) angewiesen. Sie muss anhand der Erscheinungsformen der Interaktion zeigen können, ob und wie beispielsweise eine bestimmte Sitzordnung in einem Raum als solche im Vollzug einer konkreten Interaktion für das, was passiert, von Bedeutung oder auch nicht von Bedeutung ist, weil sich die Teilnehmer der fraglichen Interaktion z.B. gar nicht hinsetzen, sondern an der Tür des Raums verweilen. In unserem fallanalytischen Beitrag in diesem Band analysieren wir ein Standbild, das zeigt, wie sich ein Sprecher nicht etwa auf einen der neben ihm befindlichen vier Stühle setzt, sondern seine Hand auf die Rückenlehne eines der Stühle legt (Bild 1): 1 Offenkundig entspricht diese Nutzung nicht dem, was man interaktionsarchitektonisch über die Implikationen dieser vier Stühle aussagen kann (u.a. und sehr grob: Sitzen als präferierte Präsenzform). Und doch profiliert sich diese Nutzung ihrerseits gerade als Abwahl der nahegelegten Implikation(en), die es interaktionsarchitektonisch vorgängig zu rekonstruieren gilt. Bei der Analyse der Interaktionsarchitektur geht es deshalb nicht um faktische Interaktionen und Nutzungen, sondern um das Möglich- und Wahrscheinlich- Machen von Interaktion und Nutzung durch Architektur. Diese Analyse ist deshalb nicht auf die Analyse von Interaktion (und entsprechende Dokumente der Erscheinungsformen von Interaktion) angewiesen - wiewohl ihr Fluchtpunkt natürlich die Interaktionsanalyse bleibt. Auch wenn sich z.B. zeigen lässt, dass in einer konkreten Interaktion eine im Raum qua Bestuhlung mani- Interaktionsarchitektur und Sozialtopografie 33 festierte Sitzordnung für diese Interaktion nicht von Relevanz ist, gehört die Bestuhlung fraglos zu den architektonischen Erscheinungsformen. In diesen drücken sich Implikationen für das aus, was mit und durch Architektur im fraglichen Raum erwartbar gemacht worden ist und deshalb zwangsläufig auch interaktiv mit jeder denkbaren Nutzung irgendwie „bearbeitet“ wird. Benötigt wird deshalb eine Dokumentation der architektonischen Erscheinungsformen, z.B. in Form einer Fotografie oder eines Standbildes, auf der bzw. dem die fragliche Bestuhlung sichtbar ist. In den Raum-als-interaktive- Ressource-Analysen haben wir architektonische Erscheinungsformen bislang nur dann einbezogen, wenn und in dem Maße, in dem sie auch tatsächlich ge- und benutzt worden sind. Bei der Interaktionsarchitekturanalyse sollen diese Erscheinungsformen nun möglichst exhaustiv erfasst und eigenständig und rigoros analysiert werden. Das verändert sowohl die Art der Daten als auch die der Fragestellung, wie wir im Folgenden Schritt für Schritt verdeutlichen wollen. 3. Architektur als Lösung für Interaktionsprobleme Wenn wir uns für Architektur interessieren, geht es uns dabei nicht um eine vorgängig sozialgeografisch (semiotisch, kulturwissenschaftlich, soziologisch oder ästhetisch) motivierte Analyse, wie sie in den letzten Jahren vermehrt postuliert wird (vgl. dazu z.B. Glasze/ Mattissek (Hg.) 2009; Gleiter 2014; Hauser et al. (Hg.) 2011; Pfaffenthaler et al. (Hg.) 2014). Unsere Architekturanalyse ist interaktionistisch motiviert: Ihren Fluchtpunkt bilden die Relevanzen und Implikationen, die von den architektonischen Erscheinungsformen eines Raums für die in diesem Raum stattfindenden Interaktionen ausgehen. Die interaktionstheoretische Perspektive, die hinter diesem Interesse steht, ist, architektonische Erscheinungsformen als Lösungen interaktiver Probleme bzw. Aufgaben zu rekonstruieren. Naturgemäß betrifft das zunächst und grundlegend Interaktionsprobleme, die mit dem zu tun haben, was als „Situierung“ bzw. „situational anchoring“ beschrieben werden kann (Hausendorf 2010, S. 169ff.; 2013). Die Verankerung der Interaktion in einer konkreten Situation betrifft nicht nur eine Sprech- und Zuhörsituation, sondern immer auch eine Wahrnehmungs-, Bewegungs- und Handlungssituation. Es geht also um grundlegende Aspekte der interaktiven Präsenz der im Raum Anwesenden (Sitzen, Stehen, Liegen, Herumlaufen etc.) und den basalen Beteiligungsweisen in einer je spezifischen sozialen Praxis (reden, zuhören, arbeiten, kooperieren, zuschauen etc.). Hier scheinen die basalen Hinweise und Beiträge der Interaktionsarchitektur zu liegen, gegenüber denen Beiträge zur Lösung anderer konstitutiver Interaktionsprobleme (wie etwa der Themen- oder Sprecherwechselorganisation) nachgeordnet schei- Heiko Hausendorf / Reinhold Schmitt 34 nen. Probleme der Situierung umfassen Aspekte der Herstellung gemeinsamer Wahrnehmungen (Ko-Orientierung), der Abstimmung der Bewegungen aufeinander (Ko-Ordinierung) und der Beteiligung an einer gemeinsamen sozialen Praxis (Ko-Operation). Die Frage ist dann, in welcher Weise architektonische Erscheinungsformen Wahrnehmungen, Bewegungen und Handlungen unter Anwesenden nahelegen und auf diese Weise „vorstrukturieren“ können. Das ist die Stelle, an der sich interaktionsarchitektonische Basisimplikationen bewähren, mit denen wir inzwischen zu arbeiten gelernt haben. Implikationen von Interaktionsarchitektur im Sinne von - Sichtbarkeit, - Hörbarkeit, - Be-Greifbarkeit, - Begehbarkeit, - Betretbarkeit, - Verweilbarkeit oder - Be-Handelbarkeit lenken die analytische Aufmerksamkeit darauf, wie durch architektonische Erscheinungsformen Wahrnehmungen, Bewegungen und Handlungen in einer grundlegenden Weise ermöglicht und erwartbar gemacht werden. Bei diesen Basisimplikationen handelt es sich um den Versuch, die Struktur basaler, für die Ermöglichung von Interaktion grundlegender Voraussetzungen von Räumen zu fokussieren. Diese interaktionsarchitektonischen Implikationen entstehen zunächst auf einzelfallanalytischer Grundlage, ihre primäre Funktionalität besteht jedoch darin, einzelfalltranszendierende Aspekte zur Verfügung zu stellen, mit denen prinzipiell alle Räume systematisch miteinander verglichen werden können, die für interaktive Nutzung hergerichtet wurden. Aus der fallspezifischen Erkenntnisperspektive ergibt sich also eine strukturbezogene allgemeine Begrifflichkeit. Ihre Aufgabe ist es, die fallanalytisch rekonstruierte, in ihrer interaktionsräumlichen Relevanz jedoch allgemeingültige Bedeutung zu klären und auszudifferenzieren. Ziel dieser Begrifflichkeit ist es, die Qualifizierung der basalen Grundkonzepte zu ermöglichen und - immer auf der Ebene interaktionsarchitektonischer Implikationen - soweit es geht, auszudifferenzieren und subkategorial aufzuschließen. Eine solchermaßen ausdifferenzierte und subkategorial erschlossene Begrifflichkeit ermöglicht nicht nur die Kontrastierung unterschiedlicher Räume/ Raumtypen, sondern besitzt auch raumanalytische Orientierung für systematische Einzelfallanalysen. Interaktionsarchitektur und Sozialtopografie 35 Die Komplexität und analytische Fruchtbarkeit der einzelnen Kategorien kann man sich gut am Beispiel von ‘Sichtbarkeit’ klarmachen. Wer oder was wird durch den Raum sichtbar gemacht? Schon in einer solchen Frage stecken sehr weitgehende Strukturimplikationen. Denn nur unter spezifischen Bedingungen ist ein Aspekt im Raum z.B. perspektivenunabhängig sichtbar. Perspektive und Perspektivität sind also für Interaktionsarchitektur relevante Konzeptimplikationen von Sichtbarkeit. Eine weitergehende Frage könnte dann beispielsweise lauten: Lassen sich prototypische, in den architektonischen Erscheinungsformen manifestierte Perspektivitätsstrukturen finden und zur interaktionsräumlichen Typisierung nutzen? Hierhin gehören offensichtlich Unterscheidungen wie die zwischen Hinten und Vorne, Unten und Oben, aber auch die von Innen und Außen, die auf eine Art Relevanzstruktur von Sichtbarkeit als Wahrnehmungsangebot verweisen. So bildet das folgende Standbild vom Kirchenraum (Bild 2), auf das wir in Hausendorf/ Schmitt (i.d.Bd.) ausführlich eingehen werden, in heuristisch fruchtbarer Weise eine im Gegenstandsbereich selbst erzeugte Relevanzstruktur von Sichtbarkeit ab: 2 Die Orientierung der Kamera auf den Altarraum folgt einer interaktionsarchitektonisch erwartbar gemachten und sozialtopografisch vertrautheitsabhängig sofort mitverstandenen Fokussierung auf ein interaktionsräumliches Vorne. Zu rekonstruieren ist dann, wie eine solche Relevanzstruktur interaktionsarchitektonisch erwartbar gemacht wird. Weitere Fragen, die sich hier anschließen, lauten (ohne Anspruch auf Vollständigkeit und Systematik): - Ist das Sichtbar-Gemachte objekthaft und selbst der Gegenstand der Wahrnehmung? - Hat das Sichtbar-Gemachte eher die Qualität eines Relevanzrahmens, der einen Fokus für Wahrnehmung anbietet/ festlegt, selbst jedoch nicht das Sichtbare repräsentiert? - Handelt es sich um interaktionsarchitektonisch konstituierte Bereiche, in denen Demonstrationen für Wahrnehmung konstituiert werden sollen/ können? Heiko Hausendorf / Reinhold Schmitt 36 - Gibt es also interaktionsarchitektonisch installierte Demonstrationsräume, die die Wahrnehmung auf sich ziehen? - Wie wird diese Wahrnehmungsstrukturierung bzw. -fokussierung weiterhin interaktionsarchitektonisch unterstützt? - Was wird durch Interaktionsarchitektur „gezeigt“? - Wie wird die Wahrnehmungsperspektive festgelegt? - Ist die Sichtbarkeit egalitär und ausgeglichen? - Oder handelt es sich um eine Form privilegierter oder herausgehobener Sichtbarkeit? Fragen wie diese erlauben auch einen eigenen, gewünscht verfremdeten Zugang zu alltäglichen und scheinbar selbstverständlichen architektonischen Grundelementen. Beispielsweise versteht sich die Interaktionsarchitektur einer Wand im Gegensatz zu der eines Fensters auch und gerade vor dem Hintergrund der Implikationen von Sichtbarkeit. Die mit einer Wand geleistete Trennung (z.B. gemäß einer Unterscheidung von Innen und Außen) wird durch ein Fenster tendenziell durchlässig (transparent) gemacht. Mit einem Fenster kann die Raumarchitektur fallweise Aspekte von Außenwelt sichtbar machen, die für das, was in der Innenwelt passiert, kontingent sind - wie im Klassenzimmer (Schmitt/ Dausendschön-Gay 2015; Dausendschön-Gay/ Schmitt i.d.Bd.), das wir analysiert haben (Bild 3): 3 Es können mit einem Fenster aber auch Aspekte weiterer Innenräumlichkeit und ‘Verschachtelung’ zugänglich gemacht werden, die für das, was im ‘Kern’ passiert, sehr wohl von großer Bedeutung sein können wie beispielsweise im Ton-und Aufnahmestudio (Mondada/ Oloff i.d.Bd.). Schließlich wäre, was Transparenz betrifft, auch an die „Vitrinen“ im Ausstellungsraum zu denken, die noch einmal neue interaktionsarchitektonische Implikationen von Sichtbarkeit in den Blick kommen lassen (Demonstrierbarkeit und Zeigbarkeit: Kesselheim 2010). Was ein Fenster (oder Glas als Baustoff) interaktionsarchi- Interaktionsarchitektur und Sozialtopografie 37 tektonisch leistet, ist also mit dem Lexem ‘Fenster’ nur sehr unzureichend und gleichsam alltagsweltlich-naiv erfasst und verstanden. Weitreichender wäre dann schon der Hinweis auf visuelle Transparenz, auf visuell durchsichtige Flächen, auf Durch- und Einsichten, die in der Einrichtung eines Fensters materialisiert sind und darin eine architektonisch vorgeformte und vielfältig ausdifferenzierte Errungenschaft gefunden haben. Am Beispiel von Sichtbarkeit kann man sich schließlich weiter klarmachen, dass wir, wenn wir Sichtbarkeit interaktionsarchitektonisch rekonstruieren, auch die Frage einschließen müssen, ob die architektonischen Erscheinungsformen eines Raums tatsächlich zur Ko-Orientierung beitragen bzw. ganz auf Ko-Orientierung und damit auf Interaktion angelegt sind. Geht es darum, die Herstellung eines einheitlichen, gemeinsamen Wahrnehmungsraums zu unterstützen oder umgekehrt die Herstellung jeweils isolierter Wahrnehmungsräume zu ermöglichen (was analog natürlich auch für Bewegung und Handlung gilt). Es gibt Räume, in denen diese Unterscheidung banal erscheint. Ein Hörsaal (Hausendorf 2012a, 2012b) ist von seiner Interaktionsarchitektur her ein Interaktionsraum, der die Ko-Orientierung in großen Gruppen sicherstellen kann und deshalb wie „unausgeschöpft“ (und unpassend) erscheint, wenn man darin allein oder zu zweit verweilt - und wenn es niemanden im Vorne gibt, auf den man sich dabei orientiert. In diesem Sinne wird der Hörsaal - genau wie der Klassenraum - durch eine interaktionsarchitektonisch implementierte „gegenläufige Sichtbarkeit“ (Dausendschön-Gay/ Schmitt i.d.Bd.) charakterisiert. 8 Eine Gästetoilette in einer Privatwohnung ist von ihrer Interaktionsarchitektur her umgekehrt offensichtlich kein Interaktionsraum (Wahrnehmungswahrnehmung und Bewegungskoordinierung wären hier prekär, so die Hinweise der Architektur). Schon für eine öffentliche Toilette, denken wir an ein Pissoir mit einer Reihe von Urinalen, gilt das nicht mehr uneingeschränkt. Und es gibt eben auch Räume, in denen diese Unterscheidung empirisch und analytisch hoch anspruchsvoll ist (wie es sich am Beispiel des Ausstellungsraums zeigen lässt: Kesselheim/ Hausendorf 2007). Empirisch ist deshalb stets zu beachten, dass Situierung Interaktion impliziert und die Implikationen, die uns interessieren, sich darauf richten, ob und wie Wahrnehmungen, Bewegungen und Handlungen Einzelner durch architektonische Erscheinungsformen tatsächlich den Status interaktiv relevanter Aktivitäten erhalten - oder ob Architektur gerade umgekehrt Vorkehrungen bereitstellt, fokussierte Interaktion weitgehend zu vermeiden zugunsten nicht-fokussierten Verweilens oder mehr oder weniger selbstbezogener Aktivitäten (wie etwa einem „einsamen“ Ausstellungsbesuch unter gleichzeitig im Ausstellungsraum mitanwesenden Anderen). Diese Frage ist nicht etwa 8 Eine monodirektional gleichläufige Sichtbarkeit wird beispielsweise in Kinosälen realisiert, wo die Sitzreihen so ausgerichtet sind, dass alle Besucher nach vorne auf die Leinwand blicken. Heiko Hausendorf / Reinhold Schmitt 38 schon durch unser analytisches Interesse vorentschieden, sondern empirisch an die architektonischen Erscheinungsformen zu stellen und entsprechend auch empirisch zu beantworten. 4. Faktische vs. erwartbar gemachte Interaktion Es ist kein Zufall, dass in der Interaktionsarchitekturanalyse Termini wie ‘Sichtbarkeit’, ‘Hörbarkeit’, ‘Begehbarkeit’ und ‘Verweilbarkeit’ zu Schlüsselbegriffen werden. Zum einen drücken sich darin Implikationen für die Lösung von Situierungsaufgaben aus, zum anderen drückt sich im Wortbildungsmuster (speziell im Suffix -bar) der Fokus auf Möglichkeiten und Potentiale architektonischer Erscheinungsformen aus. 9 Dahinter steht zunächst die bewusste Abkehr von der in einem bestimmten Raum faktisch vollzogenen Interaktion. Nur so ist es möglich, die Interaktionsarchitekturanalyse vor dem Einwand zu schützen, dass immer und grundsätzlich Interaktionen denkbar sind, in denen Situierungen (also Raumnutzungen) auftreten, die mit den rekonstruierten Implikationen nicht vereinbar sind bzw. durch die diese Implikationen interaktiv außer Kraft gesetzt werden. 10 Kein Raum ist davor gefeit, dass darin etwas passiert, was seinen interaktionsarchitektonischen Implikationen zuwiderläuft. Wenn die Architektur eines Raums also prinzipiell nicht determinieren kann, was darin an Interaktion passiert (entgegen den Ansichten mancher Ausstellungsarchitekten), stellt sich die Frage, wie anders der Status interaktionsarchitektonischer Implikationen zu fassen ist. Dafür reicht der Gegensatz von faktisch vs. möglich nicht aus. Schon die Rede von Implikationen geht ja über die Ermöglichung zugunsten des Nahelegens hinaus. Wenn wir uns für Interaktionsarchitektur interessieren, interessiert uns ja gerade nicht die Kontingenz bloß möglicher (weder unmöglicher noch notwendiger und in diesem Sinne „zufälliger“) Situierungen. Was uns interessiert, ist das an Situierung, was durch Architektur möglich und naheliegend und in diesem Sinne „wahrscheinlich“ gemacht wird (Luhmann 1981). Es geht, in einer anderen Sprache, um die in den architektonischen Erscheinungsformen immer schon impliziten Interaktanten (im Sinne des impliziten Lesers), nicht um die „realen“ Interaktanten aus Fleisch und Blut. Alles, was in einem Raum an Interaktion geschehen mag, geschieht deshalb, so die These, vor dem Hintergrund seiner interaktionsarchitektonischen Im- 9 Das verbindet unsere Implikationen mit den „affordances” aus der ecological psychology (wie z.B. „walk-on-ability“ bei Gibson 1977). Vgl. zu diesen Parallelen und zu den Unterschieden die Hinweise bei Hausendorf/ Kesselheim (i.d.Bd.). 10 Dies ist ein häufig aus konversationsanalytischer Perspektive vorgebrachtes Argument (vgl. Hausendorf 2013), insbesondere mit Bezug auf den Status von Objekten in der Interaktion (vgl. z.B. Hinweise bei Pitsch 2012 und Nevile et al. 2014). Interaktionsarchitektur und Sozialtopografie 39 plikationen. Worauf es hier ankommt, lässt sich interaktionstheoretisch aus den Grundprinzipien der Sequenzanalyse als die Manifestation von Erwartungen explizieren. So wie ein Redebeitrag Erwartungen an mögliche nächste Beiträge manifestiert (im Falle von Paarsequenzen z.B. im Sinne unmittelbar lokaler Zugzwänge), manifestieren sich in architektonischen Erscheinungsformen Erwartungen an Situierungsaktivitäten von Anwesenden. Wie in und mit Interaktion mit diesen Erwartungsmanifestationen umgegangen wird, ist dann schon eine andere Frage. Unter dem Stichwort der Interaktionsarchitektur interessiert uns zunächst nur die erwartbar gemachte Interaktion - genauer gesagt: wie mit und durch architektonische(n) Erscheinungsformen Situierungen erwartbar gemacht werden. Wenn man unter ‘Normen’ „Erwartungserwartungen“ (Luhmann 1969) versteht, also durch und mit Interaktion erwartbar gemachte Erwartungen, kann man auch sagen, dass sich in Architektur Normen von Situierungen unter Anwesenden (und in diesem Sinne: Interaktionsnormen) manifestieren und materialisieren. Vereinfacht gesagt: In den aufsteigenden, fest montierten Sitzreihen mit aufklappbaren Schreibflächen eines Hörsaals manifestiert sich die Erwartung, dass sich Interaktionsteilnehmende in großer Zahl als nach vorne und unten orientierte Zuhörer und Zuschauer mit der entsprechenden Aufmerksamkeits-, Sitz-, Verweil- und Mitschreibdisziplin am Interaktionsereignis Vorlesung beteiligen (Bild 4). 4 Die Architektur der Sitzreihen materialisiert diese Erwartung - und macht sie in genau diesem Sinne selbst erwartbar (als Erwartungserwartung bzw. Norm). Das lässt sich sehr weitgehend an den Details der wahrnehmbaren architektonischen Erscheinungsformen selbst ablesen, die auf diese Weise als Lösung für ein spezifisches Situierungsproblem des Typs Vorlesung rekonstruiert werden können (Hausendorf 2012a). Heiko Hausendorf / Reinhold Schmitt 40 5. Interaktionsarchitektur und Sozialtopografie Sozialtopografische (inklusive semiotische, kulturwissenschaftliche, soziologische und ästhetische) Dimensionen architektonischer Erscheinungsformen sind für uns in dem Maße von Interesse, wie sie dazu beitragen können, interaktionsarchitektonische Implikationen für die Situierung der Interaktion zu rekonstruieren. In dem Maße, in dem die interaktionsarchitektonischen Implikationen eines Raums - z.B. im Hinblick auf die Art und Weise, wie sich Interaktionsteilnehmer in diesem Raum bewegen können und sollten - zeichenhaft, kulturell, gesellschaftlich und formal geprägt und aufgeladen sind, ist auch die Analyse dieser Implikationen auf semiotische, kulturwissenschaftliche, soziologische und architekturästhetische Expertise angewiesen. Interaktionstheoretisch kann man sich das am Übergang zu weiteren Interaktionsproblemen klarmachen, die mit der Situierung in der Regel überlappend bearbeitet und „gelöst“ werden. Dazu gehören z.B. Interaktionsprobleme, die mit der Rahmung (Kontextualisierung) der Interaktion und der Selbst- und Fremdpositionierung der Anwesenden zu tun haben. Je stärker die architektonischen Erscheinungsformen eines Raums Ausdruck einer Institutionalisierung und Organisation der Kommunikation sind (was für die Art von Interaktionsereignissen, mit denen wir uns zur Zeit beschäftigen, in der Regel zutrifft), desto stärker gehen von diesen Erscheinungsformen auch Implikationen für die Rahmung (was geht hier gerade vor? ) und für die Aufgabenteilung unter den Beteiligten (wer macht was? ) aus. Anders gesagt: Mit der Situierung (z.B. der Etablierung eines wahrnehmungsrelevanten „Vorne“) geht dann die Rahmung und Positionierung Hand in Hand. Wenn man z.B. an die von uns behandelten Fälle des ‘Kirchenraums’ und des ‘Hörsaals’ denkt, sind mit den architektonischen Erscheinungsformen dieser Räume also durchaus Implikationen für den relevanten Kontext (‘Gottesdienst’ bzw. ‘Vorlesung’), für die Positionierung (‘Pfarrer’ und ‘Gemeinde’ bzw. ‘Dozent’ und ‘Studierende’) und weitergehend sogar noch für die Interaktionseröffnung, die Organisation des Rederechts und der Redegegenstände (Themen) materialisiert. Interaktionsarchitektonische Implikationen lassen sich also recht weitgehend an architektonischen Erscheinungsformen festmachen. Freilich braucht es dafür Vertrautheit und Vorwissen. Anders gesagt: Solche Implikationen können empirisch immer nur wissens- und vertrautheitsabhängig zur Geltung kommen. Das gilt schon für unsere Basiskonzepte von Sichtbarkeit und andere, auf Sensorik und Motorik von Anwesenden, also auf Wahrnehmung und Bewegung bezogene Konzepte: Sichtbar ist etwas immer nur für jemand, der wahrnimmt und wahrnehmen kann, begehbar immer nur für jemand, der geht und gehen kann, womit z.B. sofort sensomotorische Voraussetzungen und Ausstattungen des Wahrnehmenden, aber z.B. auch eine bestimmte Wahrnehmungsperspektive verbunden sind. Analytisch macht sich das in Interaktionsarchitektur und Sozialtopografie 41 dem Maße bemerkbar, wie wir von der Lösung der basalen Situierungsaufgaben, die sich sehr weitgehend an der sensomotorischen Ausstattung des Menschen festmachen lassen, zur Lösung weitergehender Interaktionsaufgaben übergehen, die mit der Spezifik der sozialen Praxis und den sozialen Praktiken zu tun haben, die in bestimmten architektonischen Erscheinungsformen ihr „soziales Zuhause“ gefunden haben. Genau hier macht sich der eingangs erwähnte Zusammenhang von Institutionalisierung der Interaktion einerseits und der architektonischen Erscheinungsformen andererseits bemerkbar. ‘Kirchenraum’ und ‘Hörsaal’ sind jeweils das soziale Zuhause einer institutionalisierten sozialen Praxis (‘Gottesdienst’ und ‘Vorlesung’), in deren Dienst dann natürlich auch von Beginn an Wahrnehmung und Bewegung gestellt werden. Wenn Anwesende solche Räume für ihre soziale Praxis nutzen (allein oder gemeinsam mit anderen), müssen sie nicht jedes Mal mit einer interaktionsräumlichen Analyse beginnen, bevor oder wenn sie den Raum wahrnehmen und sich darin bewegen. Vielmehr greifen sie vor allem bei der Nutzung relevanter Funktionsräume auf gesellschaftlich vorhandenes Raumnutzungswissen zurück, beantworten also gewissermaßen schon mit dem, was sie überhaupt wahrnehmen und wo und wohin sie gehen, die Fragen des Raums. Anwesende „lesen“ den Raum, indem sie ihn benutzen - und machen ihre Lesart von der Sozialtopografie des Raums durch ihre Nutzung sicht- und analysierbar. In diesem Sinne gibt es analog zur Lesbarkeit des Textes eine Nutzbarkeit des Raums, die auf „Benutzbarkeitshinweisen“ beruht (wie das Lesen eines Textes auf Lesbarkeitshinweisen beruht), die Raumnutzern vertrautheits- und wissensabhängig zur Verfügung stehen oder nicht (vgl. Hausendorf 2012b und den Beitrag von Hausendorf/ Kesselheim i.d.Bd.). Personen nutzen qua Anwesenheit die interaktionsarchitektonischen Potenziale für ihre situativen Zwecke jeweils in spezifischer Weise. Diese Nutzung entsteht im Spannungsverhältnis der interaktionsarchitektonischen Implikationen und einer sozial und kulturell vermittelten Kompetenz der Raumnutzer. Anwesenden erscheint der Raum (in vielen Fällen) als sozial strukturiert und auf spezifische, usuelle Weise für bestimmte Zwecke nutzbar gegeben. Für sie existiert der Raum als Teil alltagsweltlich-fragloser Haltungen und auf der Grundlage von „common ground“ nicht als Struktur interaktionsarchitektonisch ermöglichter Sicht-, Hör-, Greif- Betret-, Begeh- und Verweilbarkeit, sondern als sozialtopografisch strukturierter Raum. Damit ist nicht ausgeschlossen, dass es für die Realisierung bestimmter praktischer Zwecke in einer Situation nicht auch notwendig werden kann, die interaktionsarchitektonischen Potenziale zu erkunden und zur Zweckrealisierung zu nutzen. Und natürlich geht man sinnvollerweise davon aus, dass Raumnutzer in der Lage sind, dies in der alltagsweltlich notwendigen Präzision und Effektivität zu Heiko Hausendorf / Reinhold Schmitt 42 tun. Worauf es ankommt, ist: Es gibt ein Wissen (im Sinne einer raumkognitiven Vertrautheit), das es Anwesenden ermöglicht, sich Räume im Hinblick auf Wahrnehmungen, Bewegungen und Handlungen wie selbstverständlich anzueignen. Mit dem Konzept ‘Sozialtopografie’ sollen genau diese sozial und kulturell vermittelten und geprägten Orientierungen und handlungspraktischen Wissensgrundlagen von Raumnutzern erfasst werden. Sozialtopografie manifestiert sich in der Spezifik der multimodalen Raumnutzung als situationssensitive Interpretation der interaktionsarchitektonischen Implikationen des Raums. Als solche werden sie durch Anwesende und/ oder unter Anwesenden sichtbar (gemacht) und für uns analysierbar. Sozialtopografisches Wissen ist die zentrale Grundlage für die kulturell adäquate Nutzung von Räumen und ihrer interaktionsarchitektonischen Basisimplikationen. Dies gilt schon dann, wenn ein Einzelner einen Raum betritt, in dem sonst niemand anwesend sein oder hinzukommen mag. Es gilt weiter sowohl für soziale Situationen, in denen sich ein Einzelner in Gegenwart anderer Anwesender mit den Strukturen auseinandersetzt, die der Raum für seine kulturell adäquate Nutzung zur Verfügung stellt (etwa als Touristinnen und Touristen bei der Besichtigung einer Kirche), als auch für fokussierte Interaktionen in Räumen, bei denen mehrere oder sogar alle Anwesenden miteinander interagieren (etwa als Besucher/ innen eines Gottesdienstes oder einer Vorlesung). Dieses für Raumnutzung (alleine oder zusammen mit anderen Anwesenden) grundlegende Wissen lässt sich unter Bezug auf die Vorstellung von Cicourel (1975) in seinen sozialen Implikationen und seiner sedimentierten Qualität als „Normalform(-erwartung)“ verstehen. Cicourel (ebd., S. 34) erfasst mit dem Konzept „Normalform“ eine Orientierung, die er als das beschreibt, „was der alltägliche Sprecher-Hörer als das annimmt, was jedermann kennt. Die stillschweigende Kenntnis dessen, was jedermann kennt, ist also integraler Bestandteil des Normalformverhaltens der Mitglieder einer Gesellschaft“. Sozialtopografisches Wissen, das sich in der kulturspezifisch usuellen oder nicht-usuellen Nutzung interaktionsarchitektonischer Implikationen realisiert, ist also auch im Falle der alleinigen Nutzung eines Raums kein individuelles, sondern gesellschaftliches Spezialwissen. Es soll deshalb genau in dieser Qualität im vorliegenden raumreflexiven Zusammenhang aus seiner (bei Cicourel deutlichen) Bindung an verbale Interaktion gelöst werden. Gemäß dem theoretischen Postulat der Egalität aller Ausdrucksressourcen, das hinsichtlich der interaktionskonstitutiven Relevanz zwischen verbalem Ausdruck und anderen Ausdrucksformen nicht prinzipiell unterscheidet, und im multimodalen Erkenntnisinteresse an den verschiedenen Dimensionen, in Interaktionsarchitektur und Sozialtopografie 43 denen Raum für Interaktion relevant ist/ werden kann, wird es auf die kulturell adäquate und erwartbare Nutzung von Räumen übertragen. Diese Übertragung führt zu folgender Annahme: So, wie es für die Beteiligung an verbaler Interaktion spezifische Normalformerwartungen gibt, gibt es auch für die Nutzung von Räumen vertrautheits- und wissensabhängige Normalformerwartungen. Als spezialisierter Teil des für die Erhaltung und die Reproduktion gesellschaftlicher Strukturen relevanten Wissens regelt die der Sozialtopografie des Raums zugrundeliegende Normalformerwartung die situative Nutzung interaktionsarchitektonischer Implikationen. Die normalformerwartbare Nutzung erfolgt auf der Grundlage kultureller Vermittlung und Einübung und reflektiert, bestätigt und erneuert durch ihre Realisierung die spezifische Funktionalität des Raums - und sich selbst. Die Sozialtopografie ist eng verbunden mit der Interaktionsarchitektur. Sowohl die Sozialtopografie als auch die Interaktionsarchitektur sind interaktionsunabhängig und lassen sich entsprechend auch ohne Interaktionsdaten rekonstruieren. Die Konzepte fokussieren zwei zentrale Grundlagen für Raumnutzung, die sich im konkreten, raumbezogenen Interaktionsvollzug bei der Herstellung des Interaktionsraums durch Anwesende manifestieren und reproduzieren. Dabei verknüpfen wir mit der Interaktionsarchitektur die basalen Interaktionsimplikationen, die sich vor allem für Wahrnehmung und Bewegung aus den architektonischen Erscheinungsformen eines Raums ergeben (siehe die in Kap. 3 erläuterten Basiskonzepte) und die vergleichsweise wenig wissens- und vertrautheitsabhängig sind. Sie setzen lediglich Menschen im Vollsinne kognitiver und sensomotorischer Präsenz voraus. Mit Sozialtopografie verknüpfen wir die für die soziale Handlungspraxis relevanten Implikationen architektonischer Erscheinungsformen, die stark von den sozialräumlichen Wissensgrundlagen Anwesender abhängig sind. Im Gegensatz zu den interaktionsarchitektonischen Implikationen können wir die sozialtopografischen Implikationen eines Raums aufgrund ihrer raumkognitiven Voraussetzungen nur anhand konkreter Nutzungen analysieren. Wir benötigen also Daten, die Personen im Raum zeigen, seien dies Einzelne, Paare oder Gruppen, entweder allein oder mit anderen Anwesenden. Sozialtopografisches Wissen spielt bei unseren Raumnutzungsanalysen in zweierlei Hinsicht eine Rolle. Es ist zum einen als analyseleitende Orientierung relevant. Die sichtbare Raumnutzung von Anwesenden (der Ort ihrer Positionierung, die Art ihrer Positur, der damit verbundene Wahrnehmungsraum, die Nähe oder Distanz zu anderen Anwesenden etc.) wird von uns verstanden als situative Realisierung ihres allgemeinen sozialtopografischen Wissens und ihrer aktuellen sozialtopografischen Orientierung. In unmittelbarer Analogie zu verbalen Äußerungen betrachten wir räumliches Verhalten als Bear- Heiko Hausendorf / Reinhold Schmitt 44 beitung spezifischer, situativer Anforderungen, welche die Anwesenden erledigen müssen, um konkrete Räume nutzen zu können: relativ zu usuellen Nutzungsangeboten der Interaktionsarchitektur und normalformspezifischen Vorstellungen und Erwartungen für die Realisierung ihrer situativen praktischen Zwecke. Sozialtopografisches Wissen verstehen wir als kulturell vermittelt und funktionsraumspezifisch. Es ist die Kompetenz, die den für die Konstitution sozialer Bedeutung relevanten Unterschied macht zwischen der prinzipiellen Begehbarkeit im interaktionsarchitektonischen Sinne und der funktionsraumspezifischen, sozial verträglichen oder bewusst abweichenden Begehung im Kontext sozialer Handlungszusammenhänge. Das sozialtopografische Wissen ist ein spezifischer Teil des gesellschaftlichen Wissensvorrats und sozial geprägter, individueller Wissenshaushalte (Luckmann 1986, 1988). Wir gehen davon aus, dass die konkrete Raumnutzung - auch im stabilen Rahmen institutioneller Ordnung (Kirche, Schule, Rundfunk, Ausstellungsorganisation), innerhalb derer Räume für typische Funktionen (Gottesdienst, Unterricht, Unterhaltungssendung und Ausstellungsbesuch) hergerichtet und zur Verfügung gestellt werden - nicht eindeutig prognostizierbar und auch im Rahmen usueller Orientierungen relativ variabel ist. Raumnutzer realisieren ihr sozialtopografisches Wissen zwar als funktionsraumtypische Normalform, sie tun dies jedoch adaptiv und situationssensitiv hinsichtlich der aktuellen Zwecke, die sie mit ihrer Anwesenheit verfolgen. Zum anderen besitzt sozialtopografisches Wissen auch eine analysereflexive Relevanz: Es dient den Analytikern als zentrale Analysegrundlage, denn sie rekonstruieren das sichtbare Raumverhalten der dokumentierten Anwesenden auf der Grundlage ihres eigenen sozialtopografischen Wissens. Wir müssen im Verständnis des Prinzips der methodischen Adäquatheit (Garfinkel/ Wieder 1992) 11 als Analytiker selbst in der Lage sein, auf der Grundlage unseres sozialtopografischen Wissens Raum in denselben Situationen in vergleichbarer Weise wie die dokumentierten Anwesenden zu nutzen bzw. deren Raumnutzung problemlos als relevanten sozialen Ausdruck zu lesen. Nur so sind wir in der Lage, uns - aufbauend auf dem zunächst deskriptiven Modus der Analyse - schrittweise auf die kulturspezifischen und sozialhaltigen Implikationen hinzuarbeiten, welche der sichtbaren Raumnutzung inhärent sind. Und nur so können wir die mit dem konkreten Raumverhalten bearbeiteten sozialtopografischen Anforderungen rekonstruieren. 11 Garfinkel/ Wieder (1992, S. 182): „[...] the unique adequacy requirement of methods is identical with the requirement that for the analyst to recognize, or identify, or follow the development of, or describe phenomena of order in local production of coherent detail the analyst must be vulgarly competent in the local production and reflexively natural accountability of the phenomenon of order[*] he is ‘studying’.“ Interaktionsarchitektur und Sozialtopografie 45 Anwesende nutzen Raum in der Regel in habituell-selbstverständlicher Weise. Sie beschäftigen sich mit diesem Aspekt ihrer sozialen Praxis nur dann explizit, wenn er im handlungspraktischen Sinne problematisch wird. Im Unterschied dazu sind wir als Analytiker verpflichtet, die Grundlagen unserer raumanalytischen Aussagen durch die Offenlegung unseres eigenen sozialtopografischen Wissens explizit zu reflektieren und dabei über die de-factomethodologischen Grundlagen unserer Raumanalysen Auskunft zu geben. Die Analyse situativer Raumnutzung Anderer eröffnet also systematische Einblicke in wichtige Aspekte, Grundlagen, Annahmen und Idealisierungen unseres eigenen habituellen, raumbezogenen Wissens. Wir müssen bei der Raumnutzungsanalyse also aus Prinzip auf ähnliche sozialtopografische Grundlagen und Kompetenzen zurückgreifen wie die Beteiligten. Verfügen wir nicht über die gleiche raumnutzungsbezogene Kompetenz wie die dokumentierten Raumnutzer, sind unsere Erkenntnismöglichkeiten ausgesprochen beschränkt. Wir können dann jenseits der Rekonstruktion interarchitektonischer Benutzbarkeitshinweise und der sich daraus ergebenden interaktionsarchitektonischen Basisimplikationen nicht feststellen, was es sozial bedeuten und im Zweifelfall auch kosten würde, wenn wir potenziell begehbare Bereiche tatsächlich begehen würden. Wir wären letztlich nicht imstande zu sagen, um was für eine Raumnutzung es sich handelt und ob sie sich im Bereich der kulturellen oder gesellschaftlichen Normalform bewegt. Damit befinden wir uns in unmittelbarer Analogie zu verbalen Verstehensvoraussetzungen: Nur wenn wir selbst die sprachliche Kompetenz der Interaktanten besitzen, sind wir in der Lage, zu verstehen, was sie sagen und welche soziale Bedeutung sie mithilfe welcher generativer Mechanismen produzieren, deren sie sich beim Prozess der Interaktionskonstitution bedienen. Interaktionsarchitektur verweist dabei auf die vergleichsweise „kulturarmen“ Implikationen des Raums hinsichtlich seiner interaktiven Nutzung durch Teilnehmer mit humanspezifischer Sensorik und Motorik. Ihre Rekonstruktion ist deshalb auf die Verfremdung kulturell eingespielter Routinen des Wiedererkennens von Wahrnehmbarkeit und Bewegbarkeit angewiesen, weil diese sonst zum Überspringen der Einsicht in die nicht vertrautheitsabhängigen Implikationen führen würden. Die Unterscheidung von Interaktionsarchitektur und Sozialtopografie erlaubt damit auch eine Schärfung der methodologischen Frage nach der Analysehaltung zwischen angestrebter Verfremdung einerseits und notwendig relevant zu machendem Vorwissen (inklusive weitergehender Expertise) andererseits (vgl. dazu auch die Hinweise im Standbild-Beitrag von Hausendorf/ Schmitt i.d.Bd.). Es ist bei der Charakterisierung der verschiedenen analytischen Zu- Heiko Hausendorf / Reinhold Schmitt 46 gänge bei der Dokumentenanalyse bereits angeklungen, dass der Rekonstruktion der Interaktionsarchitektur eine Perspektive zugrunde zu legen ist, die maximal mit unserer informierten und verständigen sozialtopografischen Alltagsperspektive kontrastiert. Anders wären wir dazu verurteilt, unser eigenes sozialtopografisches Wissen mehr oder weniger gekonnt zu reproduzieren. Auch wäre nicht recht einzusehen, warum wir uns dann nicht gleich auf die entsprechende fachliche Expertise verlassen sollten (die z.B. Kirchenhistoriker und Religionswissenschaftler mit Bezug auf die Architektur des Kirchenraums haben mögen). Auch könnten die interaktionsarchitektonischen Implikationen, die uns (z.B. mit Bezug auf Sichtbarkeit) interessieren, gar nicht erst in den Blick kommen, wenn wir nicht hinter die alltagsweltlichen Begrifflichkeiten (wie ‘Wand’ oder ‘Fenster’) zurückgingen, um zu rekonstruieren, welche für die Lösung genuiner Interaktionsprobleme relevanten Lösungen in solchen Begrifflichkeiten sedimentiert und dem analytischen Verstehen damit oftmals verborgen sind. Demgegenüber setzen wir mit der Sozialtopografie immer schon Nutzer voraus, weil es um den Übergang zu den viel stärker wissensabhängigen Implikationen für die handlungspraktische Nutzung des Raums geht. Interaktionsarchitektur, könnte man auch sagen, fokussiert erwartbar gemachte Potenziale des Raums für Interaktion. Sozialtopografie dagegen zielt auf die kulturspezifische Interpretation dieser Potenziale durch Nutzer auf der Grundlage gesellschaftlichen Spezialwissens. Man kann sich die konzeptionellen Zusammenhänge am Beispiel des Kirchenraums (Hausendorf/ Schmitt 2010) gut verdeutlichen: Der Kirchenraum stellt für Bewegung frei begehbare Flächen wie etwa den Mittelgang zwischen den Bankreihen zur Verfügung (Bild 5): 5 Die Begehbarkeit des Mittelgangs erschließt sich, für Nutzer wie für Beobachter, weitgehend aus interaktionsarchitektonischen Implikationen, die nicht Interaktionsarchitektur und Sozialtopografie 47 auf raumkognitives Spezialwissen (zum Kirchenraum) angewiesen sind, sondern mit der interaktionsarchitektonischen Funktionalität eines ‘Ganges’ bzw. ‘Gehweges’ zu tun haben. Im Kontrast zu den Bankreihen, zwischen denen sich der Gang befindet, ist hier eine durchgehende, relativ schmale Fläche frei geblieben, also weder möbliert noch mit Hindernissen zugestellt oder sonstwie in ihrer Zugänglichkeit eingegrenzt (z.B. abgesperrt), sondern aufgrund des unmittelbaren Anschlusses an den Eingang als begehbare Fläche hochgradig erwartbar gemacht, um sich im Raum fortzubewegen. Hier können sich Gottesdienstbesucher, so die interaktionsarchitektonische Implikation, frei bewegen, um sich z.B. den Kirchenbänken zu nähern und dort Platz zu nehmen. Der Mittelgang ist insofern interaktionsarchitektonisch ein Gehweg und kein Verweilort. Im Gegensatz dazu werden Gottesdienstbesucher in den durch Bänke gestalteten Besucherbereichen rechts und links des Mittelgangs zum Sitzen und zum Blick nach vorne „ausgerichtet“. Es handelt sich ganz offensichtlich nicht ebenfalls um begehbare Flächen, sondern um erwartbar gemachte Verweilorte. Die ungehinderte Begehung der Bankreihen ist stark eingeschränkt und funktional für die Platzeinnahme. Beschreibt man die Unterschiede zwischen Mittelgang und den Sitzreihen hinsichtlich der Aspekte „Begehung“ und „Präsenzform“ in dieser Weise, nimmt man eine interaktionsarchitektonische Perspektive auf den Kirchenraum ein: Es geht um seine Betret- und Begehbarkeit und um die Orte und Plätze seiner Verweil- und Besitzbarkeit. Eine weitergehende interaktionsarchitektonische Analyse hört, was die Begehbarkeit betrifft, beim Mittelgang nicht auf. Der Mittelgang führt nicht nur zu den seitlich abzweigenden Bankreihen, sondern auch in den Bereich vor den Bankreihen, der zudem durch Treppenstufen interaktionsarchitektonisch in seiner Begehbarkeit speziell hervorgehoben ist und offensichtlich weitere Verweilstationen enthält. Kirchenbesucher wissen nun aber auf der Grundlage ihrer sozialtopografischen Kompetenz, dass diese interaktionsarchitektonisch nahegelegte Nutzung dieser durchaus begehbaren Fläche des Kirchenraums de facto begrenzt und reserviert ist. So „darf“ etwa der Altarraum im Gegensatz zum Mittelgang von den Besuchern nur zu speziellen Anlässen betreten werden (Abendmahl, Taufe, Hochzeit etc.). Normalerweise ist er jedoch für den Pfarrer/ die Pfarrerin und den Lektor/ die Lektorin reserviert, wobei auch Letztere nicht fraglos Zugang zum zentralen Bereich direkt vor dem Altar haben. Auch wenn der Altarraum von bestimmten Gottesdienstbesuchern betreten werden muss, was beispielsweise bei den so genannten Kerzengängen von Konfirmanden (Schmitt 2012a, b; 2013a, b) der Fall ist, bestimmt deren sozialtopografisches Wissen um die binnensegmentale Struktur der begehbaren Bereiche (hier: Altarraum) ihre konkreten Laufwege. So ver- Heiko Hausendorf / Reinhold Schmitt 48 meiden sie es z.B. systematisch, den vom Mittelgang der Kirche bis kurz vor den Altar „hinaufreichenden“ Teppich im Bereich der Altarstufen zu betreten (Bild 6, 7). 6 7 8 Der Teppich wird in diesem Bereich nur betreten, wenn situationsspezifische Ausnahmen - wie beispielsweise „dichter Gegenverkehr“, in dem eine Kollision mit dem Pfarrer droht - den Konfirmanden keine andere Wahl lassen (Bild 8). Das ist die sozialtopografische Perspektive auf den Kirchenraum, die davon lebt, dass eine konkrete Nutzung hinsichtlich ihrer Interpretation durch Anwesende rekonstruiert wird (Was wird im Kirchenraum als begehbar durch wen und wie interpretiert? ). In einem durch Nutzer realisierten Geh- oder Laufweg manifestiert sich die konkrete Nutzung eines der interaktionsräumlichen Angebote des Kirchenraums im Hinblick auf mögliche und erwartbar gemachte Geh- und Laufwege und grundsätzlich im Hinblick auf seine Begehbarkeit. Gottesdienstbesucher realisieren Geh- und Laufwege auf der Grundlage ihres sozialtopografischen Wissens als motivierte Selektion der nutzbaren Bereiche des Kirchenraums (allein und/ oder im interaktiven Vollzug). Geschieht diese Nutzungspraxis als Teil einer Interaktion (zusammen mit mitanwesenden und mitgehenden Anderen), verweist sie bereits (sozial überschüssig) darauf, dass und wie das Gehen als Realisierung eines Laufweges selbstreflexiv „dargestellt“ wird - als Teil einer „siutierten Praktik“ (vgl. dazu das Konzept ‘Gehen als situierte Praktik’ bei Schmitt 2012a). ‘Gehen als situierte Praktik’ konzeptualisiert also den konkreten Vollzug eines Laufweges als „laufend realisierten“, situationsbezogenen Kommentar der Gehenden und als deren wechselseitige Interpretation eines zentralen Aspektes des interaktionsarchitektonischen Raumangebots für die Herstellung eines augenblicks-, orts- und personenbezogenen Interaktionsraums. Weder diese interaktive Nutzung im Interaktionsarchitektur und Sozialtopografie 49 Rahmen des Interaktionsraums noch die singuläre Nutzung im Rahmen der Sozialtopografie erübrigen die sorgfältige und rigorose Rekonstruktion der Nutzbarkeit im Rahmen der Interaktionsarchitektur: Vor dem Hintergrund basaler Implikationen von Wahrnehmbarkeit und Bewegbarkeit erhalten Sozialtopografie und Interaktionsraum ihr jeweils eigenes Profil und können in diesem analytisch sichtbar gemacht werden. So erhellt der Vergleich von interaktionsarchitektonischer und sozialtopografischer Begehbarkeit sofort markante Besonderheiten des Raums als „sozialem Zuhause“ bestimmter gesellschaftlich und kulturell geprägter Praktiken. Vor deren Hintergrund kann dann die Herstellung eines Interaktionsraums im Vollzug einer Interaktionsepisode ihre fallspezifische Struktur gewinnen. Am Beispiel des interaktionsarchitektonischen Basiskonzeptes ‘Begehbarkeit’ wird auf diese Weise deutlich, dass Sozialtopografie eine Art Vermittlungsstatus zwischen Interaktionsarchitektur und Interaktionsraum hat. Sie steht zwischen dem Bereich der interaktionsunabhängigen Implikationen von Räumen und damit der Interaktionsarchitektur auf der einen Seite, und der konkreten Realisierung von Laufwegen im Interaktionsvollzug und damit dem Interaktionsraum auf der anderen Seite. Es ist der zentrale Bezugspunkt sowohl für die Rekonstruktion der handlungsleitenden Orientierungen der Benutzer von Räumen als auch der Weiterentwicklung der Vorstellung von ‘Gehen als situierte Praktik’ im Interaktionsvollzug. So kann die Vorstellung vom gemeinsamen Gehen als Teil einer situierten Praktik im Lichte der vorangegangenen Ausführungen verstanden werden als eine bewegungsbasierte Realisierung und Darstellung sozialtopografischer Relevanzen des Raums. Damit stellt sich dann automatisch die Frage nach weiteren Aspekten, in denen sich die Relevanz der sozialtopografischen Struktur von Räumen als Perspektivierung des objektiven Potenzials von Räumen aus der kulturspezifischen Sicht von Raumnutzern zeigt. Fragen, die sich im Anschluss an die zurückliegenden Ausführungen in methodischer und gegenstandskonstitutiver Hinsicht stellen, sind unter anderem: - Welcher analytische Zugang ist adäquat, wenn man sich empirisch mit der Sozialtopografie des Raums beschäftigen will? - Was genau sind die spezifischen Erkenntnisaspekte der sozialtopografischen Perspektive? - Wie ist die Eigenständigkeit dieser Erkenntnisperspektive im Vergleich zu anderen raumbezogenen Interessen? - Mit welchen anderen raumbezogenen Erkenntnisinteressen berührt sich die sozialtopografische Sicht und worin genau unterscheidet sie sich? Heiko Hausendorf / Reinhold Schmitt 50 Die Richtung, in der wir uns die Beantwortung dieser Fragen vorstellen, ist durch ein Kontinuum an Erscheinungsformen bestimmt, an deren interaktionsunabhängigem Pol die Interaktionsarchitektur und an deren voll und ganz in Interaktion aufgehendem Pol der Interaktionsraum steht. Die sozialtopografische Analyse fokussiert aus unserer Sicht die manifeste, raumbezogene Orientierung von Anwesenden. Sozialtopografie im Sinne einer handlungspraktischen Qualität wird für uns dadurch sichtbar und analysierbar (gemacht), dass wir konkrete Raumnutzungen durch Anwesende (allein oder zusammen mit anderen) dokumentieren. Die Frage, ob dabei interagiert wird oder nicht, ist für diese Analyse - anders als bei der Fokussierung auf den Interaktionsraum, für die sie konstitutiv ist - nicht von Belang. Für die Realisierung der sozialtopografischen Analyseperspektive ist die Anwesenheit von mindestens einer Person eine notwendige Voraussetzung, nicht aber der Nachweis von Interaktion unter Anwesenden. Bereits die Anwesenheit eines „Solitärs“ setzt die sozialtopografische Analyse in Gang, indem sie die sozialtopografische Perspektive auf sichtbare Personen in Bezug zu interaktionsarchitektonischen Implikationen des Raums setzt und versucht, diesen Bezug in raumbezogenen bzw. raumreflexiven Begriffen und Konzepten zu fassen. Ein passendes Konzept könnte hier etwa die Position(ierung) sein, insofern damit (blickliche und körperliche Orientierung, Bewegungs- und Verweilprojektionen, Art der Präsenzform) analysiert werden kann, wie interaktionsarchitektonische Implikationen von Wahrnehmbarkeit, Bewegbarkeit und Verweilbarkeit sozialtopografisch aktiviert oder auch ignoriert werden können. Eine Analyse dieser Art kommt ohne Rekurs auf Interaktion aus. Man muss den sozialtopografischen Analysefokus jedoch auch dann konsequent umsetzen, wenn man es offensichtlich mit einer Gruppe in Interaktion zu tun hat, deren körperliche Ausrichtung aufeinander bereits einen Interaktionsraum realisiert. In einem solchen Fall wird man das Beschreibungsverfahren sequenzieren müssen und dabei zunächst die sozialtopografischen Implikationen der Position jedes einzelnen Beteiligten herausarbeiten, bevor man sich in einem weiteren Schritt den Implikationen für die Herstellung des Interaktionsraums zuwendet. Auch wenn interagiert wird, fokussiert die sozialtopografische Analyse also nicht die Erscheinungsformen der Interaktion, sondern die Manifestation von Raumwissen durch Nutzer im Sinne der Selektion interaktionsarchitektonischer Implikationen. Konkrete Formen der Raumnutzung mögen zwar von Fall zu Fall (also empirisch) Teil der personal-räumlichen Grundlagen der interaktiven Bearbeitung thematisch-pragmatischer Relevanzen im Sinne der Herstellung des Interaktionsraums sein, haben aber dabei immer schon eine sozialtopografische Dimension, die es eigenständig freizulegen gilt. Interaktionsarchitektur und Sozialtopografie 51 Worum es uns mit der dreigliedrigen Struktur von Interaktionsarchitektur, Sozialtopografie und Interaktionsraum geht, ist so gesehen eine Freilegung der mit dem Interaktionsraum immer schon verbundenen Voraussetzungen. Die Herstellung des Interaktionsraums hat sowohl eine sozialtopografische als auch eine interaktionsarchitektonische Dimension, die es eigenständig zu analysieren gilt: Sozialtopografisches Wissen manifestiert sich (für Beobachter wie für Nutzer) in Relation zu den interaktionsarchitektonischen Implikationen, und es stellt die raumbasierte Grundlage für die Konstitution von Interaktionsräumen dar. Sozialtopografische Analysen lassen sich auf der Grundlage von Transkripten oder Thematisierungen (beispielsweise Beschreibungen) von Raumnutzungen nur sehr unzureichend und hoch selektiv erfassen (Logik der Sinnkonstitution: Primär- und Sekundärsinn). Sozialtopografisches Wissen ist auf Verbalisierung in der Regel gerade nicht angewiesen, sondern manifestiert sich in der Nutzung selbst. Diese Nutzung muss auf der Grundlage audiovisueller Interaktionsdokumente oder von Fotografien und Standbildern geleistet werden, die eine Raumnutzung durch eine oder mehrere Personen abbilden. Wenn mit audiovisuellen Dokumenten gearbeitet wird, sollte - wie bei dem Verfahren der visuellen Erstanalyse (Schmitt 2007a, 2007b; Schmitt/ Knöbl 2013) - der Ton systematisch ausgeblendet werden. Verbalität spielt für die sozialtopografische Rekonstruktion aufgrund der Routinen der Nutzer in der Regel keine Rolle! Was für die sozialtopografische Rekonstruktion ähnlich wie bei der Interaktionsraumanalyse und anders als bei der Interaktionsarchitekturanalyse gleichwohl wichtig werden kann, ist die Dokumentation von Raumnutzung in der Zeit, was z.B. Standbildfolgen zu sehr aussagekräftigen Dokumenten macht (siehe dazu die Bemerkungen in den Beiträgen von Hausendorf/ Schmitt zur Standbildanalyse und Schmitt zum Frame-Comic). 6. Literatur Cicourel, Aaron V. (1975): Sprache in der sozialen Interaktion. München: dtv. Durkheim, Emile (1965): The elementary forms of the religious life. Chicago: University of Chicago Press [zuerst: 1912]. Garfinkel, Harold/ Wieder, Lawrence, D. (1992): Two incommensurable, asymmetrically alternate technologies of social analysis. In: Watson, Graham/ Seiler, Robert, M. (Hg.): Text in context. Contributions to ethnomethodology. Newbury Park: Sage Publications, S. 182-206. Gibson, James J. (1977): The theory of affordances. In: Shaw, Robert/ Bransford, John (Hg.): Perceiving, acting, and knowing. Toward an ecological psychology. Hillsdale, NJ/ New York: Lawrence Erlbaum Associates, S. 67-82. Heiko Hausendorf / Reinhold Schmitt 52 Glasze, Georg/ Mattissek, Annika (Hg.) (2009): Handbuch Diskurs und Raum. Theorien und Methoden für die Humangeografie sowie die sozial- und kulturwissenschaftliche Raumforschung. Bielefeld: transcript. Gleiter, Jörg H. (2014): Architektursemiotik: Ein- und Ausblicke. In: Gleiter, Jörg H. (Hg.): Symptom Design. Vom Zeigen und Sich-Zeigen der Dinge. (= Architektur- Denken 7). Bielefeld: transcript, S. 7-19. Goffman, Erving (1963): Behavior in public places. Notes on the social organization of gatherings. New York: The Free Press. Hausendorf, Heiko (2010): Interaktion im Raum. Interaktionstheoretische Bemerkungen zu einem vernachlässigten Aspekt von Anwesenheit. In: Deppermann, Arnulf/ Linke, Angelika (Hg.): Sprache intermedial. Stimme und Schrift, Bild und Ton. (= Jahrbuch des Instituts für Deutsche Sprache 2009). Berlin/ New York: de Gruyter, S. 163-197. Hausendorf, Heiko (2012a): Der Hörsaal als Interaktionsraum. Ein exemplarischer Beitrag zur Archäologie der Vorlesung. In: De Stefani, Elwys/ Gazin, Anne-Danièle/ Ticca, Anna Claudia (Hg.): Space in social interaction. L’espace dans l’interaction sociale. Der Raum in der sozialen Interaktion. Lo spazio nell’interazione sociale. (= Bulletin Suisse de Linguistique Appliquée VALS/ ASLA 96). Neuchâtel: Université de Neuchâtel, S. 43-68. Hausendorf, Heiko (2012b): Über Tische und Bänke. Eine Fallstudie zur interaktiven Aneignung mobiliarer Benutzbarkeitshinweise an der Universität. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 139-186. Hausendorf, Heiko (2013): On the interactive achievement of space - and its possible meanings. In: Auer, Peter/ Hilpert, Martin/ Stukenbrock, Anja/ Szmrezcsanyi, Benedikt (Hg.): Space in language and linguistics: geographical, interactional and cognitive perspectives. Boston/ New York: de Gruyter, S. 276-303. Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2012): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr. Hausendorf, Heiko/ Schmitt, Reinhold (2010): Opening up openings. Zur multimodalen Konstitution der Eröffnungsphase eines Gottesdienstes. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen. Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 53-101. Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopografie. Umrisse einer raumlinguistischen Programmatik. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 1). Zürich. www.zora.uzh.ch/ 78153/ 1/ SpuR_Arbeitspapiere_Nr01_Mai2013.pdf (Stand: Mai/ 2013). Hauser, Susanne/ Kamleithner, Christa/ Meyer, Roland (Hg.) (2011): Architekturwissen. Grundlagentexte aus den Kulturwissenschaften. Zur Ästhetik des sozialen Raums. (= Architekturen 1). Bielefeld: transcript. Kesselheim, Wolfgang (2010): Wissenskommunikation multimodal. Wie Museumsbesucher sich über den Inhalt einer Museumsvitrine verständigen. In: Fachsprache: Internationale Zeitschrift für Fachsprachenforschung, -didaktik und Terminologie 32, 3-4, S. 122-144. Interaktionsarchitektur und Sozialtopografie 53 Kesselheim, Wolfgang/ Hausendorf, Heiko (2007): Die Multimodalität der Ausstellungskommunikation. In: Schmitt (Hg.), S. 339-375. Lawrence, Denise L./ Low, Setha M. (1990): The built environment and spatial form. In: Annual Review Anthropology 19, S. 453-505. Le Baron, Curtis D./ Streeck, Jürgen (1997): Built space and the interactional framing of experience during a murder interrogation. In: Human Studies 20, S. 1-25. Luckmann, Thomas (1986): Grundformen der gesellschaftlichen Vermittlung des Wissens: Kommunikative Gattungen. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie, Sonderheft 27, S. 191-211. Luckmann, Thomas (1988): Kommunikative Gattungen im kommunikativen Haushalt einer Gesellschaft. In: Smolka-Koerdt, Gisela et al. (Hg.): Der Ursprung von Literatur. Medien, Rollen, Kommunikationssituationen zwischen 1450 und 1650. München: Fink, S. 279-288. Luhmann, Niklas (1969): Normen in soziologischer Perspektive. In: Soziale Welt 20, 1, S. 28-48. Luhmann, Niklas (1981): Die Unwahrscheinlichkeit der Kommunikation. In: Luhmann, Niklas (Hg.): Soziologische Aufklärung 3. Soziales System, Gesellschaft, Organisation. Opladen: Westdeutscher Verlag, S. 25-34. Mondada, Lorenza (2007): Interaktionsraum und Koordinierung. In: Schmitt (Hg.), S. 55-93. Müller, Cornelia/ Bohle, Ulrike (2007): Das Fundament fokussierter Interaktion. Zur Vorbereitung und Herstellung von Interaktionsräumen durch körperliche Koordination. In: Schmitt (Hg.), S. 129-165. Nevile, Maurice/ Haddington, Pentti/ Heinemann, Trine/ Rauniomaa, Mirka (2014): On the interactional ecology of objects. In: Nevile, Maurice et al. (Hg.): Interacting with objects. Language, materiality, and social activity. Amsterdam/ Philadelphia: John Benjamins, S. 3-26. Pfaffenthaler, Manfred/ Lerch, Stefanie/ Schwabl, Katharina/ Probst, Dagmar (Hg.) (2014): Räume und Dinge. Kulturwissenschaftliche Perspektiven. Bielefeld: transcript. Pitsch, Karola (2012): Exponat - Alltagsgegenstand - Turngerät: Zur interaktiven Konstitution von Objekten in einer Museumsausstellung. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 233-273. Schegloff, Emanuel A./ Sacks, Harvey (1973): Opening up closings. In: Semiotica 8, S. 289-327. Schmitt, Reinhold (2007a): Von der Konversationsanalyse zur Analyse multimodaler Interaktion. In: Kämper, Heidrun/ Eichinger, Ludwig M. (Hg.): Sprachperspektiven. Germanistische Linguistik und das Institut für Deutsche Sprache. (= Studien zur Deutschen Sprache 40). Tübingen: Narr, S. 395-417. Schmitt, Reinhold (2007b): Theoretische und methodische Implikationen der Analyse multimodaler Interaktion. In: Holly, Werner/ Paul, Ingwer (Hg.): Medialität und Sprache. (= Mitteilungen des Deutschen Germanistenverbandes 54, 1). Bielefeld: Aisthesis, S. 26-53. Schmitt, Reinhold (Hg.) (2007): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr. Heiko Hausendorf / Reinhold Schmitt 54 Schmitt, Reinhold (2012a): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung. Online-Zeitschrift zur verbalen Interaktion 13, S. 1-44. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2012/ ga-schmitt.pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2012b): Störung und Reparatur eines religiösen Ritus: Die erloschene Osterkerze. In: Klein, Wolfgang/ Habscheid, Stephan (Hg.): Dinge und Maschinen in der Kommunikation. Zeitschrift für Literaturwissenschaft und Linguistik 168, S. 62-91. Schmitt, Reinhold (2013a): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 68). Tübingen: Narr. Schmitt, Reinhold (2013b): Zum „Be-Greifen“ relevanter Aspekte der räumlichen Umgebung. In: Shamne, Nikolaĭ Leonidovich (Hg.): Raum in der Sprache. Raum der Sprache. Raum der Interaktionen. Festschrift zum 30-jährigen Bestehen des Instituts für Philologie und interkulturelle Kommunikation der Universität Wolgograd. Wolgograd: Verlag der Universität Wolgograd, S. 13-27. Schmitt, Reinhold (i.Vorb.): Zur Konstitution von Dokumenten für raumanalytische Erkenntnisinteressen: Ein Praxisbericht. Mannheim, Ms. Schmitt, Reinhold/ Dausendschön-Gay, Ulrich (2015): Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse. (= Arbeitspapiere des UFSP Sprache und Raum (SpuR) 4). Zürich. www.spur.uzh.ch/ research/ publications/ SpuR_Arbeitspapier_Nr04_150711.pdf (Stand: Juli/ 2015). Schmitt, Reinhold/ Deppermann, Arnulf (2007): Monitoring und Koordination als Voraussetzungen der multimodalen Konstitution von Interaktionsräumen. In: Schmitt (Hg.), S. 95-128. Schmitt, Reinhold/ Knöbl, Ralf (2013): „Recipient design“ aus multimodaler Sicht. In: Deutsche Sprache 41, 2, S. 242-276. Gliederung 1. Vorbemerkungen....................................................................................................27 2. Raum als interaktive Ressource und Interaktionsarchitektur .........................31 3. Architektur als Lösung für Interaktionsprobleme ............................................33 4. Faktische vs. erwartbar gemachte Interaktion ...................................................38 5. Interaktionsarchitektur und Sozialtopografie....................................................40 6. Literatur ...................................................................................................................51 HEIKO HAUSENDORF/ WOLFGANG KESSELHEIM DIE LESBARKEIT DES TEXTES UND DIE BENUTZBARKEIT DER ARCHITEKTUR. TEXT - UND INTERAKTIONSLINGUISTISCHE ÜBERLEGUNGEN ZUR RAUMANALYSE 1 1. Einführung Die Überlegungen, die im Folgenden vorgestellt werden, stehen im Schnittpunkt zweier Fragestellungen: einer textlinguistischen und einer interaktionsanalytischen. Wenn man zunächst textlinguistisch davon ausgeht, dass ein Text als ein lesbares Etwas zu definieren ist (siehe Kap. 2), stellt sich schnell die Frage, ob es angesichts einer metaphorisch seit langem eingeführten Vorstellung von der „Lesbarkeit der Welt“ (Blumenberg 1983) überhaupt noch etwas geben kann, was nicht als Text aufgefasst werden kann. Wie soll beispielsweise Architektur vom Text als einem lesbaren Etwas abgegrenzt werden, wenn der gebaute Raum neben allem anderen, was er noch sein mag, zweifellos auch ein zeichenhaftes Etwas und in diesem Sinne lesbar ist? Auf diesen Zeichencharakter der Architektur hat z.B. die Architektursemiotik eindrücklich hingewiesen (vgl. Nöth 1985; Dreyer 2003 oder Schäfers 2006, S. 43ff. für einen Überblick), doch nutzt sie den Text-Begriff vorzugsweise als Metapher, um beispielsweise die Stadt mit Methoden und Kategorien zu untersuchen, die an Schrifttexten entwickelt worden sind (vgl. Hauser 1990; Dreyer 2003, S. 3253f.; Schäfers 2006, S. 49ff.). Wie aus architektursoziologischer Perspektive kritisiert worden ist (vgl. z.B. Delitz 2009, S. 86ff.; Fischer 2009, S. 7; Steets 2010, S. 182), kommt dabei in der Regel die körperliche Erfahrbarkeit des Raumes zu kurz. 1 Der vorliegende Beitrag hat eine längere Vorgeschichte. Er geht zurück auf eine 2012 erfolgte Anfrage zur Aktualisierung des in Kesselheim/ Hausendorf (2007) erstmalig vorgestellten Ansatzes für einen Artikel in einem Themenheft - die Veröffentlichung in dem fraglichen Themenheft ist dann aus verschiedenen Gründen nicht zustande gekommen. Wir haben das zum Anlass genommen, die Rolle der Architektur für Interaktion grundsätzlich zu überdenken und systematisch anzugehen. Daraus ist der folgende Sammelband entstanden. Der Beitrag ergänzt die im Beitrag von Hausendorf/ Schmitt (i.d.Bd.) entwickelte Perspektive auf ‘Interaktionsarchitektur’ und ‘Sozialtopografie’ um eine textlinguistische Perspektive: Die für die Interaktionsarchitekturanalyse zentralen ‘interaktionsarchitektonischen Implikationen’ lassen sich in ihrer Charakteristik weiter bestimmen, wenn man sie vor dem Hintergrund der für die Textanalyse zentralen ‘Lesbarkeitshinweise’ als Benutzbarkeitshinweise profiliert. Darum geht es im vorliegenden Beitrag, der eine überarbeitete Fassung von Hausendorf/ Kesselheim (2013) darstellt. Heiko Hausendorf / Wolfgang Kesselheim 56 Wir fragen deshalb, ob man den gebauten Raum mehr als nur metaphorisch als Text verstehen und gewinnbringend analysieren kann und ob sich die kommunikative Relevanz des gebauten Raums angemessen auf Lesbarkeit zurückführen lässt. Diese Frage führt uns in die Welt der „Dauerkommunikation“ (Ehlich 1994): Architekturkommunikation bedient sich wie Textkommunikation zeitbeständiger Zeichen, und beide Formen von Kommunikation sind nicht auf die Anwesenheit der Kommunikationspartner angewiesen. Ist also Architekturkommunikation von der Textkommunikation her angemessen zu erfassen, wie das die Metaphorik von der Lesbarkeit der Architektur so griffig suggeriert? Wenn man interaktionsanalytisch davon ausgeht, dass der gebaute Raum (ein Hörsaal, eine Kirche oder ein Museum) als sedimentierte, Stein gewordene Antwort auf spezifische Interaktionsprobleme (der Vorlesung, des Gottesdienstes oder der Ausstellung) und in diesem Sinn als „Interaktionsarchitektur“ (Hausendorf/ Schmitt im Theorieteil dieses Bandes) verstanden werden kann (siehe Kap. 3), stellt sich schnell die Frage, wie zu erklären ist, dass durch bestimmte Räume bestimmte Arten von Interaktion möglich und wahrscheinlich gemacht werden können und wie Interaktionsteilnehmer erkennen und nutzen können, was der gebaute und gestaltete Raum für die Interaktion zur Verfügung stellt. Wenn es eine Lesbarkeit des Raumes gibt, muss man sie aus unserer Sicht hier suchen: als Antwort auf Fragen einer jeweils spezifischen sozialen Interaktionspraxis. Diese interaktionsanalytische Perspektive führt in die Welt der Situierung der Kommunikation unter Anwesenden, zu der die Sicherstellung wechselseitiger Wahrnehmung (also die Ko-Orientierung), die wechselseitige Abstimmung von Bewegungen (also die Ko-Ordination) und die Herstellung einer auf die fragliche Praxis zugeschnittenen Konfiguration (also die Ko-Operation) gehören (Hausendorf 2013). Die These, die wir in diesem Beitrag entwickeln wollen, ist, dass trotz der oben dargestellten Parallelen nicht Lesbarkeit die passende Chiffre ist, um den Beitrag der Architektur zur Interaktion zu erfassen. Vielmehr ist Benutzbarkeit die Bedingung der Kommunikation mit und durch Architektur. Die textlinguistische, an Lesbarkeit orientierte Perspektive und die interaktionsanalytische, an Benutzbarkeit orientierte Perspektive lassen sich separat und mehr oder weniger unabhängig voneinander entwickeln (siehe Kap. 2 und 3). Aber sie haben einen markanten empirischen Überschneidungsbereich, der in den letzten Jahren nicht zufällig vermehrt in die Aufmerksamkeit der Linguistik gerückt ist: Tatsächlich dürfen wir bei Textvorkommen nicht nur an den Siegeszug des Buchdrucks mit seiner Entbindung der Lektüre aus konkreten Situationszusammenhängen zugunsten weitgehend „lokomobiler“ Texte (Ehlich 1994) denken. In unserem Alltag wimmelt es nach wie vor auch von „lokostatischen“ Texten (ebd.), deren Lesbarkeit wir nicht verstehen Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 57 können, wenn wir nicht die Situation der Lektüre miteinbeziehen, also das, was in einer konkreten Lektüresituation sinnlich wahrnehmbar ist (Hausendorf/ Kesselheim 2008, S. 33ff. zu Wahrnehmbarkeit als Lesbarkeitsressource). Typischerweise handelt es sich dabei um „angebrachte“ Texte, die eine eigene Welt von Auf- und Inschriftlichkeit und „linguistischen Landschaften“ (Auer 2010) begründen, deren Musterhaftigkeit wir in vielen Fällen mit Verweis auf die Materialität der Zeichenträger auf Begriffe bringen (Tafeln, Schilder, ...). Es sind, in diesem speziellen Sinne, „materialisierte“ Texte („language in the material world“: Scollon/ Scollon 2003; Domke 2014; Fix 2008). Sie sind für unsere Fragestellung von besonderem Interesse, weil sie typischerweise im gebauten und gestalteten Raum auftreten und ihre Lesbarkeit damit stark durch Aspekte der Sichtbarkeit, Greifbarkeit, Betretbarkeit, Begehbarkeit, kurz: der Benutzbarkeit der Architektur tangiert wird. Lesbarkeit des Textes und Benutzbarkeit der Architektur greifen in diesen Fällen auf wirkungsvolle Weise ineinander. Der Beitrag ist so aufgebaut, dass wir zunächst unser Konzept von Lesbarkeit skizzieren, weil es den kommunikationstheoretischen Ausgangspunkt bildet, um nach der Textualität von Architektur zu fragen. Wir werden dabei den Gedanken entwickeln, dass Lesbarkeit die Grundbedingung der Kommunikation mit Texten und durch Texte ist (siehe Kap. 2). Zentral für unser Verständnis ist, dass Lesbarkeit im Moment der Lektüre und mit der Lektüre selbst zustande gebracht wird. Lesbarkeit ist also keine kommunikationsexterne Vorbedingung, sondern eine im Vollzug der Lektüre selbst immer wieder hervorzubringende und in diesem Sinne emergente Kommunikationsbedingung. Diese Hervorbringung („accomplishment“ im Sinne der Ethnomethodologie) erfolgt nicht voraussetzungslos, sondern durch die Auswertung von Lesbarkeitshinweisen, an die die Lektüre wahrnehmungs-, sprach- und vertrautheitsabhängig anschließen kann. Wenn wir den Text eingangs als lesbares Etwas eingeführt haben, dann ist damit gemeint, dass der Text nichts anderes ist als ein Ensemble von Lesbarkeitshinweisen. Als solches ist er nicht einfach gegeben; Lesbarkeitshinweise sind vielmehr emergente Phänomene, die in und mit dem Lektüreprozess entstehen und vergehen. Als lesbares Etwas wird der Text also in jeder Lektüre neu konstituiert (durch Auswertung seiner Lesbarkeitshinweise), so sehr seine materialen Erscheinungsformen auch seine vorgängige und nachträgliche Präsenz suggerieren mögen. Wohl mag ein Text wie der vorliegende in seinen materialen Erscheinungsformen (z.B. als gedruckte Blattsammlung in einem Buch) vor und nach der Lektüre Bestand haben, aber wenn diese materialen Erscheinungsformen für die Lesbarkeit des Textes relevant werden sollen, müssen sie als Lesbarkeitshinweise relevant werden, vereinfacht gesagt: die ausgedruckte und geheftete Blattsammlung muss als Hinweis darauf wahrgenommen und behandelt werden, Heiko Hausendorf / Wolfgang Kesselheim 58 dass wir es z.B. mit einem „Beitrag“ zu tun haben. Dafür ist nicht das materiale Text-„Substrat“ (Ehlich 1994, S. 29) in seinem fraglos gegebenen So-Sein verantwortlich, sondern ein mit der Wahrnehmung des Substrats mitverstandener Lesbarkeitshinweis, der aus einer Routine des Umgangs mit Textträgern (wie dem Buch und spezieller dem „Sammelband“) kulturell geprägt und nur vertrautheitsabhängig zustande kommen kann (vgl. Hausendorf/ Kesselheim 2008, S. 35ff. zu Vertrautheit als Lesbarkeitsressource). Wenn wir uns aus dieser Perspektive der Kommunikation mit und durch Architektur nähern (siehe Kap. 3), wollen wir zunächst zeigen, dass auch der gebaute Raum im Moment seiner Benutzung über die Auswertung von Hinweisen hergestellt wird, die als emergente, also mit der Kommunikation entstehende und vergehende Phänomene aufzufassen sind. Hier kommt das architektursoziologische Argument zum Zug, dass auch die Materialität des gebauten Raumes nicht aus dem Prozess der Kommunikation mit und durch Architektur herausgenommen werden darf. Es geht also nicht um so etwas wie „architectural determinism“ (vgl. dazu die kritischen Hinweise bei Smith/ Bugni 2006, S. 129f.). Auch Stein gewordene Hinweise verstehen sich nicht von selbst, sondern sind aus einer Routine des Umgangs mit gebautem Raum hervorgegangen und können deshalb immer nur vertrautheitsabhängig zustande kommen. Darin macht sich die „Sozialtopografie“ des gebauten Raumes bemerkbar (Hausendorf/ Schmitt i.d.Bd.). Anders allerdings als es die Analogie zum Text vermuten lässt, geht es bei der Architektur nicht um Lesbarkeit, sondern um Benutzbarkeit. Die Hinweise, die für die Kommunikation mit und durch Architektur konstitutiv sind, sind deshalb Benutzbarkeitshinweise. Lesbarkeits- und Benutzbarkeitshinweise lassen sich in vielen Fällen trennscharf auseinanderhalten. Aber es gibt Überschneidungsbereiche, in denen Lesbarkeit und Benutzbarkeit Hand in Hand gehen. Das ist bei den eingangs erwähnten „angebrachten“ Texten der Fall, die als „lokostatische“ an einen bestimmten Ort gebunden sind. Diesem Überschneidungsbereich wollen wir uns abschließend zuwenden (siehe Kap. 4). Dabei werden wir auf Architektur(en) von Räumen eingehen, mit denen wir uns bereits empirisch auseinandergesetzt haben (Hörsaal: Hausendorf 2012a; Museum: Kesselheim 2009; Kesselheim 2010; Seminarraum: Hausendorf 2012b). 2. Text als Ensemble von Lesbarkeitshinweisen Die Frage, ob Räume Texte sein können, setzt die Klärung des Begriffs ‘Text’ voraus. Wir wollen im Folgenden davon ausgehen, dass ein Text als ein „lesbares Etwas“ zu betrachten ist (Hausendorf/ Kesselheim 2008, S. 23). Textualität muss entsprechend auf Lesbarkeit zurückgeführt werden: Textualitätshinweise sind per definitionem Lesbarkeitshinweise. Texte sind Ansammlungen Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 59 von Lesbarkeitshinweisen; mit ihnen und durch sie wird ‘der Text’ im Moment der Lektüre hervorgebracht (Hausendorf i.Dr.). Das Lesen von Texten entspricht dieser Auffassung folgend dem Realisieren von Lesbarkeitshinweisen, das als eingespielte Routine des ‘Auswertens’ in sehr vielen Fällen unbemerkt und reibungslos funktioniert. Es ist auf einen bewussten Nachvollzug nicht nur nicht angewiesen, sondern vollzieht sich eigenständig als soziales Geschehen sui generis. Lesende nehmen den Text in der Regel als „gegeben“ wahr - und nicht als etwas, das sie im Moment der Lektüre selbst erzeugen. Die Fokussierung auf Lesbarkeit(shinweise) gibt mit der Betonung des Lesens naturgemäß der Erscheinungsform Schrift ein besonderes Gewicht für das Zustandekommen von Texten. 2 Entsprechend ist das Wort Lesen seit dem Althochdeutschen mehr und mehr in der Verwendung ‘etwas Geschriebenes lesen’ gebräuchlich, also an Schrift gebunden. 3 In der Tat ist Schrift ein einzigartig starker, prototypischer Lesbarkeitshinweis, dem man sich kaum entziehen kann. Wo Schrift ist, kann man wohl sagen, kann nicht nicht gelesen werden. Mit der Evolution von Schrift, speziell der Alphabetschrift und ihrer Verbreitung durch den Buchdruck, wird das Lesen immer stärker in seiner sozialen Eigengesetzlichkeit profiliert, die es zu einem Kommunikationsgeschehen sui generis macht (s.o.). Mit der Fokussierung auf Lesbarkeit wird Textualität also sehr eng an Schriftlichkeit gebunden, ohne dass daraus allerdings folgt, dass Texte immer und ausschließlich aus den Buchstaben der Alphabetschrift bestehen müssten; Lesbarkeit gibt es auch außerhalb phonografischer Schriftsysteme, und Schrift und Lesbarkeit können letztlich wohl nicht auf ‘geschriebene Sprache’ reduziert werden. Die Bindung an Schrift(sprach)lichkeit als Implikation von Lesbarkeit ist jedenfalls komplizierter, als es den Anschein hat. Diesen Gedanken, den man unter einer Reihe von Gesichtspunkten zu diskutieren hätte, 4 wollen wir hier nicht vertiefen, weil er zu weit weg führt 2 Jedenfalls ist mit der Bindung von Textualität an Lesbarkeit eine umstands- und grenzenlose Ausweitung des Text-Begriffes auch auf mündliche Kommunikation, wie sie in der Textlinguistik durchaus üblich ist (vgl. z.B. den Überblick bei Adamzik 2004, S. 41ff.), nicht vereinbar. Man wird sonst weder der Eigengesetzlichkeit der Face-to-face-Interaktion noch der der Textkommunikation gerecht. 3 Vgl. Duden (2006), Eintrag lesen; ursprünglich in der Bedeutung ‘aufsammeln’, ‘auflesen’, danach durch Bedeutungsentlehnung aus dem lateinischen legere in der dominanten Bedeutung von ‘den Schriftzeichen folgen’ (Kluge/ Seebold 2011, S. 571, Eintrag lesen). Das Adjektiv lesbar (17. Jh.) ist dann schon eine Ableitung aus dem auf Geschriebenes festgelegten Gebrauch von lesen (Duden 2006, S. 482). 4 Wir denken hier z.B. an Diskussionen um die Sichtbarkeit und die Bildlichkeit von Schrift (vgl. z.B. die Beiträge in Strätling/ Witte (Hg.) 2006; Krämer/ Bredekamp (Hg.) 2003) und an die in der Textlinguistik wieder aufgenommene Frage, ob Bilder Texte sein können (Dürscheid 2007; Ehlich 2007a; Schmitz 2005), bis hin zur Postulierung einer „Bildlinguistik“ (Diekmannshenke et al. (Hg.) 2011). Passend bemerkt Ehlich: „Zu den wohl häufigsten stillschweigenden Gleichungen gehört [...] die von ‘Text’ und ‘Schrift’. Zu deutlich präsentiert sich diese als Heiko Hausendorf / Wolfgang Kesselheim 60 von unserem Thema. Für die Argumentation im vorliegenden Papier wollen wir der Einfachheit halber von einem an Alphabetschriftlichkeit orientierten Verständnis von Lesbarkeit ausgehen, zumal die Entwicklung der Alphabetschrift in vielerlei Hinsicht als Schrittmacher lesbarkeitsbasierter Textkommunikation angesehen werden kann (vgl. Goody et al. 1986; Raible 1991). Das hier skizzierte Verständnis von Lesbarkeit unterscheidet sich grundlegend von dem in der Leseforschung und Sprachdidaktik verbreiteten normativen Verständnis von „Lesbarkeit“, mit dem auf Verständlichkeit und andere zu optimierende Eigenschaften von Texten hingewiesen wird (vgl. den Überblick bei Antos et al. 2011). Lesbarkeit in dem grundlegenden Sinn, den wir vor Augen haben, ist längst hergestellt, wenn wir anfangen, über die Optimierbarkeit von Texten nachzudenken. Lesbarkeit in unserem Verständnis meint die Grundbedingung der Kommunikation mit Texten und durch Texte, also die conditio sine qua non der auf Schriftlichkeit beruhenden Kommunikation. Sie ist das, so die These, was Anwesenheit für die Face-to-face-Interaktion ist: die fortlaufend sicherzustellende und deshalb prinzipiell im Moment der Kommunikation emergente Bedingung des Kommunizierens. Für Interaktion (als Spezialfall von Kommunikation) ist dieser Gedanke einer selbstreferenziell und autopoietisch erzeugten Kommunikationsbedingung explizit entwickelt worden (vgl. dazu die durch Goffman begründete interaktionssoziologische Tradition und den daran anschließenden Interaktionsbegriff der Luhmann’schen Systemtheorie: Hausendorf 1992; Kieserling 1999). Anwesenheit ist keine vorgängige und externe Bedingung der Kommunikation, sondern selbst eine kommunikative Errungenschaft, ein interactive achievement im Sinne der Konversationsanalyse. Für die Textkommunikation fehlt bis heute eine vergleichbar kommunikationstheoretisch fundierte Konzeptualisierung. Das in der Textlinguistik schon lange eingeführte Konzept der Textualität, dem in diesem Zusammenhang eine besondere Bedeutung zukommt, ist in der durch de Beaugrande/ Dressler (1981) etablierten Tradition als ein kognitionstheoretisches Konzept entwickelt und weitergeführt worden. Eine kommunikationstheoretisch überzeugende Alternative dazu gibt es nach wie vor nur in Ansätzen. Die Diskussion von Textualität ist in der Folgezeit zumeist für die Frage der Definition des Text-Begriffs instrumentalisiert worden. Im Mittelpunkt stand, verkürzt gesagt, die definitorische Frage, welchen Kriterien ein schriftsprachliches Vorkommen genügen muss, damit es „Text“ genannt werden darf. Diese Diskussion erscheint in dem Maße überholt, wie sie den Prozess der Textkonstitution beim (Schreiben und) Lesen aus dem Blick verliert (vgl. z.B. die Beiträge in Fix et al. (Hg.) 2002). allgemeines Merkmal von Texten, als dass der Verlockung einer solchen Gleichung nicht nachgegeben werden könnte.“ (Ehlich 2007a, S. 604). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 61 Mit dem Übergang von Textualität zu Lesbarkeit verbinden wir deshalb einen kommunikationstheoretischen Neuansatz, der Textualität von vornherein als Problem im Gegenstandsbereich selbst verortet und als Problem der Emergenz von Lesbarkeit im Moment der Lektüre versteht (Hausendorf et al. i.Vorb.). Zu rekonstruieren ist dann, wie Lesbarkeit als kommunikative Errungenschaft beim Lesen hergestellt wird. 5 Damit ist allerdings nicht gemeint, den Prozess der Textkonstitution in den Kopf der Leser und Leserinnen zu verlagern. Zweifellos ist das Lesen ein kognitiver Vorgang (dem die kognitionswissenschaftlich ausgerichtete (Text-)Linguistik sehr viel Aufmerksamkeit gewidmet hat: vgl. mit sprechendem Titel z.B. Schnotz 2006), aber als solcher interessiert er uns gerade nicht. Der Fluchtpunkt unseres Konzeptes sind vielmehr die Lesbarkeitshinweise, an die Lesende anschließen können und anschließen müssen. Unser Interesse gilt deshalb nicht dem in einer konkreten Lektüre tatsächlich Gelesenen, sondern dem in einer konkreten Lektüresituation (durch Lesbarkeitshinweise) lesbar Gemachten. Ob dieses Lesbare auch das tatsächlich Gelesene ist, ist dann schon eine andere Frage, die auf einen anderen Gegenstandsbereich und andere Methoden führt (z.B. im Sinne einer „Psychologie des Lesens“: Christmann/ Groeben 1999). 6 Das Insistieren auf Lesbarkeit hat seinen Sinn darin, dass es uns zurückführt auf die Frage nach dem, was einen Text, z.B. ein Stück beschriftetes Papier, lesbar werden lässt: eben die Lesbarkeitshinweise. Zu rekonstruieren, wie Lesbarkeit als kommunikative Errungenschaft beim Lesen hergestellt wird, heißt, die Lesbarkeitshinweise zu rekonstruieren, die im Moment der Lektüre ausgehend von der Wahrnehmung in der Lektüresituation, den sprachlichen Erscheinungsformen und der Vertrautheit mit dem Lektürekontext zur Verfügung stehen. Dabei zeigt sich dann schnell, dass Lesbarkeit in der modernen Text- und Schriftkultur ein komplexes Bündel unterschiedlicher Lesbarkeitsmerkmale in sich vereint. Dabei handelt es sich um Merkmale wie Begrenzbarkeit, intratextuelle Verknüpfbarkeit, thematische Zusammengehörigkeit, pragmatische Nützlichkeit, Musterhaftigkeit und intertextuelle Beziehbarkeit (Hausendorf/ Kesselheim 2008). Diese Merkmale sind als ‘Textualitätskriterien’ seit de Beaugrande und Dressler in der Textlinguistik der Sache nach immer wieder und kontrovers diskutiert worden. Die genannte Liste stellt einen Neuvorschlag 5 Diese Perspektive passt gut zur Tradition der ethnomethodologisch geprägten Textanalyse, wie sie bei Wolff ebenfalls unter dem Begriff der „sozialen Lesbarkeit“ skizziert wird (Wolff 2006, 2008). 6 Dieser Ansatz weist Überschneidungen mit der Vorstellung des „impliziten“ oder „Modell- Lesers“ auf, sofern die für die Analyse interessanten Leser und Leserinnen nicht die „empirischen“ Leser aus Fleisch und Blut sind, sondern die aus Papier, die im Text selbst als antizipierte Leser und Leserinnen zuhause sind (Iser 1994; Eco 2011). Heiko Hausendorf / Wolfgang Kesselheim 62 vor, der versucht, dem inzwischen erreichten Forschungsstand gerecht zu werden. 7 Lesbarkeitshinweise sind auf diese Merkmale zu beziehen, so dass ein Text durch Lesbarkeitshinweise im Sinne der Auswertung von Abgrenzungs- und Gliederungshinweisen, Verknüpfungshinweisen, Themahinweisen, Funktionshinweisen, Intertextualitätshinweisen und Textsortenhinweisen zustande kommt. Dabei darf man die Lesbarkeitshinweise nicht reifizieren, sondern muss ernst nehmen, dass sie im Moment der Lektüre als emergente Phänomene zu betrachten sind, d.h. erst beim und mit dem Lesen selbst wahrnehmungs-, sprach- und vertrautheitsabhängig manifest werden. Ungeachtet der vermeintlichen Dinglichkeit des physischen Text-„Substrats“ (s.o.) gibt es also keine Vorgängigkeit einer Spur, die die textlinguistische Analyse nur noch positivistisch zu registrieren hätte (zur epistemischen Logik der Spur: Krämer et al. (Hg.) 2007; Scherner 1994). Lesbarkeit steht vielmehr dafür, dass Kommunikation durch Texte wahrnehmungs-, sprach- und vertrautheitsorientiert anschlussfähig und wahrscheinlich wird. Dafür braucht es einen Anreiz, aufgrund dessen es Leserinnen und Lesern nahegelegt wird, einen Unterschied zu machen zwischen einer Information (einem Sachverhalt in der Welt: Darstellung sensu Bühler) und ihrer Mitteilung, d.h. der Absicht, diese Information einem anderen zu verstehen zu geben (Ausdruck und Appell sensu Bühler). 8 Lesbarkeitshinweise leisten abstrakt formuliert genau das: Sie veranlassen Leser und Leserinnen, eine Mitteilungsabsicht zu unterstellen und in genau diesem Sinne Lesbarkeit hervorzubringen. Wenn man es so fasst, wird sofort deutlich, worin der genuine Leistungsbeitrag der Alphabetschrift besteht (s.o.): Die Alphabetschrift entwickelt auf einen Schlag einen starken Lesbarkeitssog, weil sie als evolutionäre Errungenschaft so „unwahrscheinlich“ ist (Luhmann 1981), dass sie sofort die Unterscheidung von Information und Mitteilung provoziert. Zugleich zeigt sich, dass auch und gerade die Schrift als Lesbarkeitshinweis ein in der Lektüresituation emergentes Phänomen ist: Damit sie gelesen werden kann, müssen Lesende mit der fraglichen Schrift vertraut sein. Ein beschrifteter Zettel, der unübersehbar auf einem leeren Tisch liegt, ist nur für den, der lesen kann, ein (schwer ignorierbarer) Lesbarkeitshinweis - für ein Kleinkind mag derselbe Zettel ein greifbares, zusammenknüllbares, vielleicht sogar essbares Etwas sein, ein Lesbarkeitshinweis jedenfalls nicht. Die hier skizzierte Auffassung von Lesbarkeit als Bedingung der Möglichkeit der Kommunikation mit Texten und durch Texte hat eine wichtige Implikation, auf die wir abschließend aufmerksam machen wollen, weil sie für den Übergang zu den Benutzbarkeitshinweisen der Architektur wichtig ist. Wäh- 7 Vgl. Habscheid (2009, S. 34f.), der die genannten Merkmale systematisch mit den Textualitätskriterien von de Beaugrande und Dressler vergleicht. 8 Diese Formulierung folgt Luhmanns Verstehensbegriff, mit dem die Einheit der Trias von Ausdruck, Darstellung und Appell entwickelt werden kann (Luhmann 1984, S. 193ff.). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 63 rend die Face-to-face-Interaktion in Episoden zerfällt und Anfang und Ende hat (Hausendorf (Hg.) 2007), die sich in den Erscheinungsformen der Interaktion als „Eröffnungs-“ und „Beendigungsaktivitäten“ manifestieren, ist die Zeitlichkeit eines konkreten Lektürevorgangs den Erscheinungsformen dieser Kommunikation (dem Text als Gesamt seiner Lesbarkeitshinweise) zwangsläufig äußerlich. Zwar sind die Lesbarkeitshinweise grundsätzlich auf die Zeitlichkeit der Lektüre bezogen und als solche auch zu rekonstruieren (als Manifestationen von Erwartungen und Projektionen, als Anleitung zu Rückgriffen auf schon Gelesenes und Vorgriffen auf noch zu Lesendes), aber ob und wie diese Hinweise in einer konkreten Lektüre dann auch umgesetzt werden, kann man den Hinweisen selbst nicht ansehen. Auch in dieser Hinsicht lässt sich die Textkommunikation als Dauerkommunikation (siehe Kap. 1) verstehen, die auf der Beständigkeit und Wirksamkeit ihrer Lesbarkeitshinweise beruht - und (anders als die Face-to-face-Interaktion) nicht auf der Episodenhaftigkeit des Vollzugs dieser Hinweise. Man kann also sagen, dass die kommunikative Relevanz der Lesbarkeitshinweise auf die Potenzialität des möglich und wahrscheinlich Gemachten bezogen werden muss. 9 Zwar hat das Lesen durch Leser und Leserinnen aus Fleisch und Blut einen zumeist klar angebbaren Anfang und ein klar angebbares Ende. Doch dies berührt ja nur das Gelesene in der ganzen Kontingenz einer faktischen Lektüre, nicht das Lesbare des Textes, das sich ganz der Emergenz der Lesbarkeitshinweise verdankt, die sich bei jeder Kommunikation neu bewähren muss bzw. anders bewähren kann - was die Rekonstruktion der Lesbarkeitshinweise zu einer analytischen Aufgabe eigener Art macht. 3. Architektur als Ensemble von Benutzbarkeitshinweisen Wenn man vom Konzept der Dauerkommunikation ausgeht, wie wir es anhand der Textkommunikation diskutiert haben, lassen sich auch gebaute Räume in genau diesem Sinne von Dauerkommunikation verstehen: Der gebaute und gestaltete Raum ist gleichsam das physische Substrat (s.o.) der Kommunikation mit und durch Architektur, das als Anreiz verstanden werden kann, eine Unterscheidung von Information und Mitteilung zu machen und so den Raum zu „verstehen“ (im Sinne Luhmanns, s.o.). Architektur wird dadurch im Sinne „architektonischer Erscheinungsformen“ von Kommunikation (Hausendorf/ Schmitt im Theorieteil dieses Bandes) rekonstruierbar. In der einschlägigen Forschung ist dieser Sachverhalt unterschiedlich thematisiert worden. So ist aus semiotischer Perspektive vor allem die Zeichenhaftigkeit der Architektur mit all ihren Implikationen betont worden: von der Untersu- 9 Vgl. dazu auch Ehlich (1994, S. 33), der davon spricht, dass „die kommunikative Qualität völlig in die Potentialität zurückgenommen“ sei, diese Aussage aber auf die „bis heute nicht oder kaum entschlüsselten Texte“ beschränkt. Heiko Hausendorf / Wolfgang Kesselheim 64 chung einzelner architektonischer Elemente (wie Ecos bekannter Analyse der Säule, Eco 1972a) über Studien zu Gebäuden (wie Stenglin 2011) bis hin zu Analysen der Stadt (wie in Barthes 1988b, die ihn dazu geführt hat, von „Lektüren der Stadt“, von der Stadt als Schrift, vom „Schreiben durch den Stein“ oder auch explizit von der „Lesbarkeit der Stadt“ zu sprechen); von Ansätzen, die nach den sozialen Bedeutungen von Zeichenarrangements im Raum fragen wie die aktuellen Ansätze der „geosemiotics“ (z.B. Scollon/ Scollon 2003) oder der „linguistic landscapes“ (Gorter 2006; Backhaus 2007; Shohamy/ Gorter (Hg.) 2009) bis hin zu Fragen nach der speziellen Form von (Massen-) Kommunikation, die durch und mit Architektur zustande kommt (Eco 1972b, S. 296ff., 332). Auch wenn in der Architektursemiotik naturgemäß die Frage nach der Bedeutung der Architektur im Vordergrund steht (charakteristisch dafür scheint uns Ecos Beschreibung der Denotation und Konnotation architektonischer Elemente zu sein: Eco 1972a und 1972b, S. 301-317), gibt es Versuche, die kommunikativen Funktionen von Architektur zu bestimmen. So identifiziert z.B. Preziosi (1979a, S. 47-55, und 1979b, S. 61-73) in Anlehnung an Jakobson eine „directive function“ des gebauten Raums, die darin besteht, dass bestimmte Verhaltensweisen „are staged or induced through the spatiotemporal organization of given constructs, and environmental objects carry exhortations to channel, constrain and routinize spatio[kinetic] activity“ (Preziosi 1979a, S. 52), und eine „territorial function“ (angelehnt an Jakobsons phatische Funktion), mit der der gebaute Raum in Kontakt mit dem Nutzer tritt und „Anweisungen“ zu seiner korrekten Nutzung gibt (ebd., S. 53). 10 Gebaute Räume etablieren ein „behavior setting“, das bestimmte Verhaltensmuster nahelegt (Barker 1968). Auch alltagsintuitiv liegt ja die Vorstellung nahe, dass wir, wenn wir ein Museum, eine Kirche oder einen Hörsaal oder auch einen Supermarkt oder eine shopping mall (Delitz 2005, S. 59ff.) betreten, unmittelbar in eine Kommunikation hineingezogen werden, dass der gestaltete Raum auf vielfältige Weise zu uns spricht (talking places): dass er uns „sagt“ (auch wenn es keine Beschriftungen und keine Lautsprecherstimme, kein voice over gibt), wohin wir schauen sollen, wohin wir unsere Schritte lenken sollen und was wir wo genau wie zu tun haben. Wir wollen diese „interaktionsarchitektonischen Implikationen“ (Hausendorf/ Schmitt im Theorieteil dieses Bandes) in Analogie zu den Lesbarkeitshinweisen als Benutzbarkeitshinweise verstehen. Im Folgenden wollen wir zunächst an Beispielen illustrieren, wie Benutzbarkeitshinweise in Interaktion relevant werden können, bevor wir auf den Vergleich mit den Lesbarkeitshinweisen zurückkommen. 10 Vgl. Ravelli/ Stenglin (2008), die aus systemfunktionalistischer Perspektive untersuchen, wie gebaute Räume die ‘interpersonelle Metafunktion’ von Zeichensystemen realisieren, indem sie Gefühle bei ihren Nutzern induzieren. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 65 Der gebaute Raum kann aufgrund seiner Benutzbarkeitshinweise nicht nur physisch, sondern auch sozial eine Zumutung sein, weil wir uns seinen Benutzbarkeitshinweisen oftmals kaum entziehen zu können glauben. Ein anschauliches Beispiel dafür bietet die im Folgenden wiedergegebene Szene (vgl. Abb. 1), in der Studierende dabei sind, einen Seminarraum umzuräumen (Beispielnachweis und Analyse in Hausendorf 2012b): Im Seminarraum 11 11 Auf den folgenden Bildern ist jeweils der in der darunterstehenden Transkription fett gedruckte Moment der Äußerung zu sehen. Bild 6 zeigt den Augenblick im unmittelbaren Anschluss an die letzte hier wiedergegebene Äußerung unter Bild 5. 1 2 NI GE DO BA KA DO: ( wem_er / wetsch) DO: alli TISCH (scho mol anerucke-/ an rAnd Use-) 3 4 BA: JA : [ICH find schO: wil KA: [(susch isch so-) BA: susch isch_s eifach Heiko Hausendorf / Wolfgang Kesselheim 66 5 6 BA: so : (.) susch isch_s so DINGSmässig- (.) susch isch so: VORlesigsmässig; Abb. 1: Wider die Benutzbarkeitshinweise: Studierende gestalten einen Seminarraum zum ‘Kinosaal’ um. Interessant an dieser Szene 12 ist für den vorstehenden Zusammenhang, dass eine Teilnehmerin als Begründung (account) für ihre Aktivitäten (das Verrücken von Tischen) eine Qualität des umgebenden Raumes geltend macht, die es zu verändern gilt. In der vorgefundenen Anordnung von Tischen und Stühlen, also im Hinblick auf die Raumgestaltung, wird der Raum in seinen Implikationen als problematisch behandelt und von den Beteiligten in seinen mobiliaren Benutzbarkeitshinweisen als soziale Zumutung erlebt. Offenbar geht es in der Szene darum, etwas mit den Tischen zu machen, sie von einer Position innerhalb des Seminarraumes in eine Position an den Rändern (also an den Wänden des Seminarraumes) zu bewegen. Mit dieser teils angestrebten, teils schon vollzogenen Bewegung verändern die Tische ihre Form der Benutzbarkeit: Um den Tisch herum, den die Interaktionsteilnehmerin Barbara (BA) bereits an die Wand geschoben hat, kann man z.B. nicht mehr sitzen. Seine „Besitzbarkeit“ ist damit noch nicht ausgeschlossen, aber deutlich eingeschränkt. Der, der sich an diesen Tisch setzen wollte, fände sich mit Blickrichtung zur Wand, was eine Nutzung des Tischs nahelegt, in der es nicht darum geht, andere zu sehen und von anderen gesehen zu werden. Mit der angestrebten Positionierung der Tische am Rand des Raumes wird eine Nutzung, die eine auf einen gemeinsamen sozialen Anlass hin orientierte „Besetzung“ der Tische verlangt, unmöglich gemacht. Auch wenn die an den Rand gerückten Tische projektiv als Ablage- und Abstellflächen genutzt werden können, fragt sich, was im dann „frei“ werdenden Innenraum des Seminarraumes möglich und wahrscheinlich werden 12 Für die Transkriptionen in diesem Beitrag bedanken wir uns bei Barbara Zeugin und Tobias Funk, für das Layout der Standbildsequenzen bei Andi Gredig. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 67 kann. Zunächst ist nicht zu übersehen, dass Bewegung und Beweglichkeit stark zunehmen, der Raum stärker als bislang zu einem Raum für Bewegung (z.B. Tanzen) werden kann. Weiterhin werden alle sozialen Anlässe problematisch, für die es wichtig wäre, einen Tisch bzw. den Teil eines Tisches exklusiv vor sich und für sich zu haben. Andauernde Schreib- und Lektürearbeiten in geteilter Gegenwart anderer werden ohne Tisch schwierig(er). Man könnte das fortführen. Aber es wird vielleicht auch so deutlich, dass mit der geplanten Positionierung der Tische jedenfalls das Nutzen des Raumes als „Seminarraum“ schwierig(er) wird: das Nutzen des Raumes als Ort, an dem sich Lehr-Lern-Interaktion in einer bestimmten Sitzordnung vollziehen kann (in Reihen hintereinander oder im Stuhl- und Tischkreis: vgl. dazu auch die Hinweise auf die Möblierung des „Klassenzimmers“ bei Dausendschön-Gay und Schmitt i.d.Bd.). In dem letzten hier wiedergegebenen Beitrag von Barbara (BA) findet sich eine explizite Begründung, die genau in diese Richtung geht (susch isch s eifach so susch isch s so dingsmässig susch isch so vorlesigsmässig). Argumentiert wird mit dem, was ist, wenn die Tische nicht verrückt werden, wenn alles im Raum so bleibt, wie es ist (susch „sonst“). Der aktuelle Zustand des Raumes erscheint damit als irgendwie problematisch: Wenn es so bleibt, wie es ist, ist es in einer Weise, die unbefriedigend ist. Worin diese Art und Weise besteht, die durch die aktuelle Positionierung der Tische mitbestimmt ist, bleibt in der Äußerung zunächst auffällig unausgesprochen. Der einleitende Äußerungsteil (susch isch s so) wird dreimal wiederholt, ohne dass die notwendige Adjektiv- Ergänzung (so …? ) erfolgt. Hinzu kommt, dass beim zweiten Mal verzögert eine Umschreibung erfolgt (dingsmässig), die anzeigt, dass der Sprecherin gerade das richtige Wort fehlt, für das, was ihr - so die Suggestion - gerade evident vor Augen steht (eifach so …). Und auch die Einlösung der Äußerungsstruktur mit der Adjektiv-Ergänzung vorlesigsmässig zeigt noch in der Wortbildung (eine im Deutschen sehr produktive „Spontanbildung“ mit dem Suffix „-mäßig“: vgl. z.B. Weinrich 1993, S. 1007) die Suche nach dem passenden Ausdruck und das Sich-Behelfen mit einer Umschreibung an. Für das, worum es geht, fehlt der Sprecherin, so ihre Darstellung, der passende Ausdruck. Die Tische und ihre Position im Raum bekommen damit Sinn als Ausdruck für etwas, das schwer begrifflich zu fassen ist, aber mit dem zu tun hat, was der Raum in seinem So-Sein ausstrahlt und vermittelt in Bezug auf das, was in ihm an sozialer Aktivität möglich und wahrscheinlich ist, hier und jetzt aber gerade außer Kraft gesetzt werden soll. Barbara macht diesen Sinn in ihrem Beitrag über einen speziellen Typus universitärer Lehrveranstaltungen zugänglich: den Typ der ‘Vorlesung’. Die Atmosphäre des unveränderten Raumes hat also mit seiner Entsprechung zum Raum einer Vorlesung (dem Hörsaal) zu tun. Diese auf eine bestimmte universitäre Lehrsituation hin ori- Heiko Hausendorf / Wolfgang Kesselheim 68 entierte Atmosphäre des Raumes erscheint als etwas Negatives und Unerwünschtes, das sich nicht mit dem verträgt, was im Raum demnächst passieren soll. Was genau an Implikationen zur Debatte steht, auf die hier mit der Umschreibung vorlesungsmäßig verwiesen wird, bleibt im fraglichen Ausschnitt unausgesprochen und vage. Barbaras Begründung appelliert an die Vertrautheit der Anwesenden mit der charakteristischen räumlichen Situierung einer Vorlesung. Für das, was Barbara ihrer eigenen Darstellung nach eher „vorschwebt“, als dass sie es begrifflich fassen kann, bietet sich vielleicht nicht zufällig der bereits verwendete Ausdruck ‘Atmosphäre’ an. Er bringt etwas zum Ausdruck, das sich im Übergang von den multimodal durch Wahrnehmungen, Bewegungen und Handlungen realisierten Benutzbarkeitshinweisen zum metapragmatischen Reden über diese Benutzbarkeitshinweise ergibt: die sozialtopografische Aufladung der Benutzbarkeitshinweise im Sinne einer sozialen Situation (wie der ‘Vorlesung’), die über die interaktionsarchitektonischen Implikationen hinausgeht und sich offenbar schwer auf den Begriff bringen lässt. Über ‘Atmosphäre(n)’ lässt sich reden, über Benutzbarkeitshinweise in der Regel nicht. 13 Es sind wohl insbesondere die mit der Hörsaalbestuhlung implizierten Benutzbarkeitshinweise, auf die hier verwiesen wird, ohne dass sie als solche benannt werden (müssen). Fast jede Darstellung eines Hörsaals dokumentiert diese Benutzbarkeitshinweise (Beispielnachweis und weitere Analysen in Hausendorf 2012a). Im Hörsaal Der Hörsaal ist in vielfacher Hinsicht der Prototyp für die Situierung universitärer Lehre - er ist die architektonische Antwort auf Situierungsprobleme des Interaktionstyps ‘Vorlesung’ (Hausendorf 2012a), die u.a. darauf zurückgehen, dass wir es hier mit einer Erscheinungsform von Versammlungsöffentlichkeit zu tun haben. Mit dem Bauen und Gestalten von ‘Hörsälen’ hat die Lösung solcher Situierungsprobleme über Jahrhunderte hinweg architektonische Sedimentierungen hinterlassen, die eine starke Ressource für jede immer wieder aktuell stattfindende Interaktion darstellen. Schon mit der Inbesitznahme des Hörsaals durch die Anwesenden (mit ihrer Art, bestimmte Plätze einzunehmen) wird diese Ressource auf eine ebenso selbstverständliche wie effektive Weise interaktiv relevant gesetzt. Wenn die Dozentin (DZ) in der in Abbildung 2 illustrierten Szene die Anwesenden „zur Vorlesung“ begrüßt, ist die soziale Veranstaltung also längst etabliert, etwas übertrieben ge- 13 Der Begriff der ‘Atmosphäre’, der sich an dieser Stelle aufdrängt, ist auch architekturtheoretisch von Interesse, wenn es um das Erleben von Raum geht (vgl. z.B. Hahn 2012, S. 12ff.; aus architektursoziologischer Perspektive vgl. Delitz 2009, S. 81; vgl. auch Fischer-Lichte 2006 und Böhme 2006 am Beispiel von Kirchenräumen). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 69 sagt: ist interaktiv bereits entschieden, worum es in der gemeinsamen Interaktion geht und welches die für die relevante soziale Praxis konstitutive Aufgabenverteilung ist. Das ist ganz wesentlich ein Verdienst der architektonischen Benutzbarkeitshinweise, die die Musterhaftigkeit des Hörsaals manifestieren. Abb. 2: Wenn die Dozentin die Anwesenden begrüßt, ist die soziale Veranstaltung ‘Vorlesung’ längst etabliert Nicht erst die Wahrnehmung von im Raum angebrachten Zeichen (siehe Kap. 4), sondern schon das Betreten eines Raumes, das Sich-Bewegen im Raum und das Platz-Nehmen kommen so gesehen einer „Lektüre“ des Raumes gleich. Genau davon gibt uns Abbildung 2 einen Eindruck. Indem die Beteiligten bestimmte architektonisch und mobiliar etablierte Verweilpositionen (zum Beispiel, im Fall der Dozentin, den Podiumsbereich mit dem Rednerpult im Gegensatz zu den Sitzreihen mit aufklappbaren Schreibflächen) einnehmen, folgen sie einer gebauten Suggestion von Sinn und realisieren mit ihrem Geh-, Verweil-, Steh- und Sitzverhalten gleichzeitig soziale Positionen. Je stärker die Architektur des Raumes sozialtopografisch aufgeladen ist (etwa im Hinblick auf symbolisch hoch voraussetzungsreiche Orte; vgl. Hausendorf/ Schmitt 2010 und Hausendorf/ Schmitt im Empirieteil dieses Bandes am Beispiel des Kirchenraumes), desto stärker tritt in den Vordergrund, dass wir einen gebauten Raum auch dann „lesen“, wenn es nichts zu lesen gibt und wir uns vermeintlich nur in ihm bewegen. Je mehr sich die Sozialtopografie in die Architektur „einschreibt“ (Schreiben mit Stein, siehe oben), desto deutlicher wird, dass wir mit der Interaktionsarchitektur zugleich auch eine Sozial- Heiko Hausendorf / Wolfgang Kesselheim 70 topografie multimodal beantworten. Die „Lektüre“ des Raumes wird dabei in einem sehr unmittelbaren Sinn verkörpert: Wohin wir uns wenden, wie wir gehen (Schmitt 2012), wohin wir gehen und wo wir verweilen, wo wir nicht stehenbleiben, wo wir uns setzen, all das wird sozialtopografisch lesbar gemacht. Der Raum ist also, wenn man die Gemeinsamkeiten zum Text betonen will, voll von Lesbarkeitshinweisen im Sinne der oben genannten Lesbarkeitsmerkmale: In der Tat kann man die Analogie z.B. zwischen Buch und gebautem Raum mit Gewinn durchspielen und die Lesbarkeitsmerkmale, -quellen und -hinweise, die wir aus der textlinguistischen Analyse kennen (siehe Kap. 2), auf die kommunikative Relevanz von Räumen beziehen. So könnte man etwa die den Raum umgebenden Mauern mit speziell gekennzeichneten Eingangsbereichen als Abgrenzungshinweise verstehen; den freien Raum zwischen Podium und Stuhlreihen als Gliederungshinweis und die Treppenwege als Steuerungshinweis; im Rednerpult auf dem Hörsaalpodium könnte man einen Rahmungshinweis auf die Cathedra, den ‘Lehrstuhl’, als maßgebliche Organisationseinheit der Universität erkennen und in der Tafel einen Intertextualitätshinweis auf eine ganze Textwelt schon geschriebener und gelesener Tafeltexte. Insofern hat die Analogie von der Lesbarkeit des gebauten Raumes durchaus ihren Sinn (und könnte in der Konkretheit der einzelnen Hinweise wohl auch über die übliche metaphorische Verwendung des Text- Begriffs für architektonische Ensembles, wie sie in der Architektursemiotik zu finden sind, hinausgehen). Und doch geht in einer solchen Analogie verloren, dass das „Lesen“ z.B. eines Hörsaals oder eines Kirchenraumes etwas anderes ist als das Lesen z.B. eines Buches. Wer die Analogie allein betont, läuft Gefahr, Unterscheidungen aufzugeben, mithilfe derer man die Eigengesetzlichkeiten sowohl der Kommunikation durch Texte als auch der Kommunikation durch Architektur in den Blick bekommt. Als eine solche Unterscheidung wollen wir an dieser Stelle die Unterscheidung von Lesbarkeit und Benutzbarkeit einführen, weil sie dazu anregt, auf beiden Seiten der Unterscheidung näher an die Charakteristik der Kommunikation durch Texte und die Charakteristik der Kommunikation durch Architektur heranzukommen. Schon die Argumente für die Analogie zwischen Text und Raum weisen unseres Erachtens in die gesuchte Richtung: In dem Maße, in dem wir uns den interaktionsarchitektonischen Implikationen nähern (und von den im Raum angebrachten Zeichen zunächst einmal absehen), tritt immer stärker hervor, dass die Kommunikation durch Architektur ihren Fluchtpunkt in einer hochgradig situativ verankerten Kommunikation hat, die in besonderer Weise die menschliche Sensorik und Motorik involviert und deshalb auf Wahrnehmungen und Bewegungen im gebauten Raum ausgerichtet ist: „Architektur wird gesehen, durchschritten, betastet; wir liegen, sitzen, stehen in ihr.“ (Delitz Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 71 2009, S. 87). An dieser Stelle setzen die interaktionsarchitektonischen Basiskonzepte wie Sichtbarkeit, Hörbarkeit, Be-Greifbarkeit, Begehbarkeit, Betretbarkeit (Hausendorf/ Schmitt im Theorieteil dieses Bandes) an. Durch und mit Architektur werden (auch einsame, nicht in Gegenwart anderer vollzogene) Wahrnehmungen und Bewegungen dadurch zur Kommunikation, dass sie als Benutzung des gebauten Raumes aufscheinen und sich in ihnen architektonische Benutzbarkeitshinweise im Hinblick auf die genannten Basiskonzepte manifestieren. In der Kommunikation mit und durch Architektur geht es also darum, ein spezifisches Benutzen und „Gebrauchen“ (Hahn 2009, S. 87f.) des Raumes möglich und wahrscheinlich zu machen. In der Architekturtheorie ist dieser Zusammenhang besonders von Alexander et al. (1995 [1977]) stark gemacht worden, die eine „Sprache für Bau und Planung“ von Städten, Gebäuden und Räumen entwickeln. Diese ‘Sprache’ besteht aus ‘Mustern’ (etwa ‘Haupteingang’, ‘Zone vor dem Eingang’, ‘Eingangsraum’ oder ‘Die Treppe als Bühne’), die - wie in der Grammatik einer Sprache - immer neu miteinander kombiniert werden können und so unendlich viele konkrete architektonische Produkte ergeben. Jedes Muster wird mit seinen konkreten Merkmalen als Antwort auf je ein „in unserer Umwelt immer wieder auftretendes Problem“ verstanden, und die konkreten Merkmale der ‘Muster’ ergeben sich aus ihrem Beitrag zur Lösung dieses Problems: So soll die Treppe in einem Privathaus das Problem lösen, wie dem Herabsteigenden ein „Auftritt“ wie auf einer Bühne ermöglicht werden kann; oder der Eingangsraum in einem öffentlichen Gebäude das Problem, wie dem Eintretenden die ihm offenstehenden nächsten Schritte sichtbar gemacht werden können. Anders als im Falle des Lesens eines Buches findet das Benutzen von Räumen einen vergleichsweise leicht dokumentierbaren und insofern empirisch sehr gut zugänglichen Ausdruck: Die Emergenz von Benutzbarkeitshinweisen verkörpert sich gleichsam in beobachtbarer Sensorik und Motorik Anwesender. Für die Emergenz von Lesbarkeitshinweisen gilt das, wenn überhaupt, nur sehr eingeschränkt. Es ist oft gezeigt worden, wie sehr die Aneignung des modernen Textes zu einer kognitiven Herausforderung geworden ist (Illich 1991), die sich allenfalls aus Fixationen und Sakkaden mittels Eye-Tracking erschließen lässt, sich jedenfalls am Bewegungsverhalten von Lesern und Leserinnen in der Regel nicht „ablesen“ lässt. Wer einen Text (wie z.B. einen Roman) liest, tut das meist still und für sich. 14 Wer ein Buch liest, blickt nicht umher und geht auch nicht herum. Die sinnliche Wahrnehmung des Lesens ist eine hoch spezialisierte, in mancherlei Hinsicht „entsinnlichte“ Wahrnehmung (Giesecke 1992), die auf Ressourcen der material-räumlichen Lektüresituation kaum noch angewiesen scheint. 14 Damit wollen wir nicht die vielen Kulturen und Praktiken des gemeinsamen lauten (Vor-) Lesens leugnen: siehe Kapitel 4. Heiko Hausendorf / Wolfgang Kesselheim 72 Entsprechend ist die Lesbarkeit eines Texts typischerweise eine Antwort auf Fragen kognitiver Natur (wie: Worum geht es? Was ist der Zweck, den der Text verfolgt? ), jedenfalls sehr viel seltener eine Antwort auf Probleme der Sensorik und der Motorik (wie: Wohin muss ich jetzt gehen? ) 15 und fast nie eine Antwort auf Probleme der Ko-Orientierung von Wahrnehmungen, der Ko-Ordinierung von Bewegungen und der Ko-Operation unter Anwesenden. Die Architektur des gebauten Raumes dagegen kann als direkte Antwort auf Probleme der Interaktion verstanden werden. Genau hierin bewährt sich die Benutzbarkeit der Architektur: Benutzbarkeitshinweise stehen der Interaktion unter Anwesenden im Sinne einer Ressource zur Verfügung. Sie stehen der Interaktion (als Kommunikation unter der Bedingung der Anwesenheit der Kommunikationspartner) deshalb viel näher als Lesbarkeitshinweise. Tatsächlich gibt es Gegenbeispiele auf der Seite der Lesbarkeit, die die eben akzentuierte Unterscheidung von Lesbarkeit und Benutzbarkeit in Frage zu stellen scheinen: Man denke etwa an die Lektüre einer Möbelaufbauanleitung, die man möglicherweise auch an der Manipulation von Werkzeugen und Möbelelementen „ablesen“ kann. Oder an die Lektüre einer Wegbeschreibung oder Navigationshilfe, die sich möglicherweise auch am Geh- oder Fahrverhalten „ablesen“ lässt. Oder, und damit wollen wir uns abschließend beschäftigen, an die Lesbarkeit von Aufschriften und Kärtchen in einer Museumsvitrine. 4. Lesbarkeit und Benutzbarkeit Wir haben bislang mehr oder weniger davon abgesehen, dass gebaute Räume nicht selten ein Ort sind für die Anbringung symbolischer und ikonischer Zeichen, inklusive Schrift. Vor dem Hintergrund unserer Unterscheidung von Lesbarkeit und Benutzbarkeit sind „angebrachte“ Texte dieser Art besonders interessant, weil sie zeigen, wie Lesbarkeitshinweise und Benutzbarkeitshinweise zusammenwirken können und was ihre genuinen Leistungen sind. Wir wollen das am Beispiel einer Szene illustrieren, in der sich eine Gruppe von vier Kindern (Ayla (AY), Benno (BE), Chris (CH) und Dario (DA)) mit ihrer Betreuerin Friederike (FR) vor einer Vitrine in einem zoologischen Museum einfindet (vgl. Abb. 3). 15 Aarseth (1997, S. 1) hat in seiner Analyse von ‘Cybertexts’ auf solche Formen der Rezeption aufmerksam gemacht, die über die kognitive Interpretation des Gelesenen hinausgehen und äußerlich wahrnehmbare Reaktionen erfordern. Er nennt sie „extranoematisch“. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 73 Im Museum 1 2 FR BE CH AY DA FR: etz chönd_er mal s_skelET ahluege vom MURmeltierdas isch_s MURmeltierdas isch i dä BERgä, XX: SO gross ? FR: SO gross. 3 4 (3.0) FR: EICHhörnli- DA: AH bIber; dAs ( ) FR: chasch ihre au mal PLATZ mache? XX: ja ab[er ] FR: [und da]sch_skeLETT, da_sch_s EICHhörn li aber ihr chönd ja lÄse- (---) hÄ? 5 6 DA: WO? FR: JA (.) da_sch de SIEbesch lö fer gseht us wie e MUUS, aber hät ganz en lange schwanz; BE: <<liest> ! SIE ! bEnschlÄfer; > Heiko Hausendorf / Wolfgang Kesselheim 74 7 8 FR: ratte hätts sehr viel (.) wo, (-) am wasser; zum bispiel- BE: <<liest> WANder rat te-> FR: ja- XX: lug das isch en BIber, FR: los emal am ZÜRISEE; (-) XX: ahh- FR: detä wo mir oises BÖtli händ häts ganz viel STEI, (--) uf dene STEI ( ) det häts z (.) Z_Ässe ume, (wo) (.) sie uffrässed; CH: dA; <<liest> HAUSmaus- WALDmaus-> FR: genau. (-) das isch e [RATte; ] BE: [<<liest> WANder] FR: (-) das sind [ RAT te; ] DA: [<<liest> hausRATTE; ](.) hausRATTE; > BE: [<<liest> WANDERRATTE->] CH: [<<liest> WANDERRATTE->] Abb. 3: Die Benutzbarkeitshinweise der Vitrine werden durch die Besuchergruppe interaktiv relevant gemacht Schon in ihrem Bewegungsverhalten und dem Einnehmen einer bestimmten Konfiguration orientiert sich die Gruppe sichtbar an dem, was die Gestaltung des Raumes und seines Mobiliars nicht nur ermöglicht, sondern als besonders plausible, erwartbare und gleichsam „natürliche“ Benutzbarkeit nahelegt: das gemeinsame Verweilen an einer Betrachtungs-, Zeige- und Lesestation im Ausstellungsraum. Die wichtigsten Benutzbarkeitshinweise, die damit von der Gruppe, speziell auch durch FR, interaktiv relevant gemacht werden, sind die mobiliaren Benutzbarkeitshinweise, die in der Vitrine materialisiert sind, und durch die Gestaltung des Umgebungsraumes der Vitrine unterstützt werden. Sie machen aus dem Platz vor der Vitrine einen besonders attraktiven Platz: - die Ausrichtung auf Sichtbarkeit bei gleichzeitiger Verhinderung von Greif- und Anfassbarkeit durch die Materialität des Glases (lat. vitrum); - die Hervorhebung von Dingen im durchsichtigen Behälter durch die vitrineneigene Beleuchtung und durch die Gestaltung eigener Aufstellflächen und -vorrichtungen (Podeste); - die Ausrichtung auf eine Betrachtungsperspektive (und auf Lesen, s.u.) durch die Anbringung von Schrift auf der Glasfront der Vitrine; - die Ausrichtung auf gemeinsames sitzendes Verweilen vor der Vitrine durch die Aufstellung einer Sitzbank. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 75 Diese und andere Benutzbarkeitshinweise werden durch Ko-Orientierungen der Wahrnehmungen (z.B. die Aufforderung zum Anschauen (aluege) und die Zeigegesten der Betreuerin Friederike: Bilder 2 und 3), Ko-Ordinierungen der Bewegungen (z.B. das breite Ausschwärmen vor der Vitrine: Bild 1) und die Ko-Operation der Handlungen (z.B. das Platz-Schaffen für Ayla auf der Bank: Bilder 4 und 5) interaktiv aufgenommen und umgesetzt. Von besonderem Interesse für den vorstehenden Zusammenhang ist nun die Stelle, an der die Betreuerin die Lesbarkeit der angebrachten Schrift als spezielles Angebot der Benutzbarkeit der Vitrine ins Spiel bringt (aber ihr chönd ja lÄse- (---) hÄ? , Bild 3), das ihre eigenen, vorangegangenen mündlichen Kommentare (Bilder 2 und 3) gleichsam überflüssig macht. Neben das Betrachten tritt damit das Lesen als Option in den Vordergrund. Die Kindergruppe übernimmt diese neue Orientierung sofort: Benno und Chris drücken ihre Rücken durch und beugen sich vor, was den Abstand zu den klein gedruckten „Schildchen“ minimiert (Bild 3 zu 4). Benno liest laut (vor) mit starker Dehnung und Betonung ! SIE! bEnschlÄfer; (5) und später WANderratte- (7), Chris liest laut vor HAUSmaus- WALDmaus- (7) und zusammen mit Benno WAN- DERRATTE- (7). Dabei wird nicht nur gelesen, sondern das Lesen wird als gemeinsame Aktivität eigens demonstriert und inszeniert, es wird gleichsam hörbar gemacht. Zu den Techniken des Sprechens-als-Lesen gehören: - ein auffallend verlangsamtes Sprechtempo, - ein Rhythmus, der ins Skandieren übergeht, - eine Überlautung, bei der [e] auch in unbetonter Position erhalten bleibt, - eine erhöhte Lautstärke (die sich im Lauf des gemeinsamen Lesens noch steigert), - Orientierung an der Aussprachenorm des Standarddeutschen („Schriftdeutschen“): Hauswie -maus werden nicht wie in der Mundart üblich monophthongiert, - auffälliges Nach-Vorne-Beugen und Anlehnung des Gesichts an die Glasfront (das die Anstrengung des Lesens gleichsam sichtbar macht). Für die Entzifferung der „Schildchen“ ist das laute Lesen auch bei noch unsicheren Lesern, wie es die vier Kinder sind, keinesfalls zwingend notwendig. Dominant scheint uns vielmehr die interaktive Funktionalität des lauten Lesens: Die Kinder zeigen sich gegenseitig an, dass sie ein Element der räumlichen Umwelt als etwas Lesbares identifiziert haben und laden die anderen dazu ein, diese Nutzung des Raums im Sinne des Lesens zur gemeinsamen Aktivität zu machen. Besonders hörbar wird das in der kurzen Phase chorischen Lesens, in der Benno und Chris vollständig synchron WANDERRATTE vorlesen. In diesem gleichzeitigen Lesen - in dem Benno und Chris gleichzeitig Heiko Hausendorf / Wolfgang Kesselheim 76 Leser- und Hörer-des-Gelesenen sein müssen, um sich aufeinander abstimmen zu können - wird besonders sinnfällig, wie das laute Vorlesen als „Methode“ verwendet wird, um Lesbarkeit als gemeinsame Orientierung in der Situation vor der Vitrine zu etablieren. 16 Das Lesen der Objektkennungen ist dabei eingebettet in die Benutzung der Vitrine als Teil des Ausstellungsraums. Es verselbständigt sich nicht als isolierte Tätigkeit, sondern wird gleichsam in Dienst gestellt für eine optimale Ausschöpfung des Angebots der Vitrine, das - so die Darstellung - erst in einer spezifischen Verbindung von Sehen und Lesen, Anschauen und Wissen, sich erschließt. Das Vorlesen eines Tiernamens wird so als Anweisung behandelt, das betreffende Exponat in der Vitrine zu suchen (Benno: ! SIE! bEnschlÄfer; Dario: WO? , Bild 5f.). Zumindest für die Betreuerin ist diese Verbindung von Lesen und Sehen, konkret im Sinne der Zuordnung und Kategorisierung, die dominante Orientierung - sichtbar etwa auch darin, dass sie das Vorlesen eines Tiernamens als erfolgreiche Identifikation des betreffenden Tiers behandelt (FR: JA (.) da_sch de SIEbeschlöfer, Bild 6; geNAU. (-) das isch e RATte, Bild 7; ja, Bild 8). Mit dieser Zuordnungsarbeit sind die Lesbarkeitshinweise der angebrachten Schrift natürlich keineswegs erschöpft. Vielmehr kann die Schrift im Zuge der weiteren Lektüre als eine komplexe Ressource für Wissenskommunikation in Anspruch genommen werden: So gibt es etwa Themahinweise, die sich aus der wiederholten Referenz auf ein und denselben Weltausschnitt ergeben (Nagetiere), Funktionshinweise, die aus dem Vorkommen lateinischgriechischer Terminologie abgeleitet werden können (Funktionsbereich der (Natur-)Wissenschaft), Gliederungshinweise, die sich daraus ergeben, dass alle Objektkennungen in der gleichen Schriftgröße geschrieben sind, die kleiner ist als die Vitrinenbeschriftung („Einheimische Nagetiere“), was die Objektkennungen auf einer niedrigeren Hierarchiestufe ansiedelt usw. Mit dieser Verzahnung von Betrachtbarkeit einerseits und Lesbarkeit andererseits werden die Benutzbarkeitshinweise der Vitrine im Sinne der Wissenskommunikation aktiviert. Damit einher geht die für die Ausstellung konstitutive Verwandlung von Dingen in Exponate: Die Lesbarkeit der Objektkennungen trägt - neben den mobiliaren Benutzbarkeitshinweisen der Vitrine - maßgeblich dazu bei, dass aus Dingen Exponate werden, die nicht in gleicher Weise wie andere Dinge „benutzt“, sondern „gelesen“ werden wollen: als Gegenstände, die es mit Aufmerksamkeit und Muße zu betrachten gilt, um ausgehend vom Gesehenen Informationen und Verstehen zu ermöglichen; das heißt auch: als Dinge, die primär als Zeichen interpretiert werden sollen. In diesem Sinne macht sich FR in unserem Beispiel zum Sprachrohr 16 Nur mit dieser interaktiven Funktionalität lässt sich übrigens überzeugend erklären, warum auch Erwachsene in unseren Daten in vergleichbaren Situationen immer wieder beginnen, laut vorzulesen, was geschrieben steht (Kesselheim 2012). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 77 der Institution Museum. Mit ihrer Fokussierung auf Lesbarkeit behandelt sie Dinge als Repräsentanten für eine Art oder Gattung (type-token). So jedenfalls wird es verständlich, wenn sie im Angesicht des Murmeltierexponats (in einer Vitrine im Schweizer Flachland) behaupten kann das isch_s MURmeltierdas isch i dä BERgä, Bild 2. Sie behandelt die Exponate also als Objektzeichen, denen ebenfalls eine Lesbarkeit zukommt, die es im Hinblick auf eine spezifische Wissenskommunikation auszuwerten gilt. Man sieht an diesen Beispielen sehr anschaulich, wie mit dem Übergang vom ‘Ding’ zum ‘Exponat’ mit den Techniken des ‘Ausstellens’, zu denen das Anbringen von Schrift gehört, der Übergang von der Benutzbarkeit eines Gegenstandes in die Lesbarkeit eines kommunikativen Zeichens (Verstehen) bewerkstelligt wird. Man sieht, anders gesagt, was Lesbarkeitshinweise (Texte) leisten können, wenn sie im Kontext mobiliarer Benutzbarkeitshinweise der „Ausstellung“ auftreten - aber dafür dann auch auf spezielle Aktivitäten wie das laute Lesen angewiesen sind, wenn sie unter Anwesenden, d.h. interaktiv, relevant werden sollen. 5. Fazit Die Wahrnehmung und Benutzung des gebauten Raumes lässt sich durchaus als Lektüre veranschaulichen, wenn man betonen möchte, dass interaktionsarchitektonische Implikationen sozialtopografisch verstanden und „gelesen“ werden. In diesem Sinne kann man mit einem gewissen Recht von der Lesbarkeit der Architektur sprechen (siehe Kap. 1 und 3). Andererseits muss man sehen, dass die Lektüre eines Textes ihrerseits eine hochgradig spezialisierte und evolutionär späte Spielart raum- und dingbezogener Benutzbarkeitshinweise darstellt. Im Fall der Lesbarkeitshinweise hat sich mit dem Aufkommen und der Verbreitung von Texten allmählich ein Typus von Benutzbarkeitshinweisen herausgebildet, der sich gegenüber einer zunächst situativ verkörperten und materialisierten Orientierung an Wahrnehmung und Bewegung mehr und mehr zugunsten einer die visuelle Wahrnehmung favorisierenden kognitiven Orientierung verselbständigt hat. Entsprechend unangemessen mögen wir es im Alltagssprachgebrauch empfinden, wenn wir das Lesen eines Buches als das Benutzen eines Dings auffassen wollten. Zwar ist in letzter Zeit durchaus zu Recht die Situationsbindung auch der schrift- und textbasierten Kommunikation betont worden, womit speziell die Materialität der schriftlichen Kommunikation in den Fokus gerückt worden ist (vgl. z.B. Holly 2013 am Beispiel der Diskussion von Textualität und Visualität); das von uns beschriebene Beispiel vor der Vitrine belegt diese Situationsbindung besonders anschaulich. Gleichwohl beruht die historisch bedeutsame Innovation der Kommunikation durch Texte darauf, dass sich Lesbarkeit gegenüber Benutz- Heiko Hausendorf / Wolfgang Kesselheim 78 barkeit verselbständigen und sich der ‘Text’ vom Situationsbezug der Benutzbarkeit mehr und mehr ablösen und fast vollständig unabhängig machen konnte. Wer das ignorieren wollte, wird beiden Seiten nicht gerecht: weder der Kommunikation durch Lesbarkeitshinweise, mit der die Kommunikation durch das physische Substrat des „Textträgers“ geradezu spektakulär verdinglicht worden ist (Ehlich 2007b, S. 500f.; 2007c, S. 573ff.), noch der Kommunikation durch Benutzbarkeitshinweise, in der die Kommunikation hinter die Evidenz der uns umgebenden, oftmals Stein gewordenen Architektur fast vollständig zurückzutreten scheint, so dass das genuin Soziale der Kommunikation mit und durch Architektur im Alltag zugunsten des So-Seins der Materialität des Raumes unauffällig und unscheinbar bleibt und analytisch mit einigem Aufwand entdeckt und betont werden muss (wie das z.B. in der Architektursoziologie geschieht, siehe Anm. 17). Anders als der Text, der seine kommunikative Nützlichkeit gleichsam vor sich her trägt und sich selbst als Kommunikation inszeniert, erscheint der gebaute Raum in seiner Objekthaftigkeit im Alltag wie „natürlich“ gegeben, also gerade nicht als Konstruktion zu kommunikativen Zwecken (vgl. dazu am Beispiel der „Funktionszeichen“ auch Barthes 1988a, S. 166). 17 Wir plädieren deshalb für die Unterscheidung von Lesbarkeit und Benutzbarkeit. Lesbarkeit ist als Grundbedingung schriftbasierter Kommunikation von Benutzbarkeit als Grundbedingung von Kommunikation mit und durch Architektur (inklusive Mobiliar) zu unterscheiden. In beiden Fällen kommt die Kommunikation dadurch zustande, dass es Hinweise gibt, die Leser und Leserinnen bzw. Benutzer und Benutzerinnen im Moment der Lektüre bzw. im Moment der Benutzung wie selbstverständlich realisieren („auswerten“) können. Weder sind die Lesbarkeitshinweise mit dem Text vorgegeben, noch stecken die Benutzbarkeitshinweise im gebauten Raum selbst. Als Erscheinungsform der Kommunikation sind sie an den Moment der Lektüre bzw. der Benutzung gebunden. Gleichwohl erschöpfen sie sich nicht in einer konkreten Lektüre bzw. in einer konkreten Nutzung, sondern stehen dauerhaft als Kommunikationspotenziale zur Verfügung (vgl. dazu den Unterschied von faktischer und erwartbar gemachter Interaktion: Hausendorf/ Schmitt im Theorieteil dieses Bandes). Sie ermöglichen Kommunikation nicht nur, sondern machen Kommunikation in einer bestimmten Art und Weise wahrscheinlich. In genau dieser Funktionalität müssen sie auch analysiert werden: Auch an der Architektur interessiert uns in dieser Hinsicht nicht das tatsächlich Benutzte, sondern das durch Architektur benutzbar Gemachte: „Das, was Archi- 17 Das dürfte ein Grund dafür sein, dass ‘Raum’ und ‘Räumlichkeit’ in der Interaktionslinguistik und in der Soziologie lange wenig Beachtung gefunden haben (vgl. aus linguistischer Perspektive z.B. Hausendorf 2010; vgl. aus soziologischer Perspektive z.B. Steets 2010 und allgemein die aktuelle Konjunktur raum- und architektursoziologischer Konzeptionen). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 79 tektur „sagt“, ist zunächst nichts anderes als eben die Nahelegung von Körperhaltungen und Bewegungen.“ (Delitz 2009, S. 88). Benutzbarkeitshinweise sind darin mit den „affordances“ der „ecological psychology“ vergleichbar: Sie fokussieren auf basale Anschlussmöglichkeiten im Sinne der interaktionsarchitektonischen Basiskonzepte. 18 Ihre spezifisch kommunikative Relevanz kommt dann mit der sozialtopografischen Aufladung dieser Basiskonzepte ins Spiel. Dazu ist die Analyse dann allerdings, wie in diesem Beitrag auf exemplarische Weise illustriert, auf Daten angewiesen, in denen konkrete Nutzungen (wie bei der gemeinsamen Nutzung des Seminarraums oder beim gemeinsamen Ausstellungsbesuch) dokumentiert sind. 6. Literatur Aarseth, Espen J. (1997): Cybertext. Perspectives on ergodic literature. Baltimore u.a.: Johns Hopkins University Press. Adamzik, Kirsten (2004): Textlinguistik. Eine einführende Darstellung. (= Germanistische Arbeitshefte 40). Tübingen: Niemeyer. Alexander, Christopher/ Ishikawa, Sara/ Silverstein, Murray/ Jacobson, Max/ Czech, Hermann (1995): Eine Muster-Sprache. Städte, Gebäude, Konstruktion. Wien: Löcker. [Englische Originalfassung 1977]. Antos, Gerd/ Hasler, Ursula/ Perrin, Daniel (2011): Textoptimierung. In: Habscheid, Stephan (Hg.): Textsorten, Handlungsmuster, Oberflächen. Linguistische Typologien der Kommunikation. Berlin/ New York: de Gruyter, S. 638-658. Auer, Peter (2010): Sprachliche Landschaften. Die Strukturierung des öffentlichen Raums durch die geschriebene Sprache. In: Deppermann/ Linke (Hg.), S. 271-298. Backhaus, Peter (2007): Linguistic landscapes. A comparative study of urban multilingualism in Tokyo. Clevedon: Multilingual Matters. Barker, Roger G. (1968): Ecological psychology. Concepts and methods for studying the environment of human behavior. Stanford: Stanford University Press. Barthes, Roland (Hg.) (1988): Das semiologische Abenteuer. Frankfurt a.M.: Suhrkamp. Barthes, Roland (1988a): Die Machenschaften des Sinns. In: Barthes (Hg.), S. 165-167. 18 Das zeigt sich auch in den Begriffen, die z.B. Gibson (1977) verwendet, um auf solche „affordances“ zu verweisen: „stand-on-able“, „walk-on-able“ etc. Die Nähe zu den interaktionsarchitektonischen Basiskonzepten von Sichtbarkeit, Betretbarkeit, Begehbarkeit etc. liegt auf der Hand (vgl. dazu auch die kritische Diskussion des Konzepts der „affordances“ bei Hutchby 2001). Allerdings modellieren die „affordances“ die menschliche Wahrnehmung der Umwelt, nicht ihre kommunikative Nutzung. - Gelegentlich wird das Konzept der „affordances“ auch im Kontext der Text- und Lesbarkeitshinweise rezipiert (vgl. etwa Pentzold et al. 2013, S. 85ff., die Textualitätshinweise explizit mit „Affordanzen“ verbinden und am Beispiel von „online-medialen Texten“ diskutieren). In der Sache vergleichbar (aber ohne Bezug auf das Konzept der „affordances“) ist auch die Argumentation bei ten Have (1999), der von „textual devices“ spricht. Heiko Hausendorf / Wolfgang Kesselheim 80 Barthes, Roland (1988b): Semiologie und Stadtplanung. In: Barthes (Hg.)., S. 199-208. Blumenberg, Hans (1983): Die Lesbarkeit der Welt. Frankfurt a.M.: Suhrkamp. Böhme, Gernot (2006): Atmosphären kirchlicher Räume. In: Artheon-Mitteilungen 24, S. 26-31. Christmann, Ursula/ Groeben, Norbert (1999): Psychologie des Lesens. In: Franzmann, Bodo/ Hasemann, Klaus/ Löffler, Dietrich/ Schön, Erich (Hg.): Handbuch Lesen. Im Auftrag der Stiftung Lesen und der Deutschen Literaturkonferenz. München: Saur, S. 145-223. de Beaugrande, Robert-Alain/ Dressler, Wolfgang Ulrich (1981): Einführung in die Textlinguistik. (= Konzepte der Sprach- und Literaturwissenschaft 28). Tübingen: Niemeyer. Delitz, Heike (2005): Gebaute Begehrlichkeit. Zur Architektursoziologie der Konsumgesellschaft in Deutschland. In: Hellmann, Kai-Uwe/ Schrage, Dominik (Hg.): Das Management der Kunden. Studien zur Soziologie des Shopping. Wiesbaden: Verlag für Sozialwissenschaften, S. 39-66. Delitz, Heike (2009): Architektursoziologie. Bielefeld: transcript. Deppermann, Arnulf/ Linke, Angelika (Hg.) (2010): Sprache intermedial. Stimme und Schrift, Bild und Ton. (= Jahrbuch des Instituts für Deutsche Sprache 2009). Berlin/ New York: de Gruyter. Diekmannshenke, Hajo/ Klemm, Michael / Stöckl, Hartmut (Hg.) (2011): Bildlinguistik. Theorien - Methoden - Fallbeispiele. (= Philologische Studien und Quellen 228). Berlin: Erich Schmidt. Domke, Christine (2014): Die Betextung des öffentlichen Raumes. Eine Studie zur Spezifik von Meso-Kommunikation am Beispiel von Bahnhöfen, Innenstädten und Flughäfen. Heidelberg: Winter. Dreyer, Claus (2003): Semiotische Aspekte der Architekturwissenschaft. Architektursemiotik. In: Posner, Roland/ Robering, Klaus/ Sebeok, Thomas Albert (Hg.): Semiotik. Ein Handbuch zu den zeichentheoretischen Grundlagen von Natur und Kultur/ Semiotics: A handbook on the sign-theoretic foundations of nature and culture. Bd. 3. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK) 13.3). Berlin/ New York: de Gruyter, S. 3234-3277. Duden (2006): Das Herkunftswörterbuch. Etymologie der deutschen Sprache. 4. Aufl. Mannheim u.a.: Dudenverlag. Dürscheid, Christa (2007): Schrift - Text - Bild. Ein Brückenschlag. In: Zeitschrift für Germanistische Linguistik 35, 1/ 2, S. 269-282. Eco, Umberto (1972a): A componential analysis of the architectural sign/ column. In: Semiotica, S. 97-117. Eco, Umberto (1972b): Einführung in die Semiotik. [Orig.: La struttura assente. Mailand: Bompiani, 1968]. München: Fink. Eco, Umberto (2011): Bekenntnisse eines jungen Schriftstellers. Richard Ellmann lectures in modern literature. Unter Mitarbeit von Burkhart Kroeber. München: Hanser. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 81 Ehlich, Konrad (1994): Funktion und Struktur schriftlicher Kommunikation. In: Günther, Hartmut/ Ludwig, Otto (Hg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung / Writing and its use. An interdisciplinary handbook of international research. Bd. 1. (= Handbücher zur Sprach- und Kommunikationswissenschaft/ Handbooks of Linguistics and Communication Science (HSK) 10.1). Berlin/ New York: de Gruyter, S. 18-41. Ehlich, Konrad (2007a): Sind Bilder Texte? In: Ehlich (Hg.), S. 603-618. Ehlich, Konrad (2007b): Text und sprachliches Handeln. Die Entstehung von Texten aus dem Bedürfnis nach Überlieferung. In: Ehlich (Hg), S. 483-507. Ehlich, Konrad (2007c): Textualität und Schriftlichkeit. In: Ehlich (Hg), S. 565-577. Ehlich, Konrad (Hg.) (2007): Sprache und sprachliches Handeln. Bd. 3. Diskurs - Narration - Text - Schrift. Berlin/ New York: de Gruyter. Fischer, Joachim (2009): Architektur: „schweres“ Kommunikationsmedium der Gesellschaft. In: Aus Politik und Zeitgeschichte 25, S. 6-10. Fischer-Lichte, Erika (2006): Kirchenräume als performative Räume. In: Artheon-Mitteilungen 24, S. 19-25. Fischer, Joachim/ Delitz, Heike (Hg.) (2009): Die Architektur der Gesellschaft. Theorien für die Architektursoziologie. Bielefeld: transcript. Fix, Ulla (2008): Nichtsprachliches als Textfaktor. Medium, Material, Ort. In: Zeitschrift für Germanistische Linguistik 36, 3, S. 343-354. Fix, Ulla/ Adamzik, Kirsten/ Antos, Gerd/ Klemm, Michael (Hg.) (2002): Brauchen wir einen neuen Textbegriff? Antworten auf eine Preisfrage. Frankfurt a.M.: Lang. Gibson, James J. (1977): The theory of affordances. In: Bransford, John/ Shaw, Roberts (Hg.): Perceiving, acting, and knowing. Toward an ecological psychology. Hillsdale, NJ: Erlbaum, S. 67-82. Giesecke, Michael (1992): Sinnenwandel, Sprachwandel, Kulturwandel. Studien zur Vorgeschichte der Informationsgesellschaft. Frankfurt a.M.: Suhrkamp. Goody, Jack/ Watt, Ian P./ Gough, Kathleen (1986): Entstehung und Folgen der Schriftkultur. Frankfurt a.M.: Suhrkamp. Gorter, Durk (2006): Introduction: The study of the linguistic landscape as a new approach to multilingualism. In: International Journal of Multilingualism 3, S. 1-6. Habscheid, Stephan (2009): Text und Diskurs. Paderborn: Fink. Hahn, Achim (2009): „Gebrauch und Geschmack“ - Architektonisches Verhalten im Kontext der Lebensführung. Die ‘Architektur der Gesellschaft’ aus Sicht der phänomenologisch-hermeneutischen Soziologie. In: Fischer/ Delitz (Hg.), S. 79-108. Hahn, Achim (2012): Erlebnislandschaft - Erlebnis Landschaft? Einführung in ein Forschungsprojekt. In: Hahn, Achim (Hg.): Erlebnislandschaft - Erlebnis Landschaft? Atmosphären im architektonischen Entwurf. Bielefeld: transcript, S. 11-37. Hausendorf, Heiko (1992): Gespräch als System. Linguistische Aspekte einer Soziologie der Interaktion. Opladen: Westdeutscher Verlag. Heiko Hausendorf / Wolfgang Kesselheim 82 Hausendorf, Heiko (Hg.) (2007): Gespräch als Prozess. Linguistische Aspekte der Zeitlichkeit verbaler Interaktion. (= Studien zur Deutschen Sprache 37). Tübingen: Narr. Hausendorf, Heiko (2010): Interaktion im Raum. Interaktionstheoretische Bemerkungen zu einem vernachlässigten Aspekt von Anwesenheit. In: Deppermann/ Linke (Hg.), S. 163-197. Hausendorf, Heiko (2012a): Der Hörsaal als Interaktionsraum. Ein exemplarischer Beitrag zur Archäologie der Vorlesung. In: Stefani, Elwys de/ Gazin, Anne-Danièle/ Ticca, Anna Claudia (Hg.): Space in social interaction. L’espace dans l’interaction sociale. Der Raum in der sozialen Interaktion. Lo spazio nell’intera-zione sociale. Bulletin Suisse de Linguistique Appliquée VALS/ ASLA 96. (= Bulletin Suisse de Linguistique Appliquée VALS/ ASLA 96). Neuchâtel: Université de Neuchâtel, S. 43-68. Hausendorf, Heiko (2012b): Über Tische und Bänke. Eine Fallstudie zur interaktiven Aneignung mobiliarer Benutzbarkeitshinweise an der Universität. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 139-186. Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2012): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr. Hausendorf, Heiko (2013): On the interactive achievement of space - and its possible meanings. In: Auer, Peter/ Hilpert, Martin/ Stukenbrock, Anja/ Szmrezcsanyi, Benedikt (Hg.): Space in language and linguistics: geographical, interactional and cognitive perspectives. Berlin/ Boston: de Gruyter, S. 276-303. Hausendorf, Heiko (i.Dr.): Warum der Text ein lesbares Etwas ist. Überlegungen zu Lesbarkeit als Bedingung schriftsprachlicher Kommunikation. In: Wagner, Franc (Hg.): Was ist ein Text? Aspekte einer interdisziplinären Texttheorie. (= TeNor - Text und Normativität 4). Basel: Schwabe. Hausendorf, Heiko/ Kesselheim, Wolfgang (2008): Textlinguistik fürs Examen. Göttingen: Vandenhoeck & Ruprecht. Hausendorf, Heiko/ Kesselheim, Wolfgang (2013): Können Räume Texte sein? Linguistische Überlegungen zur Unterscheidung von Lesbarkeits- und Benutzbarkeitshinweisen. (= Arbeitspapiere des UFSP „Sprache und Raum“, SpuR02). Zürich: Universität Zürich. www.zora.uzh.ch/ 84555/ 1/ SpuR_Arbeitspapiere_Nr02_Aug2013. pdf (Stand: Juni/ 2016). Hausendorf, Heiko/ Kesselheim, Wolfgang/ Kato, Hiloko/ Breitholz, Martina (i.Vorb.): Die Lesbarkeit des Textes. Linguistische Aspekte der Textkommunikation. Hausendorf, Heiko/ Schmitt, Reinhold (2010): Opening up openings: Zur Struktur der Eröffnungsphase eines Gottesdienstes. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen. Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 53-101. Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopographie. Umrisse einer raumlinguistischen Programmatik. (= Arbeitspapiere des UFSP „Sprache und Raum“, SpuR01). Zürich: Universität Zürich. www.zora. uzh.ch/ 78153/ 1/ SpuR_Arbeitspapiere_Nr01_Mai2013.pdf (Stand: Juni/ 2016). Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 83 Hauser, Susanne (1990): Die Stadt als Zeichenwelt. In: Kruse, Lenelis/ Graumann, Carl Friedrich/ Lantermann, Ernst-Dieter (Hg.): Ökologische Psychologie. Ein Handbuch in Schlüsselbegriffen. Weinheim: Beltz, S. 479-483. Holly, Werner (2013): Textualität - Visualität. In: Zeitschrift für Germanistische Linguistik 41, 1, S. 1-7. Hutchby, Ian (2001): Technologies, texts and affordances. In: Sociology 35, 2, S. 441-456. Illich, Ivan (1991): Im Weinberg des Textes. Als das Schriftbild der Moderne entstand. Ein Kommentar zu Hugos Didascalion. München: Beck. Iser, Wolfgang (1994): Der Akt des Lesens. Theorie ästhetischer Wirkung. München: Fink. Kesselheim, Wolfgang (2009): Die Analyse von Kommunikation in der Museumsausstellung. Eine Herausforderung für die Linguistik. In: Stenschke, Oliver (Hg.): Wissenstransfer und Diskurs. (= Transferwissenschaften 6). Frankfurt a.M. u.a.: Lang, S. 245-266. Kesselheim, Wolfgang (2010): Wechselspiele von ‘Text’ und ‘Kontext’ in multimodaler Kommunikation. In: Klotz, Peter/ Portmann-Tselikas, Paul R./ Weidacher, Georg (Hg.): Kontexte und Texte. Soziokulturelle Konstellationen literalen Handelns. (= Europäische Studien zu Textlinguistik 8). Tübingen: Narr, S. 327-343. Kesselheim, Wolfgang (2012): Gemeinsam im Museum: Materielle Umwelt und interaktive Ordnung. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 187-231. Kesselheim, Wolfgang/ Hausendorf, Heiko (2007): Die Multimodalität der Ausstellungskommunikation. In: Schmitt, Reinhold (Hg.): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr, S. 339-375. Kieserling, André (1999): Kommunikation unter Anwesenden. Studien über Interaktionssysteme. Frankfurt a.M.: Suhrkamp. www.gbv.de/ dms/ bs/ toc/ 3033 01015.pdf (Stand: Juni/ 2016). Kluge, Friedrich/ Seebold, Elmar (2011): Etymologisches Wörterbuch der deutschen Sprache. 25. Aufl. Berlin/ Boston: de Gruyter. Krämer, Sybille/ Bredekamp, Horst (Hg.) (2003): Bild - Schrift - Zahl. München. Krämer, Sybille/ Kogge, Werner/ Grube, Gernot (Hg.) (2007): Spur. Spurenlesen als Orientierungstechnik und Wissenskunst. Frankfurt a.M.: Suhrkamp. Luhmann, Niklas (1981): Die Unwahrscheinlichkeit der Kommunikation. In: Luhmann, Niklas (Hg.): Soziologische Aufklärung 3. Soziales System, Gesellschaft, Organisation. Opladen: Westdeutscher Verlag, S. 25-34. Luhmann, Niklas (1984): Soziale Systeme. Grundriss einer allgemeinen Theorie, Frankfurt a.M.: Suhrkamp. Nöth, Winfried (1985): Architektur. In: Nöth, Winfried (Hg.): Handbuch der Semiotik. Stuttgart: Metzler, S. 400-408. Pentzold, Christian/ Fraas, Claudia/ Meier, Stefan (2013): Online-mediale Texte: Kommunikationsformen, Affordanzen, Interfaces. In: Zeitschrift für Germanistische Linguistik 41, 1, S. 81-101. Heiko Hausendorf / Wolfgang Kesselheim 84 Preziosi, Donald (1979a): Architecture, language, and meaning. The origins of the built world and its semiotic organization. (= Approaches to Semiotics 49). Den Haag: de Gruyter Mouton. Preziosi, Donald (1979b): The semiotics of the built environment. An introduction to architectonic analysis, Bloomington. (= Advances in Semiotics). Bloomington: Indiana University Press. Raible, Wolfgang (1991): Die Semiotik der Textgestalt. Erscheinungsformen und Folgen eines kulturellen Evolutionsprozesses. (= Abhandlungen der Heidelberger Akademie der Wissenschaften. Philosophisch-historische Klasse, Jahrgang 1991. I. Abhandlung). Heidelberg: Winter. Ravelli, Louise J./ Stenglin, Maree (2008): Feeling space: Interpersonal communication and spatial semiotics. In: Antos, Gerd (Hg.): Handbook of Interpersonal Communication. Berlin/ New York: de Gruyter Mouton, S. 355-396. Schäfers, Bernhard (2006): Architektursoziologie. Grundlagen - Epochen - Themen. Wiesbaden: Verlag für Sozialwissenschaften. Scherner, Maximilian (1994): Textverstehen als „Spurenlesen“ - Zur texttheoretischen Tragweite dieser Metapher. In: Canisius, Peter/ Herbermann, Clemens-Peter/ Tschauder, Gerhard (Hg.): Text und Grammatik. Festschrift für Roland Harweg zum 60. Geburtstag. Bochum: Brockmeyer, S. 317-340. Schmitt, Reinhold (2012): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung. Online-Zeitschrift zur verbalen Interaktion 13, S. 1-44. www.gespraechsforschung-ozs.de (Stand: Juni/ 2016). Schmitz, Ulrich (2005): Blind für Bilder. Warum sogar Sprachwissenschaftler auch Bilder betrachten müssen. In: Osnabrücker Beiträge zur Sprachtheorie (OBST) 69, S. 187-227. Schnotz, Wolfgang (2006): Was geschieht im Kopf des Lesers? Mentale Konstruktionsprozesse beim Textverstehen aus der Sicht der Psychologie und der kognitiven Linguistik. In: Blühdorn, Hardarik/ Breindl, Eva/ Waßner, Ulrich Hermann (Hg.): Text - Verstehen. Grammatik und darüber hinaus. (= Jahrbuch des Instituts für Deutsche Sprache 2005). Berlin/ New York: de Gruyter, S. 222-238. Scollon, Ron/ Scollon, Suzie Wong (2003): Discourses in place. Language in the material world. London/ New York: Routledge. Shohamy, Elana/ Gorter, Durk (Hg.) (2009): Linguistic landscape. Expanding the scenery. London/ New York: Routledge. Smith, Ronald W./ Bugni, Valerie (2006): Symbolic interaction theory and architecture. In: Symbolic Interaction 29, 2, S. 123-155. Steets, Silke (2010): Der sinnhafte Aufbau der gebauten Welt - Eine architektursoziologische Skizze. In: Frank, Sybille/ Schwenk, Jochen (Hg.): Turn over. Cultural Turns in der Soziologie. Festschrift für Helmuth Berking. Frankfurt a.M.: Campus, S. 171-188. Stenglin, Maree (2011): Spaced out: An evolving cartography of a visceral semiotic. In: Dreyfus, Shoshana/ Hood, Susan/ Stenglin, Maree (Hg.): Semiotic margins. Meaning in multimodalities. London: Continuum, S. 73-100. Die Lesbarkeit des Textes und die Benutzbarkeit der Architektur 85 Strätling, Susanne/ Witte, Georg (Hg.) (2006): Die Sichtbarkeit der Schrift. München: Fink. ten Have, Paul (1999): Structuring writing for reading. Hypertext and the reading body. In: Human Studies 22, S. 273-298. Weinrich, Harald (1993): Textgrammatik der deutschen Sprache. Mannheim u.a.: Dudenverlag. Wolff, Stephan (2006): Textanalyse. In: Ayass, Ruth/ Bergmann, Jörg R. (Hg.): Qualitative Methoden der Medienforschung. Reinbek: Rowohlt, S. 245-273. Wolff, Stephan (2008): Dokumenten- und Aktenanalyse. In: Flick, Uwe/ Kardorff, Ernst von/ Steinke, Ines (Hg.): Qualitative Forschung: Ein Handbuch. Reinbek: Rowohlt, S. 502-513. Gliederung 1. Einführung ..............................................................................................................55 2. Text als Ensemble von Lesbarkeitshinweisen ....................................................58 3. Architektur als Ensemble von Benutzbarkeitshinweisen.................................63 4. Lesbarkeit und Benutzbarkeit ..............................................................................72 5. Fazit ..........................................................................................................................77 6. Literatur ...................................................................................................................79 II. VIDEOAUFZEICHNUNGEN ALS ANALYSEDOKUMENTE: MÖGLICHKEITEN UND PERSPEKTIVEN WOLFGANG KESSELHEIM VIDEOBASIERTE RAUMFORSCHUNG ALS INTERDISZIPLINÄRES FORSCHUNGSFELD: EIN EXEMPLARISCHER EINBLICK IN UNTERSCHIEDLICHE METHODISCHE ZUGÄNGE 1. Einleitung 1 Die Beiträge dieses Sammelbands nutzen Videoaufzeichnungen, um das Zusammenspiel von gebautem Raum und Interaktion zu erforschen. Damit befinden sie sich am Schnittpunkt zweier hochaktiver Forschungsfelder. Zum einen boomt (nicht nur) in der Linguistik und ihren Nachbardisziplinen die Forschung zum Thema ‘Raum’, zum anderen hat sich die Arbeit mit Video in den letzten Jahren als eine Standardmethode der qualitativen Forschung durchgesetzt, und es sind in schneller Folge eine Reihe von Überblicks- und Einzeldarstellungen zu qualitativen Methoden der Videoanalyse erschienen (siehe etwa Broth et al. 2014; Bohnsack 2009; Dinkelaker/ Herrle 2009; Goldman et al. (Hg.) 2007; Heath et al. 2010; Knoblauch et al. (Hg.) 2006; Kissmann (Hg.) 2009; Tuma et al. 2013; Mondada 2013). Anstatt den Versuch zu unternehmen, dieses komplexe und sich schnell verändernde Forschungsumfeld systematisierend darzustellen und in einem zweiten Schritt die eigene Videopraxis in diesem Umfeld zu verorten, soll in dem vorliegenden Beitrag ein anderer Weg gegangen werden: Über die Kontrastierung mit Ansätzen aus anderen Disziplinen, die ebenfalls an Praktiken der Raumnutzung und Raumkonstruktion interessiert sind und die ebenfalls mit Video arbeiten, soll herausgearbeitet werden, was genau den Umgang mit (und das Verständnis von) Video in den hier versammelten Arbeiten auszeichnet. Ich werde in diesem Beitrag exemplarisch vier Arbeiten vorstellen - zwei Arbeiten aus der Anthropologie (Mohn 2006; Pink 2007) und zwei aus der Erziehungswissenschaft (Hayes 2007; Nolda 2006). Obwohl sie ähnliche Fragen zum menschlichen Umgang mit dem Raum und seinen Implikationen stellen (oder zu stellen scheinen), offenbaren diese Studien gänzlich andere Vorstellungen davon, wie Video genutzt werden kann, um auf die zugrunde liegenden Fragen eine Antwort zu finden. Auf die Darstellung von Arbeiten, deren Umgang mit Video dem des hier vertretenen Ansatzes weitgehend entspricht - 1 Bedanken möchte ich mich speziell bei Christoph Hottiger und Kenan Hochuli, die das Entstehen dieses Beitrags mit ihren Diskussionen intensiv begleitet haben; mein Dank geht auch an den UFSP Sprache und Raum der Universität Zürich für seine Unterstützung. Wolfgang Kesselheim 90 sei es, weil sie den gleichen disziplinären Traditionen entstammen oder weil der Ansatz der Interaktionsarchitektur und Sozialtopografie durch sie inspiriert worden ist 2 - wurde dagegen bewusst verzichtet, weil es mir im vorliegenden Beitrag auf die Profilierung der im vorliegenden Band versammelten Ansätze im Kontrast zu anderen Ansätzen ankommt, die einen vergleichbaren Gegenstand haben. Die Darstellung der vier Arbeiten ist hochgradig selektiv und kann den betreffenden Arbeiten nicht im Detail gerecht werden. Doch soll es hier primär um die Beschreibung der Rolle gehen, die Video in diesen Forschungsansätzen einnimmt, und um die Beantwortung der damit verbundenen Frage, wie genau Raum jeweils über die Arbeit mit Video in den Blickpunkt der Forschung gerät. Wenn die folgende Darstellung auch an den einzelnen vorgestellten Arbeiten orientiert ist, so ist sie doch geprägt von einer Reihe grundlegender Fragen, die ihnen gemeinsam ist. Diese Fragen lauten: - Wie werden Praktiken der Raumkonstruktion und Raumnutzung mit der Videokamera erfasst? Gemeint ist hier zum einen: Was soll die Kamera filmen? Wird sie auf ein Interaktionsgeschehen gerichtet oder primär auf einen Schauplatz? Zum anderen geht es um die Frage, was unter den Begriffen ‘Raumkonstruktion’ oder ‘Raumnutzung’ zu fassen ist: Wer konstruiert Raum im Rahmen welcher Prozesse? Kann Video diese Prozesse abbilden und, wenn ja: wie? - In welchem Sinn ist Raum auf dem Video zu sehen? Hier geht es im Wesentlichen darum, ob Videoaufnahmen Zugang zu einer räumlichen Situation gewähren oder nur zur „Sicht“ des Forschenden auf diese Situation; und schließlich: - Welche Rolle spielt Video im Forschungsprozess? Oder anders gefragt: Wann und wie hilft Video dabei, Raumpraktiken zu analysieren und zu verstehen? Bei der Aufnahme? Beim Anschauen, dem Bearbeiten oder Zeigen des Videos? Diese Fragen gilt es beim Lesen der folgenden Abschnitte im Gedächtnis zu behalten. Der Blick auf die unterschiedliche Beantwortung dieser Fragen ermöglicht es, im Laufe der Lektüre ein immer präziseres Bild von der Arbeit mit Video zu entwickeln, die die Beiträge dieses Sammelbands kennzeichnet. 2 Gemeint sind etwa Charles Goodwins Untersuchungen zur interaktiven Rolle der „materiellen Strukturen“ in der Umwelt (siehe etwa Goodwin 2000, 2003), Untersuchungen aus dem Paradigma der ‘Workplace Studies’, etwa zur Konstruktion von Raum in professionellen Kontexten (siehe z.B. Heath/ Luff 1992), oder zu aktuellen videobasierten Studien zur interaktiven Konstruktion von Raum aus der skandinavischen Konversationsanalyse (z.B. Broth 2009). Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 91 2. Pink (2007): „Walking with video“ Sarah Pink untersucht als Sozialanthropologin die menschlichen Praktiken des ‘place-making’, also wie Menschen ihre materielle Umwelt mit sozialen und kulturellen Bedeutungen versehen. Besonders interessiert sich Pink für die sinnlich-körperlichen Aspekte des Prozesses des ‘place-making’. Um diesen auf die Spur zu kommen, schlägt sie eine Forschungsmethode vor, die sie „Walking with video“ nennt (Pink 2007, S. 240). Die Methode besteht darin, die für die Akteure bedeutsamen Orte mit den Akteuren zusammen aufzusuchen, sich die Orte im Gespräch zeigen und erklären zu lassen und dieses Geschehen mit einer Videokamera zu filmen. Ihre Methode illustriert Pink am Beispiel eines Projekts, in dem sie erforscht, wie Akteure im Verlauf des Aufbaus eines Gemeinschaftsparks oder -gartens diesen als spezifischen ‘place’ konstruieren. 3 Pink argumentiert, die Arbeit mit einer mobilen Kamera sei dem von ihr untersuchten Prozess des ‘place-making’ in besonderer Weise angemessen, da die körperliche Bewegung durch den Raum für die Konstitution des Raumes eine besonders wichtige Rolle spiele. In der Bewegung der Akteure durch den Raum verbinden sich visuelle Wahrnehmungen auf spezifische Art und Weise mit anderen körperlichen Wahrnehmungen, etwa der Wahrnehmung der eigenen Muskel- und Körperbewegungen (das Gefühl des durch Regen aufgeweichten Matsches unter den Füßen, die Erfahrung beim Gehen des Umwegs, der nötig ist, weil ein direkter Pfad noch fehlt usw.). Das mobile Filmen könne hier als Katalysator wirken, der ein ethnografisches Verstehen der Raumerfahrungen anderer ermögliche (2007, S. 243), es sei eine „filmic representation of how place is made precisely by walking“ (ebd., S. 247). Pinks Einsatz der Kamera folgt systematisch einem ‘Interaktionsgeschehen’, wie es auch bei der Datenerhebung für die Beiträge dieses Sammelbands der Fall war. Was gefilmt wird, ergibt sich aus dem Versuch, dieses Geschehen angemessen zu repräsentieren. Die Kamera wird auf das gerichtet, was in der Interaktion zwischen Akteur und Ethnografin jeweils relevant gesetzt wird. Für das Gartenprojekt heißt das: Die Kamera folgt den Zeigegesten des gefilmten Akteurs, seinen Blicken, sie richtet sich auf die Personen, die aus der 3 Bei dem von Pink analysierten Raum handelt es sich, anders als bei den empirischen Beiträgen dieses Sammelbands, um einen Außenraum, nicht um einen Innenraum. In diesem Sinn ist also keine hundertprozentige Vergleichbarkeit gegeben. Doch Pink untersucht keine von Menschenhand unberührte Landschaft, sondern einen Teil des ‘built space’. Es ist eine urbane Restfläche, die durch Gebäude und Straßen umgrenzt ist und die architektonisch gestaltet werden soll. Meines Erachtens lassen sich Wege, Bänke und Leuchten im Innen- und im Außenraum trotz ihrer unleugbaren Unterschiede gleichermaßen mit dem methodischen Instrumentarium der Interaktionsarchitektur- und Sozialtopografieanalyse untersuchen. Wolfgang Kesselheim 92 Online-Interpretation der Filmenden für die fragliche Praxis des ‘place-making’ gerade relevant sind usw. Gemeinsam ist auch der rekonstruktive Ansatz: Das Ziel ist es, mithilfe von Video zu rekonstruieren, welche Bedeutungen die Gefilmten ihrer räumlichen Umwelt im Vollzug ihrer alltäglichen Praktiken zuschreiben - wobei mit „Bedeutung“ in beiden Ansätzen auch so basale Dinge („Basisimplikationen“ im Sinne der Interaktionsarchitekturanalyse: Hausendorf/ Schmitt im Theorieteil dieses Bandes) gemeint sein können wie „hier kann man langgehen“ (Betret- und Begehbarkeit), „hier kann man für einen Schwatz stehen bleiben“ (Verweilbarkeit). Doch hier beginnen die Unterschiede. Relativ unbedeutend scheint mir zu sein, dass Pink das explizite Thematisieren der Raumsicht eines Akteurs durch Aktivitäten des Benennens, Erläuterns und Zeigens untersucht, nicht wie die Beiträge in diesem Sammelband das Raumverständnis, das im interaktiven Raumverhalten implizit Ausdruck findet. 4 Unbedeutend erscheint mir dieser Unterschied deswegen, weil auch die explizite Konstruktion des Raums und seiner Bedeutungen mit dem in diesem Band vorgestellten Analyseinstrumentarium untersucht werden kann. Tatsächlich kann es bei der Nutzung des Raums im Rahmen von Interaktion jederzeit zu „accounts“ (Garfinkel 1967) der Raumkonstruktion durch die Interaktionsbeteiligten und zur expliziten Aushandlung der Bedeutung des Raums kommen. Diese expliziten Thematisierungen der Raumsicht der Interaktionsbeteiligten lassen sich problemlos in einer konversationsanalytischen Untersuchung der interaktiven Herstellung von Raum behandeln (siehe etwa Kesselheim i.d.Bd.; vgl. auch Hausendorf 2012). Wichtiger und folgenreicher scheint mir dagegen die Tatsache zu sein, dass die Forschende in der Methode des „Walking with video“ nicht nur mit der Kamera beobachtet, wie andere in ihrer Interaktion den Raum konstruieren. Vielmehr ist sie Teil des Interaktionsteams, das während der gemeinsamen Ortsbegehung in der ‘place’-Konstruktion zusammenwirkt. 5 Pointiert könne man sagen, Pink ist „interaktionsblind“, weil sie nicht berücksichtigt, dass es sich bei dem von ihr gefilmten Geschehen um Interaktion handelt. Denn auch wenn auf dem Video nur eine Person zu sehen ist, die Person nämlich, deren Praktiken des ‘place-making’ Pink erforscht - ist doch deren Aktivität des 4 Dies gilt für die Analyse des Interaktionsraums und der Sozialtopografie, die beide von tatsächlichen Raumnutzungen ausgehen. Aber auch die Interaktionsarchitekturanalyse interessiert sich vorwiegend für Nutzungsimplikationen, die in der Regel unter der Schwelle unserer bewussten Aufmerksamkeit durch architektonische Erscheinungsformen signalisiert werden, und weniger für die explizite Vermittlung erlaubter und blockierter Raumnutzungen durch Schilder wie „Betreten verboten! “. 5 Dies gilt auch für Erhebungen der interaktionistischen Raumforschung: Selbst wenn die dokumentierte Situation „natürlich“ ist, in dem Sinn, dass sie nicht für die Erhebung hervorgebracht wurde, spielt die Kameraperson doch als (peripheres) Interaktionsmitglied eine Rolle. Diese muss bei der Analyse berücksichtigt werden. Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 93 Zeigens und Erläuterns keineswegs monologisch. Sie ist im Sinne des ‘recipient design’ auf die „ortsfremde“ Forschende zugeschnitten und entsteht, wie die sequenzielle Analyse des Videos zeigen könnte, Zug um Zug im Zusammenspiel mit den Interaktionsbeiträgen der Forscherin. Pink versteht die im Video abgebildete Situation der Raumkonstruktion also so, dass ein Mitglied der Gartengruppe den werdenden Garten als ‘place’ herstellt (begleitet von der Forschenden, die diese Form der Raumkonstruktion lediglich registriert und zu erfassen versucht). Aus interaktionsanalytischer Perspektive dagegen ist in dem Video die interaktive Ko-Konstruktion des Gartens zu sehen, an der die Beteiligten gemeinsam teilhaben, wenn auch mit durchaus unterschiedlichen Rollen. 6 Während also die Kameraperson für Pinks Analysepraxis als Interaktionspartnerin keine Rolle spielt, nimmt sie in einem anderen Sinn eine viel wichtigere Stellung als in dem hier verfolgten Ansatz interaktionistischer Raumforschung ein. Für die Methode des „Walking with video“ ist nämlich die Idee zentral, dass die Forscherin bzw. der Forscher beim gemeinsamen Gehen sinnlich-körperliche Erfahrungen macht, die denen der beforschten Akteure so nahe kommen, dass sie zur Grundlage für ein empathisches Nachvollziehen der Raumkonstruktion der Erforschten werden können. So kann man etwa, wenn man sich beim Filmen auf die Geschwindigkeit des Gefilmten einstellt, den spezifischen Rhythmus seiner Bewegung durch den Raum spüren 7 oder man erlebt die unterschiedlichen Wahrnehmungen in ihrer ‘place’spezifischen Verbindung (etwa wenn sich Blickachsen synchron zum körperlichen Gefühl des Gehens verschieben). Video sei damit, so folgert Pink, „not merely a method of audio-visually recording people and physical settings“, sondern Video „provides ways of [...] sensing place, placing senses, sensorially making place and making sense of place“ (2007, S. 243), wie Pink in Anlehnung an Feld/ Basso (Hg.) (1996, S. 91) formuliert. Wenn Pink von den Leistungen des Videos für die ethnografische Rekonstruktion von Praktiken des ‘place-making’ spricht, dann hat sie meines Erachtens nicht das Video als audiovisuelles Produkt im Blick, sondern vielmehr das Filmen als Aktivität: Nicht der Film vermittelt die „sensory embodied (emplaced) understandings“ (Pink 2007, S. 250), sondern wohl stärker die von Forscherin und Forschungssubjekt geteilte Bewegung, für die das Filmen den Anlass gibt. Das hat Auswirkungen für das Verständnis dessen, was das Videobild ist. Überspitzt gesagt ist für Pink das Videobild weniger ein Dokument für die gefilmte räumliche Situation als für die „corporeal inter- 6 Vgl. dazu etwa die Analysen der Herstellung eines gemeinsamen Blicks beim Betrachten eines Kunstwerks bei Heath/ vom Lehn (2004). 7 Diese ‘Synchronisierung’ ist auf dem Video höchstens indirekt zu beobachten, etwa dadurch, dass sich die Größe des gehenden Akteurs auf dem Videobild nicht ändert. Wolfgang Kesselheim 94 subjectivity between filmmaker and film subject“ (ebd., S. 248). So sind auch die Standbilder zu verstehen, die in Pinks Beitrag abgedruckt sind. 8 Diese Standbilder ermöglichen dem Leser nicht, eine räumliche Situation zu sehen, die zum Zeitpunkt der Aufnahme bestand; vielmehr sind die Standbilder Beleg für bestimmte sinnlich-körperliche Erfahrungen der Filmenden, für bestimmte Relevantsetzungen oder Perspektivierungen im Moment der Erhebung. Abb. 1: Pink (2007, Figure 3) So zeigt Abbildung 1 eben nicht eine matschige Stelle auf einer ungepflegten Wiese, sondern dokumentiert, wie sich die körperliche Erfahrung des mühsamen Gehens für die filmende Ethnografin so in den Vordergrund gedrängt hat, dass sie sich in einer Bewegung der Kamera manifestiert hat. Auf dem Standbild wird also in Pinks Sicht nicht die räumliche Umwelt sichtbar, auf deren Grundlage die Lesenden erschließen könnten, was für den gefilmten Akteur den betreffenden Raum ausmacht. Zu sehen ist vielmehr die Reaktion auf sinnlich-körperliche Erfahrungen, die die Forschende im Prozess des gemeinsamen Gehens gemacht hat. Für den Datenstatus der Videobilder heißt das: Um nachvollziehen zu können, wie die gefilmten Akteure ihren Raum konstruieren, müssen die Leser das auf dem Bild Sichtbare durch die Brille des sprachlich Ausgedrückten sehen. Welchen Aspekt von ‘place’ das Standbild repräsentiert, kann nur verstehen, wer die betreffenden Analysen gelesen hat. 9 8 Hausendorf/ Schmitt (‘Standbildanalyse’, i.d.Bd. bezeichnen Standbilder als ‘Sekundärdokumente’, während es sich beim Video um ein ‘Primärdokument’ der Interaktionssituation handle. Pink dagegen betont, dass schon das ‘Primärdokument’ Video das Ergebnis des interessengeleiteten Kamerahandelns des Forschenden sei; siehe dazu auch Kapitel 3. 9 Dieser Umgang steht in einem gewissen Gegensatz zu Pinks Überzeugung, Video ermögliche eine direktere Vermittlung der Erfahrung fremder Raumherstellungspraktiken als Spra- Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 95 Diese Nutzung von Standbildern ist durchaus angemessen für Pinks Verständnis von ‘place’ als etwas, das sich, obschon es auf „verorteten“ Sinneseindrücken aufbaut, gerade nicht in dem erschöpft, was in der räumlichen Umwelt sinnlich zu erfassen ist. So umfasst ‘place’ durchaus auch Erinnerungen an vergangene Zustände und die ihnen zugeschriebenen Bedeutungen (der Garten als „a physical environment in which many memories and meanings were already invested“, Pink 2007, S. 241) sowie zukünftige Nutzungen. Ihren mit Video dokumentierten Gang beschreibt Pink wie folgt: This walk around the garden was an exercise in experiencing and imagining. The narrative that guided our walk through the material garden site referred to the garden as an imagined (and planned) place and involved continually comparing our present sensory embodied experiences of the garden with potential others: new textures under foot; new flower beds and aromas; lighting at the two ends of the planned path; the sociality of the mums with their pushchairs who might stop at the bench for a chat on their way back from town; and the physical comfort of an 89-year-old lady who, David told me, walked into town four times a week, but who, when it was wet, had to walk all the way round rather than taking the short cut through the garden. (ebd., S. 240) Für Abbildung 2 heißt das: Pink lädt die Rezipienten ein, in dem Standbild mehr zu sehen als nur ein wegloses Stück Brachland: nämlich den Kontrast („continually comparing ...“) zwischen dem weglosen Brachland und dem gestalteten Park („new textures under foot; new flower beds ...“) mit den Praktiken, die dieser ermöglicht („the sociality of the mums … who might stop ...“). Abb. 2: Pink (2007, Figure 2) che, wenn sie auch davor zurückschreckt, Video die Möglichkeit prä-kultureller Erfahrungen zuzusprechen (Pink 2007, S. 247f.). Wolfgang Kesselheim 96 3. Hayes (2007): „Overwhelmed by the image“ / Mohn (2006): „Permanent work on gazes“ Auch Hayes (2007) nutzt Video als Zugang zu Praktiken der Raumnutzung und -konstruktion. Anders aber als im Ansatz der Interaktionsraumanalyse spielt für Hayes’ analytischen Zugriff auf Raum Interaktion keine eigenständige Rolle. Für Hayes liegt Raum als kulturelles Produkt sozusagen fix und fertig vor, der Raum-als-Produkt ist der Ausgangspunkt seiner Forschung. Er fragt weder nach dem Prozess, der zu diesem Produkt geführt hat, noch nach den Subjekten der Raumproduktion. In Hayes’ Arbeit hat Video deshalb auch nicht die Aufgabe, den kulturellen Prozess der Raumherstellung zu dokumentieren. Das Video dokumentiert die Annäherung des Forschenden an das kulturelle Produkt ‘Raum’, den ethnografischen Forschungsprozess, der das Produkt ‘Raum’ über den individuellen sinnlich-körperlichen Nachvollzug zu erschließen sucht. Dies lässt sich gut an Hayes’ Untersuchungen zu einer verlassenen Internatsschule im Reservat Cœur d’Alene in Idaho und zum Strand von Waikiki auf Hawaii zeigen, die in Hayes (2007) referiert werden. In beiden Fällen dient die Arbeit mit Video dazu, einen Zugang zu diesen Schauplätzen zu eröffnen. Anders also als in einer Interaktionsraumanalyse soll die Kamera nicht die Bezugnahme von Interaktionsbeteiligten auf Elemente ihrer materiellen Umwelt dokumentieren. Es ist genau umgekehrt: Interaktionsereignisse kommen nur in dem Maße ins Bild, wie sie etwas zur Spezifik dieser Schauplätze beitragen, also gleichsam als ein Attribut dieser Schauplätze. Wenn das Kamerahandeln also nicht durch ein Interaktionsgeschehen bestimmt wird, was steuert es dann? Gefilmt wird alles, was die auf das ethnografische Erfassen des Raums gerichtete Aufmerksamkeit des Forschers erregt. Hayes Kameraführung orientiert sich an dem Ziel, dem Forschenden Raumerfahrungen zu ermöglichen und seine Raumerfahrung zu dokumentieren. Hayes nutzt die Videokamera als ein Werkzeug, das durch seine spezifischen medialen Beschränkungen dem Forschenden ein neues Sensorium für den Raum eröffnet. So beschreibt er beispielsweise seine Nutzung der Kamera bei der Erkundung der verlassenen Schule von Cœur d’Alene wie folgt: Immediately I find that I must hesitate as I walk through each door. Light streaming through the window overwhelmed the camera and it takes a moment for the aperture to adjust. As I walk back out into the hallway, I must again hesitate for the moment it takes the camera to adjust to the shadow. By mediating my experience with the building, the camera brought the qualities of light and shadow to the foreground. I found that as I walked toward a window, the bright light momentarily obscured my vision, then instantly, I was presented with a clear view to the outside and I could see for miles around. This became my experience of the building. (Hayes 2007, S. 68) Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 97 Die Kamera ist hier ein Instrument, das den Forschenden auf eine besondere Qualität des Raums aufmerksam macht. Hier kommt es nicht auf den Film an, der durch das Filmen erzeugt wird, sondern auf die spezielle „mediatisierte“ Raumerfahrung, die das Blicken durch den Sucher, das Zoomen und Schwenken oder das Feedback der Belichtungsautomatik im Forscher hervorbringt. Gäbe es ein Standbild dieses Aufnahmemoments, so zeigte es in Hayes’ Verständnis nicht einen Klassenraum, sondern eine Situation der „Überwältigung“ der Belichtungsautomatik, die einen visuellen Zugang zur Raumerfahrung des Forschers ermöglicht. 10 Zu einem späteren Zeitpunkt im Forschungsprozess spielt das aufgenommene Material allerdings doch eine eigenständige Rolle, nämlich bei der Vermittlung der ethnografischen Analysen. Film sei, so hebt Hayes hervor, kein „transparent medium for delivering recorded information mediating experience like a window“ und das Filmbild keine „direct, objective, and real representation“ (Hayes 2007, S. 70). Der Raum, den ein Film zeigt, sei immer das Ergebnis von „socially and academically domesticated and regulated decisions about what is included in and what is excluded from the film“ (ebd.). Wenn der Film einen Zugang zu einer bestimmten räumlichen Situation eröffnet, dann als Dokument einer bestimmten Sicht des Raums durch den Forschenden und dessen „physical, intellectual, and emotional encounter with the subject of [his or her, W.K.] research“. Und in diesem Zusammenhang schreibt Hayes dem bewegten Bild eine besondere Vermittlungsqualität zu, indem ein Film die Zuschauer einlädt, „to engage with me [d.i. mit dem Ethnografen, W.K.] and my experience of the place represented in the film“ (ebd.). Wenn das Video aber nicht als Dokument verstanden wird, das das Vorliegen einer bestimmten räumlichen Situation zu einem bestimmten Zeitpunkt belegt, sondern als eines, das die Raumerfahrung des Ethnografen sichtbar macht, 11 dann ist es selbstverständlich erlaubt, alle filmischen Mittel einzuset- 10 An diesem imaginierten Standbild lässt sich noch ein weiterer Kontrast zu dem hier vertretenen Ansatz zeigen: Weil es Hayes um die individuelle (Re-)konstruktion von Raum durch den Forscher geht, nicht um Raumkonstruktion in und für Interaktion, steht das Standbild auch in einem anderen zeitlichen Zusammenhang. Weil aus der Perspektive der hier versammelten Beiträge Raum im Hinblick auf Interaktion betrachtet wird, muss man ein Standbild immer als in die Zeitlichkeit der Interaktion eingebettet verstehen. Und zwar selbst dann, wenn auf ihm - wie bei der Interaktionsarchitekturanalyse gängig - keine Personen zu sehen sind und es sich darum nur um eine mögliche, eine nahegelegte Interaktion handelt (vgl. etwa Hausendorf/ Schmitt (i.d.Bd.), ‘Standbildanalyse’, Kap. 1)! Mit „Zeitlichkeit“ ist natürlich nicht die strikte Sequenzialität gemeint, die die Konversationsanalyse als zentrales Prinzip der Interaktion herausgearbeitet hat. Für Hayes ist das nicht so: Wenn das Standbild als Ausschnitt aus einer zeitlichen Abfolge zu sehen ist, dann ist es die Zeitlichkeit des Forschungsprozesses. 11 Durch verfremdende Verfahren stellt Hayes sicher, dass der Zuschauer versteht, dass er eben nicht auf eine ursprüngliche, authentische räumliche Situation schaut, sondern auf eine durch den Blick des Forschenden vermittelte. Wolfgang Kesselheim 98 zen, um dem Zuschauer diese Erfahrung näher zu bringen. So mündet Hayes’ Analyse des Strands von Waikiki in einer Videomontage, in der Hayes Fotos über das mit erhöhter Geschwindigkeit abgespielte Filmmaterial legt, während auf der Tonspur ein Gewirr von vor Ort aufgenommener Musik, Auto- und Wellengeräuschen und Gesprächsfetzen zu hören ist, zusammen mit der Stimme eines Sprechers, der in schneller Folge die Namen von in Waikiki verkauften Produkten vorliest. Auf diese Weise soll der Zuschauer das erfahren, was Hayes als die „essence of the place“ herausgearbeitet hat: den „chaotic flow that is composed of differences and contradictions“ (Hayes 2007, S. 47f.). In diesem Punkt trifft sich Hayes’ Auffassung von der Leistung des Videos mit der der Visuellen Anthropologin Elisabeth Mohn - auch wenn für deren Arbeiten die Beobachtung von Interaktion sehr wohl im Zentrum steht (siehe unten). Mohn ergreift Position gegen die Vorstellung, die Kamera könne ein Geschehen im Raum „registrieren“ und es so für die nachträgliche Analyse zugänglich machen. Viel eher ähnelten Videoaufnahmen den Feldnotizen des „schreibenden Ethnografen“, sie seien „audiovisual rather than written fieldnotes“, die die Perspektive und die Gewichtungen des Forschenden reflektierten (Mohn 2006, S. 176). Nutzt man wie Mohn die Kamera als „caméra-stylo“, sind die Videobilder „audiovisual formulations“ (ebd., S. 177), die analog zur verbalen Formulierung von Analysebeobachtungen Anstoß zu neuen Aufnahmen geben und zu einer immer genaueren Beantwortung der Forschungsfragen führen. So beschreibt Mohn etwa ihre Arbeit als Kameraethnografin im Rahmen eines von der DFG geförderten Projekts zum Schülerhandeln im Unterricht (vgl. etwa Breidenstein 2004) wie folgt: From highly selective video sequences maintaining no claim to complete documentation of a situation, focused edited sequences can ultimately emerge which are, for example, able to uncover something about the practices and problems of spending time in school and to present it in a compact interpretative manner. (Mohn 2006, S. 176) Weil die Idee des Videos als umfassendes Dokument einer natürlichen Situation der Ethnografie fremd sei - die Bilder eines Videos seien immer schon konstruiert und ein Dokument der Arbeit des Ethnografen -, gebe es kein „processing taboo“ (ebd., S. 177). Im Gegenteil: die Bearbeitung des Filmmaterials sei ein Mittel, die Bedeutungsstrukturen, die mit dem Filmen in Gang gesetzt worden seien, herauszuarbeiten. Sie sei ein „focusing device and interpretative tool in the ethnographic research process“ (ebd.), das genauso wie die Arbeit an verbalen Kategorien die Sinnstrukturen des beobachteten Geschehens zutage fördern könne. Am Ende des von Mohn beschriebenen Forschungsprozesses steht kein Text, sondern ein Videofilm, in dem, so Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 99 Mohns Überzeugung, die „characteristics of scientific cognitive processes materialize cut by cut, become palpable, graspable“ (ebd., S. 178). Was das für die Untersuchung der Nutzung von Raum in Interaktion bedeutet, lässt sich gut am Beispiel der DVD ‘Lernkörper’ zeigen (Mohn/ Amann 2006), die im Rahmen des oben erwähnten DFG-Projekts zum Schülerhandeln entstanden ist. Ein Abschnitt der DVD ist einer Frage gewidmet, wie sie im vorliegenden Sammelband ganz ähnlich z.B. in den Beiträgen von Putzier und Dausendschön-Gay/ Schmitt gestellt wird: Wie konstruieren Schüler den Klassenraum mit seinen Tischen, Stühlen, Gängen, dem Lehrerpult usw. für die Zwecke ihrer Interaktion? Mohn und Amann versuchen mit Hilfe von de Certeaus Begriff der „Taktiken“ (Certeau 1988) zu rekonstruieren, wie die Schüler durch ihre Handlungen die vom Klassenraum und seiner Einrichtung vorgegebenen Handlungsmöglichkeiten ausreizen, ja zuweilen die institutionell vorgegebenen Bedeutungen des Raums und seines Mobiliars umdefinieren: 12 Gelegentlich verlieren die Orte im Klassenraum ihre scheinbar festen Bedeutungen und verwandeln sich in Versammlungsorte, Treffpunkte, Bühnen und Zuschauerräume selbst dort, wo man es nicht unbedingt erwartet. (Mohn/ Amann 2006) In den Kapiteln ‘Über Orte’ und ‘Über Wege’ präsentieren die Autoren Fälle solcher „taktischer“ Raumnutzungen in Form von kurzen, stark bearbeiteten Videosequenzen. Diese werden von einem sehr spärlichen Kommentar aus dem Off begleitet. Ein Beispiel: [Filmsequenz] - Sprecherin: „Treffpunkt? … Oder doch heimliche Bühne? “ - [Filmsequenz] - Sprecherin: „Bühne.“ - [Filmsequenz]. In der speziellen Verknüpfung von Bild und Text, die dieses Beispiel exemplarisch illustriert, zeigt sich der unterschiedliche Status, der dem Video hier im Kontrast zu den Untersuchungen der hier versammelten Beiträge zugeschrieben wird. Wollte man diesen Unterschied scherenschnittartig zuspitzen, könnte man sagen: Aus der Perspektive der Kamera-Ethnografie sind die Filmsequenzen ‘visuell formulierte Antworten’ auf die Frage nach den „taktischen“ Freiheiten des Umgangs mit institutionellen räumlichen Gegebenheiten. Aus der Perspektive der hier versammelten Beiträge handelt es sich um Ausschnitte aus der originalen Dokumentation des Interaktionsgeschehens, die zur Beantwortung einer Forschungsfrage ausgewählt und zu Kollektionen gruppiert sind und die nun als Datengrundlage für die nachfolgende Interaktionsraumanalyse fungieren können. 12 Die in diesem Zitat zutage tretende Vorstellung, dass die räumliche Umwelt und ihre Elemente bestimmte Nutzungen erwartbar macht, ohne sie jedoch zu determinieren, kommt der Perspektive der Interaktionsarchitektur sichtbar nahe. Wolfgang Kesselheim 100 Im Endprodukt wird also noch einmal der Unterschied im Umgang mit Video bei der Erforschung des Handelns von Akteuren im Raum deutlich: So wie die Kamera-Ethnografie der Fähigkeit des Videos misstraut, ein neutrales, „registrierendes“ (im Sinne von Bergmann 1985) Dokument für eine bestimmte räumliche Situation und das dort ablaufende Interaktionsgeschehen sein zu können, so sehr traut sie ihm zu, den Rezipienten die Analysen der Ethnografen in einem „dichten Zeigen“ (Begleittext zu Mohn/ Amann 2006, S. 5f.) audiovisuell zugänglich zu machen. Umgekehrt die implizite Position der empirischen Beiträge dieses Sammelbands: Sie sind überzeugt, die Sichtbarmachung der überaus feinen und zeitlich hochaufgelösten Verbindungen zwischen dem körperlich-sprachlichen Handeln der Interaktionsbeteiligten und kleinräumigen Elementen des umgebenden Raums sei ohne die sprachliche Ausformulierung der Analysebeobachtungen nicht zu leisten. Dagegen trauen sie dem Video durchaus zu, den Raum (und im Fall einer Sozialtopografie- oder Interaktionsraumanalyse: das sich dort abspielende Interaktionsgeschehen) in einer Weise „registrierend“ zu konservieren, dass die Aufnahmen zur Grundlage einer nachträglichen Analyse werden können. Hierbei ist für die in diesem Band versammelten empirischen Beiträge das Bestreben prägend, so zu filmen, dass das Video der Perspektive eines Teilnehmers an einer Interaktion nahe kommt. 13 Dem liegt der (oft implizit bleibende) Gedanke zugrunde, dass die Rekonstruktion der Nutzungsangebote und -implikationen des Raums für „seine“ Nutzer dann besonders gut gelingen kann, wenn im Video möglichst viele der Benutzbarkeitshinweise des Raums auf eine Weise im Bild sind, wie sie sich den Interaktionsteilnehmern in der dokumentierten Situation präsentieren. 14 Es ist deshalb mehr als nur 13 Es sei daran erinnert, dass diese Daten ja ursprünglich aus einem Interesse am Interaktionsraum erhoben worden sind. - Im Fall von Daten, die speziell für eine Interaktionsarchitekturanalyse erhoben werden, geht es meines Erachtens um die Einnahme einer potenziellen Perspektive eines Teilnehmers an einer durch den Raum möglich und wahrscheinlich gemachten Interaktion. 14 Mit ‘Perspektive eines Teilnehmers’ ist nicht nur die eines einzelnen Teilnehmers an einer faktischen Interaktion gemeint. Für den Fall einer interaktionsarchitektonischen Analyse handelt es sich um die Perspektive eines potenziellen Teilnehmers, der eine vom Raum nahegelegte Position und Orientierung einnimmt. Mir scheint es wichtig festzuhalten, dass die Frage nach der Perspektive auch dann eine Rolle spielt, wenn auf einem Datum keine Personen zu sehen sind. Während es für das Hören nur in akustisch speziell hergerichteten Räumen eine Rolle spielt, wie ich mit meinem Körper im Raum orientiert bin (etwa in einem Konzertsaal), spielt die Perspektive bei der visuellen Wahrnehmung eines gebauten Raums immer eine Rolle, indem sie bestimmt, was jeweils im Raum wahrgenommen wird. Da die Interaktionsarchitekturanalyse es nicht mit einer einzelnen, tatsächlich realisierten Position und Orientierung im Raum zu tun hat, sondern mit Potenzialen, muss sie versuchen, der Tatsache gerecht zu werden, dass an unterschiedlichen Positionen im Raum jeweils unterschiedliche Benutzbarkeitshinweise sichtbar und auswertbar sind, etwa indem sie mögliche Positionierungsalternativen durchspielt. Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 101 eine Stilfrage, dass die Kamera das Geschehen nicht aus der Vogelperspektive beobachtet, selbst wenn dies den Überblick über das Geschehen erleichtern würde (vgl. dazu auch Pink 2007, S. 247). Die Orientierung an möglichen Teilnehmerperspektiven scheint mir auch der Grund zu sein, warum die Analysen dieses Sammelbands konsequent an Standbilder angebunden sind. Während in der Draufsicht alle Punkte eines gebauten Raums für das Auge nahezu gleichzeitig verfügbar sind (siehe Abb. 3), erinnert das Standbild daran, dass Positionen im Raum durch Bewegungen erreicht werden müssen, dass Blicke an die Körper der Akteure gebunden sind usw. (siehe Abb. 4). 15 Genau in diesem Punkt unterscheidet sich der in diesem Sammelband vertretene Ansatz von einer pädagogischen Raumforschung, wie sie Sigrid Nolda im Rahmen der „Kursforschung“ betreibt. Dieser Ansatz soll im folgenden Abschnitt dargestellt werden. 4. Nolda (2006): „Pädagogische Raumaneignung“ Nolda (2006) geht - inspiriert von Bohnsacks „dokumentarischer Methode“ (siehe etwa Bohnsack 2009) - der Frage nach, wie Lehrende und Lernende in Kursen der Erwachsenenbildung die Kursräume und die dort vorhandenen Objekte wie Flipcharts oder Projektionsflächen für ihre Handlungszwecke nutzen. Dazu dokumentiert sie per Video die Interaktion während und zwischen den Unterrichtsstunden in unterschiedlichen Kursräumen. In der Arbeit mit Video, das die Beteiligung am Unterricht durch Positionierungen im Raum, durch Bewegungen, durch Blicke usw. sichtbar mache, sieht die Autorin ein Mittel, die Beschränkung der pädagogischen Forschung auf kognitive Prozesse aufzuheben (2006, S. 313). 16 Insbesondere erlaube Video die Beantwortung der Frage, wie Lehrende und Lernende mit den „räumlichen Vorgaben“ der Kursräume umgehen. An diesen „Vorgaben“ ist Nolda deshalb besonders interessiert, weil in der konkreten architektonischen Gestaltung und Ausstattung eines Kursraums spezifische „pädagogische Utopien inszeniert“ seien (ebd., S. 317), Vorstellungen darüber also, wie Lehren und Lernen in dem betreffenden Raum stattfinden soll. Die „Vorgaben“ des Kursraums - Nolda spricht auch von der „Latenz der Pädagogik des Raums“ - müssen nun „von den Adressaten aufgegriffen werden [...], um sich zu realisieren“ (ebd.). So entstehen „manifeste Raumaneignungen durch Lehrende und Lernende“ (ebd.). 15 Vgl. dazu de Certeaus Unterscheidung der „Stadt als Konzept“, die der Autor an eine erhöhte Betrachtungsperspektive bindet, und der „Praktiken des Gehens“, durch die Gehende die Stadt konstruieren (Certeaus 1988, S. 197-208). 16 Zur Positionierung von Lehrern im Unterricht aus der Perspektive der Interaktionsraumanalyse siehe z.B. Schmitt (2013, Kap. II, S. 1-5). Wolfgang Kesselheim 102 Dieses Konzept der ‘Raumaneignung’ ist für Nolda zentral: In diesem Begriff fasst sie all jene Verhaltensweisen zusammen, in denen die Teilnehmenden und Dozierenden auf die pädagogischen Angebote des Raums eingehen, oder aber gegen seine Angebotsstruktur anarbeiten. In ihrem Interesse an dem interaktiven Umgang mit der ‘Latenz’ des Raumes kommt die Autorin dem Fokus der Forschung zu Interaktionsarchitektur und Interaktionsraum sehr nahe (vgl. etwa Hausendorfs Analyse des Umräumens eines Seminarraums, Hausendorf (2012) und Beispiel 3 in Nolda (2006)! ), speziell wenn sie ihre „interaktionistische“ Raumauffassung betont, „die Räume unauflösbar mit der Organisation und dem Vollzug von Aktivitäten verbindet“ (ebd., S. 316). Der Unterschied liegt im analytischen Zugriff auf die „Vorgaben des Raums“. Um diese zu erschließen, geht Nolda nicht von ihren Videos oder daraus entnommenen Standbildern aus, sondern jeweils von einem Grundriss der analysierten Kursräume. 17 Abbildung 3 illustriert eine solche Raumskizze. Abb. 3: Nolda (2006, Skizze 1) 17 Es wurde angeregt, solche Skizzen auch in eine interaktionsarchitektonische Untersuchung miteinzubeziehen. Dieser Vorschlag ist aus meiner Sicht nicht unproblematisch. Man arbeitet in solch einem Fall mit einer Repräsentation des Raums, die sich stark von dem unterscheidet, wie sich der Raum „seinen“ Nutzern präsentiert. Gut kann man das an der „interaktiven“ Übersicht über den Ausstellungsraum klar machen, auf die Hausendorf/ Schmitt, ‘Standbildanalyse’ (i.d.Bd.) verweisen (siehe www.zm.uzh.ch/ dauerausstellung/ virtuellerrundganghome/ untergeschoss.html). Während auf dieser das gesamte Untergeschoss mit seinen Symmetrieachsen auf einen Blick zu sehen ist, müssen die Raumnutzer sich den Raum ‘Schritt für Schritt’ und ‘Blick für Blick’ erschließen. Und während ein ‘Mouseover’ enthüllt, welche Vitrinen thematisch zusammengehören, müssen sich die Raumnutzer diese Zusammenhänge auf anderem Weg erschließen. Die Interaktionsarchitekturanalyse müsste, wenn sie derartige Daten zur Analyse heranzieht, eine ausführliche Debatte über den unterschiedlichen Status dieser Daten führen. Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 103 Dazu erläutert die Autorin: Diese Raumskizze dient dazu, auf die dahinter liegende pädagogische Konzeption zu schließen bzw. gedankenexperimentell die Möglichkeiten auszuloten, die der Raum für Vermittlungen und Aneignungen bietet und welche darauf bezogenen Verhaltensformen er nahe legt. (Nolda 2006, S. 317f.) Darüber hinaus greift Nolda zur Ermittlung des pädagogischen Angebots des Kursraums auf andere Datenquellen zurück, beispielweise Dokumente wie Kurskonzepte, Selbstdarstellungen der Bildungsträger, Aussagen der Beteiligten usw. (ebd., S. 318). Hierin liegt ein wichtiger Unterschied zum Ansatz der Interaktionsarchitektur. Nolda verlässt sich bei der Ermittlung der ‘Vorgaben des Raums’ auf ihr eigenes alltägliches Raumwissen sowie das der Akteure des Felds. Die Interaktionsarchitekturanalyse verfügt zur Ermittlung dieser ‘Vorgaben’ dagegen über das Konzept der ‘Benutzbarkeitshinweise’ (siehe Hausendorf/ Kesselheim i.d.Bd.) und das für die Analyse von Interaktion adaptierte Konzept der „affordances“ (siehe ursprünglich Gibson 1979). Diese beiden Konzepte erlauben es, in methodisch kontrollierter Weise aufzuzeigen, welche konkreten Merkmale des Raums mit welchen Erwartungen an ein bestimmtes Raumverhalten verbunden sind und wie genau diese Erwartungen im Einzelnen in der Architektur selbst zum Ausdruck kommen. So kann die interaktionsarchitektonische Analyse nicht nur einen Raumbereich alltäglich plausibel als ‘Dozentenbereich’ klassifizieren, sie kann rekonstruieren, welche architektonischen Erscheinungsformen es nahelegen, auf diesen Schluss zu kommen. Indem sie also unser alltägliches Raumwissen im Sinne eines methodischen „Sich-Dummstellens“ ausklammert (siehe dazu Hausendorf/ Schmitt, ‘Standbildanalyse’ (i.d.Bd.), Kap. 4), kann die interaktionsarchitektonische Analyse zu den basalen Zusammenhängen zwischen Interaktion und räumlicher Umwelt vorstoßen. Der zweite Unterschied liegt in dem geringen Stellenwert, den die Sequenzialität - im Gegensatz zu den hier versammelten, von der Konversationsanalyse inspirierten Arbeiten - für Noldas Analysen der Raumnutzung-in-Interaktion hat. Diese zeigt sich beispielhaft an der Analyse des folgenden Standbildes (siehe Abb. 4): Der Dozent trägt - in der Hand ein zusammengerolltes Skript [...] - frei vor und unterstützt seine Rede mit expressiver Gestik. An einer Stelle nutzt er - fast beiläufig - kurz die Flipchart, um das Gesagte durch eine während des Redens eigenhändig erstellte Skizze zu verdeutlichen. Bemerkenswert ist, dass er sich dabei immer wieder zu den Teilnehmern umdreht. Statt also die Medien zur Unterstützung des Gesagten in vollem Umfang und durchgängig einzusetzen, setzt er primär seinen Körper als Illustrationsmedium (vgl. Bild 3 [hier Abb. 4]) ein. (Nolda 2006, S. 320) Wolfgang Kesselheim 104 Abb. 4: Nolda (2006, Bild 3) Obwohl hier von einem einmaligen Interaktionsgeschehen die Rede ist, werden doch keine einzelnen, genau im zeitlichen Ablauf verortete Handlungsschritte referiert: Der Dozent wendet sich „immer wieder“ den Teilnehmern zu, er nutzt seinen Körper „primär“ zur Illustration des Gesagten, und über seinen Medieneinsatz erfahren wir nur, dass er nicht „durchgängig“ ist. Dieses geringe Interesse an der Sequenzialität des Interaktionsgeschehens hat auch Folgen für die Funktion der in Noldas Artikel abgedruckten Standbilder. Anders als in den Beiträgen dieses Sammelbands dienen Standbilder im referierten Ansatz dazu, eine Möglichkeit des Verhaltens zu illustrieren, die der Raum dem Dozierenden bietet. Noldas Standbilder sind statisch gedacht, als Demonstration einer „zeitlosen“ Positionierung im Raum (einer „Konstellation“, Nolda 2007). Sie provozieren die Frage: Welches Verhältnis zu dem simultan im Raum Vorhandenen wird auf dem Standbild sichtbar? Aus der Perspektive der ‘Interaktionsraumanalyse’ sind Standbilder - auch wenn sie optisch den von Nolda präsentierten gleichen mögen - Ausschnitte eines interaktiven Geschehens, das gleichsam „stillgestellt“ worden ist, aber dennoch als Fluchtpunkt vorhanden ist. Daher provozieren sie andere Fragen: Welche Handlungsmöglichkeiten eröffnet die auf dem Standbild zu sehende Konstellation zu genau dem dokumentierten Moment der Interaktion? Welche nächsten Schritte, welche nächste Nutzung der räumlichen Umwelt ermöglicht die beobachtete Konstellation, welche macht sie erwartbar oder blockiert sie? Diese Verbindung des Raums zur Zeitlichkeit der Interaktion gilt aber auch für die Interaktionsarchitekturanalyse, die ja an potenziellen Raumnutzungen Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 105 interessiert ist. Auch diese potenziellen Interaktionen im Raum muss man sich als sequenziell geordnetes Geschehen vorstellen. 18 Anders als Bohnsack (2009, S. 151f.) zu argumentieren versucht, impliziert die Entscheidung, in der Analyse dem zeitlichen Verlauf einer Interaktion zu folgen, keineswegs, die Simultaneität der Phänomene zu ignorieren, die auf einem „Fotogramm“ gleichzeitig sichtbar werden. Denn sobald man Interaktion nicht mehr auf das Verbale reduziert, 19 muss man sich die Frage stellen, wie die Interaktionsbeteiligten das simultan im Raum Vorhandene in die Sequenzialität ihrer Interaktion hereinholen. Die Analyse von Standbildern und Standbildfolgen, wie sie in der ‘Interaktionsraumanalyse’ vorgenommen wird, leistet genau das. Sie versucht, die in einem einzelnen Standbild erkennbaren Elemente des Raums und die räumlichen Positionierungen der Interaktionsbeteiligten, die sich aufeinander und auf ihre räumliche Umwelt orientieren, nicht nur daraufhin zu analysieren, was sie in diesem einen abgebildeten Moment für Bedeutungsstrukturen zu erkennen geben, sondern sie ist überzeugt, dass die Bedeutung dieser räumlichen Konstellation nur vollständig auszuschöpfen ist, wenn man sie in Beziehung setzt zum zeitlichen Fluss der Interaktion. Aber auch wenn man aus der Perspektive der ‘Interaktionsarchitekturanalyse’ (in der es ja um potenzielle Raumnutzungen geht) ein Standbild analysiert, auf dem keine Personen zu sehen sind, weist das Standbild über den „eingefrorenen Moment“ hinaus. Es lädt dazu ein, von der im Standbild repräsentierten räumlichen Situation mit ihren zeitbeständigen architektonischen Erscheinungsformen Potenziale für anschließende Raumnutzungen abzuleiten und sie als Folge aus vorgängigen Nutzungen des Raums zu sehen, die zu der im Standbild repräsentierten räumlichen Situation geführt haben. 5. Schluss Das Ziel dieses Beitrags war es, über die Darstellung thematisch benachbarter, aber dennoch auf vielen Ebenen kontrastierender Methoden der videobasierten Raumforschung herauszuarbeiten, worin die Besonderheiten der Videonutzung in den hier vorliegenden empirischen Arbeiten liegen. Zwei Punkte möchte ich abschließend noch einmal hervorheben. 18 Besonders deutlich wird das, wenn in der räumlichen Umwelt Vorkehrungen vorhanden sind, die auf eine zeitliche Strukturierung von Interaktionen hinsteuern. Man denke nur an Bänder, die an Flughäfen oder Bahnhöfen Warteschlangen strukturieren, um eine geordnete Folge von Interaktionen mit den Angestellten wahrscheinlich zu machen. 19 Das Bild, das Bohnsack (2009, S. 136) von der konversationsanalytischen Gesprächsforschung zeichnet, wird der aktuellen Forschungssituation mit ihrer dezidierten Hinwendung zur Multimodalität längst nicht mehr gerecht. Wolfgang Kesselheim 106 Zum einen hat der Methodenvergleich gezeigt, dass die Charakterisierung einer Methode als ‘videobasiert’, ‘videografisch’ oder als ‘mit Video arbeitend’ wohl nicht mehr zum Verständnis dieser Methode beiträgt als die Aussage, eine Methode arbeite mit Transkripten. Vielmehr gilt es zu bestimmen, wie genau Video im Forschungsprozess eingesetzt wird und wie genau in der Vorstellung der Forschenden dieser Einsatz von Video einen Zugang zu den Praktiken der Raumkonstruktion eröffnen soll: ob dieser Zugang etwa über die Aktivität des Filmens erfolgt, die „mediatisierte“ Raumerfahrungen ermöglicht, über das Videomaterial, das als „Rohdatum“ einer nachträglichen Analyse der gefilmten Situation dient, oder vielleicht doch über den editierten Videofilm, der es über seine Rhetorik erlaubt, die Raumpraktiken der Forschungssubjekte empathisch nachzuvollziehen. Zum anderen zeigt sich, wie eng die Art und Weise, wie Video im Forschungsprozess genutzt wird, mit den Raumvorstellungen der einzelnen Ansätze und damit mit ihren Gegenständen korreliert. So schlägt sich die konversationsanalytisch fundierte Grundüberzeugung, dass Interaktionsbeteiligte die für ihre Interaktion relevante räumliche Umwelt im Verlauf des Interaktionsgeschehens aktiv konstruieren, in den empirischen Arbeiten dieses Sammelbands beispielsweise auf folgenden Ebenen nieder: - bei der Beantwortung der Frage, was die Kamera überhaupt aufnehmen soll, wenn die Wirkung des gebauten Raums auf Interaktion untersucht werden soll (nämlich ein interaktives Geschehen und all jene Elemente der räumlichen Umwelt, die sich die Interaktionsbeteiligten als relevant signalisieren! ), - bei der Entscheidung, aus welcher Perspektive das Geschehen dokumentiert werden soll (aus einer Perspektive, die die Rekonstruktion der Wahrnehmungs- und Bewegungsmöglichkeiten der raumkonstruierenden Teilnehmer erleichtert! ), - bei der Befolgung eines weitgehenden „Bearbeitungstabus“ (weil die Bearbeitung den Status der Videobilder als Dokument einer vergangenen Interaktionssituation und damit den Zugriff auf die Konstruktionsleistungen der Interaktionsbeteiligten in Frage stellt! ) und - bei der Arbeit mit Standbildern, die ausgehend vom „stillgestellten“ Moment nach den möglichen oder nahegelegten „nächsten“ Bewegungen oder Handlungen fragt (weil Raum als prinzipiell in die Sequenzialität der Interaktion eingebettet verstanden wird). Auf den ersten Blick mögen diese Punkte zwar die Forschungspraxis der in diesem Sammelband enthaltenen Arbeiten zutreffend charakterisieren, aber eben nur, weil sie auf Daten aufbauen, die ursprünglich für die ‘Interaktions- Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 107 raumanalyse’ erhoben worden sind. Namentlich für die ‘Interaktionsarchitekturanalyse’ scheinen sie nicht zu gelten, weil diese nicht an einzelnen Interaktionsepisoden interessiert ist. Der Vergleich zu den in diesem Kapitel vorgestellten Arbeiten zeigt jedoch eindrücklich, wie wichtig es ist, nicht von der richtigen Idee, dass Interaktionsarchitektur nicht an der Raumnutzung in einzelnen, faktischen Interaktionsepisoden interessiert ist, zu der irrigen Vorstellung überzugehen, dass Interaktionsarchitektur nicht an Interaktion interessiert wäre. Das Gegenteil ist der Fall. Das Konzept der Interaktionsarchitektur soll ja gerade rekonstruierbar machen, an welchen architektonischen Erscheinungsformen unsere Raumnutzung im Zuge von Interaktion anknüpfen kann. Wenn die Ausrichtung des Konzepts auf den Fluchtpunkt Interaktion aufgehoben oder gelockert wird, hat das - wie die obige Liste eindrücklich vor Augen führt - weitreichende Konsequenzen, die methodologisch sehr sorgfältig reflektiert werden müssen. Ohne die Bindung an Interaktion besteht beispielsweise die Gefahr, dass die Entscheidungen, was aus welcher Perspektive aufgenommen wird, beliebig werden. Die Beispiele von Pink, Hayes und Mohn illustrieren, wie wichtig es wird, die Rolle des Forschenden beim Aufnahmeprozess zu reflektieren, sobald man sich für die Entscheidung, was wie zu dokumentieren ist, nicht an den in der Situation aufgezeigten Relevantsetzungen der Interaktionsbeteiligten orientieren kann. Frers (2009) zeigt aus einer Perspektive, die „inspired, but not constricted by ethnomethodology“ sei (ebd., S. 155), welcher analytische Nutzen daraus zu ziehen ist, wenn man die Erhebungssituation deutlich stärker, als es bisher geschieht, als Interaktion zwischen Filmenden und Gefilmten betrachtet und nach den Rollen fragt, die der filmende Forscher „im Feld“ einnimmt. Auch wenn diese Frage im Zuge der Dokumentation faktischer Interaktion gestellt worden ist, so ist ihre Relevanz auch für die Analyse potenzieller interaktiver (oder individueller) Raumnutzung evident. Ähnliches gilt für „nacherhobene“ Fotos. Sobald man die Perspektive und Kadrierung eines Fotos nicht mehr auf die Online-Interpretation des Forschenden beim Dokumentieren eines Interaktionsgeschehens zurückführen kann, müssen die Entscheidungen des Forschenden reflektiert und transparent gemacht werden, die zu dem betreffenden Foto geführt haben. Schon das Standbild als ein „Sekundärdokument“ der aufgenommenen Situation, das zu analytischen Zwecken erzeugt worden ist (siehe Hausendorf/ Schmitt, ‘Standbildanalyse’ (i.d.Bd.)) erfordert die Beantwortung der Frage „Weshalb wurde genau dieses Standbild ausgewählt? “ Stammen die Daten aber nicht mehr aus der Interaktionssituation, ist die Beantwortung dieser Frage noch wichtiger. Um ein beliebiges Beispiel aufzugreifen: Welche Interpretation der Benutzbarkeitshinweise des Raums hat den fotografierenden Forscher dazu Wolfgang Kesselheim 108 bewegt, beispielsweise wie in Abbildung 2 in Hausendorf/ Schmitt, ‘Standbildanalyse’ (i.d.Bd.) zu sehen ist, einen Mittelgang in einer Kirche mit Blick auf den Altar zu fotografieren? Warum im Querformat? Warum diesen Ausschnitt? Welche Benutzbarkeitshinweise sind möglicherweise aus dieser Perspektive sichtbar, aber aus anderer Perspektive nicht? Wichtige Konsequenzen hat die Lockerung der ‘Interaktionsbindung’ der in der Interaktionsarchitekturanalyse verwendeten Daten auch für deren Status als Dokument. Anders als im Fall von Videos und Standbildern eines Interaktionsgeschehens lässt sich bei nacherhobenen Fotos oder bei stark bearbeiteten Videosequenzen nicht der Anspruch vertreten, sie eröffneten einen privilegierten („registrierenden“) Zugang zu einer spezifischen räumlichen Situation. Mit dem Einbezug von Fotos, Raumskizzen, experimentellen Formen der audiovisuellen Darstellung und anderem in die interaktionsarchitektonische Forschung nähert sich die Arbeitsweise (wie Hausendorf/ Schmitt, ‘Standbildanalyse’ (i.d.Bd.) zu Recht bemerken) derjenigen der Ethnografie an. Die Interaktionsarchitekturanalyse muss daher wie diese die Debatte führen, in welchem Sinn auf diesen Dokumenten dann eigentlich Raum zu sehen ist und - damit zusammenhängend - die eigene Vorgehensweise bei der Erhebung der Daten reflektieren. In diesem Sinn hat die in diesem Kapitel vorgenommene Kontrastierung mit alternativen Methoden der videobasierten Raumforschung nicht nur die Profilierung des eigenen Ansatzes ermöglicht. Vielmehr eröffnet sie auch Perspektiven für die methodische Reflexion und Weiterentwicklung der videobasierten Erforschung des Zusammenhangs von Architektur und Interaktion. 6. Literatur Bergmann, Jörg (1985): Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit - Aufzeichnungen als Daten der interpretativen Soziologie. In: Hausendorf, Heiko (Hg.): Gespräch als Prozess. (= Studien zur Deutschen Sprache 37). Tübingen: Narr, S. 22-68. Bohnsack, Ralf (2009): Qualitative Bild- und Videointerpretation. Die dokumentarische Methode. Opladen: Budrich. Breidenstein, Georg (2004): KlassenRäume - eine Analyse räumlicher Bedingungen und Effekte des Schülerhandelns. In: Zeitschrift für qualitative Bildungs-, Beratungs- und Sozialforschung 5, 1, S. 87-107. Broth, Mathias (2009): Seeing through screens, hearing through speakers. Managing distant studio space in television control room interaction. In: Journal of Pragmatics 41, S. 1998-2016. Broth, Mathias/ Laurier, Eric/ Mondada, Lorenza (Hg.) (2014): Studies of video practices. Video at work. New York: Routledge. Videobasierte Raumforschung als interdisziplinäres Forschungsfeld 109 Certeau, Michel de (1988): Kunst des Handelns. [Orig.: L’invention du quotidien 1: Arts de faire. Paris: Union Générale d’Editions 1980]. Berlin: Merve. Dinkelaker, Jörg/ Herrle, Matthias (2009): Erziehungswissenschaftliche Videographie. Eine Einführung. Wiesbaden: VS Verlag für Sozialwissenschaften. Feld, Steven/ Basso, Keith H. (Hg.) (1996): Senses of place. Santa Fe: School of American Research Press. Frers, Lars (2009): Video research in the open. Encounters involving the researchercamera. In: Kissmann (Hg.), S. 155-177. Garfinkel, Harold (1967): Studies in ethnomethodology. Englewood Cliffs: Prentice-Hall. Gibson, James J. (1979): The ecological approach to visual perception. Boston: Houghton Mifflin Company. Goldman, Ricki/ Pea, Roy/ Barron, Brigid/ Derry, Sharon J. (Hg.) (2007): Video research in the learning sciences. Mahwah, NJ: Erlbaum. Goodwin, Charles (2000): Action and embodiment within situated human interaction. In: Journal of Pragmatics 32, S. 1489-1522. Goodwin, Charles (2003): The body in action. In: Coupland, Justine/ Gwyn, Richard (Hg.): Discourse, the body, and identity. Houndmills/ Basingstoke: Palgrave Macmillan, S. 19-42. Hausendorf, Heiko (2012): Über Tische und Bänke. Zur interaktiven Aneignung mobiliarer Benutzbarkeitshinweise an der Universität. In: Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr, S. 139-185. Hayes, Micheal T. (2007): Overwhelmed by the image. The role of aesthetics in ethnographic filmmaking. In: Goldman et al. (Hg.), S. 67-76. Heath, Christian/ Hindmarsh, Jon/ Luff, Paul (2010): Video in qualitative research. Analysing social interaction in everyday life. (Introducing qualitative methods). London: Sage. Heath, Christian/ Luff, Paul (1992): Collaboration and control. Crisis management and multimedia technology in London Underground line control rooms. In: CSCW 1, 1-2, S. 69-94. Heath, Christian/ vom Lehn, Dirk (2004): Configuring reception. (Dis-)regarding the ‘spectator’ in museums and galleries. In: Theory, Culture and Society 21, 6, S. 43-65. Kissmann, Ulrike Tikvah (Hg.) (2009): Video interaction analysis. Methods and methodology. Frankfurt a.M.: Lang. Knoblauch, Hubert/ Schnettler, Bernt/ Raab, Jürgen/ Soeffner, Hans-Georg (Hg.) (2006): Video analysis: Methodology and methods. Qualitative audiovisual data analysis in sociology. Frankfurt a.M.: Lang. Mohn, Elisabeth (2006): Permanent work on gazes. Video ethnography as an alternative methodology. In: Knoblauch et al. (Hg.), S. 173-180. Mohn, Elisabeth/ Amann, Klaus (2006): Lernkörper. Kameraethnographische Studien zum Schülerjob. Göttingen: IWF. Wolfgang Kesselheim 110 Mondada, Lorenza (2013): Video as a tool in the social sciences. In: Müller, Cornelia (Hg.): Body, language, communication. An international handbook on multimodality in human interaction. Berlin/ Boston: de Gruyter. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK) 38.1), S. 982-992. Nolda, Sigrid (2006): Pädagogische Raumaneignung. Zur Pädagogik von Räumen und ihrer Aneignung - Beispiele aus der Erwachsenenbildung. In: Zeitschrift für qualitative Bildungs-, Beratungs- und Sozialforschung 7, 2, S. 313-334. Nolda, Sigrid (2007): Videobasierte Kursforschung. In: Zeitschrift für Erziehungswissenschaft 10, 4, S. 478-492. Pink, Sarah (2007): Walking with video. In: Visual Studies 22, 3, S. 240-252. Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 64). Tübingen: Narr. Tuma, René/ Schnettler, Bernt/ Knoblauch, Hubert (2013): Videographie. Einführung in die interpretative Videoanalyse sozialer Situationen. Wiesbaden: Springer VS. Gliederung 1. Einleitung ................................................................................................................89 2. Pink (2007): „Walking with video“ ......................................................................91 3. Hayes (2007): „Overwhelmed by the image“ / Mohn (2006): „Permanent work on gazes“ .......................................................................................................96 4. Nolda (2006): „Pädagogische Raumaneignung“ .............................................101 5. Schluss....................................................................................................................105 6. Literatur .................................................................................................................108 LORENZA MONDADA ZWISCHEN TEXT UND BILD: MULTIMODALE TRANSKRIPTION 1. Einführung Seit ihren Anfängen in den 1970er Jahren ist es ein Charakteristikum der Konversationsanalyse, dass sie großen Wert darauf legt, mit Audio- und Videoaufnahmen von sozialer Interaktion in ihrem natürlichen räumlich-materiellen, sozialen und kulturellen Kontext zu arbeiten. In der angelsächsischen Literatur wird dies mit dem Begriff ‘naturally occurring’ gefasst (für eine Diskussion dazu siehe Sacks et al. 1974, S. 234f.; Speer 2002; Lynch 2002; Mondada 2012a). Die Audio- und Videoaufnahmen werden einer sehr detaillierten Analyse unterzogen. Entsprechend hoch sind die Anforderungen, die die Konversationsanalyse an ihre Transkriptionen stellt (Jefferson 1983, 1985, 1996, 2004). In diesem Beitrag befasse ich mich mit konversationsanalytischen Transkriptionen: Ich gehe auf die dabei auftretenden Probleme, ihre möglichen Lösungen und auf die zu treffenden Entscheidungen ein und diskutiere die jeweiligen analytischen und epistemologischen Konsequenzen. Konkret geht es um Fragen und Herausforderungen, die sich stellen, wenn man die Transkription des Verbalen (im Folgenden vereinfachend: ‘verbale Transkription’) mit einer Transkription multimodaler Ausdrucksressourcen verbindet (im Folgenden vereinfachend: ‘multimodale Transkription’), d.h. mit der Notation von Gesten, Blicken, Körperhaltungen, Positionen und Bewegungen im Raum und der Manipulation von Gegenständen. Damit wandelt sich die Transkription von einem rein textuell-lesbaren Objekt in ein Hybride aus Text und Bild, das lesbar und betrachtbar ist. Tatsächlich bringt die Praxis des Transkribierens immer komplexe Objekte hervor, nämlich Darstellungen, in denen sich textliche Elemente mit Visualisierungen verbinden. Das gilt schon für die auf den Audiokanal beschränkte verbale Transkription und erst recht für die multimodale Transkription, die sich auf den visuellen Kanal stützt. Dieser Beitrag erörtert die wichtigsten Veränderungen, die sich ergeben, wenn man Multimodalität als Ressource der Interaktion ernst nimmt, denn daraus entstehen für das Transkribieren neue Fragen und Probleme. Einige dieser Probleme lassen sich dadurch lösen, dass man in die Transkription Bilder einfügt. Dies ist jedoch kein Standardrezept für die Darstellung von Multimodalität, zumal sich Bilder ihrerseits wieder als Quelle neuer Probleme und Aporien erweisen können. Text und Bild lassen sich in einer multimodalen Transkription auf verschiedene Weisen miteinander verschränken. Im Folgenden werden verschiedene Formen ausgelotet und diskutiert. Lorenza Mondada 112 In diesem Zusammenhang ist es wichtig, nicht zu vergessen, dass die Transkription in erster Linie das Ergebnis einer Praktik ist - sie lässt sich nicht als eigenständiges Objekt von der Aktivität ihrer Herstellung ablösen. Diese Aktivität hängt ihrerseits eng mit analytischen und konzeptuellen Fragen zusammen. Eine Transkription ist deshalb nicht als rein visuelles oder formales Objekt zu verstehen, das sich auf Linien, Bilder und Schrift reduzieren lässt. Wie wir sehen werden, besteht bei der Diskussion über Transkriptionen ständig die Gefahr des Reduktionismus, und zwar auf zwei Ebenen: einer Reduktion der Praktik als solcher auf das Objekt; einer Reduktion des Objekts, das bestimmten Prinzipien und Zielen unterliegt, auf die formale Oberfläche. Ich werde versuchen, einen solchen Reduktionismus zu vermeiden, wenn ich im Folgenden verschiedene Ansätze diskutiere, um den Herausforderungen multimodaler Transkriptionen zu begegnen. Dafür skizziere ich zunächst die grundlegenden Prinzipien der Transkription und die analytischen Ziele und Fragen, denen sie unterliegt, und setze die Varianten des Transkribierens dazu in Beziehung. Zunächst rufe ich die Prinzipien in Erinnerung, auf denen Transkriptionen basieren (siehe Kap. 2), und erläutere, in welcher Weise sie in der verbalen und der multimodalen Transkription jeweils umgesetzt werden (siehe Kap. 3). Anschließend gehe ich auf einige grundlegende Dimensionen von Multimodalität ein (siehe Kap. 4), die sich auf verschiedene Weisen darstellen lassen. Die zu transkribierenden Phänomene können textbasiert beschrieben werden (siehe Kap. 5); sie lassen sich aber auch durch in den Text integrierte Bilder darstellen (siehe Kap. 6) oder sogar mithilfe von in Bilder integrierten Text (siehe Kap. 7). Die grundlegende Idee all dieser Ansätze ist, soziale Interaktion in einer multimodalen Transkription darzustellen, die Text und Bild kombiniert. Hier gibt es interessante Varianten, in denen sich unterschiedliche Praktiken und Konzeptionen der Analyse der Multimodalität sozialer Interaktion zeigen. Im letzten Teil des Beitrags wird ein Beispiel analysiert, wobei verschiedene Optionen der Transkription genutzt und jeweils mit Bezug auf die empirische Analyse diskutiert werden (siehe Kap. 8). Vorab ist es sinnvoll, sich den Stellenwert der Transkription im Rahmen der konversationsanalytischen Praxis vor Augen zu führen: Gegenstand und primäres Datum der Konversationsanalyse ist immer die Audio- oder Videoaufnahme. Diese hat den Anspruch, die soziale Interaktion naturalistisch in ihrem situierten Ablauf zu dokumentieren (Heath et al. 2010; Mondada 2006, 2012a). In Bezug auf die Handlung als solche bildet sie aber selbst schon eine erste Repräsentation, mit der bereits eine Reihe technischer und analytischer Entscheidungen getroffen werden. Sie soll die praxeologischen Eigenschaften der Handlung erhalten, bildet dieses Handeln aber bereits in einer Art Proto- Analyse ab, mit der sie es zugleich reflexiv gestaltet (Mondada 2006). Die Zwischen Text und Bild: Multimodale Transkription 113 Transkription bildet somit eine Darstellung zweiter Ordnung. Sie ist das Ergebnis einer Praktik, die wiederum dadurch gekennzeichnet ist, dass sie die Eigenschaften dieser Handlung einerseits für die Analyse konserviert und sie andererseits gerade dadurch gestaltet, indem sie die flüssige, bewegte, kontinuierliche Handlung in der Zeit anhält, immobilisiert und in Text und unbewegten Bildern erstarren lässt (vgl. Bergmann 1985; Ashmore/ Reed 2000). Das Transkribieren ist ein theoretischer Vorgang (Ochs 1979; siehe auch De Stefani/ Bürki (Hg.) 2006) - oder sogar ein politischer, wie verschiedene Autoren betonen (etwa Bucholtz 2000; Duranti 2006). Allgemeiner gefasst ist es eine selektive, interpretierende und strukturierende Handlung. Diese aktive Auswahl, Interpretation und Konfiguration der Daten folgt zahlreichen unterschiedlichen und zum Teil widersprüchlichen Kriterien. Das macht die Transkription zu einem äußerst dynamischen Gegenstand, der sich ständig verändert. Unterschiede in der Darstellung hängen vor allem mit dem Zweck der Transkription (und folglich deren Adressaten) zusammen, also damit, ob es sich z.B. um eine Arbeitstranskription handelt oder um eine Transkription für eine Publikation, ob sie für den persönlichen oder für den öffentlichen Gebrauch gedacht ist, ob sie in einer Fachzeitschrift publiziert werden soll oder in einem Lehrbuch oder auf einer Power-Point-Folie in einer Lehrveranstaltung gezeigt wird. Und „dieselbe“ Transkription kann sehr unterschiedlich gestaltet sein, je nachdem, ob sie in erster Linie gelesen, gesehen, analysiert, wiederverwendet werden soll, ob sie auf Papier angefertigt wird oder als alignierte Computerdatei, ob sie für eine allgemeine Analyse bestimmt ist oder für Analysen zu einem bestimmten Phänomen. Diese mediale Variabilität macht deutlich, dass es sehr verschiedene Gründe gibt, zu transkribieren. Im Großen und Ganzen lassen sich hier zwei Richtungen unterscheiden: Die eine Form der Transkription bezieht sich auf den Adressaten und dient dazu, etwas zu zeigen oder zu belegen und zu überzeugen. Die andere - wichtigere - Form dient der Produktion analytischer Erkenntnis. In diesem Fall ist die Transkription nicht nur Arbeitswerkzeug, sondern auch ein Werkzeug der Entdeckung: Wie wir im Weiteren sehen werden, ermöglicht sie insbesondere, Phänomene überhaupt erst wahrzunehmen und zu identifizieren, bevor sie zum Gegenstand der Analyse gemacht werden, und ihre temporal-sequenziellen Eigenschaften im Detail zu untersuchen. 2. Prinzipien der Transkription in der Konversationsanalyse Die Praxis des Transkribierens von Alltagsgesprächen wurde vor allem im Rahmen der Konversationsanalyse entwickelt, wobei die wegweisenden Impulse von Gail Jefferson (2004) hervorzuheben sind, die diese Praxis und ihre Untrennbarkeit von den Anforderungen der Analyse vermutlich mit dem Lorenza Mondada 114 höchsten Anspruch und der größten Kompetenz vertreten hat (für eine Darstellung ihrer Konventionen siehe Hepburn/ Bolden 2012). Grundlegende Prinzipien, die diese Praxis und dieses System des Transkribierens leiten, sind - die Bedeutung des Details: Aus der Feststellung „there is order at all points“ (Sacks 1984, S. 22) folgt, dass „no order of detail in interaction can be dismissed a priori as disorderly, accidental, or irrelevant” (Heritage 1984, S. 241). Dies bedeutet zum Einen, dass kein Detail von vornherein ignoriert oder getilgt werden darf; zum Anderen müssen die Details so abgebildet werden, wie sie zu hören bzw. zu sehen sind - nicht so, wie sie nach den Normen der Sprache, des Handelns oder der textbasierten Darstellung erscheinen müssten. Die Bedeutung des Details ergibt sich aus der Ordnung der Handlung, die die Teilnehmer endogen und methodisch produzieren und als solche behandeln. - die Bedeutung von Sequenzialität und Zeitlichkeit: Wenn man der Orientierung der Teilnehmer auf die Frage „Why that now? “ (Schegloff/ Sacks 1973) folgt, richtet sich die Aufmerksamkeit auf die Details, die die sequenzielle Ordnung der Interaktion konstituieren - sowohl die Zusammenhänge zwischen „prior“ und „next“ als auch allgemein die Zeitlichkeit des Handelns. - die Bedeutung der an der Handlung Beteiligten: Um den Sprecherwechsel zu berücksichtigen, müssen die Stimmen der verschiedenen Sprecher unterschieden und identifiziert werden. Die Interaktion ist kein Text, in dem diese Stimmen durcheinandergehen, sondern eine Einheit, die sich aus den jeweiligen Beiträgen der verschiedenen Teilnehmer konstituiert. Diese Prinzipien hängen eng mit denen der Analyse zusammen. Sie geht davon aus, dass soziale Interaktion auf einer ausgefeilten „Maschinerie“ beruht, die eine sehr präzise Koordination zwischen den Teilnehmern erzeugt. Das zeigt sich etwa im System des Sprecherwechsels und seinen zeitlichen Aspekten (z.B. dem präzisen Umgang mit Überlappungen; siehe dazu Jefferson 1973, 1984, 1986, 1989; Sacks et al. 1974), aber auch in der ebenfalls zeitlich sehr ausgefeilten Komposition einzelner Turns und ihrer sequenziellen Organisation (z.B. der Länge von Pausen und ihrer Interpretation durch die Teilnehmer im Sinne von Präferenzen, vgl. Schegloff 2007). 3. Verbale und multimodale Transkription Verbale Transkriptionen (auf der Basis von Audioaufnahmen) und multimodale Transkriptionen (die sich auf Details von Videoaufnahmen stützen) folgen zwar denselben Prinzipien, dennoch haben sie in der Konversationsanalyse nicht denselben Status. Das hat nicht nur historische Gründe (die verbale Zwischen Text und Bild: Multimodale Transkription 115 Transkription hat eine lange Tradition, die multimodale ist wesentlich jüngeren Ursprungs), sondern auch konzeptuelle; denn die beiden Typen von Ressourcen, Sprache und Körperlichkeit, haben jeweils spezifische Eigenschaften. Im Folgenden skizziere ich einige grundlegende Unterschiede, wobei ich die Spezifika der Analyse von Multimodalität als bekannt voraussetze (siehe dazu etwa Goodwin 2000b, 2002; Goodwin/ Goodwin 2000, 2004; Mondada 2013, 2014a, 2014b). - Standardisierung: Die verbale Transkription folgt Praktiken und Konventionen, die innerhalb der wissenschaftlichen Community der Konversationsanalyse weitgehend standardisiert sind (vgl. das von Gail Jefferson 2004 entwickelte System; vgl. das in der deutschsprachigen Konversationsanalyse weit verbreitete GAT-System: Selting et al. 2009). Multimodale Transkriptionen sind dagegen oft idiosynkratisch, es gibt dafür (noch) keine etablierten Konventionen bzw. die Konventionen können von einer Person oder Forschungsgruppe zur anderen variieren. - Systematik: Bei einer verbalen Transkription kann man sich zwischen verschiedenen Feinheitsgraden entscheiden (z.B. Basistranskript oder erweiterte Transkription). Die gewählte Form lässt sich aber jeweils über die gesamte Transkription hinweg einheitlich anwenden; so kann man z.B. bei allen Pausen die Dauer genau messen, für jede Überlappung Anfang und Ende festhalten, Selbstreparaturen und andere Abbrüche systematisch erfassen. Die multimodale Transkription hingegen ist zwangsläufig selektiv und nie über eine ganze Aufnahme hinweg einheitlich. Sie hängt sowohl vom jeweiligen analytischen Interesse des Transkribenten ab als auch vom jeweils spezifischen Moment der Interaktion und den in diesem Moment genutzten multimodalen Ressourcen. So ist es etwa wenig sinnvoll, alle Bewegungen von rechter und linker Hand über ein ganzes Gespräch hinweg zu transkribieren; stattdessen werden die Handbewegungen nur transkribiert, wenn sie für die Handlungsorganisation relevant sind. Insofern unterscheidet sich die Praxis des Transkribierens radikal von der des Kodierens: Die multimodale Transkription soll das Geflecht der Relevanzen abbilden, das die verkörperte und situierte Organisation des Handelns der Teilnehmer bestimmt; die Kodierung dagegen folgt durchgängig einer Liste festgelegter Kategorien, unabhängig von lokalen Relevanzen. Während die verbale Transkription also von einer Reihe mehr oder weniger feststehender Phänomene ausgeht, die für die Interaktion potenziell relevant und insofern zu erfassen sind, ist es bei der multimodalen Transkription sehr viel schwieriger, wenn nicht unmöglich, vorab zu entscheiden, welche Details relevant sind und dargestellt werden müssen (vgl. Mondada 2014e). Lorenza Mondada 116 - Linearität vs. Multidimensionalität: Während die verbale Transkription relativ linear ist (auch wenn ihr parallele Zeilen z.B. für die Notation der Prosodie hinzugefügt werden können), erfasst die multimodale Transkription zwangsläufig eine ganze Reihe von Ressourcen notwendig parallel, weil sie sich simultan entfalten. Dabei ist der Einsatz dieser Ressourcen zwar präzise abgestimmt, die einzelnen Aktivitäten verlaufen jedoch nicht synchron (z.B. hängen Geste und Blick oft zusammen, aber ihre Dauer und zeitliche Ausdehnung decken sich nicht). Angesichts dieser Unterschiede können für eine multimodale Transkription nicht einfach die Prinzipien, Praktiken und Darstellungsweisen der verbalen Transkription übernommen werden; z.B. lassen sich Gesten nicht nach denselben Konventionen darstellen wie sprachliche Beiträge. Diese Unmöglichkeit ist keine praktische, sondern eine konzeptionelle. Ich gehe hier nur auf zwei entsprechende Darstellungsweisen ein, die in der Literatur häufig genutzt werden. Bei der ersten wird die Notation von Gesten, Blicken oder Körperbewegungen in doppelte Klammern gesetzt, wie es für Phänomene üblich ist, die - um eine treffende Unterscheidung von Jefferson (1985) aufzugreifen - nicht transkribiert, sondern beschrieben werden. Um in diesem Beitrag nicht immer wieder gleichsam mit dem Finger auf die Arbeit von Kollegen zu zeigen, illustriere ich die unterschiedlichen Varianten mit eigenen Daten, die ich an anderer Stelle analysiert und nach anderen Konventionen dargestellt habe (Mondada 2007). Der folgende Ausschnitt entstammt einem Videokorpus von Arbeitssitzungen, in denen mehrere Agronomen um einen Tisch stehen und anhand von Karten und anderen bildlichen Darstellungen über verschiedene Formen der Bodennutzung diskutieren. In diesen Daten lassen sich Zeigegesten identifizieren, die weniger eine referenzielle Funktion haben (z.B. auf einen bestimmten Punkt der Karte hinzuweisen) als vielmehr eine interaktionelle, nämlich eine direkt bevorstehende Redeübernahme anzuzeigen. Im Beispiel werden die Gesten nach der Konvention der Beschreibung in doppelten Klammern dargestellt: (1) (ge-ex-1) — Variante mit ((Geste in doppelten Klammern)) 1 PAL .h je pense que dans le cas du gaec du pra ↑ dou .h ich denke im Fall von (( Name des Hofs )) 2 .h c’est tout l’un, tout l’autre. .h ist es ganz das eine oder ganz das andere 3 VIV .hh ↑ oui. parce que: i’m’semble: eh iici c’étai: : t .hh ja denn mir scheint eh hihier das war 4 quic’que ça voulait représen[ter, c’était ((pointe)) werdas was es darstellen soll [ te das war (( zeigt )) Zwischen Text und Bild: Multimodale Transkription 117 5 LAU [c‘est les amandes [ sind das die mandeln 6 ça? ((pointe)) das da? (( zeigt )) Das Problem bei dieser Form der Notation ist vor allem die zeitliche Positionierung - es betrifft also eine grundlegende Dimension der Konversationsanalyse. Solche Beschreibungen werden häufig am Ende des betreffenden Turns eingefügt (manchmal auch am Anfang). Wollte man das buchstabengetreu verstehen, würde es bedeuten, dass die Geste am Ende (bzw. zu Beginn) des Turns ausgeführt wird. Nun weiß man aber, dass solche Gesten - wie auch andere Körperbewegungen - in der Regel parallel zum Sprechen erfolgen (Schegloff 1984). Sie haben also nicht nur eine konkrete zeitliche Position, sondern auch einen Verlauf mit einer Amplitude und somit eine Dauer. Diese zeitlichen Eigenschaften müssen in einer solchen Transkription notwendig ignoriert werden, denn über die zeitliche Verortung der Geste sagt sie nichts aus. Die zweite Darstellungsform, die in der Literatur häufig verwendet wird, trägt dem eben vorgebrachten Einwand Rechnung: Sie nutzt die konventionelle Notation für Überlappungen, um die Dauer der Geste anzuzeigen. Das folgende Beispiel illustriert diese Version anhand desselben Gesprächsausschnitts: (2) (ge-ex-1) — Variante mit [ ((Beschreibung der Geste)) 1 PAL .h je pense que dans le cas du gaec du pra ↑ dou .h ich denke im Fall von (( Name des Hofs )) 2 .h c’est tout l’un, tout l’autre. .h ist es ganz das eine oder ganz das andere 3 VIV [.hh ↑ oui. parce que: i’m’semble: eh iici c’étai: : t [ .hh ja denn mir scheint eh hihier das war [(( pointe )) [(( zeigt )) 4 quic’que ça voulait représen[ter, c’était werdas was es darstellen soll [ te das war 5 LAU [c‘est les amandes [ sind das die mandeln 6 [ça? [(( pointe )) [ das da? [(( zeigt )) Mit der eckigen Klammer („[“), die normalerweise Überlappungen anzeigt, wird hier markiert, in welchem Moment die Geste beginnt (und eventuell auch, wo sie endet). Diese Notationsweise hat den Vorteil, dass sie den As- Lorenza Mondada 118 pekt der Zeitlichkeit in die Transkription integriert; ein großer Nachteil ist allerdings, dass sie die simultane Geste genauso behandelt wie simultanes Sprechen, obwohl es sich um zwei grundsätzlich verschiedene Phänomene handelt: Eine Überlappung behandeln die Teilnehmer - im Sinne des Prinzips „ein Sprecher nach dem anderen“ (Sacks/ Schegloff/ Jefferson 1974) - als Störung, simultane Gesten hingegen als normal und unproblematisch. Die Eigenschaften der Überlappung lassen sich nicht auf reine Gleichzeitigkeit reduzieren, und sie beziehen sich nur auf das Sprechen; eine „kinesische Überlappung“ in diesem Sinne gibt es nicht. Diese Ausführungen machen deutlich, dass Gesten eine Notationsweise erfordern, die nicht der Notation des Sprechens entlehnt, sondern spezifisch auf Körperbewegungen zugeschnitten ist. Im nächsten Abschnitt gehe ich zunächst auf einige Prinzipien einer solchen Notationsweise ein; anschließend nehme ich das Beispiel von oben auf und verwende dafür eine multimodale Notation, die ich in Mondada (2007) vorgeschlagen habe. 4. Einige grundlegende Dimensionen multimodaler Notation Die Diskussion im vorigen Abschnitt hat gezeigt, dass eine multimodale Transkription eigene Konventionen erfordert, um die Spezifika der körperlichen Dimension sozialen Handelns zu erfassen. Die Anforderungen an eine entsprechende Notationsweise ergeben sich wiederum aus den Grundprinzipien einer konversationsanalytischen Mentalität: - Zeitlichkeit: Gesten, Blicke, Bewegungen sind körperliche Ressourcen, deren Einsatz sich in der Zeit entfaltet; die entsprechenden Aktivitäten haben jeweils einen bestimmten Verlauf und erfolgen teils simultan und teils nacheinander. Das Notationssystem muss demnach in der Lage sein, sie in ihren komplexen zeitlichen Bezügen zueinander darzustellen (man muss hier also von Zeitlichkeiten sprechen, vgl. Mondada 2015a), während es gleichzeitig dem oben schon angesprochenen Paradox unterliegt, dass es einen komplexen zeitlichen Fluss in eine starre räumliche Darstellung überführt (Bergmann 1985). Die Transkription muss somit eine Reihe zeitlicher Fragmente mit unterschiedlicher Dauer abbilden, und ihre Komplexität erhöht sich noch, wenn man sich nicht auf einen einzigen körperlichen Aspekt konzentriert (z.B. nur Kopfnicken oder eine bestimmte Geste), sondern den Einsatz des Körpers holistisch erfassen will. - Sequenzialität und Koordination zwischen den Interaktanten: Das Problem der Simultaneität körperlicher Verhaltensweisen und ihrer Koordination stellt sich nicht nur beim einzelnen Teilnehmer (zeitliche Beziehung zwischen seinem Sprechen, seinen Gesten, seinen Blicken usw.), sondern auch in Bezug auf die Koordination und Abstimmung zwischen den Teilnehmern Zwischen Text und Bild: Multimodale Transkription 119 (z.B. zeitliche Beziehung zwischen der Geste des einen und dem Blick des anderen). Hier stellt sich die Frage, ob die konkreten körperlichen Verhaltensweisen sich jeweils sequenziell auswirken („sequential implicativeness“, vgl. Schegloff/ Sacks 1973) - das kann auch auf der körperlichen Ebene geschehen, wenngleich nicht immer in derselben Weise wie auf der Ebene des Sprechens. - Räumlichkeit: Wenn man körperliche Verhaltensweisen der Teilnehmer als Ganzes und zudem ihre wechselseitige Koordinierung berücksichtigen will, stellt sich die Frage, wie sich die Teilnehmer wechselseitig aufeinander abstimmen und wie sie im Interaktionsraum verortet sind (Mondada 2009; dieses Problem wird häufig übersehen, wenn man sich z.B. auf das Studium der Gesten beschränkt). Die relative körperliche Positionierung ist textbasiert schwer darzustellen; gerade bei solchen Phänomen muss eher auf eine visuelle Darstellung (Skizzen oder Bilder) zurückgegriffen werden. - Dynamische und kinesiologische Eigenschaften von Körperbewegungen: Die Zeitlichkeiten von Bewegungen erfordern eine relationale Notation (ihre jeweilige Dauer und ihre Bezüge zueinander, relative Anfangs- und Endpunkte); darüber hinaus müssen aber auch die Form, der Verlauf und die Gestalt der Bewegungen selbst beschrieben werden (es ist schon nicht einfach, Gestikulieren im Verlauf zu beschreiben, bei Körperbewegungen ist das noch weitaus komplizierter). Diese grundlegenden Dimensionen von Bewegungen können auf verschiedene Weisen wiedergegeben werden, sowohl mit textuellen als auch mit bildlichen Mitteln, worauf ich im Folgenden näher eingehen werde. 5. Konventionen der textbasierten Darstellung von Multimodalität In den letzten Jahrzehnten haben verschiedene Autoren systematische multimodale Notationen vorgeschlagen. Ein grundlegender Vorläufer in diesem Bereich sind die gesture studies, in denen nacheinander mehrere Ansätze ausgearbeitet wurden: Auf die Konventionen von Laban (1956) folgten ein kinesiologisches Notationssystem (Birdwhistell 1970, S. 257-282; vgl. auch das System in Birdwhistell 1981, das in dem berühmten Projekt ‘History of an Interview’ verwendet wurde, siehe McQuown (Hg.) 1971) und weitere komplexe Notationsweisen (Kendon/ Ferber 1973 und Kendon 1990 entwickeln eine sehr detaillierte Beschreibungsweise am Beispiel der schrittweisen Annäherung von zwei Personen vor der eigentlichen Begrüßung). Ein zentraler Entwicklungsschritt war Kendons Unterscheidung zwischen Vorbereitung, stroke, Aufrechterhaltung und Zurückziehen oder Beendigung der Geste (vgl. Lorenza Mondada 120 Kendon 1990, 2004), die in der gesamten nachfolgenden Literatur aufgenommen wurde. Pionierarbeiten im Bereich der Konversationsanalyse waren die Notationen von Goodwin (1981) und Heath (1986). Diese stelle ich im Folgenden kurz vor, bevor ich mein eigenes Notationssystem entwickle. 1 Charles Goodwin, ein Pionier nicht nur in der Verwendung von Videodaten im Rahmen der Konversationsanalyse, sondern auch in ihrer systematischen Analyse, schlägt in seinen Konventionen von 1981 eine abstrakte Notation für Blicke vor, wie sie das folgende Beispiel illustriert: (3) Goodwin (1981) Bei dieser Notationsweise ist erkennbar, dass der Blick sich auf den Gesprächspartner richtet (--), ebenso die Verlagerung des Blicks dorthin (...) und von dort wieder weg (, , , ,). Diese Notation könnte auch für andere multimodale Aspekte als den Blick genutzt werden; dafür verwenden Goodwin/ Goodwin jedoch andere, stärker beschreibende Konventionen: 1 Aus Platzgründen gehe ich hier nicht auf die Vor- und Nachteile computergestützter Transkriptionen ein (besonders mithilfe von Programmen, in denen die Transkription direkt mit dem Audiobzw. Videosignal verbunden werden kann, wie Praat (www.fon.hum.uva.nl/ praat/ ), CLAN (http: / / childes.psy.cmu.edu/ clan/ ), ELAN (Handbuch unter www.mpi.nl/ corpus/ html/ elan/ index.html) und anderen). Das würde eine eingehende Diskussion erfordern, die den Rahmen dieses Beitrags sprengen würde. Zwischen Text und Bild: Multimodale Transkription 121 (4) Goodwin/ Goodwin (1987, S. 32; das gleiche Beispiel mit einigen Abweichungen in Goodwin/ Goodwin 1992, S. 168) (4a) Version von 1987 (4b) Version von 1992 Die Autoren verwenden dieses Beispiel in einem Artikel über Bewertungen, um zu zeigen, wie ein Sprecher eine erste Bewertung behutsam auf eine zweite abstimmt. In der Transkription sind verschiedene Phänomene notiert, z.B. Bewegungen des Oberkörpers, Kopfbewegungen (eyebrow flash, nod) und Blicke. Die Beschreibung eines Phänomens wird hier jeweils in die grafischen Markierungen seiner Dauer eingefügt; für den Blick zeigt ein Pfeil den Beginn an (aber nicht das Ende). Christian Heath, der andere Pionier der konversationsanalytischen Forschung zur Multimodalität, verwendet ähnliche, aber anscheinend komplexere Notationen, die in den Konventionen allerdings nicht immer expliziert werden. Der folgende Ausschnitt erscheint in einem Artikel von 1989 und einer Reproduktion dieses Artikels aus dem Jahr 1991 in zwei unterschiedlichen Versionen: Lorenza Mondada 122 (5) Heath (1989, S. 116 und 1991, S. 99) (5a) Version von 1989 (5b) Version von 1991 Der Ausschnitt stammt aus einer medizinischen Konsultation, im Verlauf derer der Arzt (Dr) den Fuß des Patienten (P) bewegt und damit einen Ausdruck von Schmerz auslöst. Die Transkription beschreibt einerseits die Position des Patienten, der dem Arzt gegenübersitzt, und andererseits die Handgriffe, die der Arzt während des Gesprächs am Körper des Patienten vornimmt. In der Gegenüberstellung wird deutlich, dass die erste Version mehr Details enthält, während die zweite Version vereinfacht wurde, um die Lesbarkeit zu erhöhen. Mit Blick auf diese Vorarbeiten und die Geschichte dieser Notationsweisen wie auch der von Kendon (1990, 2004) habe ich eine eigene Notationsweise entwickelt, die den jeweils zugrundeliegenden Prinzipien folgt und sie systematisiert. 2 Diese Notation beruht grundsätzlich darauf, dass jede körperliche 2 Die Konventionen, die ihnen zugrunde liegenden Prinzipien und ihre Anwendung sind in einem Handbuch detailliert erläutert: https: / / franz.unibas.ch/ fileadmin/ franz/ user_upload/ redaktion/ Mondada_conv_multimodality.pdf (Stand: Juni/ 2016). Zwischen Text und Bild: Multimodale Transkription 123 Bewegung - sei es eine Geste, ein Blick, eine Kopf- oder Körperbewegung oder eine Haltung - einen bestimmten Verlauf hat, den man unterteilen kann in ihre Vorbereitung, ihre Verfestigung und ihre Beendigung; man muss also ihre Dauer bestimmen, ihren (eventuell emergenten) Anfang und ihre (eventuell allmähliche) Beendigung. Für die Notation dieser Verlaufsaspekte gelten folgende Konventionen: - Beginn und Ende einer Bewegung werden durch Symbole markiert (ein bestimmtes Symbol für jeden Teilnehmer und ggf. für jede Art von Bewegung). Dieses Symbol wird in die Zeile der verbalen Transkription eingefügt und gibt so genau an, in welchem Moment des Sprechens - oder der Stille, wenn nicht gesprochen wird - die Bewegung jeweils beginnt und endet. - Die Vorbereitung der Geste wird durch Punkte ............ angezeigt. - Dann folgt, eingeschlossen zwischen zwei Symbolen, die Beschreibung der Geste selbst. - Das Zurückziehen oder die Beendigung der Geste wird durch Kommas , , , , , , , gekennzeichnet. - Die Form der Darstellung ist eine textbasierte (sie verwendet wie die vorangegangenen Beispiele typografische Zeichen), darüber hinaus nutzt sie jedoch die räumliche Dimension des Textes, um Simultaneität abzubilden. Diese visuelle Dimension transformiert die Transkription in eine Art Abbildung. - In diese Darstellung können zusätzlich Bilder eingefügt werden. Diese werden mithilfe eines eigenen Symbols präzise auf den Zeitpunkt (nicht die Dauer) bezogen, auf den sie verweisen: den genauen Moment der Interaktion, in dem das Standbild aus der Videoaufzeichnung extrahiert wurde. - So lassen sich die Emergenz, der Ablauf und die Beendigung der Bewegung detailliert beschreiben und zugleich die zeitlichen Bezüge (Gleichzeitigkeit und Nacheinander) zwischen verschiedenen multimodalen Handlungen präzise darstellen. Da die Konventionen an anderer Stelle ausführlich erläutert worden sind (s.o. Anm. 2), beschränke ich mich hier darauf, ihre Anwendung anhand des oben bereits zitierten Ausschnitts (2) zu zeigen: (6a) Mondada (2007) 1 PAL .h je pense que dans le cas du gaec du pra ↑ dou .h ich denke im Fall von (( Name des Hofs )) 2 .h c’est tout l’un, tout l’autre. .h ist es ganz das eine oder ganz das andere Lorenza Mondada 124 3 VIV +.hh# ↑ oui. # parce # que: i’#m’*sem #+ble: eh i- *ici# .hh ja denn mir scheint eh hihier +...................................+zeigt m Stift-->> lau *öffnet Mappe----* Bild #Bild 1 #Bild 2 #Bild 3 #Bild 4 #Bild 5 Bild 6# 4 c›étai: : t quic’que ça voulait représen[ter, c’était das war werdas was es darstellen soll [ te das war 5 LAU [*c‘est les [ sind das die lau *........... 6 am*andes ça? mandeln das da? lau ..*zeigt m Finger-->> 1 2 3 4 5 6 In dieser multimodalen Notation wird deutlich, dass die Zeigegeste von Viviane sich schon mit dem Beginn ihrer Turnübernahme (Einatmen am Anfang von Zeile 3) aufbaut und ihre maximale Ausdehnung direkt vor dem deiktischen Element erreicht, gleich nachdem Laurence auf die Geste reagiert: Diese öffnet die Mappe, die sie vorher geschlossen in der Hand gehalten hat, und deckt damit den Ort auf, auf den Viviane mit ihrem Stift zeigt (3: ici/ hier). Diese beiden Gesten, Vivianes Zeigen und das Aufschlagen der Mappe durch Laurence, fallen nicht einfach zeitlich zusammen, sie sind vielmehr interaktional aufeinander bezogen und sequenziell organisiert (für eine systematische Analyse dieses Ausschnitts siehe Mondada 2007). Darüber hinaus macht die Beschreibung der Gesten einen Unterschied zwischen Vivianes Zeigen mit dem Stift und Laurences Zeigen mit dem Finger deutlich; diese unterschiedlichen Gesten hängen mit den Aktivitäten und den Expertisen der betreffenden Zwischen Text und Bild: Multimodale Transkription 125 Teilnehmerinnen in der Interaktion zusammen und projizieren verschiedene Handlungen (für eine Analyse der interaktionalen Folgen dieser beiden Gesten siehe Mondada 2014e). Eine solche Transkription lässt sich nun noch weiter verfeinern. So können z.B. auch die Bewegungen erfasst werden, die Vivianes Turnübernahme vorbereiten und dieser weit vorausgehen: (6b) (neue Version von Ausschnitt 6a) 1 PAL ben suivant le ca: s ↓ euh: ben on tra- .h on est là nun je nachdem euh: nun wir ar- .h wir sind da 2 que pour le champ, et puis à un autre mo ↑ ment: nur für das Feld und in einem anderen Moment 3 ben on va échouer, (0.2) en pâtu ↑ rage +.h+ nun da landen wir ( 0.2 ) bei der Wiese .h viv +bewegt reHd+ 4 sur l’assemblage +sans parcours. .h +je pense que + bei Zusammenlegung von Feldern ohne Weg .h ich denke viv +...................+bewegt Blatt-+ +bewegt s n vorn+ 5 +dans le cas +du gaec du pr+a ↑ dou im Fall von (( Name des Hofs )) viv +re.Hd. n.vorn+dreht Hdgelenk+greift Stift-> 6 .h c’est tout+ l’un, + tout l’autre. .h ist es ganz das eine oder ganz das andere viv --->+dreht Stift+ 7 VIV +.hh ↑ oui. parce que: i’m’*sem+ble: eh i- *ici .hh ja denn mir scheint eh hihier +.............................+zeigt m Stift-->> lau *öffnet Mappe---* 8 c›étai: : t quic’que ça voulait représen[ter, c’était das war werdas was es darstellen soll [ te das war 9 LAU [*c‘est les [ sind das die lau *............ 10 am*andes ça? mandeln das da? lau ..*zeigt m Finger-->> Lorenza Mondada 126 Diese Transkription vermag zugleich einen wichtigen Punkt in Bezug auf die Relevanz der Notation der Details verdeutlichen: Vivianes Handbewegungen (die nicht im engen Sinne Gesten darstellen) sind in dieser sequenziellen Position insofern relevant, als sie eine bevorstehende Turnübernahme projizieren. Solche Phänomene sind aber für die Interaktion nicht grundsätzlich bedeutsam, das hängt vielmehr von der jeweiligen sequenziellen Umgebung ab. Es ist möglich, dass die gleiche Drehung des Handgelenks in einer anderen Umgebung keine Relevanz hat, in dem Fall würde sie auch nicht festgehalten. Dies unterstreicht noch einmal den weiter oben angesprochenen Unterschied zwischen multimodaler ‘Transkription’ und ‘Kodierung’ (bei der diese Bewegungen entweder im ganzen Korpus systematisch zu notieren oder nicht zu notieren wären), der mit der Selektivität der multimodalen Transkription zu tun hat, die dem Prinzip der Relevanz folgt. Außerdem illustriert der Ausschnitt, dass auf diese Weise nicht nur Gesten oder Blicke notiert werden können (vgl. zu Letzteren die Notation in Rossano 2013), sondern jede Bewegung, etwa auch Gehen, das travelling der Kamera usw. (vgl. Mondada 2014c). Multimodale Notationen können also kumuliert werden. So könnte man in diesem Ausschnitt neben den Gesten und Handbewegungen von Viviane noch weitere Dimensionen erfassen, z.B. den Blick ihres Gesprächspartners und des aktuellen Sprechers Pierre-Alain (PAL): (6c) (um den Blick erweiterte Fassung von Ausschnitt 6b) 1 PAL ben suivant le ca: s ↓ euh: ben on tra- .h on est là nun je nachdem öh nun wir ar- .h wir sind da 2 que pour le champ, et puis à un autre mo ↑ ment: nur für das Feld und in einem anderen Moment 3 ben on va échouer, (0.2) en pâtu ↑ rage .h nun da landen wir ( 0.2 ) bei der Wiese .h 4 sur l’assembla‡ge +sans parcours. .h +je pen‡se que+ bei Zusammenlegung von Feldern ohne Weg .h ich denke >>Bl zu LAU-->‡Bl zu VIV--------------------‡Bl n.u.-> viv +..................+bewegt Blatt-+ +u. bewegt s.vor+ 5 +dans le cas du gaec du pr+‡a ↑ dou im Fall von (( Name des Hofs )) ---->‡sieht zu LAU--> viv +dreht Handgelenk, bewegt s. vor+ 6 .h c’est tout‡ l’un, tout l’autre. .h ist es ganz das eine oder ganz das andere -->‡sieht zu VIV--> Zwischen Text und Bild: Multimodale Transkription 127 7 VIV +.hh ↑ oui. par‡ce que: i’m’*sem+ble: eh i- *ici .hh ja denn mir scheint eh hihier +............................. +zeigt m Stift-->> lau *öffnet Mappe---* pal --->‡schaut auf das gezeigte Blatt-->> 8 c›étai: : t quic’que ça voulait représen[ter, c’était das war werdas was es darstellen sollte das war Diese noch einmal gesteigerte Komplexität der Transkription zeigt die Bedeutung des Details für die sequenzielle Analyse, denn sie erlaubt nun eine andere Deutung des Geschehens: In Zeile 4 verlagert Pierre-Alain seinen Blick von Laurence (die hier - in den Begriffen von Goodwin (1979) - ein unknowing recipient ist) zu Viviane (Kollegin von Pierre-Alain und knowing recipient), und zwar kurz bevor Viviane ihre Handbewegung beginnt. In Ausschnitt 6b hatten wir gesehen, dass Viviane in einem bestimmten Moment eine mögliche Turnübernahme als Selbstwahl projiziert und sich dabei an ihrer Interpretation von Pierre-Alains aktuell entstehendem Beitrag orientiert. Ausschnitt 6b kann nun belegen, dass Pierre-Alain sie mit der Verlagerung seines Blicks zu ihr einlädt, demnächst den Turn zu übernehmen, und sie auf diese Einladung reagiert (genauer gesagt reagiert sie auf Pierre-Alains Anzeige, dass sein Turn sich dem Ende nähert und somit demnächst ein Sprecherwechsel möglich ist). Man sieht an diesem Beispiel, dass eine höhere Komplexität der Transkription nicht einfach dazu dient, eine schwindelerregende Fülle von Details zu erzeugen; vielmehr kann sie für die Analyse der sequenziellen Organisation aufschlussreich und sogar unentbehrlich sein, z.B. um initiative und reaktive Handlungen, Selbst- und Fremdinitiierung zu unterscheiden. Mithilfe der illustrierten Konventionen lassen sich also die Zeitlichkeit (Dauer, zeitliche Begrenzungen) und die Gleichzeitigkeit bzw. das Nacheinander körperlicher Bewegungen präzise erfassen. Sie markieren diese Zeitlichkeit bezogen auf das emergente Sprechen, das in diesen Transkriptionen als zeitlicher Maßstab fungiert. Dass die multimodale Transkription auf diese Weise notgedrungen an der des Sprechens „aufgehängt“ wird, könnte als Ausdruck einer dem Transkribieren innewohnenden Sprachfixierung ausgelegt werden. Die Notationsweise ist allerdings nicht per se sprachzentriert, sondern privilegiert das Sprechen nur im Rahmen solcher sozialen Aktivitätszusammenhänge, die in erster Linie eben auf Sprechen und Zuhören ausgerichtet sind (wie das z.B. in einer Diskussion oftmals der Fall ist) - im Unterschied zu anderen Aktivitätszusammenhängen, für die die primär kommunikativ relevante Handlung keine verbale, sondern z.B. eine manuelle ist (wie das z.B. im Rahmen einer praktischen Instruktion der Fall sein kann). Daher lässt sich mit dieser Notationsweise bei anderen Aktivitäten, in denen die Teilnehmer nicht Lorenza Mondada 128 das Sprechen in den Vordergrund stellen, das Handeln an einer Notation der Zeit „aufhängen“. So etwa beim folgenden Ausschnitt, der in einem Rundfunkstudio aufgenommen wurde und einen Wechsel des Teilnahmerahmens zeigt: Die beiden Moderatoren Isa und Oli arbeiten zunächst jeder für sich an ihren PCs; dann richtet Oli seinen Blick auf Isa und projiziert damit einen an sie adressierten Turn. (7) Mondada/ Oloff (i.d.Bd.) 1 #(2.1) ⊥ (0.2) ⊥ (1.2)+(0.5) # Bild #Bild 1 m #Bild 2 isa >>blickt n. unten auf Dok----------> l.10 oli ⊥ Kopfhörer ab, auf Schulter ⊥ oli +...schaut zu ISA--> 1 2 In diesem Ausschnitt ist die Pause durch verschiedene Bewegungen segmentiert. Deren Notation zeigt, wie Oli sich von seiner Einzelarbeit (bei der er durch den Kopfhörer akustisch isoliert ist) auf eine Wiederaufnahme des Gesprächs mit Isa umorientiert (die in dem Moment auf die Dokumente konzentriert ist, in denen sie blättert). Vorstellbar ist natürlich auch eine Form der Transkription, die die Interaktion von vornherein und ausnahmslos einem Zeitmaß unterordnet - sofern dieses für das Geschehen relevant ist. Dies ist das grundlegende Prinzip von Transkriptionen, die mit der Alignment-Software ELAN angefertigt werden: Hier werden alle Notationen der jeweils sekundengenauen Zeitachse zugeordnet. Das nächste Beispiel zeigt einen Screenshot aus einer Transkription, die vollständig mit ELAN erstellt wurde (Mondada 2014d), d.h. die gesamte Transkription ist nach der gemessenen metrischen Zeit eingeteilt. Der Ausschnitt stammt aus einer chirurgischen Operation, in deren Verlauf der Chirurg (SURG) seinen Assistenten (ASS) bittet, das Körpergewebe, das er mit der Zange gefasst hat, anders zu halten (reprends plus près/ fass es etwas näher). Zwischen Text und Bild: Multimodale Transkription 129 (8) Mondada (2014d) Bei dieser Art von Operation muss das Gewebe gerade so viel Spannung haben, dass der Chirurg es leicht schneiden kann. Die Transkription zeigt, dass der operierende Chirurg mit dem Stück Gewebe, das er selbst hält, in Richtung des Assistenten deutet und es bewegt (beschrieben als „waves“), während er seine Aufforderung formuliert. Der Assistent reagiert darauf, indem er das Gewebe loslässt, das er mit der Zange gehalten hat, und das Stück greift, das der Chirurg ihm zeigt. Die Transkription dokumentiert, dass die Aufforderung parallel zur Geste erfolgt und dass der Angesprochene darauf reagiert, indem er schweigend die entsprechende Handlung ausführt. Die Transkription macht sich eine Eigenschaft der Software ELAN zunutze, die darin besteht, dass man die verschiedenen Zeilen beliebig anordnen kann. Die erste Zeile enthält die Handbewegungen des Chirurgen, die zweite seine sprachlichen Äußerungen und die dritte die Bewegungen des Assistenten. Das Sprechen bildet hier also nicht die erste Ebene. Dies ist wichtig für primär manuelle Aktivitäten, die durchgängig auf Bewegungen beruhen und bei denen die Teilnehmer nur von Zeit zu Zeit auf Sprechen und Zuhören zurückgreifen, um diese Aktivitäten zu koordinieren und zu regulieren. Aus der emischen Perspektive der Teilnehmer ist anzumerken, dass die in regelmäßige Einheiten unterteilte Zeitlinie (Sekunden oder Millisekunden je nach dem Feinheitsgrad, den man in ELAN zugrunde legt) nicht immer die primär relevante Orientierung sein muss; es handelt sich dabei also grundsätzlich um eine etische, nicht um eine emische Zeitlichkeit. In diesem Sinne gilt es auch zu beachten, dass kronos nicht kairos ist: Kronos verweist auf die standardisierte, homogene, abstrakte, quantitativ messbare Zeit, die ihrerseits aus einer bestimmten Geschichte zeitlicher Technologien und Institutionen hervorgegangen ist (Zerubavel 1982); die Zeit der Interaktion ist hingegen eher kairos, die rechte Zeit, der günstige Moment, die Gelegenheit, die Kontingenz. Diese Zeit wird im und durch den sequenziellen Ablauf der Interaktion reflexiv geschaffen und gestaltet - dadurch, wie die Teilnehmer ihre Handlungen formatieren, durch die Zeitlichkeit der Reaktionen auf diese Handlungen und Lorenza Mondada 130 durch den praxeologischen Kontext, in dem sie ablaufen (z.B. das, womit die Teilnehmer gerade beschäftigt sind, während sie interagieren). Deshalb kann eine Pause lang wirken, obwohl sie nur einige Zehntelsekunden dauert (zum Beispiel wenn die Teilnehmer miteinander sprechen und sich dabei ansehen, ohne irgendetwas anderes zu tun), während andere Pausen von mehreren Sekunden zwischen zwei Turns nicht als lang wahrgenommen werden, weil die Teilnehmer mit etwas beschäftigt sind, dessen Rhythmus sich durch eine andere Zeit bestimmt als die des Sprechens. Überhaupt beziehen die Beteiligten ihre Aktivitäten ganz allgemein auf andere „Zeitgeber“ als Uhren oder Chronometer, nämlich eher auf zeitliche Objekte wie den im Entstehen begriffenen Turn, das Ende des Gesprächs, die Zeit, die nötig ist, um eine Aktivität zu beenden, die Dauer eines Ereignisses (z.B. die Garzeit des Essens bei einem Gespräch in der Küche oder die Dauer einer Fernsehsendung bei einer Unterhaltung im Haus). Das relativiert die Objektivität z.B. der zeitlichen Notation von Pausen (in den Transkriptionen wie in den Alignment-Programmen), denn diese Zeitmessung ist wie oben schon beschrieben eine externe etische Messung. 6. Verwendung von Bildern in der multimodalen Transkription Die bisher diskutierten Notationsweisen stützen sich im Wesentlichen auf eine textbasierte Darstellung. Allerdings nutzen sie räumliche Effekte auf der Fläche (oder dem Bildschirm) zur Darstellung von Zeit; damit überschreiten sie die Linearität konventioneller Texte und nähern sich der Räumlichkeit von Bildern an - der Text wird so selbst zu einer Art Bild (Schriftbildlichkeit). Darüber hinaus werden in Transkriptionen oft Bilder aus der Videoaufnahme (Standbilder) eingefügt. Dabei können unterschiedlich viele Bilder genutzt werden, und diese können mehr oder weniger stark mit dem Text der Transkription verschränkt und mehr oder weniger präzise auf die Zeitlichkeit der Interaktion bezogen sein. Um diesen letzten Aspekt geht es in diesem Abschnitt. Eingebettete Bilder tragen zur Transkription in einer Weise bei, die eine rein textbasierte Darstellung aus prinzipiellen Gründen nicht leisten kann: - Sie können eine Geste oder eine Bewegung erheblich komplexer, spezifischer und vollständiger „wiedergeben“ als eine verbale Beschreibung (so detailliert sie auch sein mag). - Ein bestimmter Moment, in dem verschiedene multimodale Details miteinander koordiniert und synchronisiert sind, lässt sich in einem einzigen Bild einfangen - das kann eine textbasierte Beschreibung in dieser Form auch dann nicht leisten, wenn man die Notationszeilen für multimodale Phänomene vervielfältigt. Zwischen Text und Bild: Multimodale Transkription 131 - Bilder können die physischen Positionen der Teilnehmer und der Gegenstände im Raum, also die Umgebung der Interaktion in einer Weise wiedergeben, die eine Beschreibung kaum leisten kann. - Eine Serie aufeinanderfolgender Bilder kann den Verlauf von Bewegungen oder Verschiebungen im Raum wiedergeben, indem sie diesen Prozess in einzelne Bilder unterteilt. Das Potenzial von Bildern hängt von ihrer Verwendung ab, sowohl von der Auswahl und Anzahl als auch von ihrer Integration in den Text. Für diese Integration gibt es zahlreiche Möglichkeiten: - Bilder können direkt in die Transkription eingefügt werden. Verschiedene Techniken wurden entwickelt, um die jeweilige Verbindung zwischen Bild und Transkription anzuzeigen. Nach den von mir entwickelten Konventionen werden Bilder grundsätzlich auf einen bestimmten Moment der verbalen Transkription bezogen und somit zeitlich verortet (so wie jede andere multimodale Notation, nur mit dem Unterschied, dass sich ein Bild auf einen Zeitpunkt bezieht und nicht auf eine Zeitspanne). In dieser Weise wird das Bild in der Zeit verankert (siehe Beispiele 6 und 8). - Ein Bild kann in den Text integriert sein, mit dem es analysiert und kommentiert wird. Dabei kann es explizit auf einen konkreten Moment der Transkription bezogen werden oder auch nicht. - Bild und Transkription können teilweise redundant sein - wenn z.B. die im Bild beobachtbaren Körperhaltungen auch in der multimodalen Transkription kurz beschrieben werden - oder aber strikt komplementär, etwa wenn es zu der abgebildeten Körperhaltung gar keine multimodale Transkription gibt. Bei dieser letzten Version kann das Bild gestützt durch die Analyse als eine „dichte Beschreibung“ genutzt werden, die nicht denselben externen Beschränkungen unterliegt wie eine multimodale Transkription (vgl. z.B. Schmitt 2004). Durch den Einsatz der Bilder werden deren Potenziale also jeweils eingeschränkt oder vervielfältigt. Bevor wir auf ihre ‘visuelle Grammatik’ eingehen, möchte ich noch einmal unterstreichen, dass solche Bilder trotz ihres erheblichen mimetischen Potenzials nicht mit dem betreffenden Phänomen als solchem verwechselt werden dürfen. Tatsächlich sind sie nur eine visuelle Darstellung zweiter Ordnung, denn sie repräsentieren einen Ausschnitt aus der Videoaufnahme, die selbst schon eine visuelle Darstellung (erster Ordnung) des eigentlichen Phänomens oder Geschehens ist. In Transkriptionen eingefügte Bilder sind also keine direkten Fotografien von der Handlung, sondern Standbilder aus Primärdokumentationen, den Videoaufnahmen. Insofern hängt ihr repräsentatives Potenzial u.a. von der Qualität dieser Video- Lorenza Mondada 132 aufnahme ab - sowohl der materiellen Bildqualität (Beleuchtung, Schärfe, Kontrast, Auflösung etc.) als auch ihrer praxeologischen Adäquatheit (vor allem Bildausschnitt, Tiefenschärfe und Perspektive der Kamera auf das Geschehen). Multimodale Phänomene lassen sich mit einem Standbild unterschiedlich gut wiedergeben. Erstens sind bestimmte Aspekte visuell gar nicht wahrnehmbar (z.B. taktile Phänomene). Zweitens sind manche Phänomene für die Teilnehmer sichtbar, in der Aufnahme jedoch nicht (aufgrund der Kameraperspektive im jeweiligen Moment). Drittens sind manche Phänomene zwar in der Videoaufnahme sichtbar, lassen sich aber durch ein starres Bild oder selbst eine Serie von Einzelbildern nicht wiedergeben, weil sie nur in bewegten Bildern sichtbar sind (z.B. kleine Gesten, die keine breite Ausdehnung oder deutlich sichtbare Verlaufsbahn haben). Diese Betrachtungen mögen banal erscheinen, sie sind jedoch wichtig, um die Grenzen der Nutzbarkeit und Effektivität von Bildern in Transkriptionen im Auge zu behalten - und um den Eindruck von Transparenz und Wirklichkeitstreue zu relativieren, den solche Bilder erzeugen. Wenden wir uns nun den verschiedenen Varianten zu, wie Bilder und ihr Potenzial in multimodalen Transkriptionen genutzt werden können. Eine erste Feststellung betrifft die Zahl der Bilder und deren Verkettung. Es ist durchaus gebräuchlich, ein einzelnes Bild zu verwenden, z.B. um die räumliche Anordnung der Teilnehmer zu zeigen und deren Identifizierung zu erleichtern, etwa durch Einfügung ihrer Namen (solche Bilder finden sich typischerweise am Anfang eines Ausschnitts). Häufig werden in Transkriptionen aber mehrere Bilder zusammen verwendet. So können zwei nebeneinandergestellte Bilder einen Kontrast erzeugen, etwa indem sie zwei konstitutive Momente der Entwicklung oder des Verlaufs einer Geste zeigen. Eine Serie von Bildern wiederum kann eine allmähliche Fortbewegung oder Verlagerung wiedergeben; die Bilder segmentieren die Bewegung dann in einzelne Phasen und zeichnen sie durch die Kontraste jeweils von einem Bild zum nächsten nach (siehe Beispiel 6). Eines der Prinzipien für die Auswahl von Bildern für eine Transkription ist also Kontrast - die Sichtbarmachung eines Unterschieds auf dem Hintergrund der Ähnlichkeiten. Der folgende Ausschnitt gibt dafür ein Beispiel. Er entstammt einer Versammlung von Bürgern, die sich in einem Projekt partizipativer Stadtentwicklung engagieren. Ein Bürger, Latuillière, fordert, dass es in dem Park, um den es in der Diskussion geht, keinen Parkplatz geben solle (21). Der Moderator der Versammlung, Prévost, der gerade auf dem Weg zum Whiteboard ist, um etwas anzuschreiben, dreht sich daraufhin um und fragt die anderen, ob sie dem Vorschlag zustimmen. Zwischen Text und Bild: Multimodale Transkription 133 (9) Mondada (i.Dr.) 21 LAT #pas *de parking # kein Parkplatz pre *wendet s um u. geht z. Tafel ---> Bild #Bild 5 #Bild 6 22 COL? °ah ben ouais° aber ja 23 PRE o*ui? *# ou #pas? # ja? oder nicht? "*wendet s. z. Saal um u. macht kreisförm. Geste->> Bild Bild 7# #Bild 8 #Bild 9 5 6 7 8 9 Hier wurden die Bilder so gewählt, dass der Kontrast vom einen zum nächsten möglichst groß ist, um nachzuzeichnen, wie der Moderator sich erst zur Tafel umdreht (Bild 5, 6), sich dann wieder dem Saal zuwendet (Bild 7) und zu einer Handbewegung ansetzt (Bild 8, 9). Während diese Bildserie vor allem auf Kontrastierung abzielt, setzt die folgende eine ganz andere Art der Darstellung um (siehe (10) nächste Seite). Diese Bilder wurden in einem regelmäßigen zeitlichen Abstand automatisch erzeugt; ihre Abfolge erweckt den Eindruck eines Films. Aber die Regelmäßigkeit (im Unterschied zu einer gezielten Auswahl) lässt auch den Kontrast hinter die Kontinuität zurücktreten, die der Handlung einen starken Anschein von stetigem Fluss verleiht. Die Veränderung der Kameraposition stört die Lesbarkeit der Bilder: Die Bewegung, die im letzten Bild sehr deutlich sichtbar wird, ist nicht die der Teilnehmer, sondern die des Kameramanns. Das erinnert uns erneut daran, dass diese Bilder die Videoaufnahme wiedergeben und nicht die Handlung selbst. Lorenza Mondada 134 (10) Broth/ Lundström (2012, S. 108; unveröffentlichte Version von Ausschnitt 7) Diese Beispiele machen die Schwierigkeit deutlich, eine Bewegung in einer Transkription und in starren Bildern wiederzugeben - und auch die raffinierten Methoden des Umgangs mit diesem Problem, die sich in der Literatur finden. Das grundsätzliche Paradox der Verwendung von Bildern in einer multimodalen Transkription liegt darin, dass sie ein dynamisches Objekt durch eine starre Darstellung wiedergibt. Für die Transkription bleibt das zentrale Problem die Darstellung der Zeitlichkeit, die ihr Ziel und zugleich ihre größte Hürde ist. Die Bilder verweisen immer auf einen bestimmten Punkt in der Zeit. Dadurch können zwei nebeneinander gezeigte Bilder eine Dauer repräsentieren, nämlich die Zeitspanne zwischen den beiden Momenten ihrer Aufnahme. Durch entsprechende Bearbeitung kann eine Dauer aber auch in einem einzigen Bild repräsentiert werden, z.B. durch Pfeile, die eine Bewegung bzw. ihre Richtung anzeigen (siehe Beispiel 7 und Beispiel 9/ Bild 9). Eine andere Möglichkeit dazu ist, in einem einzigen Bild verschiedene Bewegungen überlagernd darzustellen wie im folgenden Beispiel (siehe (11) nächste Seite). Kendon repräsentiert in diesem Bild die Handbewegung des Sprechers zum einen durch Pfeile, die ihre Richtung anzeigen, zum anderen durch Vervielfältigung der abgebildeten Hand entlang des Bewegungsverlaufs. Das eine Bild besteht also eher aus mehreren übereinandergelegten Bildern des Phänomens, um das es hier geht. Es ist bezeichnend, dass Bilder dieses Typs meist Zeichnungen sind, mit denen sich Bewegungsverläufe besser abstrahieren und visualisieren lassen. Zwischen Text und Bild: Multimodale Transkription 135 (11) Kendon (2004, S. 145) Der folgende Ausschnitt illustriert das oben angesprochene zeitliche Paradox: Ein Bild, das auf einen bestimmten Moment verweist, repräsentiert hier einen Zeitraum. (12) Goodwin (2007, Abb. 3) Das Bild zeigt zwei Archäologinnen, die mit Aushubarbeiten beschäftigt sind. Es wurde in einem singulären Moment aufgenommen (der durch das timing der Videoaufnahme angezeigt wird); der eingefügte Pfeil sowie die grafische Anbindung an den Text der Transkription verleihen ihm aber eine Dauer, nämlich die Zeitspanne, die der der Äußerung a real nasty part of it. entspricht. Diese Beispiele, in denen isolierte Bilder eine Bewegung und ihre Dauer wiedergeben, zeigen die komplexen Beziehungen zwischen Moment und Dauer in der visuellen Darstellung und die Paradoxie des Versuchs, Bewegung durch Lorenza Mondada 136 starre Bilder darzustellen (das letztlich dem Paradox entspricht, den Fluss des emergenten Sprechens mit textuellen Mitteln wiederzugeben). Darüber hinaus zeigen die Beispiele auch, dass Bilder in der Darstellung modifiziert werden können: - Man kann Text darüberlegen (z.B. die Namen der Teilnehmer) oder auch Zahlen (etwa den Zeitindex). - Pfeile, Kreise und dergleichen können eingefügt werden, um Bewegungen und ihre Richtung anzudeuten. - Die Bilder müssen nicht den ganzen Screenshot wiedergeben, sie können auch auf Teile oder Ausschnitte daraus reduziert werden (‘trimming’, ‘cropping’). - Die optische Qualität der Bilder (Helligkeit, Kontrast etc.) lässt sich mithilfe entsprechender Software verbessern. - Entsprechend können Bilder auch verfälscht werden, z.B. durch Filter oder Reduktion auf die Konturen. „Gezeichnete“ Bilder gewährleisten einerseits Anonymität, andererseits erhöhen sie die Verständlichkeit des Bildes. Allerdings werden sie dadurch auch hoch selektiv; z.B. wird dabei meist der Hintergrund getilgt und damit Aspekte der räumlichen und zeitlichen Umgebung. Bilder in Transkriptionen entsprechen somit eher einer ‘Montage’ und ‘Collage’ als einer wirklichkeitsgetreuen, transparenten Abbildung der ursprünglichen Handlung. Solche Montagen können noch dadurch verdichtet werden, dass man Bilder miteinander verbindet, die auf ganz verschiedene Arten von Objekten verweisen, aber in ihrem Zusammenspiel der Handlung Sinn verleihen. Ein Beispiel dafür zeigt die folgende Transkription von Goodwin (2000a): Sie stellt die Arbeit von Archäologen dar, die den Boden untersuchen (Bild aus der Videoaufnahme), mithilfe einer Munsell-Farbkarte (die rechts abgebildet ist) seine Farbe bestimmen und ihre Feststellungen in einen Vordruck eintragen (siehe (13) nächste Seite). Diese komplexe Darstellung - Goodwin (2000b, S. 1512) spricht hier zu Recht von Heterotopie - setzt sich zusammen aus der Transkription des verbalen Austauschs, einem Standbild aus der Videoaufnahme, einer prototypischen Munsell-Farbkarte (nicht unbedingt der, die in der abgebildeten Situation tatsächlich verwendet wurde) und einem Schriftstück, das von den Teilnehmern verfasst wurde (wenn auch nicht zwangsläufig genau in dem Moment, den das Bild wiedergibt - tatsächlich wurde das abgebildete Blatt über die gesamte Interaktion hinweg ausgefüllt und nur die erste Zeile in dem betreffenden Moment geschrieben). Die Abbildung gibt die Handlung in ihrem Verlauf wieder, und sie ergibt auch nur in ihrem Verlauf Sinn; der singuläre Moment Zwischen Text und Bild: Multimodale Transkription 137 als solcher, das punctum, ist hier bedeutungslos. Das Paradox der Darstellung von Zeit in der multimodalen Transkription ist, dass diese eine Zeitspanne anhand von Bildern darstellt, die in singulären Momenten aufgenommen wurden. (13) Goodwin (2000a, S. 168) 7. Von bebilderten Texten zu beschrifteten Bildern In den letzten Beispielen habe ich einige Varianten dessen gezeigt, wie Bilder innerhalb einer textbasierten Transkription verwendet werden können. Dabei bestimmt der Text die globale Struktur der Transkription - auch wenn diese stark verräumlicht ist -, und das Bild wird darin eingefügt. Es sind aber auch andere Verhältnisse von Text und Bild vorstellbar, etwa dass umgekehrt das Bild primär ist und der Text in eine visuelle Struktur integriert wird. Dies ist eine radikalere Variante multimodaler Transkription; es handelt sich dann nicht mehr um einen bebilderten Text, sondern um ein beschriftetes Bild. Ein Primat des Bildes vor dem Text kann auf verschiedene Weise umgesetzt werden. Das folgende Beispiel nutzt dafür die Prinzipien des Comicstrips: Lorenza Mondada 138 (14) Laurier (2012, S. 221) Diese Art der Transkription (die in Laurier 2014, S. 243ff. eingehend diskutiert wird) bietet eine Reihe von Vorteilen: Sie ermöglicht, einen Gesprächs- und Handlungsverlauf anhand ausgewählter Momente zu repräsentieren und dabei zugleich die räumliche Umgebung zu zeigen, in der sich die Teilnehmer bewegen (hier die Straße, auf der sie mit dem Auto fahren). Mithilfe der an den Comicstrip angelehnten Konventionen (vgl. McCloud 1993) lässt sich auch differenzieren zwischen dem Sprechen der Teilnehmer (in den Sprechblasen) und Beschreibungen des Forschers (in den rechteckigen Feldern). Allerdings unterscheidet sich diese Form erheblich von einer Transkription im Sinne des „frame comic“ von Schmitt (i.d.Bd.). Der wichtigste Nachteil dieser Notationsweise ist, dass sie die Zeitlichkeit der Handlung nicht abbildet. Das gilt sowohl für das Sprechen (so können etwa Überlappungen oder Pausen nicht notiert werden) als auch für das multimodale Handeln (etwa die Dauer von Bewegungen). Die Darstellung zielt hier klar auf eine holistische Vermittlung des Geschehens, die von den narrativen Konventionen des Comicstrips unterstützt wird. Eine andere Variante, die das Bild ins Zentrum stellt und ihm lediglich Text einschreibt, ist die folgende, die eher vom Filmdrehbuch inspiriert ist (siehe (15) nächste Seite): Diese Darstellung eines Rettungseinsatzes zerlegt die Handlung schrittweise in Bilder und macht daraus einen durchgehenden Hintergrund für die Handlung (vgl. Beispiel 10): Die wenigen wiedergegebenen Wortbeiträge sind jeweils darübergelegt, erstrecken sich meist über mehrere Bilder und vermitteln so eine Dauer der jeweiligen Äußerung. Während manche Bilder diskontinu- Zwischen Text und Bild: Multimodale Transkription 139 ierlich wirken (z.B. die ersten), geben andere die Details, auf die die Kamera zoomt, lebhaft wieder (z.B. die beiden Hände, die sich flüchtig berühren). Die zeitliche und optische Beziehung zwischen zwei Bildern ist also nicht immer die gleiche (anders als etwa bei der Bildserie oben in Beispiel 10). (15) Buscher (2005) Diese interessanten Ansätze, das Bild ins Zentrum der Transkription zu stellen, zeigen die Vielfalt möglicher Verbindungen von Text und Bild in einer multimodalen Transkription. Das grundlegende Problem der multimodalen Analyse, nämlich das der Zeitlichkeit, lösen sie jedoch nicht. 8. Das Problem der Zeitlichkeit: Beispiel einer Analyse-Transkription In diesem Abschnitt sollen die Auswirkungen der verschiedenen Varianten multimodaler Transkription und ihrer jeweiligen Verwendung von Bildern in einer stärker analytischen Perspektive diskutiert werden. Dazu nutze ich einen Ausschnitt aus einer Videoaufnahme, für den ich jeweils im Hinblick auf die Zwecke der Analyse verschiedene Formen der Kombination von verbaler Transkription und Bildern sowie verschiedene Techniken der Bildbearbeitung erprobe und kommentiere. Der Ausschnitt stammt aus einem Korpus von Bürgerversammlungen im Rahmen eines Projekts partizipativer Demokratie (s.o. Beispiel 9). In diesem Projekt können sich Bürger an der Gestaltung eines öffentlichen Parks beteiligen, indem sie Aspekte vorschlagen, die darin ihrer Meinung nach umgesetzt werden sollten (siehe Mondada 2011, 2015b für weitere Analysen dieses Korpus). Ich konzentriere mich hier auf einen Ausschnitt, der auf den ersten Blick Lorenza Mondada 140 simpel erscheint, sich jedoch im Verlauf der Analyse als recht komplex erweisen wird. Eine Bürgerin, Turenne, schlägt vor, dass es in dem Park grüne Wege und Fahrradwege geben solle. Der Moderator, Prévost, reformuliert ihren Vorschlag und adressiert ihn an die ganze Gruppe, um deren Zustimmung einzuholen; anschließend schreibt er ihn an die Tafel. Das folgende Beispiel zeigt zunächst die verbale Transkription des Ausschnitts, der etwa 20 Sekunden dauert: (16a) (BLA1811_A) 1 PRE .hh est-ce qu’y avait d’autres cho: ses? dans vos .hh gab es noch andere Dinge in Ihren 2 propositions. Vorschlägen 3 TUR les voies d’accès au parc, qu’elles soient vertes, die Zugangswege zum Park dass das grüne Wege sind 4 et qu’il y ait qu’il y ait une amélioration des: und dass dass die Fahrradwege verbessert 5 pistes cyclables werden 6 PRE d’accord. voies d’accès ver: tes et pistes cycla: bles okay grüne Zugangswege und Fahrradwege 7 (0.3) 8 PRE donc (.) ça, (.) ça nous met, on est un peu déjà also ( . ) das ( . ) das geht etwas schon 9 dans le détail, mais, .h (.) c’est du déplacement ins Detail aber .h ( . ) das ist Anlagen für 10 doux, aménagé, (.) [c’est ça? ] sanfte Mobilität ( . ) [ ist es das? ] 11 ? ? [oui: ] c’est ça [ ja ] das ist es 12 TUR d’accord in Ordnung 13 (0.8) 14 PRE j’peux mettre déplacement doux, aménagé, ich kann schreiben Anlagen für sanfte Mobilität 15 (0.8) 16 LAT c’est l’accès. das ist Zugang 17 COL? voilà, c’est l’acc[ès °oui° genau es ist Zu [ gang ja Zwischen Text und Bild: Multimodale Transkription 141 18 PUB [c’est [l’accès [ es ist [ Zugang 19 ? [qu’on [n’oublie pas [ dass wirs [ nicht vergessen 20 JEA [c’est l’accès hein (.) [ es ist Zugang ne ( . ) 21 l’accès.= Zugang = 22 PRE =d’accord, y a accès. = okay also Zugang 23 (1.3) Der Ausschnitt beginnt damit, dass der Moderator Prévost das Wort Turenne erteilt (1-2), die daraufhin ihren Vorschlag äußert (3-5). Prévost wiederholt die zentralen Punkte daraus in Form von Schlüsselbegriffen (voies d’accès ver: tes et pistes cycla: bles/ grüne Zugangswege und Fahrradwege, 6). Er schließt mit donc/ also zunächst eine kritische Bemerkung an (8-9), nimmt dann jedoch mit dem Konnektor mais/ aber (9) umgehend Turennes Vorschlag wieder auf und reformuliert ihn nun in einer etwas anderen Version (déplacement doux, aménagé,/ Anlagen für sanfte Mobilität, 9-10). Diese neue Version wird nach seiner Bitte um Bestätigung (10) von einigen Teilnehmern akzeptiert (11-12); daraufhin schreibt Prévost sie an die Tafel (mettre (14) verweist auf das Anschreiben). Dabei wird er von der Gruppe nicht nur beobachtet, sondern auch korrigiert (vgl. dazu Svensson i.Ersch.): Ein Teilnehmer, Lathuillier, erinnert an ein Detail, das Turenne geäußert, Prévost jedoch nicht aufgenommen hat (15); andere schließen sich an (16-19). Der Moderator folgt der Aufforderung und nimmt die verlangte Korrektur an der Tafel vor (20-21). Wenn wir nun anhand der Videoaufnahme genauer betrachten, was in diesem kurzen Ausschnitt geschieht, stellen wir zunächst allgemein fest, dass der Moderator sich im Raum bewegt und sich dabei auf verschiedene Bereiche orientiert. Zu Beginn wendet er sich abwechselnd Turenne bzw. der Gruppe an ihrem Tisch und dem Rest des Saals zu. Dann dreht er sich zur Rückseite des Saals um, wo das Whiteboard steht. Diese verschiedenen räumlichen Positionen und Orientierungen entsprechen der Architektur des Raums und der Anordnung der Tische und der Tafel. Zugleich sind sie aber auch präzise auf die jeweils laufende Aktivität des Moderators abgestimmt: Vorschläge aus dem Publikum aufgreifen, Zustimmung der Gruppe dazu einholen, Vorschläge an die Tafel schreiben. Diese erste Beschreibung zeigt bereits, wie wichtig die jeweiligen Positionen der Teilnehmer im Raum sind. Auf den Videoaufnahmen der beiden Kameras sind sie jedoch nur teilweise zu erkennen. Dies ist ein generelles Problem, Lorenza Mondada 142 denn die Kamera ist in der Regel auf die Teilnehmer gerichtet, nicht auf den Raum insgesamt. Bei Interaktionen von großen Gruppen verschärft sich das Problem noch, da es durch den Aufnahmewinkel und die Raumgestaltung nicht möglich ist, den ganzen Raum in einer einzigen Aufnahme zu erfassen (Mondada 2013, 2016). Entsprechend lässt sich die räumliche Architektur oft nur aus fragmentarischen Ansichten rekonstruieren. Eine mögliche (wenn auch ebenfalls partielle) Lösung ist eine Skizze, die die jeweiligen Positionen der Teilnehmer zueinander wiedergibt. Abb.: Im Feld angefertigte Zeichnung Noch besser wäre natürlich eine dynamische Karte, die die Bewegungen der Teilnehmer aufnimmt und deren Positionen in jedem Moment anzeigt; das umzusetzen ist jedoch anscheinend bisher nicht möglich (es würde u.a. erfordern, dass man die jeweilige Perspektive der Aufnahme in Positionen auf dem Plan übersetzen kann). So bleibt als Hilfsmittel nur eine starre Karte, die keinen Zugriff auf die Verkettung und Koordinierung der Positionierungen der Teilnehmer in der Interaktion erlaubt. Immerhin können Bezüge zur Transkription eingefügt werden (z.B. kombiniert Paul McIlvenny Teile einer Transkription mit einem Plan des Wegs durch die Stadt, den die beiden interagierenden Personen mit dem Fahrrad zurücklegen (zitiert in Laurier 2014, S. 246)). Im Folgenden gehe ich nun genauer auf die verschiedenen Momente ein, aus denen sich dieser Ausschnitt zusammensetzt, analysiere sowohl die sequenzielle Organisation der Interaktion als auch ihre räumliche Verankerung und versuche dabei sowohl Verläufe als auch Zeitlichkeit zu erfassen. Die Fremdwahl der Bürgerin Turenne durch den Moderator Prévost und Turennes Reaktion darauf etablieren eine direkte Kommunikation zwischen diesen beiden Teilnehmern. Das geschieht abgesehen von Turennes Blick zu Prévost auch durch dessen Positionierung, denn der Moderator - als einzige Zwischen Text und Bild: Multimodale Transkription 143 mobile Person - bewegt sich auf Turenne zu, um ihr das Wort zu erteilen. Leider ist Turenne ganz am Anfang dieses Auschnitts nicht zu sehen (erst ab dem dritten Bild wird sie am äußersten linken Bildrand sichtbar). Der Beginn einer neuen Sequenz mit der Auswahl eines neuen Sprechers beinhaltet - besonders in großen Gruppen - ein gewisses Maß an Kontingenz, Unvorhersehbarkeit und Diskontinuität; insofern besteht immer die Gefahr, dass die Kamera nicht den gesamten Teilnahmerahmen im Bild hat. Die Zeigegeste, mit der der Moderator Turenne als nächste Sprecherin auswählt, nutzt eine Ressource, die in solchen Kontexten typischerweise verwendet wird (Mondada 2013). (16b) (BLA1811_A: Variante 1) 1 PRE *.hh #est-ce qu’*y avait d’au#tres *cho: #ses? dans* vos .hh gab es noch andere Dinge in Ihren *............. .*zeigt"* Bild #Bild 1 #Bild 2 #Bild 3 2 propositions. Vorschlägen 1 2 3 Die Zeigegeste des Moderators ist in der Transkription entsprechend den Konventionen in ihren drei Phasen repräsentiert, die auf die Zeitlichkeit des Sprechens bezogen sind (Punkte … für die Vorbereitung der Geste, dann eine Beschreibung der Geste in ihrer vollen Entfaltung, schließlich ihr Zurückziehen, das durch " markiert ist). Um sie zu visualisieren, wurden Bilder ausgewählt, die diese drei Phasen im Kontrast sichtbar machen (Bilder 1, 2, 3). Man könnte die Bilder nun noch zusätzlich beschriften, um die Dynamik der Bewegung deutlicher zu machen (Bilder 1’, 2’, 3’): 3 3 Anstatt Ausschnitte aus dem Video per Screenshot zu reproduzieren, könnte man sie auch in Zeichnungen umwandeln. Zeichnungen haben den Vorteil, dass sie das Bild auf die wesentlichen Züge reduzieren, dadurch sind sie leichter lesbar. Hier stellt sich allerdings ein ernstes Problem in Bezug auf die Erhaltung der relevanten Aspekte: Wird die Zeichnung mittels Software erstellt, werden die zu konservierenden Aspekte nicht bewusst ausgewählt; aber selbst bei einer Erstellung von Hand ist die Auswahl oft nicht in allen Details analytisch reflektiert. Tatsächlich wird die Frage der Relevanz oft vernachlässigt; u.a. wird in Zeichungen fast immer der Hintergrund und damit die Umgebung der Handlung getilgt. Deshalb wird diese Lorenza Mondada 144 1' 2' 3' Hier lässt sich aber noch eine andere Beobachtung anstellen, die nicht nur die Geste verständlicher macht, sondern auch die Aktivität des Moderators: Tatsächlich richtet Prévost nicht nur seinen Blick auf Turenne und zeigt auf sie, er bewegt sich auch zunächst durch den Raum auf sie zu und entfernt sich dann wieder von ihr. Hier bietet sich eine neue Transkription mit weiteren Bildern an: (16c) (BLA1811_A: Variante 2) 1 PRE •*.hh +est-ce qu’*y avait d’autre ch*o: se? #+ dans* vos .hh gab es noch andere Dinge in Ihren *...............*zeigt zum Tisch von TUR"* •schaut zu TUR----------> +macht 1 Schritt u. beugt s. zu TUR--+geht Bild #Bild 4 2 propositions. Vorschlägen rückw., richtet s. auf---> 3 TUR les voies #d’accès+ au parc, qu’elles soient ver#tes, die Zugangswege zum Park dass das grüne Wege sind pre -->+bl. stehen, aufrecht----> Bild #Bild 5 #Bild 6 4 et qu’il y ait qu’il y ait une amélioration des: und dass dass die Fahrradwege verbessert 5 pistes cyclables werden Diese Transkription und die zusätzlichen Bilder zeigen nicht nur, wie der Moderator Turenne und ihren Tisch auswählt, sie machen auch deutlich, dass die Zeigegeste seinen ganzen Körper einbezieht, denn er wendet sich ihr dabei zu und beugt sich zu ihr vor (Bild 4). Diese Körperspannung wird anschließend Möglichkeit hier nicht erprobt, auch wenn das durchaus interessant wäre. Oft werden Zeichnungen auch aus ethischen Gründen gewählt, denn durch ihre Selektivität sind die Teilnehmer darauf weniger leicht erkennbar. Ich gehe auf Fragen der Anonymisierung hier jedoch nicht näher ein, das würde eine längere eigene Diskussion erfordern. Zwischen Text und Bild: Multimodale Transkription 145 aufgelöst, indem er nicht nur die Geste zurückzieht, sondern sich auch rückwärts bewegt (Bild 5), bis er ein Stück von Turennes Tisch entfernt wieder eine aufrechte und stabile Position einnimmt; dabei sieht er sie jedoch weiterhin an (Bild 6), hört ihr zu und erwartet das Ende ihrer Äußerung, das sich in ihrem Sprechen abzuzeichnen beginnt. 4 5 6 Diese Form der Transkription von Bewegungen mit multimodaler Annotation und Bildern zeigt die Relevanz des Raums, in dem die Handlung stattfindet. Prévost bewegt sich zwischen der Tafel hinter ihm und den vordersten Tischen vor ihm und nutzt diesen Raum für seine verschiedenen Aktivitäten: um den nächsten Sprecher auszuwählen, der betreffenden Person zuzuhören, als sie das Wort ergreift, und auch - wie wir gleich sehen werden - um sich an die ganze Gruppe zu richten oder etwas anzuschreiben. Dabei wird auch deutlich, dass der Bildschnitt wesentlich mitbestimmt, ob die Umgebung der Handlung in der Analyse berücksichtigt wird oder nicht. Im nächsten Ausschnitt reformuliert der Moderator Turennes Beitrag. Diese Handlung ist ebenso eine verbale wie eine körperliche (vgl. Mondada 2015b): (16d) (BLA1811_A: Variante 3) 6 PRE d’acc•ord.*voies d’accès +ver: #tes et pistes cycla: bles okay grüne Zugangswege und Fahrradwege ->•blickt u wendet s. z. Saal---> *öffnende Geste m. bd. Händen--> ->+geht Ri. Saal---> Bild #Bild 7 7 Lorenza Mondada 146 Sobald der Moderator wieder den Turn übernimmt, dreht er sich sukzessive zum Saal um: Zeitgleich mit der Partikel d’accord/ okay beginnt er zunächst, die Zuhörer anzusehen, hebt dann beide Hände in einer öffnenden Geste, die Handflächen ihnen zugewandt, und beginnt auf sie zuzugehen (Bild 7). Parallel zum allmählichen Vollzug dieser Bewegungen verlagert er seine Orientierung von Turenne auf den ganzen Saal; diese Verlagerung beginnt mit der Partikel d’accord/ okay und bezieht nach und nach den gesamten Körper ein. Für diese Zeile der Transkription wurde ein einziges Bild verwendet, das die Blickwinkel der beiden Kameras kombiniert und Prévosts Bewegung so in einer doppelten Perspektive zeigt. Denn die Dokumentation eines solchen Bewegungsablaufs birgt verschiedene Probleme. Zum einen bewegen sich die Kameras ebenfalls, um den Positionswechsel des Teilnehmers im Raum zu erfassen; dadurch ist er in manchen Aufnahmen nicht vollständig im Bild, andere Aufnahmen sind durch eben diese Bewegung unscharf. Die Verlagerung kann also mangels adäquater Bildschnitte und Bilder in hinreichender Qualität nicht vollständig Schritt für Schritt dokumentiert werden. Dieses Problem wird hier so gelöst, dass die Bewegung durch einen zentralen Moment ihres Verlaufs illustriert wird, der aus zwei verschiedenen Perspektiven (Aufnahmen beider Kameras) gezeigt wird. Das Bild erfasst den Blick, die Gesten und den Körper zugleich und vermittelt so ein holistisches Bild, während die multimodale Transkription exakt ihre Zeitlichkeit angibt, d.h. ihre jeweiligen Beziehungen von Gleichzeitigkeit bzw. Nacheinander. Die verschiedenen Bewegungen sind nicht synchron: Sie beginnen alle leicht versetzt, verlaufen dann eine Weile simultan und enden in unterschiedlichen Momenten. Darum werden für ihre Transkription mehrere Zeilen benötigt, hier jeweils eine eigene für den Blick - oder eigentlich die Kopfbewegungen -, die Geste und die Gehbewegung, d.h. die Ausrichtung des Oberkörpers. Indem er sich nach vorn auf den Saal zu bewegt, adressiert der Moderator Turennes ursprünglich an ihn gerichteten Vorschlag, als er ihn wiederholt, an die ganze Gruppe um (Mondada 2015b). In seiner Körperhaltung, die er direkt anschließend einnimmt und die mit Schegloff (1998) als body-torque beschrieben werden kann, manifestiert sich jedoch eine dafür typische doppelte Orientierung: Prévost ist mit einem Teil seines Körpers auf das Publikum orientiert, mit einem anderen auf Turenne. Erzeugt wird dies durch asynchrone Bewegungen von Ober- und Unterkörper: Zwischen Text und Bild: Multimodale Transkription 147 (16e) (BLA1811_A: Variante 4) 7 (0.3)* ->*zieht Hde. zurück--> 8 PRE donc (.) *•ça,#+ (.) * ça* +nous met, on est# un also ( . ) das ( . ) das bringt uns das geht schon -->+bl. stehen------+dreht s. z. TUR---> ->*öffn.Geste bd.Hd.*dto*gestikul.-------------> -->•sieht TUR an----> Bild #Bild 8 #Bild 9 8 9 9 peu déjà* dans *l’dé•ta*il,+ #mais: , *.h #c’*est du etwas ins Detail aber .h das ist --->+dreht s.z. Saal----> -->•Blick z.Saal---> --->*liHd zgt z.TUR-*zgt z. Saal*kreisf.Geste--> Bild #Bild 10 #Bild 11 10 11 10 déplacement doux,* a#mé•na#gé.#* (.) +[c’est #ça? +* Anlagen für sanfte Mobilität ( . ) [ ist es das? ->*klein.Kreisb.*Handfl. oben------* ->•sieht TUR an----> ->+dreht s.z.TUR+ Bild #12 #13 #14 #15 Lorenza Mondada 148 12 13 „a” „ména” „gé” 14 15 Als er Turennes Vorschlag wiederholt, schaut der Moderator die gesamte Gruppe an und adressiert den Vorschlag damit an sie um (Z. 6; siehe Beispiel 16d). Seine direkt anschließende Äußerung (Z. 8-9) bildet sowohl eine neue Einheit (TCU) als auch eine neue Handlung, die sich vor allem auf Turenne bezieht: Er kritisiert ihren Vorschlag als schon zu detailliert. Mithilfe des body-torque behält er dabei zunächst mit dem Unterkörper (d.h. dem stabilsten Teil des Körpers, der direkt mit dem Boden verbunden ist) die Orientierung auf den Saal bei, nur der Kopf ist Turenne zugewandt (Bild 8). Die öffnende Geste mit beiden Händen ist ebenfalls zunächst an die anderen Teilnehmer gerichtet; sie wird jedoch schnell in ein Gestikulieren in ihre Richtung umgewandelt, während er sich ihr auch mit dem Oberkörper zuwendet (Bild 9). Es ist bezeichnend, dass Prévost sich wieder dem Saal zuwendet, während er den Konnektor mais/ aber (Z. 9) produziert. Nachdem er vorher auf Turenne gedeutet hat (Bild 10), zeigt er nun zu den anderen Teilnehmern (Bild 11) und formuliert an diese gerichtet Turennes Vorschlag neu, nachdem er dessen ursprüngliche Version kritisiert hat. Prévosts Bewegungen in diesem kurzen Ausschnitt erweisen sich also als methodisch (im Sinne der Methoden der Teilnehmer, für die sich Ethnomethodologie und Konversationsanalyse interessieren). Das kann auf verschiedene Weisen dargestellt werden: Die multimodale Transkription zeigt ihre systematische Koordination und ihre Abstimmung auf die Strukturierung des Redebeitrags; die Bilder geben sie holistisch wieder, entweder in ihrer Emergenz (durch Kontrastierung der verschiedenen Momente, in denen erst der Blick, dann die Geste, dann der Oberkörper allmählich umschwenkt, wie in den Zwischen Text und Bild: Multimodale Transkription 149 Bildern 12, 13 und 14; dabei wird die Bewegung durch einen Zoom auf den Körper des Teilnehmers besser sichtbar als in einem Gesamtbild, das die ganze Person in ihrer Umgebung zeigt) oder im Zustand ihrer Vollendung (durch Kontrastierung der wichtigsten Etappen ihrer Entfaltung wie in den Bildern 11 bis 15). Der Moderator formuliert die ursprüngliche Äußerung der Bürgerin um und schließt dann eine Bitte um Bestätigung an (c’est ça? / ist es das? , Z. 10), womit er den anderen Teilnehmern den Vorschlag in seiner neuen Version unterbreitet. (16f) (BLA1811_A: Variante 5) 10 PRE déplacement doux,* amé•nagé.* (.) +[c’est ça? +*# Anlagen für sanfte Mobilität ( . ) [ ist es das? ->*klein.Kreisb.*Handfl. oben--* ->•sieht TUR an-> ->+dreht s.z.TUR+ 11 ? [oui: / ] # [ ja ] Bild Bild 16# 12 ? c’est %ça das ist es 13 TUR d’acc%ord in Ordnung tur %heft.Nicken% 16 Wir haben gesehen, dass der neu formulierte Vorschlag sich durch die Art und Weise, wie er produziert wird (Bilder 12, 13, 14), an die gesamte Gruppe richtet. Die abschließende Bitte um Bestätigung c’est ça? / ist es das? (Z. 10) ist dagegen an Turenne adressiert: Prévost wendet sich ihr zu und sieht sie an. Die Reaktionen und die Zustimmung der Teilnehmer in dieser sequenziellen Position multimodal zu dokumentieren ist nicht einfach. Die Kameraeinstellungen erfassen hier lediglich die Teilnehmer, die dem Moderator am nächsten sitzen (Bild 16 links), und den Tisch von Turenne (Bild 16 rechts - Turenne Lorenza Mondada 150 sitzt auf der linken Seite vorn). Der Bildschnitt zeigt ein nachdrückliches Nicken von Turenne - das hier nicht abgebildet, sondern transkribiert wurde, denn ein starres Bild kann diese Geste nicht „zeigen“, auch wenn sie in der Videoaufnahme deutlich sichtbar ist. Was er nicht zeigt, sind die körperlichen Reaktionen der anderen Teilnehmer sowie die zweite Person, die unmittelbar Zustimmung anzeigt (Z. 11). Dazu liefert die Videoaufnahme lediglich eine akustische und räumliche Information: Die betreffende Person ist eine Frau, und sie befindet sich nahe der Kamera, mit der das linke Bild aufgenommen wurde, denn ihre Stimme ist auf der entsprechenden Tonspur deutlich zu hören. Wir sehen also, dass die Zustimmung der Teilnehmer hier - obgleich sie für die laufende Aktivität zentral ist - bei Weitem nicht so detailliert dokumentiert werden kann wie die vorausgehenden Aktivitäten des Moderators. Aufschlussreich ist noch ein weiterer Aspekt: Der Moderator scheint die Zustimmung der Gruppe nicht in Zweifel zu ziehen, denn er verlängert die Bewegung, mit der er sich vom Saal zu Turenne umwendet, direkt zu einer Drehung hin zum Whiteboard (Bild 17) (nebenbei wird hier deutlich, dass manche Bewegungen sich durch grafische Zusätze in den Bildern wie etwa Pfeile ideal darstellen lassen, während das bei anderen sehr viel schwieriger ist): (16g) (BLA1811_A: Variante 6) 13 +(0.8)#+ pre +dreht s.+ Bild #Bild 17 17 14 PRE +j’peux mettre déplacement# doux, *aménagé,+ # ich kann schreiben Anlagen für sanfte Mobilität +geht zur Tafel----------------------------+ *re.Hd m.Stift vor-> Bild #Bild 18 Bild 19# Zwischen Text und Bild: Multimodale Transkription 151 18 19 15 (0.4) *# (0.4) pré ->*schreibt a. Tafel-->> Bild #Bild 20 20 Prévost wiederholt den Vorschlag (déplacement doux, aménagé,/ Anlagen für sanfte Mobilität, Z. 14), während er zur Tafel geht (Bild 18); er erreicht die Tafel mit dem Ende seines Turns (Bild 19). Es hätte wenig Sinn, den Gang zur Tafel in seine einzelnen Schritte zu zerlegen. In Bild 18 ist jedoch zu erkennen, dass es sich dabei um große Schritte handelt, die Zielstrebigkeit und Entschlossenheit vermitteln. Während an anderen Stellen im Korpus solche Vorwärtsbewegungen durch die Orientierung auf irgendeinen verspätet geäußerten Einwand verzögert werden, scheint hier nichts Prévosts Bewegung hin zur Tafel zu hemmen. Diese Dynamik wird zusätzlich dadurch verstärkt, dass Prévost schon ab dem letzten Wort seines Turns die rechte Hand mit dem Filzschreiber in Richtung der Tafel führt (Z. 14) (er zieht außerdem die Kappe vom Stift ab, was aber im Bild nicht zu sehen ist) und damit einen unmittelbar bevorstehenden Anschrieb projiziert. In der Tat beginnt er, den Vorschlag anzuschreiben, sobald er die Tafel erreicht hat (Bild 20). Hier stellt sich eine neue Frage in Bezug auf die Darstellung durch Bilder bzw. allgemeiner in Bezug auf die Transkription: In welcher Weise und wie detailliert soll der Prozess des Anschreibens abgebildet werden? Aus technischen Gründen kann man im Videobild nicht sehen, was Prévost anschreibt. Es ist aber deutlich, dass er in der Mitte der Tafel schreibt (Bild 20); offenbar produziert er also keine neue Textzeile, sondern fügt einem bereits vorhandenen Lorenza Mondada 152 Text etwas hinzu. Um genauer zu verstehen, was hier geschieht, können wir auf ein anderes Element des Korpus zurückgreifen: ein Foto der beschriebenen Tafel, das am Ende der Sitzung aufgenommen wurde (Bild 21): 21 Dieses Bild lässt sich nicht in dem Sinne zeitlich verorten, dass es einen singulären Moment im dynamischen Prozess des Schreibens repräsentiert. Trotzdem hilft es, das Geschehen zu rekonstruieren: Auf dem Bild ist zu erkennen, dass unterhalb von déplacements doux in etwas anderer Schrift (Farbe, Größe, Form) aménagé hinzugefügt wurde. Aus dem Gesamtkorpus und vor allem den diesem Ausschnitt vorausgehenden Sequenzen ist ersichtlich, dass déplacement doux für einen Vorschlag steht, der früher im Gespräch diskutiert und an die Tafel geschrieben wurde, nachdem sich die Gruppe darauf geeinigt hatte. Damit wird nun verständlicher, was Prévost tut, indem er Turennes Vorschlag reformuliert mit c’est du déplacement doux, aménagé./ das ist Anlagen für sanfte Mobilität (Z. 8-9): Auch wenn er sich in dem Moment nicht zur Tafel umdreht (seine Reformulierung also nicht als Bezugnahme auf etwas schon Gesagtes präsentiert), behandelt er Turennes Vorschlag de facto als eine Variante dieses früheren Vorschlags - was möglicherweise darin anklingt, dass er das letzte Adjektiv stark betont und damit prosodisch hervorhebt. Dazu passt, dass er an der Tafel dann lediglich dem dort bereits stehenden Text aménagé hinzufügt. Rückblickend verleiht dies seiner Aktivität des Reformulierens also einen bestimmten Sinn, denn diese Reformulierung unterscheidet sich deutlich von dem, was Turenne ursprünglich (Z. 3-5) gesagt hat. Interessant ist im weiteren Verlauf, dass die Bürger genau in dem Moment intervenieren, als Prévost am Schreiben ist (vgl. Svensson i.Ersch.): Zwischen Text und Bild: Multimodale Transkription 153 (16h) (BLA1811_A: Variante 7) 15 (0.4) * (0.4) * pré ->*schreibt a (m)* 16 LAT *c’est l’accès.* es ist Zugang pré *m é * 17 COL? *voilà. c’est l’acc[*ès °oui°* * genau es ist Zugang ja pré *n a *g e * * 18 PUB [*c’est [*l’accès es ist Zugang 19 ? [*qu’on [*n’oublie pas* dass wirs nicht vergessen 20 JEA [*c’est l’accès* hein (.) es ist Zugang ne ( . ) 21 *c’est* +accès.= es ist Zugang pré *accent aigu* pré +wendet s. z.Saal um 22 PRE =d’acc+ord, y a acc+ès. =okay also Zugang pré ->+1 Schritt z.Saal+zur. z. Tafel 23 (1.0) + (0.3) pré ->+schreibt „Accès“->> Auch wenn nicht wirklich zu lesen ist, was Prévost schreibt, kann man ausgehend vom Ergebnis sehen, wie er die Buchstaben zieht, die das Wort aménagé ergeben. Damit lässt sich auch die Initiierung der Korrektur durch die Bürger zeitlich präzise zum Verlauf des Schreibens in Beziehung setzen. So wird deutlich, dass Lathuillier interveniert, sobald Prévost den ersten Buchstaben des Wortes geschrieben hat. Prévost bricht jedoch nicht ab: Er schreibt weiter, während andere Bürger Lathuilliers Initiative unterstützen. Prévost dreht sich erst dann zur Gruppe um, als er das Wort zu Ende geschrieben hat (Z. 21). In diesem Moment verstummen die Rufe, die ihn im Chor zu einer Korrektur auffordern; die Teilnehmer orientieren sich also darauf, dass er ihre Aktivität nun zur Kenntnis nimmt. Das tut er zunächst verbal mit einer Zustimmungspartikel (d’accord,/ okay, Z. 22), dann dadurch, dass er die Korrektur faktisch ausführt: Er schreibt --Accès in eine neue Zeile (23; siehe Bild 21) und macht dies damit zu einem eigenen Punkt. In der weiteren Diskussion, auf die wir hier nicht mehr eingehen, sucht die Gruppe nach passenden Adjektiven zu diesem Nomen (doux et verts, siehe Bild 21). Lorenza Mondada 154 Bei der Analyse dieses letzten Ausschnitts haben wir mit der Reproduktion eines Textdokuments eine ganz eigene Form von Bild einbezogen. Die Details solcher Artefakte lassen sich mit einer Kamera, die auf den Teilnahmerahmen ausgerichtet ist, kaum erfassen. Das Foto wurde auch nicht in dem Moment aufgenommen, in dem sich die hier untersuchte Sequenz abspielt, sondern erst nachträglich am Ende der Versammlung, es hat also eine andere Zeitlichkeit (so enthält es z.B. auch Elemente, die erst nach dieser Diskussion angeschrieben wurden). Dank dieses Bildes „sehen“ wir jedoch in der Videoaufnahme Details, die daraus nicht direkt ersichtlich oder zumindest nicht erkennbar sind. Der Rückgriff auf Bilder mit einer anderen Zeitlichkeit (vgl. die ganz ähnliche Verwendung der Munsell-Farbkarte in Goodwin 2000a (siehe Beispiel 13) oder von Architektenplänen in Mondada 2012b) ermöglicht also zum Beispiel, einen Prozess im Detail und in seinen zeitlichen Bezügen zu analysieren, der sich der Konversationsanalyse (wie auch der Textlinguistik) oft entzieht: in das Handeln eingebettetes Schreiben. 9. Fazit In diesem Beitrag habe ich Fragen des Transkribierens in der Konversationsanalyse diskutiert, indem ich nach einer kurzen allgemeinen Einführung verbale und multimodale Transkription (sprachliches und körperliches Verhalten) gegenübergestellt habe. Die verbale Transkription folgt weitgehend standardisierten konversationsanalytischen Prinzipien; bei der multimodalen Transkription können diese Prinzipien dagegen durch verschiedene Darstellungsformen umgesetzt werden. Einige dieser Möglichkeiten habe ich hier genauer betrachtet und dabei sowohl versucht, herauszuarbeiten, welche Ziele sie verfolgen und welche damit verbundenen Probleme sie versuchen zu lösen, als auch ihre jeweiligen Grenzen aufzuzeigen. Anhand eines Gesprächsausschnitts habe ich entsprechend den jeweiligen analytischen Anliegen und den verfügbaren Videobildern beispielhaft verschiedene Varianten der multimodalen Transkription umgesetzt, in denen Text und Bilder in unterschiedlicher Weise miteinander verschränkt werden. Diese Diskussion der verschiedenen Möglichkeiten multimodaler Transkription dient aber nicht nur dem methodologischen Zweck, die Darstellungsweise zu finden, die für die Analyse jeweils am besten geeignet oder am angemessensten ist. Sie verfolgt auch ein grundlegenderes theoretisches Anliegen, bei dem vor allem das Problem der Darstellung von Zeit eine zentrale Rolle spielt. Die Transkription durch Text und Bild steht permanent vor einem zeitlichen Paradox: Sie nutzt jede erdenkliche List, um Zeit darzustellen (genaue Messung der Pausen, Kennzeichnung von Überlappungen, Beschleunigung usw., Markierung der zeitlichen Grenzen der Gültigkeit von Kommentaren, Zwischen Text und Bild: Multimodale Transkription 155 Wiedergabe von Bewegungen in Bilderfolgen, Beschriftung von Bildern durch Pfeile etc.). Freilich nutzt sie dafür ein Medium, das den zeitlichen Fluss der Handlung statisch einfriert. In diesem Sinne ermöglicht die Transkription eine Darstellung von Zeitlichkeiten, die für eine analytische Betrachtung erforderlich ist; so lässt sich daran z.B. feststellen, ob eine bestimmte Handlung vor oder nach einer anderen erfolgt, ob sie mit dieser anderen sequenziell verbunden ist, sie begleitet oder auf sie abgestimmt ist usw. Solche detaillierten Überlegungen wären durch einfaches Anschauen der Handlung, und sei es noch so aufmerksam, nicht möglich. Die Transkription ist nicht das primäre Datum der Analyse - das primäre Datum bleibt immer die Audio- oder Videoaufnahme -; sie schärft jedoch den Blick auf die Aufnahmen. Zugleich ist sie selbst wiederum das Ergebnis dieses Blicks: In einem reflexiven und wechselseitig konstitutiven Prozess gewinnt sie erst im permanenten Hin und Her zwischen der Darstellung in Text und Bild und der Videoaufnahme als solcher Gestalt (und vielleicht auch Bedeutung). Dies unterstreicht noch einmal, dass Transkribieren immer eine Frage von Auswahl und Interpretation ist, die ihrerseits wiederum von der Qualität und den Entscheidungen bei der Videoaufnahme abhängen - was bedeutet, dass neben der Interaktion als solcher ergänzend auch die Praxis des (oder der) Transkribenten zu analysieren wäre. Das primäre Datum bleibt die Audio- und Videoaufnahme, auf die die Analyse immer wieder zurückkommen muss. 10. Danksagung Ich danke Ingrid Furchner für für ihre sorgfältige Durchsicht des Beitrags und für die Übersetzung des Textes aus dem Französischen. 11. Literatur Ashmore, Malcolm/ Reed, Darren (2000): Innocence and nostalgia in conversation analysis: The dynamic relations of tape and transcript. In: Forum: Qualitative Social Research 3, 1, Art. 3. www.qualitative-research.net/ fqs/ fqs-eng.htm (Stand: Juni/ 2016). Atkinson, J. Maxwell/ Heritage, John (Hg.) (1984): Structures of social action. Cambridge: Cambridge University Press. Bergmann, Jörg (1985): Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit. In: Bonß, Wolfgang/ Hartmann, Heinz (Hg.): Entzauberte Wissenschaft: Zur Relativität und Geltung soziologischer Forschung. Göttingen: Schwarz, S. 299-320. Birdwhistell, Ray (1970): Kinesics and context. Essays on body motion communication. Philadelphia: University of Pennsylvania Press. Lorenza Mondada 156 Birdwhistell, Ray (1981): Un exercice de kinésique et de linguistique: La scène de la cigarette. In: Winkin, Yves (Hg.): La nouvelle communication. Paris: Seuil, S. 160-190. Broth, Mathis/ Lundström, Fredrik (2012): A walk on the pier. Establishing relevant places in mobile instruction. In: Haddington/ Mondada/ Nevile (Hg.), S. 91-122. Bucholtz, Mary (2000): The politics of transcription. In: Journal of Pragmatics 32, S. 1439-1465. Buscher, Monika (2005): Interaction in motion: Embodied conduct in emergency teamwork. In: Mondada, Lorenza/ Markaki, Vassiliki (Hg.): Proceedings of the 2nd congress of the international society for gesture studies: Interacting bodies. Lyon. http: / / gesture-lyon2005.ens-lyon.fr/ article.php3? id_article=221 (Stand: Juni/ 2016). De Stefani, Elwys/ Bürki, Yvette (Hg.) (2006): Trascrivere la lingua / Transcribir la lengua. Bern: Lang. Duranti, Alessandro (2006): Transcripts, like shadows on a wall. In: Mind, Culture, and Activity 13, 4, S. 301-310. Goodwin, Charles (1979): The interactive construction of a sentence in natural conversation. In: Psathas, George (Hg.): Everyday language: Studies in ethnomethodology. New York: Irvington Publishers, S. 97-121. Goodwin, Charles (1981): Conversational organization: Interaction between speakers and hearers. New York: Academic Press. Goodwin, Charles (2000a): Practices of seeing: Visual analysis: An ethnomethodological approach. In: van Leeuwen, Theo/ Jewitt, Carey (Hg.): Handbook of visual analysis. London: Sage, S. 157-182. Goodwin, Charles (2000b): Action and embodiment within situated human interaction. In: Journal of Pragmatics 32, S. 1489-1522. Goodwin, Charles (2002): Time in action. In: Current Anthropology 43. Special issue: Repertoires of timekeeping in anthropology, S. 19-35. Goodwin, Charles (2007): Environmentally coupled gestures. In: Duncan, Susan D./ Cassell, Justine/ Levy, Elena T. (Hg.): Gesture and the dynamic dimensions of language. Amsterdam/ Philadelphia: Benjamins, S. 195-212. Goodwin, Charles/ Goodwin, M. Harness (1987): Concurrent operations on talk: Notes on the interactive organization of assessments. Pragmatics 1, 1, S. 1-55. Goodwin, Charles/ Goodwin, M. Harness (1992): Assessments and the construction of context. In: Duranti, Alessandro/ Goodwin, Charles (Hg.): Rethinking context: Language as an interactive phenomenon. Cambridge: Cambridge University Press, S. 147-190. Goodwin, Charles/ Goodwin, M. Harness (2000): Emotion within situated activity. In: Budwig, Nancy/ Uzgiris Ina C./ Wertsch, James V. (Hg.): Communication: An arena of development. Stamford, CT: Ablex, S. 33-54. Goodwin, Charles/ Goodwin, M. Harness (2004): Participation. In: Duranti, Alessandro (Hg.): A companion to linguistic anthropology. Oxford: Blackwell, S. 222-244. Haddington, Pentti/ Mondada, Lorenza/ Nevile, Maurice (Hg.) (2012): Interaction and mobility. Berlin/ Boston: de Gruyter. Zwischen Text und Bild: Multimodale Transkription 157 Heath, Christian (1986): Body movement and speech in medical interaction. Cambridge: Cambridge University Press. Heath, Christian (1989): Pain talk: The expression of suffering in the medical consultation. In: Social Psychology Quarterly 52, 2, S. 113-125. Heath, Christian (1991): The expression of pain and suffering in the medical consultation. In: Conein, Bernard/ Fornel, Michel de/ Quéré, Louis (Hg.): Les formes de la conversation. Bd. 2. Paris: CNET, S. 93-118. Heath, Christian/ Hindmarsh, Jon/ Luff, Paul (2010): Video in qualitative research. London: Sage. Hepburn, Alexa/ Bolden, Galina (2012): The conversation analytic approach to transcription. In: Sidnell/ Stivers (Hg.), S. 57-76. Heritage, John (1984): Garfinkel and ethnomethodology. Cambridge/ New York: Polity Press. Jefferson, Gail (1973): A case of precision timing in ordinary conversation: Overlapped tagpositioned address terms in closing sequences. In: Semiotica 9, S. 47-96. Jefferson, Gail (1983): Issues in the transcription of naturally occurring talk: Caricature versus capturing pronunciational particulars. In: Tilburg Papers in Language and Literature 34, S. 1-12. Jefferson, Gail (1984): Notes on some orderlinesses of overlap onset. In: D’Urso, Valentina/ Leonardi, Paolo (Hg.): Discourse analysis and natural rhetoric. Padua: Cleup Editore, S. 11-38. Jefferson, Gail (1985): An exercise in the transcription and analysis of laughter. In: van Dijk, Teun (Hg.): Handbook of discourse analysis Bd. 3. New York: Academic Press, S. 25-34. Jefferson, Gail (1986): Notes on ‘latency’ in overlap onset. In: Human Studies 9, S. 153-183. Jefferson, Gail (1989): Preliminary notes on a possible metric which provides for a ‘Standard Maximum’ silence of approximately one second in conversation. In: Roger, Derek/ Bull, Peter (Hg.): Conversation: An interdisciplinary perspective. Clevedon: Multilingual Matters, S. 166-196. Jefferson, Gail (1996): A case of transcriptional stereotyping. In: Journal of Pragmatics 26, 2, S. 159-170. Jefferson, Gail (2004): Glossary of transcript symbols with an introduction. In: Lerner, Gene H. (Hg.): Conversation analysis: Studies from the first generation. Amsterdam/ Philadelphia: Benjamins, S. 13-31. Keel, Sara/ Mondada, Lorenza (Hg.) (i.Dr.): Participation et asymétries dans l’interaction institutionnelle. Paris: L’Harmattan. Kendon, Adam (1990): Conducting interaction: Patterns of behavior in focused encounters. Cambridge: Cambridge University Press. Kendon, Adam (2004): Gesture: Visible action as utterance. Cambridge: Cambridge University Press. Lorenza Mondada 158 Kendon, Adam/ Ferber, Andrew (1973): A description of some human greetings. In: Michael, Richard P./ Crook, John H. (Hg.): Comparative ecology and behaviour of primates. London/ New York: Academic Press, S. 591-668. Laban, Rudolf (1956): Laban’s principles of dance and movement notation. London: MacDonald and Evans. Laurier, Eric (2012): Before, in and after: Cars making their way through roundabouts. In: Haddington/ Mondada/ Nevile (Hg.), S. 210-243. Laurier, Eric (2014): The graphic transcript: Poaching comic book grammar for inscribing the visual, spatial and temporal aspects of action. In: Geography Compass 8, 4, S. 235-248. Lynch, Michael (2002): From naturally occurring data to naturally organized ordinary activities: Comment on Speer. In: Discourse Studies 4, S. 531-537. McCloud, Scott (1993): Understanding comics. New York: Kitchen Sink. McQuown, Norman (Hg.) (1971): The natural history of an interview. Chicago: Microfilm Collection, Manuscripts on Cultural Anthropology, Joseph Reginstein Library, Department of Photoduplication, University of Chicago. Mondada, Lorenza (2006): Video recording as the reflexive preservation-configuration of phenomenal features for analysis. In: Knoblauch, Hubert/ Soeffner, Hans-Georg/ Raab, Jürgen/ Schnettler, Bernt (Hg.): Video analysis. Bern: Lang, S. 51-68. Mondada, Lorenza (2007): Multimodal resources for turn-taking: Pointing and the emergence of possible next speakers. In: Discourse Studies 9, 2, S. 194-225. Mondada, Lorenza (2009): Emergent focused interactions in public places: A systematic analysis of the multimodal achievement of a common interactional space. In: Journal of Pragmatics 41, 10, S. 1977-1997. Mondada, Lorenza (2011): The interactional production of multiple spatialities within a participatory democracy meeting. In: Social Semiotics 21, 2, S. 283-308. Mondada, Lorenza (2012a): The conversation analytic approach to data collection. In: Sidnell/ Stivers (Hg.), S. 32-56. Mondada, Lorenza (2012b): Video analysis and the temporality of inscriptions within social interaction: The case of architects at work. In: Qualitative Research 12, 3, S. 304-333. Mondada, Lorenza (2013): Embodied and spatial resources for turn-taking in institutional multi-party interactions: The example of participatory democracy debates. In: Journal of Pragmatics 46, S. 39-68. Mondada, Lorenza (2014a): Pointing, talk and the bodies: Reference and joint attention as embodied interactional achievements. In: Seyfeddinipur, Mandana/ Gullberg, Marianne (Hg.): From gesture in conversation to visible utterance in action. Amsterdam/ Philadelphia: Benjamins, 95-124. Mondada, Lorenza (2014b): Bodies in action: Multimodal analysis of walking and talking. In: Language and Dialogue 4, 3, S. 357-403. Mondada, Lorenza (2014c): Shooting as a research activity: The embodied production of video data. In: Broth, Mathias/ Laurier, Eric/ Mondada, Lorenza (Hg.): Video at work. London: Routledge, S. 33-62. Zwischen Text und Bild: Multimodale Transkription 159 Mondada, Lorenza (2014d): Requesting immediate action in the surgical operating room: Time, embodied resources and praxeological embeddedness. In: Couper- Kuhlen, Elizabeth/ Drew, Paul (Hg.): Requesting in social interaction. Amsterdam/ Philadelphia: Benjamins, S. 271-304. Mondada, Lorenza (2014e): The local constitution of multimodal resources for social interaction. In: Journal of Pragmatics 65, S. 137-156. Mondada, Lorenza (2015a): Multimodal completions. In: Deppermann, Arnulf/ Günthner, Susanne (Hg.): Temporality in interaction. Amsterdam/ Philadelphia: Benjamins, S. 267-307. Mondada, Lorenza (2015b): The facilitator’s task of formulating citizens’ proposals in political meetings: Orchestrating multiple embodied orientations to recipients. In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 16, S. 1-62. www.gespraechsforschung-online.de/ fileadmin/ dateien/ heft2015/ ga-mondada.pdf (Stand: Juni/ 2016). Mondada, Lorenza (2016): An interactionist perspective on the ecology of linguistic practices: The situated and embodied production of talk. In: Ludwig, Ralf/ Mühlhäusler, Peter/ Pagel, Steve (Hg.): Lingustic ecology and language contact. Cambridge: Cambridge University Press. Mondada, Lorenza (i.Dr.): Organiser le débat, favoriser la participation: Analyse comparée des pratiques de deux animateurs de réunions politiques. In: Keel/ Mondada (Hg.). Ochs, Elinor (1979): Transcription as theory. In: Ochs, Elinor/ Schieffelin, Bambi B. (Hg.): Developmental pragmatics. New York: Academic Press, S. 43-72. Rossano, Federico (2013): Gaze behavior in face-to-face interaction. Nijmegen: Max Planck Institute for Psycholinguistics. Sacks, Harvey (1984): Notes on methodology. In: Atkinson/ Heritage (Hg.), S. 21-27. Sacks, Harvey/ Schegloff, Emanuel A./ Jefferson, Gail (1974): A simplest systematics for the organization of turn-taking for conversation. In: Language 50, S. 696-735. Schegloff, Emanuel A. (1984): On some gestures’ relation to talk. In: Atkinson/ Heritage (Hg.), S. 266-296. Schegloff, Emanuel A. (1998): Body torque. In: Social Research 65, 3, S. 535-586. Schegloff, Emanuel A. (2007): Sequence organization in interaction: A primer in conversation analysis. Bd. 1. Cambridge: Cambridge University Press. Schegloff, Emanuel A./ Sacks, Harvey (1973): Opening up closings. In: Semiotica 8, S. 289-327. Schmitt, Reinhold (2004): Die Gesprächspause. Verbale „Auszeiten“ aus multimodaler Perspektive. In: Deutsche Sprache 32, S. 56-84. Selting, Margret et al. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 10, S. 353-402. http: / / www.gespraechsforschung-ozs.de/ heft2009/ px-gat2.pdf (Stand: Juni/ 2016). Sidnell, Jack/ Stivers, Tanya (Hg.) (2012): The handbook of conversation analysis. London: Blackwell-Wiley. Lorenza Mondada 160 Speer, Susan A. (2002): ‘Natural’ and ‘contrived’ data: A sustainable distinction? In: Discourse Studies 4, S. 511-25. Svensson, Hanna (i.Dr.): Surveiller et corriger - l’accomplissement interactionnel de la révision d’une inscription publique. In: Keel/ Mondada (Hg.). Zerubavel, Eviatar (1982): The standardization of time: A sociohistorical perspective. In: American Journal of Sociology 88, 1, S. 1-23. Gliederung 1. Einführung ............................................................................................................111 2. Prinzipien der Transkription in der Konversationsanalyse...........................113 3. Verbale und multimodale Transkription ..........................................................114 4. Einige grundlegende Dimensionen multimodaler Notation.........................118 5. Konventionen der textbasierten Darstellung von Multimodalität ...............119 6. Verwendung von Bildern in der multimodalen Transkription .....................130 7. Von bebilderten Texten zu beschrifteten Bildern ............................................137 8. Das Problem der Zeitlichkeit: Beispiel einer Analyse-Transkription ...........139 9. Fazit ........................................................................................................................154 10. Danksagung ..........................................................................................................155 11. Literatur .................................................................................................................155 HEIKO HAUSENDORF/ REINHOLD SCHMITT STANDBILDANALYSE ALS INTERAKTIONSANALYSE: IMPLIKATIONEN UND PERSPEKTIVEN 1. Einführung Seit etwa zehn Jahren haben Videoaufzeichnungen einen festen Platz in der lange durch Audioaufzeichnungen dominierten linguistischen und konversationsanalytischen Interaktionsforschung, und wahrscheinlich ist es nicht übertrieben, zu sagen, dass Videoaufzeichnungen inzwischen zum Standard der Datenerhebung in diesem Forschungsfeld gehören. Wer gegenwärtig Interaktionsforschung ohne videobasierte Daten betreibt, dürfte jedenfalls (und zu Recht) unter starken Begründungszwang geraten. Die Geschichte der Einbindung des Sichtbaren in die auf das Hörbare (und zudem auf das Gesprochene) fixierte Transkription, die Lorenza Mondada in ihrem Beitrag nachzeichnet (Mondada i.d.Bd.), legt von diesem Aufschwung der Erweiterung der Datenbasis, der eng mit dem technischen Fortschritt digitalisierter Videoaufzeichnung verbunden ist, ein vielschichtiges und beredtes Zeugnis ab. Auch über die linguistische und konversationsanalytische Interaktionsforschung hinaus hat dieser aktuelle Aufschwung videobasierter Forschung in den Sozialwissenschaften, der an eine ältere Tradition der ‘context analysis’ anschließen konnte, vielfältige Spuren hinterlassen. Diese kann man an einer Reihe von Versuchen zur Konsolidierung einer entsprechenden Methodik und Methodologie erkennen. Wolfgang Kesselheim weist in seinem Beitrag darauf hin, wie unterschiedlich „Videoanalysen“ dabei von Fall zu Fall motiviert sind und wie vielfältig dieses Forschungsfeld nach wie vor ist (Kesselheim i.d.Bd.). Das Spektrum an Fragestellungen und Konzepten, das mit Videoanalysen in den Sozialwissenschaften einhergeht, ist so reichhaltig und unüberschaubar wie die unter dem Schlagwort ‘Qualitative Sozialforschung’ anzutreffenden Ansätze selbst. Diese versuchen vielfach, ihre bereits bestehenden Forschungsinteressen nun auch mit Videoanalysen zu unterfüttern (vgl. dazu als Überblick z.B. die Beiträge in Moritz (Hg.) 2014). Für unseren Zusammenhang einschlägig(er) sind Ansätze, die sich stärker aus und in der Auseinandersetzung mit videobasierter empirischer Interaktionsforschung (insbesondere ethnomethodologisch-konversationsanalytischer Provenienz) selbst ergeben haben und aus der Konzepte hervorgegangen sind, die genuin videobasiert sind. Dazu gehören Forschungsgebiete wie das der ‘Multimodalität ’ 1 1 Der Kerngedanke einer multimodalen Konzeption von Interaktion, dass akustisch und visuell wahrnehmbare Bestandteile des menschlichen Verhaltens immer gleichzeitig und gleichwer- Heiko Hausendorf / Reinhold Schmitt 162 oder des ‘embodiment’ (vgl. Streeck et al. (Hg.) 2014) sowie andere noch im Entstehen begriffene Konzepte (wie das der „visual sociology“, vgl. Emmison/ Smith 2000, S. 173). Das für den vorliegenden Band konstitutive Interesse an Raum und Architektur, das man z.B. auch in der Raumsoziologie und der Architektursoziologie, in der Sozialgeografie und den Kulturwissenschaften beobachten kann, gehört in dieses Theoriespektrum, das der videobasierten empirischen Forschung viele Impulse verdankt. Entsprechend ist es folgerichtig, dass sich unser Interesse an Interaktionsarchitektur, Sozialtopografie und Interaktionsraum (vgl. den Beitrag der Verfasser im Theorieteil) nicht einer theoretischen Setzung verdankt, sondern einer langjährigen und intensiven Beschäftigung mit den Möglichkeiten und Herausforderungen von Videoaufzeichnungen als Datenbasis für die Interaktionsforschung. Die schrittweise Verfeinerung und die Etablierung von Standards für die Integration von Bildern und Bildfolgen in Transkriptionen stellen ebenso wie das Postulat einer „visuellen“ Erstanalyse (Schmitt i.Vorb.) 2 wichtige Etappen auf diesem Weg dar. In den Kontext dieses Zusammenhangs von Videoanalyse und Konzeptentwicklung gehört schließlich auch die Einsicht in den eigenständigen Charakter von Standbildern als Sekundärdokumenten von Videoaufzeichnungen (stills), die wir im vorliegenden Beitrag in den Mittelpunkt stellen wollen. Die Entdeckung des analytischen Wertes von Standbildern geht also nicht zufällig Hand in Hand mit der Entdeckung der interaktionsarchitektonischen und sozialtopografischen Implikationen des gebauten Raumes für die interaktive Herstellung der gerade relevanten räumlichen Umgebung (= Interaktionsraum): Dass und wie eine bestimmte Architektur eine bestimmte Interaktion ermöglichen und nahelegen kann, lässt sich aus heuristischen Gründen am besten anhand eines Standbildes zeigen, auf dem (noch) keine Personen zu sehen sind. Und auch die Art und Weise, in der Personen diese Implikationen sozialtopografisch interpretieren und aktualisieren, zeigt sich sehr deutlich in der auf einem Standbild oder einer Standbildfolge eingefrorenen Nutzung von Architektur. Die in diesem Band versammelten Beiträge betrachten die jetig zur Konstitution von Interaktion und zur Produktion sozialen Sinns beitragen, ist inzwischen weitgehend Allgemeingut. Dies schlägt sich jedoch im Moment noch primär in Veränderungen der empirischen Basis nieder, sofern Videoaufzeichnungen die bislang verbreiteten Tonaufnahmen mehr und mehr ersetzen. Die Reflexion darüber, welche Implikationen damit für die Gegenstandskonstitution, die Analysemethoden und die konzeptionellen Grundlagen einer multimodalen Interaktionsanalyse verbunden sind, hinkt dagegen noch deutlich hinterher. 2 Die Notwendigkeit einer eigenständigen, nur auf dem visuell wahrnehmbaren Geschehen basierenden Analyse wurde sehr schnell im Kontext der Entwicklung der multimodalen Interaktionsanalyse deutlich (Schmitt 2006, 2007a, 2007b). Schmitt (i.Vorb.) unternimmt einen ersten Versuch, das Verfahren der visuellen Erstanalyse systematisch zu reflektieren, um Erkenntnispotenzial und Beschränkungen auszuloten. Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 163 weils eingebundenen Standbilder deshalb nicht (wie nach wie vor üblich) als darstellungsbedingten Ersatz für das Einfügen der Videoaufzeichnung, sondern als vollwertig-eigenständige Analysedokumente. Um den empirischen Teil von einer Reflexion der Implikationen einer solchen Standbildanalyse zu entlasten, wollen wir im vorliegenden Beitrag verdeutlichen, welchen Status Standbilder (und Standbildfolgen) 3 in unseren Analysen haben und welche Rolle sie für die Interaktionsanalyse spielen können. Grundlegend für unser Vorgehen ist zunächst der Gegenstand der Interaktion als Fluchtpunkt unserer Bemühungen (siehe Kap. 2). An einer vom Gegenstand der Interaktion abgelösten „Bildanalyse“, die sich auf systematische Weise den Eigengesetzlichkeiten einer zweidimensional-flächigen Abbildung zuwendet, um auf diese Weise den Bildcharakter der Dokumente eigenständig zu rekonstruieren (siehe unten Kap. 2), haben wir kein Interesse. Wir betrachten die Standbilder vielmehr als Dokumente einer Interaktion - und sei es auch nur, wie im Falle der interaktionsarchitektonischen Analyseperspektive, als Dokumente einer durch Architektur ermöglichten und nahegelegten Interaktion. Von hier aus versteht sich, warum wir grundsätzlich eine Analogie zwischen dem herkömmlichen Verbaltranskript als Sekundärdokument der Audioaufzeichnung und Standbildern als Sekundärdokument der Videoaufzeichnung postulieren: Auch die Transkription interessiert uns bekanntermaßen ja nicht als Schreib- und Lesefläche in ihrer eigenständigen Textualität und Lesbarkeit (= als Text), was ja prinzipiell möglich wäre. Sondern wir analysieren sie als ein wie immer ausschnitthaftes und voraussetzungsreiches Dokument einer Interaktion (Hausendorf i.Dr.). Wie das Transkript im Verhältnis zur Audioaufzeichnung ist auch das Standbild im Verhältnis zur Videoaufzeichnung ein für die Zwecke der Analyse erzeugtes Sekundärdokument. Als solches stellt es Anforderungen eigener Art an die Analyse, und natürlich wollen wir nicht davon absehen, dass die Selektivität eines Standbildes eine andere ist als die einer Transkription. Mit der ‘Verschriftlichung’ gesprochener Sprache kann sich die Transkription auf ein hoch artifizielles symbolisches Kommunikationsmedium stützen. Das Standbild stellt demgegenüber eben gerade keine ‘Verschriftlichung’ dar, und alle Bestrebungen, etwas Derartiges für den Bereich der Visualität (z.B. für die populärwissenschaftlich gerne so genannte „Körpersprache“ bzw. die früher gerne so genannte „nonverbale“ Kommunikation) zu versuchen, dürften zumindest für die Forschungszwecke der linguistischen Interaktionsforschung als mehr oder weniger gescheitert angesehen werden (wie schon die ältere Diskussion um die Notation „nonverbaler Kommunikation“ angedeutet hatte: vgl. etwa Luckmann (Hg.) (1979); siehe auch den Beitrag von Mondada 3 Wenn wir im Folgenden von Standbildern sprechen, verstehen wir Standbildfolgen jeweils mit. Heiko Hausendorf / Reinhold Schmitt 164 i.d.Bd.). Das ist damit gemeint, wenn wir sagen, dass die Selektivität des Standbildes eine andere ist als die einer Transkription. Gleichwohl hat sich in unserer Praxis des Umgangs mit Standbildern als Analysedokumente gezeigt, dass wir uns in vielen Punkten bei der Standbildanalyse auf die bewährte Methodologie der konversationsanalytischen Transkriptionsanalyse verlassen können. Dies gilt insbesondere auch für den Umgang mit analytischem Vorwissen, das durch die Beschäftigung mit Standbildern auf eine unmittelbar augenfällige Weise virulent wird, insofern etwa schon das Betrachten fast immer mit einem Wiedererkennen zusammenfällt. Trotzdem stellt der sorgsame Umgang mit Vorwissen sehr zu Recht einen der Knackpunkte der konversationsanalytischen Mentalität dar. Natürlich wäre es naiv, anzunehmen, dass man dieses Vorwissen einfach beiseite schieben könnte. Genauso naiv und zudem analytisch ausgesprochen kontraproduktiv wäre es allerdings auch, sich einfach auf dieses Vorwissen zu verlassen. Es muss deshalb auf methodisch kontrollierte Weise durch Verfremdung ergänzt und dadurch einer methodologischen Reflexion zugänglich gemacht werden. Das gilt für die Analyse eines Standbildes nicht weniger als für die Analyse einer Äußerung in einer Transkriptzeile. Natürlich stellen sich der Analyse im Übergang vom gesprochenen Wort zur Sichtbarkeit z.B. eines Möbelstücks oder eines auf eine bestimmte Weise ausgestatteten und gestalteten Raumes neuartige Herausforderungen (siehe Kap. 3). Anders als für die Analyse von Audioaufzeichnungen und Transkriptionen (und in Ansätzen auch für die Analyse von Videoaufzeichnungen, siehe unten Kap. 2) haben sich für die Analyse von Standbildern aus einer wie oben skizziert interaktionsorientierten Perspektive noch keine Standards herausgebildet, sofern der eigenständige analytische Wert von Standbildern für die Interaktionsforschung überhaupt gesehen und anerkannt wird. Entsprechend gibt es noch keine etablierten Verfahren, mithilfe derer man den analytischen Wert dieser Dokumente angemessen zur Geltung bringen kann. Aber es liegen mit den Beiträgen zu diesem Band vielversprechende erste Ansätze vor, die belegen können, dass und wie eine interaktionsorientierte Standbildanalyse gewinnbringend methodisiert werden kann. Hierhin gehören z.B. Verfahren der Segmentierung und Sequenzialisierung, auf die wir in diesem Beitrag kurz eingehen wollen (siehe Kap. 4). Standbilder haben sich in den Fallanalysen dieses Bandes nicht nur als eigenständige, sondern auch als ergiebige Dokumente für die Analyse des Zusammenhangs von Interaktion, Architektur und Raum erwiesen. Dabei ist zu beachten, dass wir die Standbilder bislang aus Videoaufzeichnungen gewonnen haben, die nicht für die Zwecke solcher Analysen erhoben worden sind. In Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 165 einem Ausblick wollen wir deshalb abschließend noch kurz darauf eingehen, wie Standbilder zukünftig durch weitere und neuartige Formen der Datenerhebung ergänzt werden können. In diesem Zusammenhang versprechen auch neue Möglichkeiten der Animation digitaler Videoaufzeichnungen weitergehende Formen der Visualisierung von Analyseergebnissen beyond the still (siehe Kap. 5). 2. Interaktionsanalyse versus Bildanalyse Obwohl der mit Videoaufzeichnungen ermöglichte Rückgriff auf das von den Interaktionsteilnehmern Gesehene und das in einer sozialen Situation Sichtbare (und entsprechend mit Kameras Dokumentierbare) in der linguistischen Interaktionsanalyse der letzten Jahre einen starken Aufschwung erlebt hat (siehe Kap. 1), steht die Ausbildung eines der Analyse von Transkriptionen vergleichbaren methodischen Know-how trotz erster sich abzeichnender Standards eher noch am Anfang. Ein Indiz dafür sind die in den letzten ca. fünf Jahren deutlich angestiegenen Versuche, die bereits bestehenden Ansätze der Interaktionsanalyse von videobasierten Daten in Einführungen und Handbüchern zu erfassen (z.B. Dinkelaker/ Herrle 2009; Kissmann (Hg.) 2009; Knoblauch et al. 2009; Heath et al. 2010). Das Potenzial der Standbildanalyse, auf das wir uns im Folgenden konzentrieren wollen, ist dabei allerdings nach wie vor unterrepräsentiert. Unseren Ausgangspunkt bildet das in der Einführung bereits genannte Postulat, sich auf Standbilder als eigenständige Analysedokumente einzulassen. Standbilder werden bislang in vielen Ansätzen primär zu illustrativen Zwecken eingesetzt, um die im Druck nicht reproduzierbare Videoaufnahme zumindest partiell zu ersetzen, aus der die Standbilder erzeugt wurden (so z.B. die Hinweise bei vom Lehn 2014). So sollen sie z.B. „veranschaulichen“, wie in der durch das Verbaltranskript dokumentierten Szene der situative Hintergrund ausgesehen hat und wie sich Sprechende und Hörende vor Objekten und im Umgang mit Objekten positioniert und bewegt haben. Das Gesprochen-Gehörte und entsprechend Transkribierte wird auf diese Weise „bebildert“, und die Geschichte der Entwicklung der Transkriptionsverfahren der letzten ca. 20 Jahre ist deshalb nicht zufällig auch eine Geschichte dieser Bebilderung (siehe dazu Mondada i.d.Bd.). Will man Standbilder von dieser primär illustrativen und kompensativen Funktionalisierung für die Analyse der Transkription befreien, muss man sie in ihrer Eigenständigkeit als Analysedokument ernst nehmen. Bislang geschieht das vorwiegend im Kontext „bildfokussierender Verfahren“ (Moritz (Hg.) 2014, S. 21f.), in denen das Standbild in seiner bildlichen „Eigenlogik“ zur Geltung gebracht werden soll. So ist im Anschluss an die Heiko Hausendorf / Reinhold Schmitt 166 frühen Arbeiten von Birdwhistell und mit Bezug auf die Rekonstruktion der Bestandteile von Bewegungen („Kineme“) z.B. dafür argumentiert worden, das Standbild („Fotogramm“, „still photo“) als Dokument von Simultaneität eigenständig zu fokussieren (Bohnsack 2009, S. 151ff.). Im Anschluss an filmwissenschaftliche Fragestellungen wird das Standbild sodann im Hinblick auf die in ihm manifestierte „Einstellung und Perspektivität“ diskutiert (ebd., S. 156ff.), sodass die „Komposition des Fotogramms“ (ebd., S. 157) und darüber hinaus auch die Komposition der „Bildfläche“ in den Blick kommen. In diesem Übergang zeigt sich aus unserer Sicht auf exemplarische Weise eine Verselbstständigung der Standbildanalyse gegenüber dem Gegenstand der Interaktion: Sie läuft letztlich darauf hinaus, Standbilder als fotografische, bildlich-ikonografische oder auch kinematografische Dokumente zu verstehen, anhand derer entsprechend Kommunikation mit und durch Fotos, Bilder oder Filme als solche analysiert werden kann. Aus Interaktionsanalyse wird dann eine in Bezug auf ihren Gegenstand unspezifizierte Analyse des Sichtbaren („visual analysis“: van Leeuwen/ Jewitt 2001; „visual methodologies“: Rose 2001). Offenkundig handelt es sich dann um andere Untersuchungsgegenstände. Wie einleitend schon vermerkt, ist unser Interesse an Standbildern nicht durch eine solche Fokussierung auf bild- und filmwissenschaftliche Aspekte im weitesten Sinn motiviert. Unsere methodologische Motivation besteht vielmehr darin, auszuprobieren, ob Standbilder im Vergleich zur Videoaufzeichnung (aus der sie stammen) für die Interaktionsanalyse einen ähnlichen Stellenwert haben könnten, wie er der Transkription im Vergleich zur Audioaufzeichnung (auf die sie zurückgeht) zweifelsfrei zukommt: Die Transkription kompensiert ja nicht das Fehlen der Tonaufzeichnung, die ihr zugrunde liegt, sondern ist selbst ein für die Analyse, ihre Fragestellung, ihre Vorgehensweise und ihre Ergebnisse konstitutives Dokument, in dem bereits der gesamte Gestus der Analyse enthalten ist. In diesem Sinn wollen wir dafür plädieren, auch Standbilder als eigenständige Dokumente zu verstehen, die für eine Analyse eigener Art konstitutiv sind. Genau diese Analyse gilt es, „from the data themselves“ (Schegloff/ Sacks 1973, S. 291) zu entwickeln. Wir wollen damit auf einen bislang eher vernachlässigten, aber methodisch wichtigen Unterschied aufmerksam machen. Dieser zeigt sich in folgenden Fragen: Erkennen wir innerhalb der Analyse das Standbild als eigenständige Materialgrundlage an und versuchen entsprechend, ihr Potenzial auszuschöpfen? Oder sehen wir darin bloß einen der Publikationsform des Drucks geschuldeten Ausweg aus dem Dilemma, nicht den Videoausschnitt einfügen zu können? Wenn wir im Standbild mehr sehen wollen als einen darstellungstechnischen Kompromiss, führt kein Weg an einer Methodologie der Standbildanalyse vorbei. Das ist die eine Seite der Medaille. Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 167 Der Fluchtpunkt einer solchen Analyse bleibt allerdings - anders als im Falle der „Fotogramm“-Analyse (siehe oben) - die Interaktion, die in den Standbildern auf eine wie auch immer selektive Weise dokumentiert ist (ähnlich die Ausrichtung bei Dinkelaker/ Herrle 2009). Auch an dieser Stelle hilft die Analogie zur Transkription. Die Transkription stellt als schriftbasiertes lesbares Etwas ein Dokument eigener Art dar. Es handelt sich um einen Text, den man auch als solchen, d.h. in seiner Lesbarkeit zum Gegenstand einer textlinguistischen Analyse machen könnte. Dabei würde jedoch offenkundig der Gegenstand der Interaktion verloren gehen. Interaktionsanalyse ist deshalb grundsätzlich keine Textanalyse. Genauso wenig wird sie auf der Grundlage von Standbildern zur Bild- oder Filmanalyse. Das ist die andere Seite der Medaille. Wie die Transkription die Analyse mit dem Gesprochen-Gehörten konfrontiert, konfrontieren uns Standbilder mit dem Sichtbaren, dem Gezeigt- (bzw. Demonstriert)-Gesehenen als Bestandteil der Interaktion. Schon in dieser Gegenüberstellung zeigt sich ein erster wichtiger Unterschied: Das Gesprochen- Gehörte kommt und (ver)geht mit der Interaktion, und es ist aufgrund der Auffälligkeit von Sprache unter Anwesenden fast automatisch Bestandteil der Interaktion. Für das Sichtbare gilt das offenkundig nicht in gleicher Weise. Sofern es sich nicht um Bewegungen, Blicke oder andere momenthafte körperliche Präsenzformen der Beteiligten handelt, überdauert das in einer Interaktionssituation jeweils Sichtbare in der Regel den Moment seiner Hervorbringung in der Interaktion: Ein Konferenzraum mit seiner Möblierung, in dem eine Besprechung stattgefunden hat, ist (in den meisten Fällen) auch vor und nach der Besprechung in gleicher Weise „präsent“, d.h. für visuelle Wahrnehmung zugänglich. Jedenfalls ist die Architektur eines Raumes, aber auch die körperliche Gegenwart der Anwesenden viel weniger flüchtig als das gesprochene Wort. Es hat wohl (auch) mit dieser Dauerpräsenz zu tun, dass tatsächlich nicht alles, was die an einer Interaktion Beteiligten sehen können, auch für die Interaktion von Belang und Bedeutung sein muss. Der Interaktionsraum fällt bekanntlich nicht von selbst mit dem zusammen, was jede/ r Beteiligte/ r für sich genommen in einer bestimmten Umgebung wahrgenommen haben mag. Erst recht ist er nicht vorgegeben, sondern muss von Augenblick zu Augenblick in der Interaktion in seiner Relevanz hervorgebracht werden (so unscheinbar das von Fall zu Fall bewerkstelligt werden mag). Pointiert gesagt: Der Interaktionsraum ist nicht, sondern ereignet sich (nach Fischer-Lichte 2006, S. 20; vgl. aus konversationsanalytischer Perspektive Mondada 2007). Genau darin dürfte einer der Gründe liegen, warum sich die Konversationsanalyse bislang mit Standbildern schwer getan hat (und nach wie vor schwer tut): Dem Standbild sieht man die Interaktion nicht an, und es zeigt deshalb nicht automatisch Heiko Hausendorf / Reinhold Schmitt 168 den Interaktionsraum. Aber es zeigt die multimodalen Ressourcen des Sicht-, Greif- und sonstwie Benutzbaren, auf das die Herstellung des Interaktionsraumes zurückgreifen kann. Schon diese wenigen Bemerkungen zeigen, wie die durch Standbilder vorangetriebene Fokussierung auf Sichtbares die Interaktionsforschung mit Fragestellungen beschäftigt, die sich in der durch Transkriptionen ermöglichten Fokussierung auf gesprochen-gehörte Sprache in der Regel gar nicht erst gestellt haben. Dass Gesprochen-Gehörtes unter Anwesenden (zumal am Telefon! ) von interaktiver Relevanz ist, muss in der Regel nicht empirisch gezeigt werden; ein gesprochen-gehörtes Wort ist ein so unwahrscheinliches Ereignis, dass es kaum überhört werden kann. Für eine Bewegung, die ein Gesprächspartner während einer Unterhaltung mit seinem Oberkörper machen mag, gilt das offenkundig nicht in gleicher Weise. Schon gar nicht gilt es für das, wovon einer der Gesprächspartner in einem bestimmten Moment Notiz genommen haben mag, weil er oder sie es gesehen hat. Die visuelle Wahrnehmung ist bekanntlich sehr viel weniger eindeutig auf Kommunikation fokussiert als das Sprechen und Zuhören (Luckmann 2009, S. 30). Es geht ja nicht um individuelle Handlungen, sondern um für die Interaktion relevante Prozesse der Ko-Orientierung, Ko-Ordination und Ko-Operation (Schmitt (Hg.) 2007; Hausendorf 2013). Es ist vor diesem Hintergrund vielleicht kein Zufall, dass der Aufschwung der videobasierten Interaktionsforschung z.T. mit einem neuen Interesse an verbaler und gestikulatorischer Deixis einhergegangen ist. Denn an deiktischen Aktivitäten (wie dem ausgestreckten Zeigefinger) lässt sich sehr anschaulich rekonstruieren, dass und wie Sichtbares als Gezeigt-Demonstriertes auch verlässlich zu Gesehenem werden kann (vgl. dazu als aktuellen Überblick Stukenbrock 2014). Dies ist ein anschaulicher Beleg dafür, dass und wie die „Sprechsituation“ unter Anwesenden interaktiv hergestellt wird (Hausendorf 2003). So aufschlussreich der Blick auf die Deixis auch sein mag, so wenig lässt sich allerdings übersehen, dass man es in solchen Fällen „nur“ mit den Rosinen im Kuchen zu tun hat. Wenn wir auf alles in der visuell zugänglichen Umgebung zeigen müssten, was für uns gerade von Bedeutung ist, kämen wir aus dem Zeigen so schnell nicht mehr heraus - ganz abgesehen davon, dass es dazu einer Reflexion bedürfte, die mit dem Handlungsdruck der Interaktion nicht vereinbar ist. Es muss unter Anwesenden deshalb andere Ressourcen (als die sprachliche und z.B. gestische Deixis) geben, um das Problem der Relevantsetzung der sichtbaren Umgebung (= Situierung) zu lösen. Schon wenn man das Problem so sieht, werden Standbilder sofort zu hoch aufschlussreichen Dokumenten. Beispielsweise zeigen sie, dass und wie Positionen und Positionierungen in Form bestimmter Konfigurationen (wie die „f-formations“ im Sinne von Kendon 1990) der anwesenden Personen (um Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 169 einen Tisch sitzen, im Kreis stehen, Schlange stehen, ...) wesentlich dazu beitragen, Situierungsanforderungen zu bearbeiten: Der visuell zugängliche Bereich wird durch solche Konfigurationen von vornherein zugunsten eines bestimmten Typs von in genau diesem Sinne „fokussierter“ Interaktion (Goffman 1963) eingeschränkt („Interaktionsensemble“ sensu Schmitt 2013). Es ist die Motorik im Vollsinne humanspezifischer Fähigkeiten (Senso-, Statu- und Lokomotorik), die hier als Ressource in Anspruch genommen wird, um die Situierung der Interaktion auf ebenso unscheinbare wie effektive Weise sicherzustellen („Ko-Ordination“: Schmitt (Hg.) 2007, Hausendorf 2015). Die Multimodalitätsforschung hat das in den letzten Jahren an Ausschnitten von Videoaufzeichnungen detailliert nachzeichnen können. Dabei hat sich gezeigt, dass die fraglichen Konfigurationen auch und gerade anhand von Standbildern auf eine höchst aufschlussreiche Weise erfasst werden können, die mit dem Einfrieren eines bestimmten Augenblicks zu tun hat und den Einblick in das diesen Augenblick überdauernde sensorisch und motorisch Relevante der Interaktion gestattet (vgl. dazu auch die Verfahren der „Konfigurations-“ und „Konstellationsanalyse“ bei Dinkelaker/ Herrle 2009, S. 64ff.; S. 93ff.). Es ist von hier aus schließlich nur ein kleiner Schritt, das Augenmerk von den Beteiligten und ihren Wahrnehmungen und Bewegungen auch auf das zu richten, was die Wahrnehmungs- und Bewegungsmöglichkeiten in einer konkreten Situation maßgeblich mitbestimmt: die räumlichen Arrangements und „affordances“ (Gibson 1977). Diese stehen im Sinne architektonischer Benutzbarkeitshinweise als Ressource der Interaktion zur Verfügung (vgl. dazu auch den Beitrag von Hausendorf/ Kesselheim i.d.Bd.). Tatsächlich sind wir damit bei den bereits angesprochenen Dimensionen des Sichtbaren (wie auch des Begeh-, Betret-, Begreif- und sonstwie Aktivierbaren), die die Interaktion in der Regel überdauern, d.h. nicht - wie die gesprochene Sprache - mit der Interaktion kommen und (ver)gehen, sondern als Ressourcen weitgehend interaktionsunabhängig zur Verfügung stehen. Die fallspezifische Dokumentation solcher Ressourcen und die Rekonstruktion ihrer Implikationen für die Interaktion sind auf die Dokumentation und Rekonstruktion von Interaktion nicht angewiesen. Naturgemäß bieten sich an dieser Stelle Abbildungen an, die einen bestimmten Status Quo dokumentieren. Die mit der Fokussierung auf ein Standbild einhergehende Stillstellung der Prozessualität und Sequenzialität eines Interaktionsprozesses (die in der Videoaufzeichnung als Primärdokument noch erhalten sind), setzt damit ein Beobachtungs- und Entdeckungspotenzial frei, das die Videoaufzeichnung gerade nicht hat. Das gilt insbesondere für die Beschreibung der interaktionsrelevanten Implikationen räumlicher Ressourcen, aber auch für die Details der Nutzung dieser Implikationen durch Anwesende. Worin dieses Potenzial konkret besteht Heiko Hausendorf / Reinhold Schmitt 170 und auf welchen Wegen es freigesetzt werden kann, wollen wir im Folgenden exemplarisch an zwei Verfahren der Standbildanalyse illustrieren (siehe Kap. 4). Um die Darstellung dieser Verfahren von grundsätzlichen methodologischen Fragen zu entlasten, wollen wir zuvor aber noch kurz darauf eingehen, wie es im Falle der Standbildanalyse mit dem Spannungsverhältnis von Vorwissen und Verfremdung bestellt ist. 3. Vorwissen und Verfremdung Ähnlich wie die Transkription ermöglicht und provoziert die mit dem Standbild einhergehende künstliche Stillstellung eines Augenblicks (mit oder ohne Interaktion) die Beobachtung von Wahrnehmungs-, Bewegungs- und Handlungsmöglichkeiten und -erwartbarkeiten. Solche Stillstellungen können im Sinne einer fruchtbaren Verfremdung der Alltagsperspektive Aufschluss über die in diesen Details markant zum Ausdruck kommenden architektonischen Implikationen für Interaktion und ihre konkrete Nutzung geben. So wie es Sinn macht, mithilfe einer Transkription an einer bestimmten Stelle die Zeit anzuhalten und die Implikationen eines Beitrags für Folgebeiträge herauszuarbeiten (ohne zu berücksichtigen, wie es weitergeht), macht es auch Sinn, mithilfe eines Standbilds die Zeit anzuhalten und die sichtbar eingefrorenen Implikationen für Interaktion kontra-intuitiv und gezielt verfremdet zu explizieren. Dabei lässt sich auf den ersten Blick nicht immer der Eindruck vermeiden, dass von Banalitäten die Rede ist - weil es oftmals uns hoch vertraute räumliche Arrangements sind, die auf dem Standbild dokumentiert sind. Dieser Eindruck verschwindet jedoch, wenn man sich die strukturelle Vergleichbarkeit der analytischen Haltung bei der raumbezogenen Standbildanalyse und der Analyse von Transkripten vergegenwärtigt. Mit beiden Haltungen ist eine methodisch motivierte Aufgabe unserer alltagsweltlichen Wahrnehmung verbunden und der bewusste und radikale Verzicht auf die für sie typische Motivzuschreibung, der Kategorisierung singulärer und situationsspezifischer Vorgänge und Verhaltensweisen und der sehr schnellen Annahme darüber, worauf das, was wir sehen, hinauslaufen wird. Es wäre - und ist es zuweilen leider immer noch - ein basales Missverständnis, der bei der Transkriptionsanalyse wirksamen konstitutionsanalytischen Methodologie der Konversationsanalyse zuzuschreiben, sie wolle unser Alltagswissen mit methodischen Mitteln detailliert nachzeichnen und anreichern. Es geht vielmehr darum, die generativen Mechanismen der Interaktionskonstitution zu rekonstruieren, die unserem alltagsweltlichen Handlungswissen und seiner Vollzugssystematik zugrunde liegen. Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 171 Der gleiche radikale Wechsel der Perspektive und der bewusste Verzicht auf Alltagskategorien zugunsten einer Konstitutionsanalyse gelten auch für die raumbezogene Analyse von Standbildern. Entscheidend ist es, hinter die alltagsweltliche Selbstverständlichkeit dieser Phänomene zu kommen und den Nachweis zu führen, welche Angebote für die (aus multimodaler Sicht) grundlegenden Anforderungen der Ko-Orientierung, Ko-Ordination und Ko- Operation durch die jeweilige Interaktionsarchitektur unterbreitet werden und wie diese in einer konkreten Nutzung ausbzw. auch abgewählt werden können. Bei der raumbezogenen Standbildanalyse geht es also um die Rekonstruktion der räumlichen Ressourcen und Grundlagen, die wir als Bestandteil unseres kulturspezifischen Handlungswissens nutzen, ohne uns dessen in der Regel bewusst zu sein (vgl. dazu auch die Hinweise im Beitrag Hausendorf/ Schmitt (i.d.Bd.) zu Interaktionsarchitektur und Sozialtopografie). Im Rahmen dieser strukturellen Vergleichbarkeit der Analysehaltungen (methodisch motivierte Aufgabe der Alltagsperspektive) und der Erkenntnisinteressen (Fokussierung auf die generativen Mechanismen und Grundlagen der multimodalen Interaktionskonstitution) gibt es jedoch einen wesentlichen Unterschied: Die Analyse des Gesprochen-Gehörten kann als analysemächtiges Instrument die Methodologie der Sequenzanalyse in Anspruch nehmen. Das ist aufgrund der unterschiedlichen Konstitutionslogik im Fall der Standbildanalyse nicht gleichermaßen möglich. Hier sind die fraglichen Erscheinungsformen in ihrer Beobachtbarkeit (und Rekonstruierbarkeit) in der Regel nicht flüchtig und augenblicksgebunden, sondern tendenziell dauerhafter Natur. Eine sequenzanalytische Rekonstruktion von Interaktionsarchitektur wäre also weder möglich, noch auch nur ansatzweise sinnvoll. Selbst bei der Analyse von Standbildfolgen, in denen der zeitlich gestreckte Prozess faktischer Raumnutzung zu sehen ist, kann man nicht ernsthaft von einem sequenzanalytischen Vorgehen sprechen, ohne die grundlegende Methodologie fokussierter Interaktion zu „verwässern“. Es kommt vielmehr darauf an, Analysemethoden zu entwickeln, die von vornherein der Spezifik von Standbildern als Interaktionsdokumente Rechnung tragen. Dabei wird deutlich, dass die scheinbare „sequenzanalytische Not“ eine ausgesprochen ertragreiche Tugend sein kann. Hier setzt das von Reinhold Schmitt vorgestellte Konzept des „Frame Comic“ an (siehe den entsprechenden Beitrag von Schmitt i.d.Bd.). Es liegt in der Natur der Sache, dass die Rekonstruktion der Interaktionsarchitektur maximal mit unserer stets (vor)informierten und hermeneutisch (vor)verstandenen Alltagsroutine kontrastiert, in der sich das sozialtopografische (Vor)Wissen um Normalformerwartungen im Umgang mit räumlichen Arrangements sedimentiert hat. Anders wären wir analytisch dazu verdammt, unser eigenes sozialtopografisches Wissen mehr oder weniger gekonnt zu reproduzieren. Auch wäre nicht recht einzusehen, warum wir uns Heiko Hausendorf / Reinhold Schmitt 172 dann nicht gleich auf die fallspezifische architekturfachliche Expertise (z.B. einen Hörsaal, einen Kirchenraum oder ein Klassenzimmer betreffend) verlassen sollten. Auch können die interaktionsarchitektonischen Implikationen, die uns interessieren (z.B. mit Bezug auf das, was für die Beteiligten sichtbar ist), gar nicht erst in den Blick kommen, wenn wir nicht hinter die alltagsweltlichen Begrifflichkeiten für architektonische Errungenschaften (wie eine „Wand“ oder ein „Fenster“) zurückgehen. Das ist jedoch zwingend notwendig, will man rekonstruieren, welche für die Bearbeitung genuiner Interaktionsprobleme relevanten Lösungen in solchen Begrifflichkeiten bereits semantisch und lexikalisch eingegangen und dem analytischen Verstehen damit oftmals entzogen und verborgen sind. Methodisch sind wir deshalb gezwungen, uns bis zu einem gewissen Grade als Verfremdungsspezialisten darum zu bemühen, unser sozialtopografisches Wissen, das unsere Raumnutzung im Alltag strukturiert, bewusst auszublenden. Was wir uns also methodisch motiviert fremd zu machen versuchen, ist der Impuls, aufgrund unserer sozialräumlichen Kompetenz immer schon zu wissen, was bestimmte Räume (ein „Kirchenraum“, ein „Hörsaal“ oder ein „Klassenzimmer“) sind und wie sie zu nutzen sind bzw. genutzt werden (sollten). Ein solches Wissen behindert die Rekonstruktion interaktionsarchitektonischer Implikationen (als notwendige analytische Vorarbeit konkreter Raumnutzung) durch seine habituelle Qualität und seine normalformspezifische Grundlage: Sie setzt also voraus, was es in der Analyse erst noch freizulegen gilt. Wenn wir immer schon vorverständigt wissen, wie ein Klassenraum, ein Kirchenraum oder ein Hörsaal sozialtopografisch genutzt werden, übersehen wir einen wichtigen Teil des interaktionsarchitektonisch erwartbar gemachten Angebotes an Wahrnehmbarkeit und Bewegbarkeit. Dadurch können wir dann beispielsweise nicht mehr den Grad der Selektion ermessen, den eine konkrete Raumnutzung zwangsläufig darstellt. Hier mag ein Bezug auf die objektiv-hermeneutische Position erhellend (Oevermann et al. 1979) sein. Sie besagt: Um präzise und umfassend zu wissen, welche Implikationen eine als motivierte Selektion aus einem Universum funktional äquivalenter Möglichkeiten realisierte Variante tatsächlich besitzt, muss ich wissen, was alles - im gleichen motivierten Sinne - nicht realisiert worden ist. Für die Beurteilung der Implikationen einer motivierten interaktionsräumlichen Nutzung muss ich wissen, aus welchem Universum der interaktionsarchitektonischen Möglichkeiten und Angebote diese Selektion erfolgt ist. Die Analyse umfasst also auch die Frage, was alles nicht realisiert worden ist, obwohl es womöglich interaktionsarchitektonisch auch naheliegend war. Es ist deshalb Aufgabe der raumbezogenen Analyse, bestimmte Erwartbarkeiten, die der Raum für eine Nutzung macht, als - bezogen auf unser sozialtopografisches Wissen - „strukturell überschüssig“ zu rekonstruieren. Wir Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 173 müssen also unsere Raumkognition gegen den Strich bürsten und danach fragen: Wie sieht im konkreten Fall diese Überschüssigkeit aus? Wodurch ist sie bedingt? Und wie kann unser Wissen über sie zur Interpretation der faktisch realisierten Raumnutzung genutzt werden? Ein Weg, diese strukturelle Überschüssigkeit, die jedes räumliche Arrangement auszeichnet, in produktiver Weise zu rekonstruieren, ist der Bezug auf die interaktionsarchitektonischen Basiskonzepte von Sichtbarkeit, Betretbarkeit, Verweilbarkeit oder Begehbarkeit (siehe oben die Einleitung der Verfasser im Theorieteil). Dabei kann es von Fall zu Fall durchaus notwendig und analytisch fruchtbar sein, hinter das Wissen zurückzugehen, das wir hinsichtlich auch architektonisch sedimentierter Bau- und Gestaltungselemente haben (zu denen häufig das Mobiliar, aber eben auch Einrichtungen wie Türen, Fenster oder Wände zählen). Auch gehört hierhin die empirische Aufmerksamkeit für die Frage, wieviel an Spezialwissen bereits in den architektonischen Erscheinungsformen eines Raumes zum Ausdruck kommt und wo genau der Raum selbst zu erkennen gibt, dass seine Nutzung auf Spezialwissen angewiesen ist: So gibt die Interaktionsarchitektur etwa eines „Altars“ auch dann zu denken, wenn ich nicht weiß, was darin sozialtopografisch manifestiert ist. Für die Identifikation der interaktionsarchitektonischen Implikationen bewährt sich also nicht das Vorwissen, sondern ein während der Analyse zu entwickelndes Spezialwissen darüber, was scheinbar selbstverständlich gegebene Erscheinungsformen für das Nahelegen von Interaktion bedeuten. Wir wollen nicht dahinter zurück, dass ein bestimmter sichtbarer Gegenstand z.B. als „Stuhl“ oder „Tisch“ erkannt werden kann. Aber wir wollen rekonstruieren, was ein Stuhl oder Tisch an einer bestimmten Stelle in einem Raum für die Interaktionsarchitektur leistet, was also seine mobiliaren Benutzbarkeitshinweise sind. Die Bandbreite möglicher Nutzungen (die Benutzbarkeitshinweisstruktur eines Tisches) muss dann im konkreten Fall gegen den Widerstand unserer alltagsweltlichen Vorverständigung expliziert werden. Vorwissen und raumbezogene Expertise werden in dem Maße wichtig und weiterführend, in dem wir schließlich von der Interaktionsarchitektur zur Sozialtopografie übergehen, wie sie in konkreten Nutzungen manifest wird. Auch hier ersetzt das Wissen nicht die konkrete Analyse. Aber dass und wie z.B. eine offensichtlich zu beobachtende Vermeidung begehbarer Flächen im Kirchenraum einen bestimmten sozialtopografischen Wissensaspekt manifestiert, kann man nur sehen, wenn man sich auch auf die Sozialtopografie des fraglichen Raumes einlässt. Das gelingt nur, wenn man über die wahrnehmbaren Benutzbarkeitshinweise (Wo kann man sich setzen, wo kann man verweilen, wo kann man gehen? ) zugunsten fallspezifisch ausdifferenzierter und entsprechend vertrautheits- und wissensabhängiger Benutzbarkeitshinweise hinausgeht (Wo darf bzw. soll man sich setzen, wo darf bzw. soll man verweilen, wo darf bzw. soll man gehen? ). Heiko Hausendorf / Reinhold Schmitt 174 Das gilt insbesondere dann, wenn wir es empirisch mit räumlichen Arrangements zu tun haben, die zugleich Ausdruck hochgradig institutionalisierter und organisierter Interaktionsereignisse sind (wie das beim Gottesdienst, einer Vorlesung oder einer Schulstunde der Fall ist). Diese Seite der Erscheinungsformen lässt sich über die Analyse der Sozialtopografie systematisch erfassen, die auf Standbilder angewiesen ist, in der konkrete Nutzungen durch Anwesende dokumentiert sind. Hier zeigen Nutzer und Nutzerinnen, wie sie bestimmte Benutzbarkeitshinweise interpretieren und aktivieren, die damit in einer empirisch gehaltvollen Weise für die Beobachtung zugänglich werden. Wollte man die Sozialtopografie eines räumlichen Arrangements ohne Bezug auf eine Dokumentation konkreter Nutzungen erfassen, ginge der empirische Mehrwert in der Tat verloren: Über die vertrautheitsabhängigen Benutzbarkeitshinweise eines Kirchenraumes informiert auch eine kunst- und religionswissenschaftliche bzw. -geschichtliche Expertise. Für unsere Analysen der Sozialtopografie wird diese Expertise jedoch erst relevant, wenn sie zugunsten der Rekonstruktion einer konkreten Raumnutzung ins Feld geführt werden kann und diese Nutzung ansonsten nicht in ihrer räumlichen Relevanz erfasst werden könnte. 4. Analyseperspektiven und Analyseverfahren Im Mittelpunkt der Standbildanalyse steht die Frage der Abbildqualität von Standbildern für raumbezogene Analysen und Erkenntnisinteressen als Bestandteil multimodaler Interaktionsanalyse. Den Startpunkt unserer Überlegungen bilden die folgenden Vorentscheidungen: Erstens: Der faktische Analysegang ist durch eine grundlegende Zweischrittigkeit charakterisiert, bei der zunächst das architektonische Angebot für Interaktion rekonstruiert werden muss. Dafür sind Standbilder geeignet, auf denen (noch) keine anwesenden Personen zu sehen sind. Erst in einem zweiten Schritt wird dann der Frage nachgegangen, welche fallspezifisch-konkrete Raumnutzung in der fraglichen Interaktion vorliegt und welches Konzept sozialtopografischer Raumnutzung von Anwesenden realisiert wird. Dafür sind Standbilder heranzuziehen, auf denen zumindest ein Anwesender (aber noch nicht zwangsläufig auch Interaktion) dokumentiert ist. Diese methodische Zweischrittigkeit reflektiert die Tatsache, dass es zunächst um die möglichst umfassende Rekonstruktion der durch den Raum nahegelegten und ermöglichten Angebote für konkrete Raumnutzung geht, während es bei der analytischen Perspektive der Sozialtopografie um die möglichst umfassende Rekonstruktion der Implikationen einer situativ-faktischen Raumnutzung geht. Letzteres setzt also das Wissen um die Relevanz interaktionsarchitektonischer Basiskonzepte voraus, um die fallspezifische Raumnutzung im inter- Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 175 aktionsarchitektonischen Gesamtrahmen verorten zu können. Dabei spielt, wie bereits ausgeführt, auch das Wissen um nicht genutzte räumliche Angebote eine wesentliche Rolle. Zweitens: Die Primärdokumente, aus denen die Standbilder erzeugt werden, müssen erkenntnisspezifisch konstituiert werden. Dabei gilt grundsätzlich: Für die Analyse der interaktionsarchitektonischen Implikationen ist es zwar nicht zwingend notwendig, aber unmittelbar von Vorteil, wenn unbelebter bzw. ungenutzter Raum abgebildet wird, weil dann der Angebotscharakter der Architektur nicht durch faktische Nutzungen bereits eingeschränkt wird. Die Abbildqualität eines Standbildes richtet sich also nach dem raumbezogenen Analysefokus. So ist die Abbildqualität von Standbildern für die Analyse konkreter Nutzungen der architektonischen Interaktionsangebote maßgeblich dadurch bestimmt, dass diese Nutzungen und ihre sozialtopografischen Implikationen im Standbild möglichst anschaulich dokumentiert sind (siehe Kap. 5.1). Es ist deshalb wichtig, zu sehen, dass die bei der Konstitution von Standbildern spezifischen Abbildanforderungen hinsichtlich der Analysierbarkeit von Interaktionsarchitektur nicht identisch sind mit den Anforderungen an Standbildern, die für sozialtopografische Analysen erstellt werden. Drittens: Die raumbezogene Interaktionsanalyse basiert auf der grundsätzlichen Entscheidung, auf die Analyse von Videoaufzeichnungen als Primärdokument zunächst zu verzichten. Videoaufzeichnungen werden erst bei der abschließenden Rekonstruktion des durch die Situierung der Anwesenden jeweils momenthaft erzeugten Interaktionsraumes zum bevorzugten Analysedokument. Genau wie bei dem Verhältnis von Audioaufzeichnung und Verbaltranskript hat man es auch bei Videoaufzeichnungen und Standbildern mit Primär- und Sekundärdokumenten zu tun. Die Sekundärdokumente (Transkription und Standbild) sind in einem erkenntnisgeleiteten Transformationsprozess aus den Primärdokumenten extrahiert worden und repräsentieren einen „eingefrorenen Moment“ der primärdokumentarischen Dynamik und Zeitlichkeit. Dies gilt ganz offensichtlich für Standbilder mit anwesenden Personen, auf denen die Dauerhaftigkeit der Raumnutzung durch die Standbildextraktion auf motivierte Weise in einem Moment verdichtet bzw. aspektualisiert wird. Eine andere Extraktionsentscheidung würde entsprechend auch einen anderen Moment der Raumnutzung zeigen. Die Stillstellung des in der Videoaufzeichnung ablaufenden Geschehens gilt allerdings auch für Standbilder, auf denen keine Personen zu sehen sind und bei denen in manchen Fällen nicht (oder nur bei sehr genauer Beobachtung) überhaupt sichtbar ist, dass es sich um ein Standbild und nicht etwa um ein Videodokument (ohne Ton) handelt, auf dem sich „nichts verändert“. Offensichtlich hat dieser Unterschied mit dem Verhältnis von Gleichzeitigkeit und Nacheinander (Simultaneität und Sequenzialität) zu tun, dem in der Analyse entsprechend Rechnung getragen werden muss (vgl. dazu Dinkelaker/ Herrle 2009, S. 44ff.). Heiko Hausendorf / Reinhold Schmitt 176 Bleibt man bei der Analogie zum Transkript, so ist das Standbild nicht mit dem Gesamttranskript, sondern mit der motivierten Beschränkung auf einen Ausschnitt des Transkripts (z.B. im Sinne einer Äußerung) vergleichbar. Für die Rekonstruktion der interaktionsarchitektonischen Bedeutung des Standbildes sind deshalb zwei basale analytische Fokussierungen notwendig: Einerseits ist es wichtig, das definierte Element (Äußerung bzw. Standbild) im Hinblick auf den eigenen Implikationsreichtum im Detail zu rekonstruieren. Zu dieser Rekonstruktion gehört unter anderem auch die Frage der Gleichzeitigkeit und des Verhältnisses von sehr unterschiedlichen Aspekten. Weil wir es bei Standbildern mit ent-dynamisierten Sekundärdokumenten aus Videoaufzeichnungen zu tun haben, gehört andererseits auch die Beantwortung folgender Fragen dazu: Was muss vorher passiert sein, damit der im Standbild dokumentierte Zustand überhaupt zustande kommt? Und was ist aufgrund des eingefroren Sichtbaren im Anschluss zu erwarten? Für die interaktionsanalytische Standbildanalyse sind also die retrospektive und projektive Kontextualisierung des Standbildes wesentliche methodische Anforderungen. 4.1 Videoaufzeichnung und Standbild: Primär - und Sekundärdokumente Videodokumente werden als primäre Grundlage der Untersuchung multimodaler Interaktion trotz der hier vorgenommenen Konzentration auf Standbilder (natürlich! ) nicht grundsätzlich abgewählt. Die Analyse der Herstellung des Interaktionsraums ist auf die Dokumentation von interaktivem Vollzug in Form von (methodisch anspruchsvoller) Videoaufzeichnungen zwingend angewiesen. Wir schließen Videoaufzeichnungen in unserem aktuellen Reflexionszusammenhang jedoch motiviert aus, weil damit andere methodische Anforderungen als bei der Standbildanalyse verbunden sind. Zum jetzigen Zeitpunkt erscheint uns - auch gemessen an dem, was bislang an raumbezogenen Analyseverfahren für dezidiert interaktionistische Erkenntnisinteressen zur Verfügung steht (siehe oben) - die Konzentration auf Standbilder als Sekundärdokumente (= Extraktionen aus primärdokumentarischen Videoaufnahmen) komplex genug, um sich alleine damit zu beschäftigen. Mit Blick auf die Rekonstruktion interaktionsarchitektonischer Implikationen haben Videoaufzeichnungen zudem, wie schon angemerkt, den heuristischen Nachteil, dass sie den Bereich des möglich und erwartbar Gemachten sofort einschränken, indem sie den tatsächlichen konkreten Vollzug als selektive Realisierung eines funktional äquivalenten Universums alternativer Möglichkeiten als Teil des „Interaktionsraumes“ in den Vordergrund stellen. Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 177 In den Rahmen der Klärung des Verhältnisses von Primär- und Sekundärdokumenten gehört im vorliegenden Reflexionszusammenhang auch die Frage nach den unterschiedlichen Formen, in denen uns Räume und ihre Architektur in primärdokumentarischer Weise überhaupt zugänglich gemacht werden können. Dazu zählen nicht nur (die bislang von uns mehr oder weniger exklusiv genutzten) - Standbilder aus Videoaufzeichnungen, sondern auch - Fotografien und - mit noch einmal anderem Status - auch - Zeichnungen, Skizzen, Pläne sowie Grund- und Aufrisse. Solche Dokumente sind speziell für die Rekonstruktion der interaktionsarchitektonischen Implikationen von zentraler Bedeutung, weil sie nicht bereits Raumnutzungen und/ oder Interaktion zeigen. Sie sind dann zu ergänzen durch Dokumente, auf denen zwingend Raumnutzung, wenn auch noch nicht bereits Interaktion, zu sehen ist. Auch dabei ist die genannte Trias von Standbildern, Fotografien und karto- und piktografischen Darstellungen in Rechnung zu stellen. Tatsächlich können auch Zeichnungen, Skizzen und Pläne - etwa bei der Rekonstruktion faktisch realisierter Laufwege - methodisch berücksichtigt werden, auch wenn der analytische Status solcher Dokumente im Hinblick auf die darin bereits eingehenden Analyseleistungen ein anderer ist. Insbesondere dann, wenn es sich um „Fremddaten“ (Mondada/ Schmitt 2010, S. 40) handelt (wie z.B. die Animation eines Grundrisses im Webportal eines Museums), gelten natürlich die üblichen Kautelen und „Verwertungseinschränkungen“. Diese liegen primär darin begründet, dass man keinerlei Zugang zum Prozess der Datenkonstitution und den dabei realisierten Entscheidungen hat, auch durchaus relevante Aspekte auszuschließen. Die Differenz und Diskrepanz zwischen Primär- und Sekundärdokument und damit auch die Realitätshaltigkeit der Abbildung ist in diesen Fällen nicht adäquat einzuschätzen. Im Prozess der empirischen Beschäftigung mit den unterschiedlichen Formen der empirischen Repräsentation wäre dann das spezifische Erkenntnispotenzial der jeweiligen Repräsentanz-Formen noch auszuloten (siehe Kap. 5). Eine grundsätzliche Frage, die sich aus dem Zusammenhang der Analyse von Interaktionsarchitektur und multimodaler Interaktion auch hier wieder ergibt, ist die nach dem abbild-dokumentarischen Status solcher unterschiedlichen Repräsentanz-Formen im Vergleich zu Transkriptionen. Da wir architektonische Erscheinungsformen (‘gebaute Räume’) oft nicht nur in einer, sondern in unterschiedlicher Repräsentation vorliegen haben, stellt sich die Frage der autonomen Aussagefähigkeit der Repräsentanz-Formen und der Heiko Hausendorf / Reinhold Schmitt 178 Übertragbarkeit und additiven Anreicherung beispielsweise interaktionsarchitektonischer Aussagen auf der Grundlage der Analyse von Standbild und Grundriss. Man kann sich das an folgendem Beispiel gut vergegenwärtigen: Das nachfolgende Standbild (Bild 1) eines Ausstellungsraums (Kesselheim i.d.Bd.) erlegte uns - qua eigener Relevanz - bei der gemeinsamen Analyse die Aufgabe auf, uns vor allem mit den Basiskonzepten von Begehbarkeit und Sichtbarkeit und dabei speziell mit dem Aspekt der visuellen De-Fokussierung und Diffusität zu beschäftigen. Es waren also vor allem Fragen wie „Wohin gehen? “ und „Was anschauen? “, die sich bei der Analyse des Standbildes im Hinblick auf die interaktionsarchitektonischen Implikationen in den Vordergrund drängten. Ausgehend von den Relevanzen des ausgewählten Standbilds selbst (siehe unten) zeigte sich also eine strukturelle Überschüssigkeit an Interaktionsangeboten, was die Basiskonzepte ‘Sichtbarkeit’ und ‘Begehbarkeit’ betrifft. Bild 1: Ausstellungsraum (siehe Beitrag von Kesselheim i.d.Bd.) In scharfem Kontrast dazu betont der (vom Museum online zur Verfügung gestellte und animierte) Grundriss des Ausstellungsraumes den Aspekt der vollständigen Symmetrie und weist eine entsprechende Strukturierung primär begehbarer Flächen aus (im Druck nicht reproduzierbar, siehe aber: www.zm.uzh.ch/ dauerausstellung/ virtuellerrundganghome/ untergeschoss. html). Das interaktionsarchitektonische Angebot an Begehbarkeit (und damit auch: an Sicht- und Besehbarkeit) ist also in der Repräsentanz durch den Grundriss in ganz anderer Weise vorstrukturiert zugunsten klarer Präferenzen. Entsprechend sind die spezifischen Erkenntnismöglichkeiten und Erkenntnisbeschränkungen der jeweiligen Dokumente stets präsent zu halten. 1 Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 179 Mit dem Aspekt der Dokumentspezifik hängen letztlich die für alle Repräsentationsformen gleichermaßen geltenden Fragen der Vollständigkeit bzw. der perspektivischen Aspektualität des im Dokument wiedergegebenen Raumes zusammen. Wenn man vom Ideal einer möglichst umfassenden Raumrepräsentation ausgeht, wie sie etwa im Rahmen von videobasierten Primärdokumenten bei einem Kameraschwenk von 360° im Gegensatz zu einer Ein-Perspektiven-Aufnahme („Ich-Kamera“) realisiert würde, beziehen sich die nachfolgenden Problemaspekte auf die mit der Standbildproduktion und -auswahl verbundenen Ausschnitthaftigkeit des abgebildeten Raumes. Dieser liegt jeweils eine spezifische Perspektive zugrunde, die es als solche natürlich zu reflektieren gilt. Im Bereich der primärdokumentarischen Raumrepräsentation, das heißt hinsichtlich der empirischen Grundlage einer erkenntnismotivierten Standbildextraktion, kann der Raum in sehr unterschiedlicher Weise repräsentiert sein. Typische Formen sind beispielsweise (und ohne Vollständigkeitsanspruch): - Rundfahrten: Videoschwenk von 360°, - Zoom vom Weitwinkel ins Detail (oder umgekehrt), - bewegliche Aufnahme mit Kopfbzw. Brillenkamera (‘Augenhöhe’), - Mono-Perspektivität: vorne, hinten, Seite(n) etc., - Multiperspektivität: der gleiche räumliche Ausschnitt aus unterschiedlicher Sicht (z.B.: Altarraum von der Empore, aus dem Mittelgang, aus dem Seitenschiff), - Schuss und Gegenschuss: vorne und hinten werden bereits bei der Dokumentation als sich ergänzende Perspektiven genutzt. Es ist offensichtlich, dass im Rahmen fallanalytischer Investigation die besonderen Leistungen und Begrenzungen der jeweiligen Dokument-Typen geklärt und jeweils adäquate analytische Zugänge erprobt werden müssen. Nur so lässt sich die Frage beantworten, welche Erkenntnisimplikationen mit den einzelnen Dokumentqualitäten verbunden sind. Es ist evident, dass die Klärung der Frage nach dem Erkenntnispotenzial unterschiedlicher Formen empirischer Raumrepräsentanz im Zentrum methodischer Überlegungen liegt. Das betrifft unter anderem auch die Frage nach dem Dokumentstatus und der Erweiterbarkeit visueller Daten durch Notizen und Aufzeichnungen aus vorgängigen, gleichzeitigen oder nachfolgenden, bereits auf analytische Investigation beruhenden, raumethnografischen Expeditionen (siehe dazu Kap. 5.3). Heiko Hausendorf / Reinhold Schmitt 180 4.2 Analytische Zugänge bei der Standbildanalyse Die raumbezogene Interaktionsanalyse eröffnet und erfordert in Abhängigkeit von der empirischen Repräsentanz und der Dokumentqualität unterschiedliche analytische Zugänge. Nachfolgend werden kurz die analytischen Zugänge dargestellt, die wir bei der Ausarbeitung der Fallanalysen bereits erprobt haben. Diese Skizze standbildanalytischer Zugänge erhebt auch nicht ansatzweise den Anspruch auf Vollständigkeit der faktischen Methodenvielfalt. Auch eine hinreichend substanzielle Darstellung der einzelnen analytischen Zugänge sowie die zwischen ihnen bestehenden Gemeinsamkeiten und Unterschiede kann hier noch nicht geleistet werden (vgl. zu ähnlichen und weiteren Zugängen z.B. auch die Hinweise zur „Konstellationsanalyse“ bei Dinkelaker/ Herrle 2009, S. 93ff.). Wir wollen hier vielmehr betonen, dass - das konversationsanalytische Diktum, die Methodenentwicklung von den Daten selbst her zu betreiben, auch in unserem Erkenntnisrahmen fruchtbar ist und - dass es motivierte Relationen zwischen der Spezifik der Interaktionsarchitektur und der Sozialtopografie und den methodischen Zugängen bei ihrer analytischen Rekonstruktion gibt. Die innerhalb der Fallanalysen dieses Bandes realisierten methodischen Zugänge liefern also in erster Linie Argumente dafür, sich bei der raumanalytischen Gegenstandskonstitution - genau wie bei der Transkriptionsanalyse - von den Relevanzen der in den Daten dokumentierten Interaktionsarchitektur und Sozialtopografie leiten zu lassen. In der Tat gehen wir deshalb davon aus, dass auch Standbilder eine „auferlegte“ analytische Relevanz haben, wenn ihre Beobachtung - wie oben ausgeführt - sich zugunsten der Rekonstruktion interaktionsarchitektonischer Implikationen und sozialtopografischer Nutzungen von einem alltagsweltlichen Vorverstehen und -wissen freizumachen versteht (siehe oben Kap. 3). In diesem Sinne wird z.B. in der Fallanalyse im Beitrag von Hausendorf und Schmitt (i.d.Bd.) zur Eröffnung eines Gottesdienstes dafür argumentiert, dass die auf dem Ausgangsstandbild sichtbaren vier Stühle vor dem Altar eine auferlegte analytische Relevanz haben (Bild 2). Im Gegensatz zu den Kirchenbänken mit ihrer dominanten Festlegung auf das Vorne „zeigen“ diese Stühle mit ihrer Sitzfläche in den Besucherraum hinein und produzieren somit eine - gemessen an unseren Normalformerwartungen - widersprüchliche Wahrnehmung, welche die Stühle per se fragwürdig macht. Das gilt auch, was die Möglichkeiten ihrer angemessenen analytischen Fokussierung und Bearbeitung betrifft. Zugleich kommt in diesem Fall der Gegensatz von gebautem, ausgestattetem und gestaltetem Raum zum Zug: Das Standbild zeigt neben vielem anderen auch, dass die Korbstühle (wie z.B. auch die sichtbaren Stehtische) eine besondere Mobilität aufweisen: Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 181 das Hin- und Aufgestellte als Teil der vergleichsweise „flüchtigen“ Interaktionsarchitektur (siehe dazu die Ausführungen im Beitrag von Hausendorf/ Schmitt im empirischen Teil dieses Bandes). Bild 2: Vier Stühle vor dem Altar (Beitrag Hausendorf/ Schmitt) Die methodische Grundhaltung, die analyserelevanten Aspekte „from the data themselves“ zu gewinnen, die ihre Verankerung im Prinzip der „methodischen Adäquatheit“ hat, wie es Garfinkel/ Wieder (1992) formuliert haben, hält also unsere Orientierung an Vergleichbarkeiten und Unterschieden mit und gegenüber der konversationsanalytischen Methodologie der Transkriptionsanalyse aufrecht und macht diese dadurch auch für die Standbildanalyse fruchtbar. Das kann dann konkret die Form einer aspektualisierten Standbildanalyse annehmen (wie im Fall der vier Stühle vor dem Altar). Es kann aber beispielsweise auch bedeuten, uns in motivierten Segmenten in einer durch das Dokument selbst nahegelegten Weise von links nach rechts schrittweise durch ein Standbild „durchzuanalyiseren“, um mit dieser gezielten Verfremdung einen Gesamtüberblick über das interaktionsarchitektonische Potenzial eines Raumes zu bekommen (Bild 3 bis 7): Dieses Verfahren einer segmentalen Standbildanalyse stand am Anfang der Analysen des Klassenraumes, die Ulrich Dausendschön-Gay und Reinhold Schmitt vorgenommen haben (siehe dazu den Beitrag im empirischen Teil). 4 4 Die hier angesprochenen Verfahren der aspektualisierten und der segmentalen Standbildanalyse werden in Hausendorf/ Schmitt (2013) SpuR01 näher erläutert; die methodologischen Im- 2 Heiko Hausendorf / Reinhold Schmitt 182 3 4 5 … → … 6 7 Hinsichtlich der interaktionsarchitektonischen Analyse des vollständigen Standbildes reagiert das methodische Verfahren in diesem Fall auch darauf, zumindest in einem ersten Schritt (bei der Analyse des ersten Segments) die Dominanz sozialtopografischer Aspekte auszuschließen, die automatisch in den Vordergrund tritt, wenn Raumnutzung sichtbar wird. Man kann hier also auch sehen, dass man das Grundprinzip der methodischen Zweischrittigkeit (siehe oben) mit Gewinn auch dann realisieren kann, wenn man keine Aufnahmen von unbelebten bzw. ungenutzten Räumen zur Verfügung hat. In plikationen der segmentalen Standbildanalyse werden detailliert dargelegt in Schmitt/ Dausendschön-Gay (2015, Spur04). Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 183 solchen Fällen lässt sich ein unbelebtes Segment als erster Schritt des analytischen Vorgehens aus dem Gesamtbild „heraus-segmentieren“ und dann in dekontextualisierter Weise zum Fokus der raumbezogenen Analyse machen (vgl. dazu auch das Verfahren der „Dekontextualisierung“ bei Dinkelaker/ Herrle 2009, S. 95). Wir wollen nicht unterschlagen, dass die vorgenommene Differenzierung von aspektualisierter und segmentaler Standbildanalyse eine Idealisierung darstellt, da sie die Möglichkeit und Notwendigkeit der Verbindung einzelner Methoden bewusst außer Acht lässt. Es liegt aber auf der Hand, dass beispielsweise die segmentale Bildanalyse auch bei der aspektualisierten Bildanalyse als methodisierte Form der Standbildbeschreibung eingesetzt werden kann (bzw. muss). Dies gilt in gewisser Weise für alle Fallanalysen, da alle Beiträge mit dem Problem der Unmöglichkeit der nicht-sequenzierten Gesamtbeschreibung räumlicher Aspekte zu tun haben („Überkomplexität videographischer Daten“ im Sinn von Dinkelaker/ Herrle 2009, S. 41f.). 5. Ausblick Auf der Grundlage unserer bisherigen Auseinandersetzungen mit Standbildern als eigenständigen Dokumenten und den methodischen Verfahren ihrer Analyse lassen sich unterschiedliche Aspekte andeuten, die bei der weiteren Entwicklung der Standbildanalyse eine wichtige Rolle spielen werden. Das gilt bereits für die Datenkonstitution. Bislang haben wir bei der Konstitution von Standbildern auf Videoaufzeichnungen von Interaktion (= audiovisuelle Dokumente) zurückgegriffen. Diese Möglichkeit (und die damit auch gegebenen Beschränkungen) haben wir der Tatsache zu verdanken, dass solche Dokumente in vielen Fällen und oft in hinreichend adäquater Weise immer auch die Interaktionsarchitektur und Sozialtopografie mitdokumentieren. Dabei blieb es bislang in der Regel dem Zufall überlassen, ob man über die Videoaufzeichnungen hinaus auch interaktionsvorgängige Architekturdokumente zur Verfügung hat und ob diese aus einer analysetauglichen Perspektive heraus erzeugt worden sind (oder als in mancher Hinsicht problematische „Fremddaten“ vorliegen). Da dies in vielerlei Hinsicht unbefriedigend ist, wird es zukünftig darauf ankommen, die Datenkonstitution erkenntnisgesteuert neu zu justieren und spezielle (Primär-)Daten für die Analyse von Interaktionsarchitektur und Sozialtopografie zu realisieren. Die Planungs- und Vorphase einer solchen Datendokumentation gestaltet sich dabei anders als bei der Dokumentation fokussierter Interaktion. Dies hängt mit unterschiedlichen Aspekten zusammen, über deren faktische Implikationen wir im Moment noch relativ wenig wissen. Das ist zum einen die Heiko Hausendorf / Reinhold Schmitt 184 im Falle dauerhaft existierender Räume grundsätzliche Reproduzierbarkeit bzw. Erweiterbarkeit interaktionsarchitektonischer Dokumente, die eine Wiederholung einer Videoaufnahme und/ oder einer Fotostrecke des Raums problemlos ermöglicht. Das eröffnet die Möglichkeit, bestimmte Aspekte, die sich (erst) bei der Analyse als relevant - jedoch nicht dokumentiert - herausstellen, „nachzudokumentieren“. Im Unterschied zu Interaktionsdokumenten geschieht das, ohne dass sich dabei die für die Analyse wichtige Dokumentengrundlage - außer in Form einer additiven Anreicherung - grundsätzlich verändert. Man nähert sich damit einer Forschungsstrategie (wie beispielsweise bei ethnografischen Untersuchungen) an, für welche die Phase der Dokumentation und Analyse sequenziell austauschbare Episoden sein können bzw. auch gleichzeitig vollzogen werden können. Den Nutzen solcher „Nach-Erhebungen“ kann man sich nicht nur im Bereich video- oder fototechnischer Dokumente vorstellen, durch welche bislang „übergangene“ Raumausschnitte bzw. Architekturdetails nachgeliefert werden können. Wenn beispielsweise die Analyse der interaktionsarchitektonischen Dokumente die Relevanz eines der interaktionsarchitektonischen Basiskonzepte („Begehbarkeit“ oder „Verweilbarkeit“ etc.) verdeutlichen, kann es notwendig werden, die genauen Verhältnisse und Dimensionen begehbarer Flächen und/ oder die exakte Positionierung von Personen und die dadurch realisierte Relationierung zur räumlichen Umgebung auch tatsächlich vor Ort zu vermessen und diese Messdaten dann sowohl für die Analyse als auch für die Animation bei der Ergebnispräsentation (siehe Kap. 5.3) zu nutzen. Zum anderen kann man bei der Datenkonstitution einen Aspekt produktiv machen, der bei der Anfertigung von Interaktionsdokumenten als durchgängig negativ angesehen wird: die aktive Rolle des dokumentierenden Forschers. Es gilt bekanntlich und zurecht als hochgradig problematisch, wenn der Forschende einen aktiven Beitrag zur Datenkonstitution leistet, indem er selbst innerhalb der Interaktion als Beteiligter agiert und dabei hör- und sichtbar, also zum Bestandteil der Interaktion wird, die er dokumentieren will. Genau dieser Aspekt kann nun bei der Konstitution von Dokumenten und für die Analyse der Interaktionsarchitektur bewusst eingesetzt werden. Vor allem im Zusammenhang mit Untersuchungen zur Sozialtopografie, wenn es beispielsweise um die Reflexion der eigenen online-analytischen sozialtopografischen Kompetenz geht, kann es interessant sein, mit unterschiedlichen Varianten „besprochener Dokumente“ zu experimentieren (vgl. dazu Schmitt demn.). Neben der Datenkonstitution stellt die Ergebnispräsentation eine weitere Baustelle dar. Sie wird durch die Frage eröffnet, wie man Ergebnisse von Interaktionsarchitekturanalysen und der Analyse von Sozialtopografie in unter- Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 185 schiedlichen Publikations- und Präsentationsmedien (Bücher, online oder Powerpoint-Vorträge etc.) darstellen kann. Hier ist die momentan überwiegende einfache Reproduktion von Standbildern sicherlich nicht das „Ende der Fahnenstange“. Zukünftig wird es vor allem darum gehen, systematisch mit Softwareunterstützung zu experimentieren und z.B. 3-D-Animationen der in den Standbildern dokumentierten Räume zu erstellen. Arbeitet man zukünftig mit Videodokumenten, die speziell für raumbezogene Erkenntnisinteressen erstellt wurden, kann man sich auch die 3-D-Animation einzelner Videosequenzen ohne den Umweg über Standbilder vorstellen. Man müsste dann beispielsweise die Möglichkeit haben, die von den Anwesenden faktisch eingenommenen Positionen im Raum zum Zentrum der Animation zu machen. Man könnte dann aus ihrer Perspektive (und unter der Voraussetzung, dass man die Möglichkeit zu 360°-Bewegungen im animierten Raum hat) erkennen, was ihre konkrete Position in Relation zur Raumumgebung tatsächlich impliziert, was von dieser Position aus gesehen werden kann und vieles mehr. Und natürlich würde man diese Möglichkeit nicht nur für die Ergebnispräsentation, sondern vielmehr bereits bei der vorgängigen Analyse nutzen wollen. Auch dieser recht fragmentarische Ausblick hat einen Aspekt sehr deutlich werden lassen: Im Bereich der Datenkonstitution und der Ergebnispräsentation stellen sich bei der Interaktionsarchitekturanalyse und bei der Untersuchung der Sozialtopografie Anforderungen, die weit über unsere bisherigen Kompetenzgrundlagen hinausgehen, die aus der langjährigen analytischen Beschäftigung mit Interaktion entstanden sind. Diese neuartigen Anforderungen verlangen die Bündelung sehr unterschiedlicher Expertisen (Linguistik, Architektur, Soziologie und Software-Entwicklung, um nur einige zu nennen) und die Bereitschaft zum Experimentieren. 6. Literatur Bohnsack, Ralf (2009): Qualitative Bild- und Videoanalyse. Die dokumentarische Methode. Opladen/ Farmington Hills: Barbara Budrich. Dinkelaker, Jörg/ Herrle, Matthias (2009): Erziehungswissenschaftliche Videografie. Eine Einführung. Wiesbaden: VS Verlag für Sozialwissenschaften. Emmison, Michael/ Smith, Philip (2000): Researching the visual. London u.a.: Sage. Fischer-Lichte, Erika (2006): Kirchenräume als performative Räume. In: Artheon-Mitteilungen 24, S. 19-25. Garfinkel, Harold/ Wieder, Lawrence, D. (1992): Two incommensurable, asymmetrically alternate technologies of social analysis. In: Watson, Graham/ Seiler, Robert, M. (Hg.): Text in context. Contributions to ethnomethodology. Newbury Park u.a.: Sage, S. 182-206. Heiko Hausendorf / Reinhold Schmitt 186 Gibson, James J. (1977): The theory of affordances. In: Shaw, Robert/ Bransford, John (Hg.): Perceiving, acting, and knowing. Toward an ecological psychology. Hillsdale, NJ: Erlbaum, S. 67-82. Goffman, Erving (1963): Behavior in public places: Notes on the social organization of gathering. New York: Free Press. Hausendorf, Heiko (2003): Deixis and speech situation revisited. The mechanism of perceived perception. In: Lenz, Friedrich (Hg.): Deictic conceptualisation of space, time and person. Amsterdam/ Philadelphia: Benjamins, S. 249-269. Hausendorf, Heiko (2013): On the interactive achievement of space - and its possible meanings. In: Auer, Peter/ Hilpert, Martin/ Stukenbrock, Anja/ Szmrezcsanyi, Benedikt (Hg.): Space in language and linguistics. Geographical, interactional and cognitive perspectives. Boston/ New York: de Gruyter, S. 276-303. Hausendorf, Heiko (2015): Interaktionslinguistik. In: Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. Berlin/ Boston: de Gruyter, S. 43-69. Hausendorf, Heiko (i.Dr.): Warum wir transkribieren. Anmerkungen aus der Welt der linguistischen Gesprächsforschung. In: Text. Zeitschrift im Auftrag des Instituts für Textkritik e.V. 15. Heath, Christian/ Hindmarsh, Jon/ Luff, Paul. (2010): Video in qualitative research: Analyzing social interaction in everyday life. London: Sage. Kendon, Adam (1990): Spatial organization in social encounters: The F-formation system. In: Kendon, Adam: Conducting interaction - Patterns of behavior in focused encounters. Cambridge: Cambridge University Press, S. 209-237. Kissmann, Ulrike Tikvah (Hg.) (2009): Video interaction analysis: Methods and methodology. Frankfurt a.M.: Lang. Knoblauch, Hubert/ Schnetter, Bernt/ Tuma, René (2009): Videographie. Einführung in die interpretative Videoanalyse sozialer Situationen. Wiesbaden: Springer VS. Luckmann, Thomas (Hg.) (1979): Verhaltenspartituren: Notation und Transkription. Zeitschrift für Semiotik 2, 1. Wiesbaden Athenaion. Luckmann, Thomas (2009): Some remarks on scores in multimodal sequential analysis. In: Knoblauch, Hubert/ Schnettler, Bernt/ Raab, Jürgen/ Soeffner, Hans-Georg (Hg.): Video analysis: Methodology and methods. Qualitative audiovisual data analysis in sociology. 2., überarb. Aufl. Frankfurt a.M.: Lang, S. 29-34. Mondada, Lorenza (2007): Interaktionsraum und Koordinierung. In: Schmitt (Hg.), S. 54-91. Mondada, Lorenza/ Schmitt, Reinhold (2010): Zur Multimodalität von Situationseröffnungen. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen: Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 7-52. Moritz, Christine (Hg.) (2014): Transkription von Video- und Filmdaten in der Qualitativen Sozialforschung. Multidisziplinäre Annäherungen an einen komplexen Datentypus. Wiesbaden: Springer VS. Standbildanalyse als Interaktionsanalyse: Implikationen und Perspektiven 187 Oevermann, Ulrich/ Allert, Tilmann/ Konau, Elisabeth/ Krambeck, Jürgen (1979): Die Methodologie einer „objektiven Hermeneutik“ und ihre forschungslogische Bedeutung in den Sozialwissenschaften. In: Soeffner, Hans-Georg (Hg.): Interpretative Verfahren in den Sozial- und Textwissenschaften. Stuttgart: Metzler, S. 352-434. Rose, Gillian (2001): Visual methodologies. London: Sage. Schegloff, Emanuel A./ Sacks, Harvey (1973): Opening up closings. In: Semiotica 8, S. 289-327. Schmitt, Reinhold (2006): Videoaufzeichnungen als Grundlage für Interaktionsanalysen. In: Dickgießer, Sylvia/ Reitemeier, Ulrich/ Schütte, Wilfried (Hg.): Symbolische Interaktionen: Einführung in den Kolloquiumsband. (= Sonderheft Deutsche Sprache 34, 1-2). Berlin: Schmidt, S. 18-31. Schmitt, Reinhold (2007a): Theoretische und methodische Implikationen der Analyse multimodaler Interaktion. In: Holly, Werner/ Paul, Ingwer (Hg.): Medialität und Sprache. (= Mitteilungen des Deutschen Germanistenverbandes 54, 1). Bielefeld: Aisthesis, S. 26-53. Schmitt, Reinhold (2007b): Von der Konversationsanalyse zur Analyse multimodaler Interaktion. In: Kämper, Heidrun/ Eichinger, Ludwig M. (Hg.): Sprachperspektiven. Germanistische Linguistik und das Institut für Deutsche Sprache. (= Studien zur Deutschen Sprache 40). Tübingen: Narr, S. 395-417. Schmitt, Reinhold (Hg.) (2007): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr. Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 68). Tübingen: Narr. Schmitt, Reinhold (demn.): Zur Konstitution von Dokumenten für raumanalytische Erkenntnisinteressen: Ein Praxisbericht. Schmitt, Reinhold (i.Vorb.): Methodische Grundlagen der multimodalen Interaktionsanalyse: Das Verfahren der visuellen Erstanalyse. Schmitt, Reinhold/ Dausendschön-Gay, Ulrich (2015): Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse. (= Arbeitspapiere des UFSP Sprache und Raum (SpurR) 4). Zürich. www.spur.uzh.ch/ research/ publications/ SpuR_Arbeitspapier_Nr04_150711.pdf (Stand: Juni/ 2016). Streeck, Jürgen/ Goodwin, Charles/ LeBaron, Curtis (Hg.) (2014): Embodied interaction. Language and body in the material world. Cambridge: Cambridge University Press. Stukenbrock, Anja (2014): Deixis in der face-to-face Interaktion. Berlin/ Boston: de Gruyter. van Leeuwen, Theo/ Jewitt, Carey (2001): Handbook of visual analysis. London: Sage. van Lehn, Dirk vom (2014): Transkription und ethnomethodologische Videoanalyse. In: Moritz (Hg.), S. 391-406. Heiko Hausendorf / Reinhold Schmitt 188 Gliederung 1. Einführung ............................................................................................................161 2. Interaktionsanalyse versus Bildanalyse ............................................................165 3. Vorwissen und Verfremdung .............................................................................170 4. Analyseperspektiven und Analyseverfahren...................................................174 4.1 Videoaufzeichnung und Standbild: Primär- und Sekundärdokumente......176 4.2 Analytische Zugänge bei der Standbildanalyse ..............................................180 5. Ausblick .................................................................................................................183 6. Literatur .................................................................................................................185 REINHOLD SCHMITT DER „FRAME - COMIC“ ALS DOKUMENT MULTIMODALER INTERAKTIONSANALYSEN 1 1. Vorbemerkung Die folgenden Ausführungen zum Frame-Comic sind in die Struktur des Sammelbandes integriert. Auf der einen Seite führt der Beitrag punktuell die Überlegungen zur Relevanz von Standbildern für die multimodale Interaktionsanalyse weiter, wie sie in dem Beitrag zur Standbildanalyse von Hausendorf/ Schmitt (i.d.Bd.) vorgestellt werden. Zum anderen steht der Beitrag in einem engen Verhältnis zur Studie „Freiraum schaffen im schulischen Funktionsraum“ (Schmitt/ Dausendschön-Gay 2015). Dieses Verhältnis wird neben der grundsätzlichen bidirektionalen Verweisstruktur beider Beiträge, die sich hinsichtlich ihrer methodologischen Reflexion wechselseitig stützen und ergänzen, vor allem durch den Aspekt der Arbeitsteilung charakterisiert. Die Studie zum Freiraum stellt im Rahmen dieses arbeitsteiligen Verhältnisses eine fallspezifische Exemplifizierung des methodischen Vorgehens bei der Frame-Comic-Analyse dar. Hier wird fallbezogen demonstriert, wie die Frame- Comic-Analyse funktioniert und welches Erkenntnispotenzial damit verbunden ist. Aus diesem Grund habe ich im vorliegenden Text auf eine exemplarische Analyse verzichtet. 2. Frame - Comic? Eine erste Annäherung Die videobasierte Entdeckung der Relevanz des Visuellen für die Interaktionskonstitution führt im Kontext der multimodalen Interaktionsanalyse zur Entwicklung von speziell auf die visuell wahrnehmbaren Aspekte des interaktiven Verhaltens bezogenen Analyseverfahren und Verfahren der Datenkonstitution. Ich will nachfolgend unter dem Begriff „Frame-Comic“ einen bestimmten Typus visuell konstituierter (Sekundär-)Daten präsentieren, der im Zusammenhang mit der Entwicklung der „visuellen Erstanalyse“ (Kap. 4) als eigenständiges Analyseverfahren der multimodalen Interaktionsanalyse entstanden ist. Zum besseren Verständnis will ich an dieser Stelle vorgreifend eine kurze Definition dessen geben, was ich unter einem Frame-Comic verstehe. Im Laufe der nachfolgenden Ausführungen, bei der die Genese des Frame- 1 Dieser Beitrag ist eine stark komprimierte, speziell auf den Sammelband zugeschnittene Version eines detaillierter ausgearbeiteten Manuskripts mit dem Titel Methodische Verfahren der multimodalen Interaktionsanalyse: „Visuelle Erstanalyse“ und „Frame-Comic“ (Schmitt i.Vorb.). Reinhold Schmitt 190 Comics dargestellt wird, werden alle relevanten Aspekte dieser Definition wieder aufgegriffen und detailliert diskutiert. Der Frame-Comic ist - wie ein Transkript - ein Sekundärdokument, das für die Analyse bestimmter Fragestellungen im Rahmen von Interaktionsanalysen und raumanalytischen Erkenntnisinteressen als empirische Grundlage entwickelt wurde. Der Frame-Comic besteht aus einer Abfolge von Standbildern, die in motivierter Weise als Frames aus einer Videoaufnahme extrahiert werden. Diese Standbildfolge bildet - wie ein gezeichneter Comic - wichtige Stadien und Veränderungen eines kohärenten und konsistenten Handlungszusammenhangs ab (beispielsweise eine zeitlich begrenzte, situative Raumnutzung oder eine raumgebundene und raumbezogene soziale Praktik wie „Warten“ (Dausendschön-Gay/ Schmitt i.d.Bd.)). Der Frame-Comic stellt eine handlungskonsistente Standbildfolge dar, wodurch der abgebildete Zusammenhang, obwohl zwischen den einzelnen Frames vieles ausgelassen wird, in seiner grundlegenden Struktur versteh- und analysierbar wird. Dies liegt primär an der Wirksamkeit zweier Prinzipien: dem Kontinuitätsprinzip und dem Kontiguitätsprinzip. Das Kontinuitätsprinzip garantiert, dass die ausgewählten Bilder nicht aus unterschiedlichen und inkonsistenten Handlungszusammenhängen stammen. Das Kontiguitätsprinzip gewährleistet, dass die einzelnen Frames in ihrer Sequenzialität tatsächlich benachbart sind, wodurch keine Sprünge entstehen und die Bilder auch nicht in ihrer Platzierung getauscht werden können. Aus analytischer Perspektive ist der Frame-Comic gerade wegen der motivierten Auslassungen von besonderem Interesse, weil die dadurch bewusst herbeigeführte „Informationsverknappung“ und „Ent-Dynamisierung des Vollzugs“ spezifische Rekonstruktionsverfahren verlangt. Für den Frame-Comic sind zwei Aspekte konstitutiv: zum einen die methodisch motivierte Auflösung der zeitlichen Kontinuität des Videos durch die Selektion einzelner Frames und die damit geschaffene Statik sequenziell geordneter Einzelbilder; zum anderen die ebenfalls methodisch induzierte Abwesenheit von Verbalität. Der Frame-Comic ist also ein ausschließlich visuell wahrnehmbares Dokument ohne Anbindung an ein verbales Transkript: Aufgrund seines Status als autonomes Sekundärdokument fehlt dem Frame- Comic nicht nur kein Transkript, sondern er will auch keins haben! Aufgrund dieser Eigenschaften ist der Frame-Comic beispielsweise eine adäquate und notwendige empirische Grundlage für die Analyse situativer Raumnutzung. Für die sozialtopografische Analyse sind die einzelnen Entwicklungsstadien des Frame-Comics wesentlich besser geeignet als der voll- Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 191 ständig dokumentierte Vollzug dieser Raumnutzung (Einleitung von Hausendorf/ Schmitt i.d.Bd.; Schmitt/ Dausendschön-Gay i.d.Bd.). Und auch im Kontext visueller Erstanalysen ist der Frame-Comic ein adäquates empirisches Dokument. Und noch ein klärender Hinweis zum Abschluss dieser Vorinformation: Die Konstitutionslogik des Frame-Comics ist gänzlich unterschieden von aktuellen Versuchen (beispielweise Laurier 2014a, b), zur Gestaltung multimodaler Transkripte tatsächlich Anleihen beim Comic zu machen. Laurier (2014a) lässt beispielsweise die gemeinsam im Auto Sitzenden in gezeichneten Sprechblasen sprechen, so wie wir sie aus Comic-Zeichnungen kennen. Er geht noch einen Schritt weiter und repräsentiert mittels Sprechblasen im Bild verbale Aktivitäten von Beteiligten, die selbst nicht zu sehen sind (Laurier 2014b). Aus multimodaler Sicht ist das nicht unproblematisch, da dadurch die grundsätzliche Egalität auditiv und visuell wahrnehmbarer Informationen zu Lasten des Visuellen „überschrieben“ wird. Das ist im engen Wortsinn zu verstehen, denn die Sprechblasen überdecken einen nicht gerade geringen Teil des im Bild Sichtbaren und heben dadurch das Verbale deutlich hervor. Im Zentrum des Beitrags steht die Beschäftigung mit folgenden Fragen: - Was ist der methodische Eigenwert des Frame-Comics als empirische Grundlage für multimodale Interaktionsanalysen? - Wie sieht der Prozess des visuellen Segmentierens als zentrale Prozedur der Konstitution eines Frame-Comics aus? - Wie gestaltet sich das Verhältnis des Frame-Comics zum Verbaltranskript? - Was sind die Potenziale und Grenzen des Frame-Comics? Bevor ich mich der Beantwortung dieser Fragen zuwende, will ich zum besseren Verständnis kurz den übergeordneten Rahmen skizzieren, in dem der Frame-Comic steht. Der Frame-Comic steht im Zusammenhang mit Überlegungen zur visuellen Erstanalyse (detailliert hierzu Schmitt i.Vorb.: Kap. 6.1) als einem systematischen Versuch der gegenstandsadäquaten Entwicklung eigenständiger multimodaler Analyseverfahren. Bei der visuellen Erstanalyse handelt es sich um ein methodisches Verfahren, das zu Beginn der Konstitutionsanalyse audiovisueller Interaktionsdokumente bewusst das gesamte akustisch wahrnehmbare Interaktionsgeschehen ausklammert. Die visuelle Erstanalyse 2 stellt je- 2 Die Bezeichnungen ‘visuelle Erstanalyse’ und die in Kapitel 7 verwendete Bezeichnung ‘visuelles Segmentieren’ sind im Sinne der unökonomischen Langform zu lesen als: ‘Analyse visuell wahrnehmbaren Verhaltens ohne Bezugnahme auf verbale Aktivitäten’ und ‘Segmentierung visuell wahrnehmbaren Verhaltens ohne Bezugnahme auf verbale Aktivitäten’. Reinhold Schmitt 192 doch kein Gegenverfahren oder substitutiven Zugang zur Verbalanalyse dar. Es gelangt vielmehr entweder bei spezifischen Fragestellungen oder bei der bewussten Entwicklung methodischer Verfahren der multimodalen Interaktionsanalyse zum Einsatz. Der methodisch motivierte Ausschluss auditiver Erscheinungsformen (insbesondere solcher sprachlicher Natur) produziert an Stelle von Verbaltranskripten Standbilder und Standbildfolgen als empirische Basis der Analyse. Diese haben den gleichen Stellenwert wie Verbaltranskripte und werden wie diese sequenzanalytisch bearbeitet (siehe dazu den Beitrag zur Standbildanalyse von Hausendorf/ Schmitt i.d.Bd.). Visuelle Erstanalysen stehen am Anfang eines mehrschrittigen methodischen Verfahrens, bei dem mit jeweils spezifischer Fokussierung auf bestimmte Aspekte (Ausdrucksressourcen oder Aspekte der Interaktionskonstitution) wiederholt durch denselben Dokumentausschnitt „gegangen“wird.IchbezeichnediesegenerelleStrukturderkonstitutionsanalytischen Rekonstruktion als „systematische analytische Rekurrenz“ (Schmitt i.Vorb.). Der Frame-Comic ist ein spezifisches Ergebnis dieser visuell wahrnehmbaren und konstituierten Sekundärdaten in Form von Standbildern. 3. Wie analysiert man eine Gesprächspause? Die methodischen Überlegungen zum Frame-Comic gehen auf die Rekonstruktion der interaktiven Struktur einer längeren Gesprächspause 3 zurück (Schmitt 2004). Bei der Sichtung so genannter Pitching-Situationen im Kontext der Ausbildung von Filmstudenten 4 (Heidtmann 2009) fiel eine etwa 14-sekündige Gesprächspause auf und rückte in den analytischen Fokus. In dieser Phase passierte - ohne dass gesprochen wurde - ausgesprochen viel, und es war möglich, das interaktive Geschehen und den Gang der Interaktionskonstitution gänzlich ohne den vorherigen und nachfolgenden Kontext, in dem gesprochen wird, allein aufgrund des visuell wahrnehmbaren Verhaltens der Beteiligten detailliert zu rekonstruieren. Möglich war dabei nicht nur die Rekonstruktion einzelner Entwicklungsetappen der Interaktion in der Gesprächspause. Es konnten darüber hinaus auch unterschiedliche Beteiligungsweisen der Studierenden identifiziert, der pragmatische Gehalt ihrer interaktiven Präsenz formuliert und eine klare Hypothese (eine Seh-Art) entworfen werden, die erklären konnte, warum es gerade ein spezifisches Mitglied der studentischen Gruppe war, das diese Gesprächspause beendet. 3 Der Begriff ‘Gesprächspause’ ist aus multimodal-interaktionistischer Perspektive problematisch, da das Gespräch, d.h. die verbalen Aktivitäten, immer noch den normativen Bezugspunkt darstellen. Die korrekte, wenn auch etwas „eckige“ Formulierung wäre demnach ‘Interaktionsphase ohne verbale Aktivitäten’. 4 Pitchings sind Arbeitssitzungen, in denen Filmstudenten gemeinsam mit Dozenten Ideen für Filme entwickeln. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 193 Da es in der Gesprächspause keine verbalen Aktivitäten gibt, konnte bei der Analyse ihrer interaktiven Struktur kein klassisches Transkript als empirische Grundlage eingesetzt werden. Gleichwohl war es aus Gründen der Intersubjektivierung der empirischen Grundlage und der Analyseergebnisse nötig, eine für das spezifische Erkenntnisinteresse adäquate empirische Basis zu erstellen. Es war klar, dass sie in der Dokumentation ausschließlich visuell wahrnehmbaren Verhaltens bestehen musste. Vergleichbar dem Verbaltranskript sollte es sich um ein Sekundärdokument handeln, das die Dynamik der Videoaufzeichnung in systematischer Weise in die Statik einzelner, sequenziell geordneter und motiviert ausgewählter Standbilder überführt. Für die Logik der Standbildextraktion war die Orientierung bestimmend, primär den Wechsel von statischen Phasen und Momenten im Auge zu behalten, in denen sich die Beteiligten in signifikanter Weise bewegten, ihre Kopfhaltung und Blickrichtung veränderten, ihre Sitzposition modifizierten etc. Als Ergebnis dieses Transformationsprozesses entstand eine Abfolge von Standbildern, die nun in vergleichbarer Weise wie ein Transkript als Bezugspunkt der konstitutionsanalytischen Rekonstruktion dienen konnte. Sie sah wie folgt aus: Beginn der Gesprächspause Blickveränderung Özkan 1 2 Reinhold Schmitt 194 Blick Anja zu Michael Anja Hand am Kinn 3 4 5 6 Michael Hand am Kinn Özkan Hand am Kinn Da der fallspezifische Charakter im Vordergrund meines Erkenntnisinteresses stand, habe ich mir damals über die Tragweite der methodischen Implikationen dieses Vorgehens der durch die Relevanz der Daten selbst konstituierten Standbildfolge keine weiterführenden Gedanken gemacht. Ich wollte (vor allem in Bezug auf die systematische Untersuchung von Bergmann 1982) wissen, was man mehr und anderes als die klassische Konversationsanalyse über Gesprächspausen erfahren kann, wenn man sie zum Gegenstand der multimodalen Interaktionsanalyse macht. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 195 Ich verfügte damals noch nicht über das Konzept ‘Frame-Comic’ und die dafür nötige methodologische Sensibilität, um die konstituierte Standbildfolge im expliziten Vergleich und Kontrast mit Verbaltranskripten in ihrer spezifischen, interaktionsdokumentarischen Eigenwertigkeit zu reflektieren. Dieses methodologische Bewusstsein entstand schrittweise, primär motiviert durch die Zusammenarbeit mit Heiko Hausendorf und der sich dabei entwickelnden Frage nach der erkenntnismäßigen Eigenständigkeit und methodischen Salienz von Standbildern für interaktionistische Erkenntnisinteressen. Gleichwohl war die damalige analytische Beschäftigung mit der interaktiven Struktur einer längeren Interaktionsphase, in der nicht gesprochen wird, der erste Schritt in Richtung Frame-Comic. Es war die erste Konstitution einer ausschließlich aus visuellem Verhalten bestehenden Folge motivierter Standbilder als eigenständigem Dokument multimodaler Interaktionsanalyse. 5 Die Analyse der Gesprächspause ist ein clear case im Kontext der Notwendigkeit, visuell wahrnehmbare Interaktion aufgrund ihrer eigenen Vollzugssystematik zu rekonstruieren. Turn-Design, Wortwahl, Formulierungsdynamik, Prosodie etc. fallen als verbalitätsspezifische, akustisch wahrnehmbare Hilfstruppen in diesem Falle ja aus. Hat man sich dazu entschieden, die interaktive Struktur und den Konstitutionsgang der Gesprächspause zum Gegenstand zu machen, ist man alternativlos auf eine Abfolge von systematisch extrahierten Standbildern als empirische Grundlage angewiesen. Solche Analysen sind kein akademischer Selbstzweck. Es sind primär zwei Gründe, die ihre Relevanz ausmachen. Zum einen sind Analysen visuell wahrnehmbaren Verhaltens Lösungen für Probleme, die bei der Verfolgung fallspezifischer Fragestellungen als methodisches Erkenntnisinstrumentarium entstehen. In dieser Hinsicht können - und wollen - visuelle Analysen die Rekonstruktion verbaler Strukturen als wesentliche Bestandteile der Interaktionskonstitution natürlich nicht ersetzen. Die eigenständige Analyse visuell wahrnehmbaren Verhaltens ist vielmehr integraler Bestandteil der Analyse des Gesamtverhaltens der Interaktionsbeteiligten auf der Basis einer systematischen methodischen Rekurrenzstruktur. Zum anderen ist die Analyse visuell wahrnehmbaren Verhaltens das zentrale methodische Verfahren im Kontext spezifischer Fragestellungen, die sich auf die Rekonstruktion situativer Ordnungsstrukturen beziehen, welche die Beteiligten unter motivierter Abstinenz von Verbalität produzieren. 6 5 Der Frame-Comic kam (ohne methodologische Reflexion) bereits bei der Analyse von „Gehen als situierte Praktik“ (Schmitt 2012a) und der Rekonstruktion der „Störung und Reparatur eines religiösen Ritus“ (Schmitt 2012c) zum Einsatz. 6 Zu weiteren Untersuchungen, die ausschließlich visuell wahrnehmbares Verhalten zum Gegenstand haben, siehe beispielsweise „Gehen als situierte Praktik“ (Schmitt 2012a, 2012c) sowie „Be-Greifen“ relevanter Aspekte der unmittelbaren interaktionsarchitektonischen Umgebung (Schmitt 2013a). Reinhold Schmitt 196 4. Visuelle Erstanalyse Es gibt im Rahmen multimodaler Interaktionsanalysen die Möglichkeit, mit der Rekonstruktion der visuell wahrnehmbaren Interaktionsphänomene auch in solchen Fällen zu beginnen, in denen auditiv wahrnehmbares Verhalten für die Interaktionskonstitution zentral ist. Eine solche Entscheidung führt dann zur visuellen Erstanalyse, mit der die multimodale Komplexität des Interaktionsdokuments motiviert reduziert werden kann. Dieser Analysegang kann auf der Grundlage von Videosegmenten, Standbildfolgen und in bestimmten Fällen auf der Grundlage von Frame-Comics durchgeführt werden. Der Begriff ‘visuelle Erstanalyse’ 7 verweist auf die Position und Funktionalität dieses Verfahrens: Nur wenn die Analyse des visuellen Interaktionsverhaltens noch nicht durch das konstitutionsanalytische Wissen um das verbale Geschehen beeinflusst ist, ist das Verfahren hinsichtlich der Identifikation neuer, für die Interaktionskonstitution relevanter Aspekte und in deskriptivkategorialer Hinsicht produktiv. Die visuelle Erstanalyse ist in dieser Hinsicht ausgesprochen implikationsreich und erkenntnisgenerierend. Bei der detaillierten Deskription visueller Verhaltensaspekte bildet sich gerade durch das Fehlen eines auf Verbalität bezogenen kategorialen Vorverständnisses eine strukturreflexive, deskriptive Beschreibungssprache aus. Dieser deskriptive Beschreibungsmodus ist geeignet, visuell wahrnehmbare Aspekte der Interaktionskonstitution auch in ihrer „versteckten“ pragmatischen Relevanz in den Blick zu nehmen. Bei der visuellen Erstanalyse eines Videoausschnitts vom Filmset (Schmitt/ Deppermann 2007) konnte man so z.B. sehen, wie die Regisseurin ihre Kamerafrau durch eine Umarmung und eine gleichzeitig realisierte Bewegung um die eigene Achse „dreht“. Nachdem anhand der sprachlichen Erscheinungsformen der Szene nachfolgend eine Auseinandersetzung zwischen den beiden Protagonistinnen rekonstruiert werden konnte, wurde das Umdrehen im Sinne eines gesprächsrhetorischen Zuges sichtbar. 8 Es hat in einem ganz unmittelbaren Sinne die pragmatische Implikation von „jemanden von seiner ursprünglichen Position abbringen und ihn in die eigene Richtung orientieren“. Dies ist ein instruktives Beispiel dafür, dass relevante pragmatische Orientierungen der Beteiligten nicht nur verbalisiert, sondern auch in einem unmittelbaren Sinn verkörpert werden. 9 7 Erste Hinweise auf das Verfahren „visuelle Erstanalyse“ und seine Bedeutung im Kontext der multimodalen Interaktionsanalyse finden sich in Schmitt (2007a, S. 407ff.) sowie in Schmitt (2007b, S. 40-43), eine prototypische Umsetzung des Verfahrens stellt Schmitt/ Knöbl (2013) dar. 8 Zu den theoretischen Implikationen der Gesprächsrhetorik siehe Kallmeyer (1996) sowie als Exemplifikation des Ansatzes Kallmeyer/ Schmitt (1996). 9 Weitere Beispiele hierfür sind „jemanden umdrehen“ (Schmitt/ Deppermann 2007) oder „jemanden auf den Boden zurückholen“ (Pustički/ Schmitt 2015). Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 197 Es gibt unterschiedliche Argumente für die Produktivität und Notwendigkeit, das Verfahren der visuellen Erstanalyse einzusetzen: - Das Verfahren ist die methodologisch motivierte, analysefaktische Umsetzung des aus der context analysis 10 stammenden theoretischen Postulats der Egalität aller Ausdrucksressourcen, - es sensibilisiert für autonome Konstitutionsleistungen des visuell wahrnehmbaren Interaktionsverhaltens, - es erweitert unser Wissen über kulturelle Praktiken jenseits von Verbalität (beispielsweise „Gehen als situierte Praktik“ (Schmitt 2012a)), - es führt zur multimodalen Substantiierung bislang mono-modaler Konzepte wie „recipient design“ (Schmitt/ Knöbl 2013, 2014) und - es erweitert den Bereich verstehensdokumentarischer Aktivitäten (Deppermann 2008, Deppermann/ Schmitt 2009, Schmitt 2010) und macht Intersubjektivitätskonstitution in ihrer faktischen empirischen Vielfalt und Komplexität deutlich. Visuelle Erstanalysen (als Bestandteil einer multimodalen Interaktionsanalyse) kann man grundsätzlich auf der Basis von Primär- oder Sekundärdokumenten durchführen. Entscheidet man sich dazu, die Dynamik der Videoaufnahme an relevanten Stellen einzufrieren, um sich detailliert dem eingefrorenen Visuellen zuzuwenden, konstituiert man Standbildfolgen, die unter bestimmten Bedingungen den Status eines Frame-Comics haben. 5. Zur Begriffsbildung Der Begriff ‘Frame-Comic’ ist ein Kompositum, das aus den beiden Teilen ‘Frame’ und ‘Comic’ besteht. Beide Begriffsteile haben eine jeweils eigene Bedeutung, die teils wissenschaftlicher, technischer und alltagsweltlicher Natur ist. Der Frame: ‘Frame’ verweist auf den videotechnischen Zusammenhang und bedeutet zunächst nichts anderes als „Einzelbild“. Der zeitliche Abstand zwischen zwei Frames ist im PAL-System, das mit insgesamt 25 Bildern pro Sekunde arbeitet, die kleinste definierte Einheit des Videos pro Sekunde. Der Zeitraum zwischen zwei Frames hat im PAL-System die Dauer von 0,04 Sekunden. Der Frame selbst hat keine messbare zeitliche Dimension, zumindest keine, die für die Analyse relevant wäre. Er ist also eine Einheit der videotechnischen Verarbeitung und wird aus der dynamischen Videoaufnahme extrahiert. Man bewegt sich durch die Video- 10 Zur context analysis siehe unter anderem Birdwhistell (1970), Heilman (1979), Kendon (1990) und Scheflen (1964, 1972). Reinhold Schmitt 198 aufzeichnung und trifft dabei Extraktionsentscheidungen auf der Grundlage spezifischer Erkenntnisinteressen (siehe visuelles Segmentieren: Kap. 7). Man wählt dann beispielsweise Frame 8, 17 oder 23 als für die weitere Interaktionsanalyse relevant aus (oder Frame 5, 125 und 437). Im ersten Fall unterscheidet sich Frame 8 von Frame 17 dadurch, dass 9 weitere Frames zwischen ihnen liegen. Frame 8 zeigt also ein anderes Bild als Frame 17, was jedoch nur dann ins Auge fällt, wenn sich zwischen den beiden Frames etwas verändert hat. Ist dies nicht der Fall, zeigen Frame 8 und 17 das gleiche Bild, und man kann im Zweifelsfall nicht erkennen, dass es sich um zwei unterschiedliche Frames handelt, die 0,36 Sekunden auseinanderliegen. Unter einer videotechnischen Perspektive ist ein Frame also das Ergebnis einer durch die Bildtechnik eines bestimmten Videosystems produzierten systematischen Segmentierung, bei der die Dynamik des Videos auf die Statik einzelner Bilder reduziert wird, auf die man alle 0,04 Sekunden Zugriff hat. Unter einer interaktionsanalytischen Perspektive ist ein Frame der Grundbaustein für die Konstitution eines visuell basierten Sekundärdokumentes und damit die empirische Grundlage konstitutionsanalytischer Investigation. Dieser konstitutionsanalytische Prozess nutzt die videotechnischen Möglichkeiten, um das zu untersuchende Interaktionsgeschehen in einer spezifischen Weise festzuhalten und in genau 0,04 Sekunden auseinanderliegenden Schnitten einzufrieren. Die Selektion der Frames 8, 17 und 23 geschieht nun nicht zufällig, sondern folgt einer eng an der Handlungs- und Aktivitätsstruktur orientierten Weise. Es ist genau diese Systematik, die nun mit dem Comic den zweiten Begriffsteil in den Fokus rückt. Der Comic: Anders als beim ‘Frame’ handelt es sich beim ‘Comic’ um einen Begriff aus der Alltagskultur, der uns - auch wenn wir keine aktiven Leser bzw. Betrachter dieser erzählerischen Klein- und Kunstform sind - geläufig ist. Nach den gängigen Vorstellungen handelt es sich bei einem Comic um eine gezeichnete Darstellung eines Geschehens oder einer Geschichte in Form von Einzelbildern, die zu einer sequenziellen Bilderfolge zusammengestellt werden. Ein Comic ist eine gewissermaßen auf das Minimum reduzierte, aber Verstehen sichernde Darstellung einer Handlungssequenz. Bei dieser reichen die gezeichneten Bilder aus, um der Geschichte, die erzählt werden soll, in ihrer Entwicklungsdynamik und Handlungslogik folgen zu können. Obwohl die Bilder in einem offensichtlichen zeitlichen Verhältnis zueinander stehen, ist klar, dass viel Geschehen dazwischen ausgelassen wurde, weil dessen Darstellung für das Verstehen der Geschichte nicht unbedingt wichtig ist. Die gezeichneten Bilder tragen also als Eckpunkte die Geschichte und enthalten - aus Sicht des Comic-Zeichners und Autors - alle für das Verständnis relevanten Informationen. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 199 Der Frame-Comic: Der ‘Frame-Comic’ ist die Kombination beider Begriffsbestandteile, wobei ‘Comic’ mit seinem Prinzip der Ausschnitthaftigkeit und der systematischen Auslassung auf die Spezifik verweist, in der das dokumentierte Geschehen für die Analyse zur Verfügung gestellt wird. 11 Die ‘Frames’ sorgen hingegen für die empirische Grundlage der durch die Videotechnik vorgegebenen, selektiven Repräsentation des Dokuments. Die Kombination beider Begriffe entzieht das Konzept dem alltagsweltlichen Zusammenhang kulturspezifischer Kleinformen bildlichen Erzählens und verortet es im Kontext der multimodalen Interaktionsanalyse. Der Frame-Comic ist im Unterschied zum alltagsweltlichen Comic kein Primärdokument, anhand dessen das Erzählen und Bebildern einer Geschichte analysiert werden kann. Vielmehr verweist er als Sekundärdokument auf die Videoaufnahme, aus der er extrahiert wurde. Er ist auch nicht das Ergebnis der Phantasie oder des autonomen Gestaltungswillens eines Autors, und er erzählt auch keine (von den im Primärdokument festgehaltenen Ereignissen) unabhängige, von einem Autor (oder wie beim Comic: Zeichner) ausgedachte Geschichte. Der Frame-Comic gibt vielmehr als Sekundärdokument ausschnitthaft und in Form von Einzelbildern das im Video dokumentierte, unabhängig vom Gestaltungswillen des Analytikers bereits existierende Interaktionsgeschehen wieder. Der wesentliche Unterschied zwischen dem Frame-Comic und dem klassischen Comic ist also der Aspekt der Abbildung eines dokumentierten Interaktionsgeschehens gegenüber der narrativen Gestaltung eines Ereignisses. Der Zeichner entwirft seine Bilder entlang der Dramaturgie, die er (s)einer Geschichte geben will; der Wissenschaftler hingegen extrahiert aus einem bereits vorliegenden Interaktionsdokument die von ihm als relevant erachteten Frames, um für die eigene erkenntnisgesteuerte Analyse eine angemessene empirische Basis zu gewinnen. Und natürlich beinhaltet ein Frame-Comic aus methodischen Gründen auch keine Sprechblasen oder sonstigen Hinweise auf das verbale Interaktionsgeschehen, die das abgebildete Geschehen verstehbar machen sollen. Jenseits dieser strukturellen Unterschiede gibt es aber eine Gemeinsamkeit, die letztlich für die Begriffsbildung verantwortlich ist. Im Frame-Comic sollen - wie beim herkömmlichen, gezeichneten Comic - alle vom Analytiker als wesentlich erachteten Veränderungen des im Video vollständig dokumentierten Interaktionsgeschehens in einzelnen, sequenziell geordneten Standbildern präsentiert sein. Der Frame-Comic gibt in diesem Sinne die Eckdaten einer Handlungslogik oder eines Aktivitätsstrangs - wie beim Comic - auf der Grundlage ausgewählter Frames/ Bilder wieder. 11 Beim gezeichneten Comic spielt zudem das gesprochene Wort, das oft genug in einer Sprechblase Platz finden muss, häufig nicht die zentrale Rolle. Reinhold Schmitt 200 Beim Comic rekonstruiert der Leser bzw. Betrachter aufgrund der gezeichneten Einzelbilder und der darin festgehaltenen Veränderungen kontinuierlich diejenige(n) Aktion(en), die notwendigerweise realisiert worden sein muss/ müssen, um die festgehaltenen Veränderungen zu bewirken. Er erschließt so das Gesamtgeschehen aus den Einzelbildern. Das Gleiche gilt auch für den Frame-Comic. Auf dessen empirischer Grundlage ist es dem Analytiker ebenfalls möglich, das zwischen den ausgelassenen Frames dokumentierte Geschehen auf Grundlage der ausgewählten Standbilder zu rekonstruieren. Während der Comicleser die beschriebenen Prozesse beim Lesen jedoch automatisch und habituell realisiert, handelt es sich bei der Analyse eines Frame- Comics um ein methodisches Vorgehen, das bestimmten Prinzipien der Bearbeitung folgt (Schmitt i.Vorb., Kap. 7.6). Wie bei jedem anderen methodischen Vorgehen im Rahmen interaktionsanalytischer Anstrengungen spielt die Rekonstruktion der De-facto-Methodologie (Schmitt 2001) für die Kontrolle und Absicherung des methodischen Vorgehens bei der Konstitution eines Frame- Comics und bei seiner Analyse eine wesentliche Rolle. Nur wenn man sich damit beschäftigt, was man de facto tut, hat man die Möglichkeit, die einzelnen Bestandteile und die Angemessenheit des methodischen Vorgehens zu erkennen und einzuschätzen (Kap. 7.2). 6. Frame - Comic als Interaktionsdokument Der Frame-Comic hat wie das Verbaltranskript (siehe Kap. 8) seinen Platz im Rahmen interaktionsanalytischer Erkenntnisinteressen. Die einzelnen Frames, die den Comic konstituieren, sind einzig und allein durch die Struktur und die Dynamik der im Video dokumentierten Interaktion motiviert und bleiben immer an die Interaktion gebunden, die in ihnen ausschnitthaft eingefroren ist. Sie besitzen keinen davon unabhängigen Zweck, mit dem man sich etwa unter bildästhetischen Gesichtspunkten beschäftigen kann (Hausendorf/ Schmitt i.d.Bd.). Es ist diese interaktions-dokumentarische Qualität der Frames, die das Sekundärdokument konstituiert und strukturiert. Und es ist das jeweilige interaktionistische Erkenntnisinteresse, das darüber entscheidet, wie viele Frames ein solcher Comic hat und wie kleinbzw. großschrittig das Interaktionsgeschehen im Frame-Comic abgebildet wird. Ungeachtet der durch die spezifische Erkenntnislage motivierten Schnittfolge und dem zwischen den einzelnen Frames bestehenden zeitlichen Verhältnis (zur Bedeutung der Zeitlichkeit siehe Kap. 8.3) wird der Frame-Comic entlang der dokumentierten Interaktionsentwicklung konstituiert. Der Bezug des Frame-Comics zur Interaktionsstruktur ist jedoch nicht nur ein formalstruktureller, für den Sequenzialität die zentrale Konstitutionsgrundlage darstellt. Der Frame-Comic besitzt vielmehr einen direkten Bezug zur Hand- Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 201 lungsstruktur. Es sind konsistente und gestalthafte, thematisch-pragmatische Ausschnitte aus einem audiovisuellen Interaktionsdokument, die es überhaupt sinnvoll machen, einen Frame-Comic zu konstituieren. Hier gibt es eine Parallele zur gezeichneten Bildergeschichte: Ein komplexes - und theoretisch unendlich verfeinerbares - Interaktionsgeschehen wird durch die Auswahl weniger Standbilder auf die basalen Konstituenten seiner Handlungsstruktur „eingekocht“. 12 Auch in anderen Zusammenhängen und mit anderen Erkenntnisinteressen werden Standbilder aus Videoaufzeichnungen analysiert. Diese müssen dabei jedoch nicht automatisch den Status konsistenter Interaktionsdokumente haben, obwohl deren Analyse ebenfalls aus einer interaktionistischen Perspektive erfolgt. Aufgrund der fehlenden Aktivitätsbindung verliert in solchen Fällen die Sequenzialität des Interaktionsdokuments, die für den Frame- Comic bestimmend ist, mehr und mehr ihre Bedeutung für die Analyse. Analysiert man beispielsweise den Altarbereich einer Kirche im Rahmen interaktionsarchitektonischer Erkenntnisinteressen (wie Hausendorf/ Schmitt i.d.Bd.), ist die Sequenzialität des Interaktionsdokuments, über den der Altarraum empirisch zugänglich wird, weitgehend ausgeblendet. Sequenzen und Bilder können in einem solchen Kontext zur Verdeutlichung bestimmter Aspekte relativ frei von hinten nach vorne gezogen werden und umgekehrt. Während hier also eher das Kriterium der Vollständigkeit und der Sichtbarmachung interaktionsarchitektonischer Relevanzen für die Ordnung der Standbilder ausschlaggebend ist, spielen bei der Frame-Comic-Konstitution und -Analyse die Zeitlichkeit der Interaktionsentwicklung und die zwischen einzelnen Frames bestehenden zeitlichen Beziehungen eine zentrale Rolle. Die Bezeichnung ‘Frame-Comic’ ist daher ausschließlich für sequenziell konstituierte Sekundärdokumente aus Standbildern eines audiovisuellen Interaktionsdokuments reserviert, die eine konsistente Handlungsstruktur aufweisen. 7. Visuelles Segmentieren Im Folgenden will ich zum einen die interaktionstheoretischen Grundlagen visueller Segmentierung klären; zum anderen will ich die einzelnen Arbeitsschritte skizzieren, die dem visuellen Segmentieren als methodischem Verfahren eigen sind. 12 Der gezeichnete Comic ist letztlich nichts anderes als eine motivierte Standbildfolge, die eigentlich ein Video voraussetzt, aus dem der Zeichner seine Bilder auswählt. Ob Comic-Zeichner tatsächlich ein Video „im Kopf“ haben, weiß ich natürlich nicht. Reinhold Schmitt 202 7.1 Interaktionstheoretische Voraussetzungen Segmentierung ist ein analysepraktisches Verfahren, bei dem ein größerer Interaktionsausschnitt zum Zwecke seiner besseren Analysierbarkeit in kleinere Teile gegliedert wird. Die visuelle Segmentierung orientiert sich an Relevanzen des Videoausschnitts und geht auf der Grundlage des Postulats der theoretischen Egalität aller Ausdrucksressourcen davon aus, dass das visuell wahrnehmbare Verhalten der Beteiligten - genau wie das akustisch wahrnehmbare - bereits segmentindikative Qualität besitzt. Die Interaktionsbeteiligten produzieren in ihrem visuell wahrnehmbaren Verhalten Hinweise darauf, in welchen sinnvollen Einheiten, Mikrozusammenhängen und Aktivitätseinbindungen sie sich aktuell verhalten. Diese Hinweise werden im Rahmen der allgemeinen Intersubjektivitätskonstitution und damit zur Absicherung der Verstehbarkeit individueller Verhaltensweisen in den Relevanzen der praktischen Zwecke der Interaktion realisiert. Zu solchen Hinweisen gehören beispielsweise - der markante Wechsel der Körperpositur, - die Veränderung der räumlichen Position, - der Wechsel der Präsenzform, - das Einfrieren von Arm- und Handhaltungen im Kontext gestikulatorischer Aktivitäten oder - die blicklichen Fixierungen von Interaktionsbeteiligten oder Objekten. Bei der Betrachtung eines Videoausschnitts können auch Analytiker/ innen diese Hinweise nicht nur identifizieren. Es muss sogar möglich sein, die visuelle Segmentierung - genau wie die Beteiligten selbst - ohne größere analytische Anstrengung vorzunehmen. Es kommt bei der visuellen Segmentierung nicht darauf an, in einem analytisch gehaltvollen und umfassenden Sinne zu verstehen, worum es den Beteiligten in der zu analysierenden Situation geht. Es geht vielmehr darum, aus der „oberflächennahen Wahrnehmung“ 13 ihrer Verhaltensweisen eine Intuition für die von ihnen produzierten Segmentierungshinweise zu entwickeln. Dabei muss man sich fragen, mit welchen Ausdrucksressourcen und Verfahren sie sich - unter welchen situativen Bedingungen - wechselseitig relevante Segmentierungshinweise geben. Was einzelne Ausdrucksweisen konkret bedeuten, ist dabei nicht von primärer Wichtigkeit. Es geht bei der visuellen Segmentierung vielmehr darum, sich für allgemeine Segmentierungsprinzipien - wie beispielsweise die Produktion und Funktionalität von Kontrastivität - zu sensibilisieren. 13 Ich spreche hier bewusst von Wahrnehmung und nicht etwa von Beobachtung, um damit die „Oberflächennähe“ der von den Beteiligten produzierten Verhaltensaspekte zu fokussieren, denen man aus analytischer Perspektive die Qualität von „Segmentierungshinweisen“ zuschreiben kann. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 203 Die grundlegende Prämisse einer solchen Sensibilisierung lässt sich wie folgt formulieren: Sollen diese Segmentierungshinweise im interaktiven Vollzug unter online-analytischen Bedingungen und unter Orientierung auf praktische, situative Handlungsziele funktionieren, müssen sie ohne größere analytische Anstrengung sicht- und verstehbar sein. Dies gilt auch für die extrakommunikative Perspektive der Analytiker. Es kommt in diesem Zusammenhang beispielsweise darauf an, Stellen als Segmentierungshinweise zu befragen, - an denen sich das Verhalten einzelner Beteiligter sichtbar ändert, - an denen ein Wechsel von Dynamik zu Statik oder umgekehrt stattfindet und - an denen sich Verdichtungen bzw. die Synchronisierung von Ausdrucksressourcen finden lassen („Modalitätssynchronisierung“ im Sinne von Putzier (2011) bzw. „multimodal density“ (Norris 2004)). Das Ergebnis der Segmentierung eröffnet dann die Möglichkeit, alle Frames, die an den Schnittstellen von zwei Videosegmenten liegen, als sequenzierte Standbildreihe zusammenzusetzen, um die wesentlichen visuell wahrnehmbaren Ausdrucksveränderungen zu identifizieren. Dies ist ein praktikabler Versuch, die zunächst intuitiv vorgenommene Segmentierung durch die Identifikation segmentierungsrelevanter Verhaltensaspekte für zukünftige Segmentierungen des visuell wahrnehmbaren Verhaltens zu methodisieren. Man darf sich den Versuch der Methodisierung allerdings nicht so vorstellen, dass man irgendwann zu einer Liste kommt, die man - ungeachtet der Spezifik des zu analysierenden Interaktionsdokuments - in einer bestimmten Reihenfolge abarbeiten kann. Gleichwohl werden wiederkehrende Beobachtungen gemacht, die beispielsweise in Abhängigkeit von der Präsenzform, der Beteiligtenstruktur, der interaktionsräumlichen Konstitutionsleistungen etc. zu einer wichtigen Wissensgrundlage sedimentieren. Diese ist nicht formalistisch als Relevanzstruktur der Bearbeitung einzelner Aspekte organisiert, sondern reflektiert gewissermaßen auf der Grundlage einer „motivierten Heuristik“ generelle Aspekte der jeweiligen Interaktionsdokumente. 7.2 Methodisches Vorgehen Wie genau funktioniert nun die visuelle Segmentierung eines Videoausschnitts? Geht man von dem Fall aus, dass das audiovisuelle Interaktionsdokument bereits vorliegt und schließt damit alle vorgängigen Schritte aus, die z.B. für die Felderschließung und die Datendokumentation faktisch realisiert sein müssen, ereignet sich die visuelle Segmentierung zu einem Zeitpunkt, zu dem bereits die Selektion und Definition eines für die Analyse relevanten Videoausschnitts und die Entscheidung für das Verfahren der visuellen Reinhold Schmitt 204 Erstanalyse erfolgt sind. Die visuelle Segmentierung gliedert sich dann in unterschiedliche Arbeitsschritte. Ich selbst gehe folgendermaßen vor: 1) Zunächst schaue ich mir den definierten Videoausschnitt ohne spezifische Fokussierung an. Dabei ist eher eine auf die Gestalthaftigkeit und Segmenthaftigkeit des Geschehens ausgerichtete Wahrnehmung und nicht die Fokussierung einzelner Verhaltensaspekte der Beteiligten relevant. 2) Dann stoppe ich - bewusst voranalytisch - das Video immer dann, wenn ich den Eindruck habe, dass sich etwas für meine spezifischen Erkenntnisinteressen Relevantes ereignet bzw. verändert. Den bei diesem intuitiven Stoppen produzierten Frame speichere ich dann als Standbild ab. Wichtig ist dabei, dass man in der anfänglichen voranalytischen Segmentierungsorientierung bleibt und nicht etwa beginnt, nach dem ersten Schnitt darüber nachzudenken, warum man gerade an dieser Stelle das Video gestoppt hat. Hat man sich auf diese Weise durch den ausgewählten Ausschnitt bewegt, liegen damit alle intuitiv ausgewählten Kandidaten für den Frame- Comic vor. 3) Als nächster Schritt schließen sich - genau wie beim Transkribieren - Korrekturgänge an. Der erste Segmentierungsgang wird mehrfach wiederholt, wobei sich das Procedere des ersten Gangs wiederholt: Wieder stoppe ich das Video an relevant erscheinenden Stellen intuitiv und extrahiere an den jeweiligen Haltestellen einen Frame. 4) Danach vergleiche ich die Schnittstellen und die Anzahl der bei den einzelnen Gängen produzierten Frames. Hat man es dabei, was durchaus vorkommen kann, mit einer gewissen Streuung zu tun, muss man entscheiden, welche der extrahierten Frames Eingang in den Comic finden sollen. 5) Da die Grundlage der bisherigen Schritte in der Person des Segmentierers liegen und damit allesamt zwar methodisch motiviert, jedoch von ihrem Status her subjektiv sind, ist es nötig, den Frame-Comic zu intersubjektivieren. Auch diesen Arbeitsschritt kennen wir von der Transkripterstellung, bei denen unterschiedliche Korrekturgänge von unterschiedlichen Transkribenten durchgeführt werden. Ich selbst lasse die von mir konstituierten Frame-Comics im Hinblick auf ihre Konsistenz im Kolleg/ innen- Kreis diskutieren und evaluieren. 6) Bei der kollektiven Absicherung der Frames wurde deutlich, dass wir in einer Gruppe von sechs Personen sehr schnell ein hohes Maß intersubjektiver Sicherheit hinsichtlich der Relevanz der Frames erreicht hatten. Diese bezog sich auch auf den einzigen Frame, der in einem ersten Durchgang als „nicht passend“, „irgendwie anders“ oder als „nicht so wie die anderen“ charakterisiert wurde. Dass es diesen einen „falschen Frame“ gab, Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 205 war ein ausgesprochener Glücksfall. Er verdeutlichte nämlich in seiner kontrastiven Qualität nicht nur seine dokumentarische Andersartigkeit. Vielmehr stellte er die Frage nach den Kriterien für die Homogenität der anderen Frames. 7) Der wichtigste Erkenntnisgewinn und damit auch ein erster Ansatzpunkt zur Methodisierung der visuellen Segmentierung als Verfahren ist jedoch die Reflexion der De-facto-Methodologie, das heißt das Bewusstmachen der Kriterien, die bei der intuitiven Entscheidung in systematischer Weise relevant sind. Dieser Punkt öffnet die Tür zur Reflexion der visuell-segmentalen Kompetenz des segmentierenden Analytikers. 8) Es ist nicht überraschend, dass es bei den einzelnen Frames, die bei den unterschiedlichen Segmentierungsgängen extrahiert wurden, nicht immer den exakt gleichen Treffer gab. Die Streuung lag jedoch in einem Bereich, der bei allen Frames die wesentliche Veränderung, die im Video zu sehen war, fokussierte. Es ist also keine Frage der Phänomenqualität, die zu der Streuung führte. Diese resultierte vielmehr aus der jeweils unterschiedlichen Schnelligkeit, mit der bei den einzelnen Segmentierungsgängen per Mausklick jeweils auf dasselbe Phänomen reagiert wird. 9) Der nächste Schritt besteht dann darin, die gestreuten Frames der jeweiligen Schnitte miteinander zu vergleichen. Dieser Frame-Vergleich ist bezogen auf die Qualität und das Erkenntnisinteresse konstitutionsanalytischer Investigation voranalytisch und auf die Abbildqualität des wahrgenommenen, für die Selektion relevanten Phänomens bezogen. In der Regel ist es unproblematisch, sich für den Frame in einem Streuungsbereich zu entscheiden, der den besten dokumentarischen Wert besitzt. Man kann bei den zurückliegenden Ausführungen verschiedentlich Gemeinsamkeiten bei der Erstellung von Frame-Comics und Verbaltranskripten erkennen. Für seriös arbeitende Konstitutionsanalytiker ist es fraglos, aufgrund von Unvollständigkeiten und Ungenauigkeiten bei der Wiedergabe des Gehörten, von Falschidentifizierungen von Sprechern, „falschen Freunden“ aufgrund zu vorverständigen Hörens etc. nicht mit Erstversionen von Transkripten zu arbeiten. In der Regel durchläuft ein Transkript, ehe es empirische Grundlage konstitutionsanalytischer Rekonstruktion wird, verschiedene Korrekturgänge. Diese mehrfache Korrektur wird fraglos verstanden als eine notwendige Investition zur Qualitätssicherung des Transkripts. Niemand würde auf die Idee kommen, aus der Korrekturnotwendigkeit ein Argument gegen den Status und die Bedeutung von Transkripten als methodisch konstituierte empirische Grundlagen für die Untersuchung monomodal-verbaler Fragestellungen zu entwickeln. Das Gleiche gilt auch für den Frame-Comic. Natürlich spielten bei den notwendigen Korrekturen auf dem Weg des Frame- Reinhold Schmitt 206 Comics zu seinem Status als methodisch konstituierte empirische Grundlage für die Untersuchung multimodaler Fragestellungen andere Formen der Korrektur eine Rolle. Diese beziehen sich beispielsweise auf folgende Fragen: - Ist die Anzahl der Frames ausreichend, um die visuelle Repräsentation der Homogenität des Aktivitätszusammenhangs zu gewährleisten? - Sind die Frames tatsächlich nach dem Kontinuitäts- und Kontiguitätsprinzip ausgewählt worden? - Ist bei den einzelnen Segmentierungsentscheidungen jeweils der dokumentarisch „wertvollste“ Frame ausgewählt worden? Wie bei der Erstellung eines Transkripts, so werden die Korrekturaktivitäten im Zusammenhang mit der Erstellung eines Frame-Comics im Modus einer voranalytischen Haltung durchgeführt. Sie sind selbst nicht Teil der konstitutionsanalytischen Rekonstruktion, sondern notwendige Vorarbeiten. 8. Das Verhältnis von Transkript und Frame - Comic Die systematische Reflexion des Verhältnisses von verbalem und multimedialem Transkript und dem Frame-Comic ist eine wichtige Aufgabe der weiteren Entwicklung der multimodalen Interaktionsanalyse und eine eigenständige, systematische Fokussierung wert. Diese kann im hiesigen Zusammenhang nicht geleistet werden. Gleichwohl will ich kurz und auf der Grundlage eines nur schwer aufzuholenden Vorsprungs in der wissenschaftlichen Praxis des Transkribierens verbaler Aktivitäten, der Systematisierung der über die Jahrzehnte hinweg produzierten Ergebnisse und der Reflexion der dem Transkribieren inhärenten Implikationen einen für meine Darstellungszwecke kurzen, jedoch ausreichenden Vergleich angehen. Das Verhältnis des Frame-Comics zu klassischen Verbaltranskripten und den unterschiedlichsten Varianten multimedialer Transkripte 14 ist gleichermaßen einfach und komplex. Es ist einfach, weil es sich bei dem Frame-Comic - wie beim klassischen monomodalen Verbaltranskript und beim Multimedial-Transkript - um ein zur empirischen Bearbeitung spezieller Fragestellungen angefertigtes Sekundärdokument handelt. Es ist komplex, weil der Frame-Comic - aufgrund seiner Konstitutionslogik und seiner besonderen empirischen Funktionalität - kein Transkript ist. Man darf also nicht den Fehler begehen, den Frame-Comic als Endpunkt eines 14 Siehe Mondada (i.d.Bd.) zur Frage, wie Informationen zum visuell wahrnehmbaren Verhalten und Bilder in die Transkripte kamen. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 207 Kontinuums zu verstehen, das im Rahmen konversationsanalytischer Erkenntnisinteressen in Form unterschiedlicher Typen von Transkripten entstanden ist. Ein solcher Fehlschluss würde den Frame-Comic - auf der Grundlage des dokumentkonstitutiven Fehlens von Verbalität - als „verbalitätsfreies“ Transkript einordnen. Transkripte (egal, ob in ihnen nur auditiv oder auch visuell wahrnehmbares Verhalten notiert wird) und Frame-Comics sind diesbezüglich kategorial unterschiedlich. Sie gehen nicht etwa derart ineinander über, dass es immer weniger Verbalität gibt, bis sie beim Frame-Comic gänzlich verschwindet. Beim Versuch, die beiden Sekundärdokumente zu vergleichen, stellt sich die Frage nach den relevanten Kriterien, auf deren Grundlage die beiden Sekundärdokumente zueinander in Beziehung gesetzt werden können. Für den hiesigen Zusammenhang habe ich mich für die drei folgenden Basiskriterien entschieden: - Vollständigkeit der Abbildung (Kap. 8.1), - Sequenzialität der Abbildung (Kap. 8.2), - Repräsentation von Zeitlichkeit (Kap. 8.3). Aufgrund der Tatsache, dass Verbaltranskripte einen deutlichen wissenschaftshistorischen Vorsprung gegenüber rein visuell konstituierten Sekundärdokumenten haben, fällt das Augenmerk zudem stärker auf die Reflexion, die dieser Vergleich für den Frame-Comic besitzt. 8.1 Vollständigkeit der Abbildung Beim Vergleich der beiden Sekundärdokumente stellt sich sofort die Frage danach, was die Orientierung an der vollständigen Dokumentation des zu analysierenden Geschehens für das Verbaltranskript und den Frame-Comic jeweils bedeutet. Bei der Erstellung eines Verbaltranskripts orientiert man sich daran, im Prinzip alles, was auditiv wahrnehmbar ist und für die spätere Analyse als relevant eingeschätzt wird, zu erfassen, also z.B. nicht nur zu transkribieren, was gesprochen wird, sondern auch und gerade wie gesprochen wird. In gewisser Hinsicht ist das Ideal eine Duplizierung des Gesprochenen in Gestalt eines schriftlich fixierten Textes. Der Testfall für das Gelingen dieses Versuchs ist die maximale (Wieder-)Annäherung an das Primärdokument bei der Re- Transformation (dem mündlichen Vortrag) des transkribierten Textes unter Berücksichtigung aller kodierten Informationen. Der Versuch, die im Primärdokument festgehaltene Interaktion möglichst exakt, detailreich und vollständig im Prozess ihrer zeitlichen Entwicklung ab- Reinhold Schmitt 208 zubilden, erfolgt nach dem Prinzip „order at all points“ (Sacks 1984). 15 Für die schriftliche Abbildung des Gesprochenen werden Symbole definiert und in Form von Transkriptionssystemen systematisch zusammengestellt. Im sprachwissenschaftlichen Kontext gehen alle aktuellen Transkriptionssysteme (beispielsweise Selting et al. 1998, 2009) mehr oder weniger direkt auf die „Urversion“ von Jefferson zurück, die erstmalig in Sacks et al. (1974) publiziert wurde (siehe auch Jefferson 2004). Für die Erstellung eines Frame-Comics spielt Vollständigkeit als relevante Orientierung ebenfalls eine zentrale Rolle. Anstatt jedoch das Interaktionsgeschehen entlang der Zeitlichkeit seiner Entwicklung vollständig und detailliert zu dokumentieren, geht es beim Frame-Comic um das Erfassen relevanter Veränderungen der Interaktionsentwicklung. Will man also auch in diesem Zusammenhang von einer Vollständigkeitsorientierung sprechen, kann es beim Frame-Comic nur darum gehen, relevante Veränderungen auf der Grundlage einer aussagekräftigen Kontrastivität, die in einzelnen Frames dokumentiert wird, möglichst vollständig festzuhalten. Es handelt sich also um eine spezifische Variante von Vollständigkeit, für die das systematische Weglassen von nicht aussagekräftigen Frames konstitutiv ist. In diesem Sinne handelt es sich - im Gegensatz zur Transkription und im Gegensatz zur Audio- und Videodokumentation - nicht um einen „registrierenden“ Modus der Datenaufbereitung, sondern im Sinne von Bergmann (1985) um eine spezifische Form „methodischer Fixierung sozialer Wirklichkeit“. Die Konstitutionslogik des Verbaltranskripts besteht in der weitgehend interpretationsfreien, vollständigen Überführung des Hörbaren ins Lesbare. Entsprechend fordern neuere Transkriptionsverfahren, die in der Frühphase der Gesprächsanalyse oft verwendeten interpretativen Kommentare zur Sprechweise (wie „ironisch“ oder „empört“) durch objektivierbare Parameter zu ersetzen (vgl. GAT 2.0). Dabei stellen die Gesamtheit des einzelsprachlichen Wissens und die korrekte Umsetzung der in den jeweiligen Transkriptionsvorschriften festgelegten Transformationsregeln die zentralen Voraussetzungen dar. Diese sind dafür verantwortlich, dass unter bestimmten akustischen Bedingungen und einer gewissen Konzentration der Transkribenten zumindest der Wortlaut und die basale segmentale Struktur des Gesagten als intersubjektiv gesichert betrachtet werden können. Die Konstitutionslogik eines Frame-Comics verfügt (noch) nicht über eine vergleichbare Intersubjektivitätsgrundlage. Diese muss erst entwickelt werden (siehe aber oben). Im Vergleich zum Transkribierenden besteht die Kompetenzgrundlage des visuell Segmentierenden in der Wahrnehmung relevanter Verhaltensveränderungen von zentralen Beteiligten. Dies kann dazu 15 Zu den Prinzipien, denen bei Verbaltranskripten gefolgt wird, siehe beispielsweise Deppermann (1999, S. 46-48). Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 209 führen, dass die Segmentierungsentscheidung unterschiedlicher Segmentierender stärker als bei der Transkription des Wortlauts divergiert. Zudem verändern sich die für die Segmentierung relevanten Aspekte und damit letztlich auch die Größe der Binnensegmente in Abhängigkeit vom jeweiligen Erkenntnisinteresse. Das hängt im Wesentlichen mit der Relevanz der Ausdrucksressource zusammen, auf deren Grundlage die Segmentierung primär durchgeführt und der Frame-Comic konstituiert wird. 8.1.1 Spezifik/ Relevanz der Ausdrucksressource Besteht die dominante Ressource in auditiv wahrnehmbarem Verhalten, wirken sich mögliche Implikationen des Erkenntnisinteresses in erster Linie auf die Granularität aus, in der die Transkription erfolgt. Dies stellt beispielsweise GAT (Selting et al. 2009) systematisch durch unterschiedliche Detaillierungsniveaus (Minimal-, Basis- und Feintranskript) in Rechnung, die in Bezug auf prototypische Erkenntnisinteressen ausgearbeitet worden sind. 16 Die grundsätzliche Orientierung an der verbalen Vollständigkeit ist jedoch die gemeinsame Grundlage aller Detaillierungsniveaus. Besteht die dominante Ressource in visuell wahrnehmbaren Verhaltensweisen, wirkt sich das spezifische Erkenntnisinteresse unmittelbar auf die Selektion unterschiedlich weit auseinanderliegender Frames aus. Ist man beispielsweise an der Positionierung der Beteiligten im Raum interessiert, wird man nur dann entsprechende Frames extrahieren, wenn es tatsächlich räumliche Dynamik und Neupositionierungen gibt. Konzentriert man sich hingegen auf Gestikulation, wird man beispielsweise bei der Segmentierung Wechsel von linkszu rechtshändiger, von einzu beidhändiger, von reduzierter zu expressiver Gestikulation berücksichtigen. Da Gestikulieren eine wesentlich dynamischere Ausdrucksressource darstellt als etwa Positionierung im Raum oder auch die Veränderung von Posituren, wird man als Ergebnis der gestikulationsbezogenen Segmentierung desselben Videoausschnitts gänzlich andere und vor allem wesentlich mehr Frames produzieren und dadurch einen gänzlich anderen Frame-Comic konstituieren. Im Bereich der Verbaltranskripte wurde über die Jahrzehnte hinweg eine relativ hohe Standardisierung erreicht. Demgegenüber zeichnet sich die aktuelle Entwicklung multimedialer Transkripte durch eine hohe Varianzbreite mit teilweise idiosynkratischen Lösungen für bestimmte Abbildprobleme aus. 17 16 Im Kontext der ‘Interaktionalen Linguistik’ wurde beispielsweise der Bereich der Abbildung prosodischer und rhythmischer Phänomene ausgebaut (beispielsweise Auer/ Couper-Kuhlen/ Müller 1999). 17 Siehe auch Stukenbrock (2009) und vom Lehn (2014) zu den Anforderungen an multimediale Transkripte. Reinhold Schmitt 210 Es gibt Transkripte, die dem Prinzip ‘visueller Additivität’ folgen (beispielsweise Hausendorf/ Schmitt i.d.Bd.). Bei solchen Transkripten werden Standbilder, die aus den zugrundeliegenden Primärdokumenten extrahiert werden, zur Visualisierung relevanter körperlich-räumlicher Informationen eingesetzt. Auf die Verbalisierung dieser Informationen im Transkript wird verzichtet. Diese werden bei der analytischen Beschreibung nachgeliefert. Solchen Lösungen ist eine Tendenz der Diffundierung des Transkripts in den analytischen Beschreibungstext zu eigen. Dies wird - als „kleiner Tod“ - im Hinblick auf eine bessere Lesbarkeit in Kauf genommen. Dieser Lösung stehen Transkripte gegenüber, die nach dem Prinzip der ‘Verbalisierung visuell wahrnehmbarer Aspekte’ konstituiert werden. Hier ist die klassische Untersuchung zur Blickorganisation von Goodwin (1981) zu nennen, der noch gänzlich ohne Bilder auskam. Mondada arbeitet bei ihren Untersuchungen mit sehr detaillierten Transkripten, in denen sie Standbilder aus den Primärdokumenten und Verbalisierung kombiniert. Sie notiert so alle für die nachfolgende Analyse relevanten audio-visuell wahrnehmbaren Informationen (beispielsweise Mondada 2015). Solchen Lösungen ist eine Tendenz zur informativen Überfrachtung zu eigen, die im Zweifelsfalle dazu führt, die detaillierte empirische Grundlage bei der Lektüre zu überspringen. Transkripte unterscheiden sich zudem hinsichtlich der Frage, ob (und wenn ja, in welchem Ausmaß) sie Standbilder aus den Primärdokumenten durch verschiedene Zusatzinformationen aufbereiten: durch Pfeile und Sprechblasen (Norris 2004), eingefügten Text (Goodwin 1994), Hervorhebungen (Schmitt 2012b) oder auch Musiknoten (Erickson 2004). Mittels solcher Markierungen wird - durchaus gewollt - interpretative Qualität in die empirischen Grundlagen hineingeschrieben. Solchen Lösungen ist eine Tendenz zur interpretativen Aufladung der empirischen Grundlagen zu eigen, die eigentlich das „interpretationsfreie“ Dokument der Analyse darstellen sollen. 18 8.1.2 Kontinuität und Kontiguität Die Systematik und die Schnittweite der Extraktion von Frames aus dem Video basiert auf zwei unterschiedlichen Aspekten einer gemeinsamen Orientierung: Zum einen zeigen die Frames den durch die Fragestellung relevant gesetzten Aktivitätszusammenhang in der ausschnitthaften Kontinuität seiner Entstehung. Zum anderen schließen alle Frames, die aufeinander folgen, abbildlogisch auch tatsächlich aneinander an. 18 Weiterhin realisieren dieselben Autoren in Abhängigkeit von ihren jeweiligen Adressaten, bezogen auf die gleichen Daten, unterschiedliche Abbildverfahren. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 211 Die Abfolge der Frames ist so organisiert, dass - beispielsweise bezogen auf räumliche Dynamik und damit verbundene Positionierungen - alle Veränderungen der Positionen von Beteiligten im Raum in den Frame-Comic integriert werden. Diese Kontinuitätsorientierung gewährleistet, dass man als Analytiker die Sicherheit hat, zwei benachbarte Frames als sequenziell zusammengehörig betrachten zu können. Dies gilt natürlich nur in der Logik des Frame-Comics und nicht in der des Transkripts. Man muss also nicht fragen, ob sich die abgebildeten Personen „zwischen den Frames“ etwa an einem andern Ort aufgehalten haben und von dort wieder zurückgekehrt sind. Die Kontiguität zweier Frames kann zeitlich sehr unterschiedlich sein. Sie kann bei einer interaktiven Eröffnungssequenz im Bereich von Sekundenbruchteilen (Schmitt/ Knöbl 2014) und bei der Analyse von Raumnutzungsformen im Bereich mehrerer Minuten liegen (Dausendschön-Gay/ Schmitt i.d.Bd.). Kriterien für die Konstitution beider Fälle sind übereinstimmend die Orientierung an der Kontinuität der Interaktionsentwicklung und der damit verbundenen Vermeidung von „Sprüngen“. 8.1.3 Extraktionsweite und Seh - Arten - Potenzial Beim Frame-Comic existiert ein direkter Zusammenhang zwischen der Extraktionsweite der Frames und der Anzahl und Varianz möglicher Seh-Arten hinsichtlich dessen, was zwischen zwei Frames an interaktivem Vollzug wahrscheinlich realisiert worden ist. Je weiter die Schnitte zeitlich auseinanderliegen, desto größer wird die Anzahl möglicher Seh-Arten für das nicht sichtbare zwischenzeitliche Verhalten. Dieser systematische Zusammenhang zwischen Extraktionsweite und „interpretativer Sicherheit“ hat Konsequenzen für Fragestellungen und Erkenntnisinteressen, die auf der Grundlage von Frame-Comics verfolgt werden können. Mit einer großen Extraktionsweite lässt sich nur eingeschränkt und letztlich spekulierend der tatsächlich zwischen zwei Frames liegende interaktive Vollzug „rekonstruieren“. Maximale Extraktionsweite ist daher eher geeignet, nicht-dynamische und vom kontinuierlichen Vollzug unabhängige(re) Phänomene zu untersuchen. Hierzu zählen beispielsweise die Implikationen von Position und Positur von im Raum Anwesenden zu anderen oder die Nutzung des Raums durch Anwesende aufgrund ihrer Positionierung in dem durch die Architektur zur Verfügung gestellten Möglichkeitsrahmen. Solche Frames fordern und fördern die Rekonstruktion sozialtopografischer Implikationen, ohne durch Vollzugsdynamik abgelenkt zu werden. Frames, die hierfür extrahiert werden, repräsentieren eher statische Momente, Augenblicke der Ruhe, Transitionen am Umschlagplatz von Abgeschlossenem und noch nicht neu Begonnenem sowie Startund/ oder Endpunkte von Bewegungen. Reinhold Schmitt 212 Ein instruktives Beispiel hierfür sind die beiden folgenden Frames, die unter dem Aspekt der individuellen Raumnutzung in ihrer Statik und symbolischen Eigenständigkeit funktional sind: 19 A B Die beiden Frames aus dem Alpha-Gottesdienst zeigen dieselbe Person in zwei unterschiedlichen Positionen und Positionierungen, für die eine maximal kontrastierende Raumnutzung und ein spezifisches Beteiligungsformat charakteristisch sind. Um sich dafür zu interessieren, ist es weder nötig zu wissen, wie die konkrete zeitliche Beziehung der beiden Frames aussieht, noch, wie die Person vom Sitzplatz zum Mikro gelangt ist. Interessiert man sich jedoch für die Rekonstruktion der Laufwege und die Art des Gehens, kommt man mit diesen beiden Frames nicht weit. Man muss vielmehr neue Frames extrahieren, die eine Beschäftigung mit dem Aspekt „Gehen als situierte Praktik“ ermöglichen. Das sieht dann im vorliegenden Fall wie folgt aus: 19 Diese beiden sowie die nachfolgenden Standbilder stammen aus der Fallanalyse von Hausendorf/ Schmitt (i.d.Bd.). A Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 213 B 8.1.4 Zunehmende Detaillierung Ein weiter Unterschied zwischen Frame-Comic und Verbaltranskript besteht also offensichtlich in den Auswirkungen, die mit der Möglichkeit verbunden sind, das Detaillierungsniveau der Sekundärdokumente zu verfeinern. Wie man ein Basistranskript mit seiner Konzentration auf wenige äußerungs- und interaktionsstrukturelle Phänomene durch die Integration suprasegmentaler Informationen schrittweise anreichern kann, so kann man auch in einen bereits existierenden Frame-Comic neue Frames einfügen. Zieht man jedoch zwischen zwei Frames neue Frames ein, geht das in der Regel nicht nur mit einer visuellen Anreicherung einher, sondern zuweilen mit der Konstitution eines neuen Dokuments. Der zentrale Unterschied ist also, dass sich bei einem Verbaltranskript die Detaillierung auf der Grundlage einer letztlich unveränderten Basisstruktur (in der Regel ist das der gesprochene Wortlaut) vollzieht. Folglich gibt es bei der Detaillierung keinen neuen Wortlaut zu hören, sondern das bereits gehörte und schriftlich Fixierte wird durch neue Informationen spezifiziert. Beim Frame-Comic hingegen entsteht ein neuer visueller Eindruck, der das vorher fixierte visuelle Interaktionsgeschehen in offensichtlicher und teilweise signifikanter Weise verändert. 1 2 3 Reinhold Schmitt 214 Natürlich wählen wir auch bei der Arbeit mit Transkripten aus. Bestimmte Segmente, die für die Rekonstruktion der Handlungsstruktur weniger wichtig sind, landen in Beschreibungen, die zum nächsten Segment überleiten. Die analysierten Segmente sind oft dadurch charakterisiert, dass sich in ihnen markant etwas an der Handlungsstruktur ändert: Eine Erzählung beginnt, eine bestimmte Positionierung startet, ein Anwesender ändert erkennbar seine interaktive Beteiligung etc. 20 8.2 Sequenzialität (der Abbildung) Ein weiterer Aspekt beim kontrastiven Vergleich der beiden Sekundärdokumente ist die Ermöglichung eines sequenziellen Vorgehens bei der Analyse. Zumindest im ethnomethodologischen Zusammenhang ist es unstrittig, ein Verbaltranskript entlang seiner zeitlichen Entwicklung möglichst kleinschrittig zu rekonstruieren und nicht wahllos von vorne nach hinten zu springen. Die gleiche Unstrittigkeit gilt auch für den Frame-Comic. Auch hier muss das Dokument ermöglichen, das relevant gesetzte Phänomen in der Zeitlichkeit seiner Entstehung sequenzanalytisch zu rekonstruieren, ohne dass die Entwicklung von Seh-Arten bei Frame 1 bereits auf der Grundlage des Wissens um nachfolgende Frames eingeengt wird. Vielmehr wird durch die umfassende und detaillierte Rekonstruktion der zeitlich geordneten, akustisch und visuell wahrnehmbaren Phänomene ein Zugang zu den generativen Mechanismen der Interaktionskonstitution eröffnet. Dadurch wird die von den Beteiligten realisierte Methodologie ihres Alltagshandelns sichtbar. Beim Verbaltranskript werden durch die Vollständigkeit aller hörbaren Phänomene im Transkript Zusammenhänge deutlich, die sich nur durch die im Sekundärdokument sichtbare Segmentalität und den Bezug einzelner Aspekte aufeinander zeigen. Bei der Analyse des Frame-Comics liegt die erkenntnisgenerierende Produktivität gerade darin, die methodisch gewollte Reduktion explizierend aufzufüllen. Zum einen soll dadurch im Rahmen der Fallspezifik möglichst präzise ausgelotet werden, was „zwingend“ zwischen zwei Frames geschehen sein muss und was motivierte Anschlusserwartungen des aktuellen Frames sind. Zum anderen geht es um die Reflexion der Annahmen, Idealisierungen und Erwartungen, die für diese fallspezifische Rekonstruktionsarbeit bestimmend sind. Es ist vor allem dieser letzte Punkt, der uns zwingt, unser eigenes sozialtopografisches Wissen zu explizieren, um dieses dann in einem zweiten Schritt zu intersubjektivieren. Um dies zu gewährleis- 20 Mit bestimmten Einschränkungen kann man also sagen: Auch im Transkript gibt es markante Stellen, die sich wie bestimmte Frames im Frame-Comic als konstitutive Segmente für die Analyse anbieten. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 215 ten, ist jedoch zunächst die autonome Analyse der einzelnen Frames notwendig, der dann die Fokussierung von Veränderung von Frame zu Frame folgt (Schmitt i.Vorb., Kap. 7.6). 8.3 Repräsentation von Zeitlichkeit Beim Verbaltranskript wird durch die vollständige Verschriftung des Interaktionsgeschehens eine implizite „Time-Line“ abgebildet, die es ermöglicht, einzelne Äußerungen zeitlich zueinander in Beziehung zu setzen. In der Regel weiß man bei der Analyse eines Verbaltranskripts nicht wirklich exakt, wie viel Zeit seit dem Ende von Äußerung 2 und dem Beginn von Äußerung 4 vergangen ist. Für viele Erkenntnisinteressen ist es ausreichend, sich die Zeitlichkeit über Äußerungslänge und Pausenstruktur erschließen zu können. Bei einem Frame-Comic geben die einzelnen Frames keine Auskunft über das zeitliche Verhältnis, das zwischen ihnen besteht. Sind die extrahierten Frames sehr ähnlich, kann man ohne Time-Line nicht sicher sein, ob die Frames die Sequenzialität des Interaktionsdokuments wiederspiegelt. Hinsichtlich der nachfolgenden drei Frames 21 sind beispielsweise folgende Sequenzen möglich: 1-2-3, 1-3-2, 2-1-3, 2-3-1, 3-1-2 sowie 3-2-1. Zeit: 06: 57: 20 Zeit: 07: 05: 17 1 2 21 Die Abbildungen stammen aus Schmitt/ Knöbl (2014). Reinhold Schmitt 216 Zeit: 07: 11: 17 3 Zeitlichkeit kann nur durch eine Time-Line und die darin repräsentierte sequenzielle Position der Frames abgebildet werden. Das zeitliche Verhältnis der Frames zueinander ist für die Frame-Analyse nicht nur zur Absicherung der richtigen Frame-Abfolge wesentlich. Sie sind vielmehr in einem basalen Sinne Grundlage für angemessene Interpretationen des Frame-Comics. Die zwei folgenden Standbilder sind sich so ähnlich, dass aufgrund von Kontinuitäts- und Kontiguitäts-Idealisierungen der Eindruck entsteht, sie folgen unmittelbar aufeinander. Eine naheliegende Interpretation könnte sein: Nachdem der Lehrer kurz in die Klasse geschaut hat, orientiert er sich auf die Tafel, indem er seinen Kopf nach links wendet und auch mit seiner linken Hand die Tafel berührt. Wenn man Auskunft über die dabei vergangene Zeit geben sollte, würde man sich wahrscheinlich im Bereich weniger Sekunden bewegen. 4 9 Faktisch liegt jedoch zwischen den beiden Frames eine Zeitspanne von über einer Minute! In der Zwischenzeit hat der Lehrer (siehe nachfolgend) sein Pult aufgesucht, hat von dort aus mit Schülern gesprochen und erst danach wieder seinen Platz an der Tafel eingenommen und sich dort stabil verankert. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 217 4 5 6: 46 7: 17 6 7 7: 23 7: 35 8 9 7: 38 7: 48 Die Zeit, die zwischen einzelnen Frames vergangen ist, ist für die Frame- Comic-Analyse nicht nur zur Absicherung der richtigen Frame-Abfolge wesentlich. Sie ist auch für die inhaltliche Analyse der einzelnen Frames und den darin dokumentierten Veränderungen von zentraler Wichtigkeit. Denn die Zeitlichkeit ist entscheidend dafür, wie wir eine Veränderung zwischen zwei Frames interpretieren. Zum Abschluss dieses Vergleiches der beiden Sekundärdokumente will ich den wesentlichen Unterschied zwischen Transkript und Frame-Comic noch einmal aus der Perspektive der wissenschaftlichen Praxis reformulieren. Transkribieren ist die prozesshaft organisierte wissenschaftliche Praxis (Bezemer/ Mavers 2011), durch die auf der Grundlage der vollständigen Verschriftlichung des im Primärdokument Gehörten (und partiell auch des Gesehenen) Sekundärdokumente in Form schriftlicher Texte, den Transkripten, entstehen. Beim Frame-Comic entsprechen dem die wissenschaftliche Praxis des Segmentierens des audiovisuellen Primärdokuments auf der Grundlage visuell Reinhold Schmitt 218 wahrnehmbaren Verhaltens sowie das Auswählen und das sequenzielle Anordnen der beim Segmentieren extrahierten Frames in Form einer handlungskonsistenten Standbildfolge. Der Frame-Comic ist also zum einen kein verbalitätsfreies Transkript, und er ist zum anderen die methodische Antwort auf Fragen, die sich außerhalb des konversationsanalytischen Erkenntniszusammenhangs stellen. 9. Potenzial und Grenzen des Frame - Comics Die Funktionalität und Fruchtbarkeit des Einsatzes handlungskonsistenter Bildfolgen ist vor allem für sozialtopografische Analysen im Kontext konsistenter Handlungszusammenhänge - wie etwa bei Warten (Dausendschön- Gay/ Schmitt i.d.Bd.) und Freiraum schaffen im Klassenraum (Schmitt/ Dausendschön-Gay 2015) evident. Bei der mikroanalytischen Rekonstruktion kleiner und dynamischer lokaler Handlungszusammenhänge, für die neben dem visuell wahrnehmbaren Geschehen auch das Hörbare konstitutiv ist, stellt sich das etwas anders dar. In solchen Zusammenhängen ist die Funktionalität des Frame-Comics von vornherein eine andere, da dem visuell-erstanalytischen Zugang notwendigerweise die Rekonstruktion des verbalen Geschehens folgen muss, um im Sinne von Goffman (1983) Zugriff auf die multimodal konstituierte „interaction order“ zu bekommen. Hier ist der Frame-Comic also integriert in die grundsätzlich multimodal orientierte Konstitutionsanalyse und aus spezifischen Erkenntnisgründen der Verbalanalyse vorgeordnet. Ein weiterer Aspekt, der sich in grundsätzlicher Weise auf das Erkenntnispotenzial des Frame-Comics auswirkt, ist die Größe des zugrundegelegten Handlungszusammenhangs und das Erkenntnisinteresse, das darauf bezogen verfolgt wird. Je kleiner der festgelegte Ausschnitt und je statischer die visuelle Seite der Interaktion ist, desto geringer scheint das Erkenntnispotenzial des visuellen Sekundärdokuments zu sein. Vor allem die Intersubjektivität der visuellen Segmentierung und die Rekonstruktion der wahrscheinlichen Anschlussimplikationen nachfolgender Frames schrumpfen hier doch merklich. Ob sich dieser momentane Eindruck verfestigen wird oder primär damit zusammenhängt, dass es im Moment noch keine dem Transkript vergleichbaren substanziellen Erfahrungen mit dem Frame-Comic gibt, muss zukünftigen empirischen Erfahrungen überlassen bleiben. Es wird vor allem interessant sein zu sehen, wie sich der Frame-Comic im Vergleich mit dem Verbaltranskript, dem Universalwerkzeug für die Analyse verbal konstituierter Ordnungsstrukturen, schlägt. Im Moment ist noch offen, ob die Einsatzmöglich- Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 219 keiten der handlungskonsistenten Standbildfolge auf spezifische Erkenntnisinteressen beschränkt bleiben oder ob die gerade erst einsetzende systematische Entwicklung der multimodalen Interaktionsanalyse auch zur allgemeinen „methodischen Aufwertung und Konsolidierung“ des Frame-Comics führen wird. Das sind jedoch letztlich nur sekundäre Relevanzen. Denn die eigentliche erkenntnisgenerierende Kraft entwickelt der Frame-Comic neben seiner spezifischen Qualitäten als Sekundärdokument über die methodisch-methodologischen Implikationen, die mit diesem Sekundärdokument unweigerlich verbunden sind. Der Frame-Comic zwingt durch die motivierte Aussparung in der Dokumentation und der damit verbundenen Verdichtung der Handlungsdynamik dazu, diese quasi aus jedem Einzelframe zu rekonstruieren. Er verlangt somit, jeden einzelnen Frame als eigenständiges Dokument eigenwertig nicht nur in seiner faktischen Abbildqualität - in seinem Jetzt -, sondern gerade auch in seinem notwendigen Vorher und seinem motivierten Nachher zu analysieren. Im gewissen Sinne ist die deskriptive Rekonstruktion dessen, was es in dem Frame zu sehen gibt, eigentlich nur der Startpunkt zum Generieren weiterführender, analyseleitender Fragen: Was muss, aufgrund des im aktuellen Frame dokumentierten Geschehens, vorher zwingend passiert sein, und was sind - ganz im Sinne der konversationsanalytischen Vorstellungen - die Anschlussimplikationen dessen, was es aktuell zu sehen gibt: Wie wird/ kann es jetzt aufgrund welcher Hinweise weitergehen? Der Frame-Comic ist mit den Anforderungen, die er an seine Analyse stellt, eine gute und - wie ich meine - notwendige methodisch-methodologische Übung. Er setzt die für die konversationsanalytische Rekonstruktion so zentrale Frage „What is next? “ und die darin zum Ausdruck kommende präferenzielle analytische Orientierung an „Progression der Interaktionskonstitution“ (Stivers/ Robinson 2006) durch seine Auslassungen und seine Reduktion auf das visuell Wahrnehmbare im eingefrorenen Format selektiver Standbilder motiviert außer Kraft. Er verleiht dadurch dem einzelnen Frame einen wichtigen Status, den der Analytiker durch methodische Analyseverfahren respektieren muss. Ein Teil des Respekts wird dadurch erbracht, dass bei der analytischen Rekonstruktion die entwickelten Seh-Arten immer auch als reflexiver Ausdruck der Kompetenzgrundlagen des Analytikers thematisch gemacht werden. Die zentrale Bedeutung des Frame-Comics besteht nicht nur darin, adäquate empirische Grundlage für bestimmte Fragestellungen zu sein. Der Frame- Comic ermöglicht zudem aufgrund seiner Konstitutionslogik und seiner zentralen Eigenschaften die Ent-Dynamisierung des Primärdokuments und er- Reinhold Schmitt 220 öffnet so einen nur auf den ersten Blick erschwerten methodischen Zugang zu relevanten Aspekten der Raumnutzung und Interaktionskonstitution. Und - last but not least - stiftet der Frame-Comic dazu an, sich die konversationsanalytische und objektiv-hermeneutische Maxime „order at all points“ im Sinne folgender Frage problematisch zu machen: Ist es möglich bzw. nicht eigentlich naheliegend, die bisherige Relevanz und Gültigkeit der analytischen Maxime „order at all points“ ihrer Bindung an die sequenzielle Analyse des interaktiven Vollzug der Ordnung zu entheben? Wenn die Fallstruktur tatsächlich ein Prozess ist, der sich in permanenter Reproduktion befindet, dann kann man bezogen auf den Frame-Comic und auf der Grundlage der bislang mit ihm gemachten Erfahrungen in folgender Richtung weiterdenken: Muss man bei der Rekonstruktion einer Fallbzw. Ordnungsstruktur notwendigerweise ihre gesamte interaktive Reproduktion sequenzanalytisch aufarbeiten? Reicht es nicht vielmehr aus, aussagekräftige und sequenziell geordnete points (extrahiert aus Videoaufnahmen) zu analysieren, um der order auf die Spur zu kommen? 10. Literatur Auer, Peter/ Couper-Kuhlen, Elizabeth/ Müller, Frank Ernst (1999): Language in time. The rhythm and tempo of spoken interaction. Oxford: Oxford University Press. Bergmann, Jörg R. (1982): Schweigephasen im Gespräch. Aspekte ihrer interaktiven Organisation. In: Soeffner, Hans-Georg (Hg.): Beiträge zu einer empirischen Sprachsoziologie. Tübingen: Narr, S. 143-184. Bergmann, Jörg R. (1985): Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit. Aufzeichnungen als Daten der interpretativen Soziologie. In: Bonß, Wolfgang/ Hartmann, Heinz (Hg.): Entzauberte Wissenschaft. Zur Relativität und Geltung soziologischer Forschung. Göttingen: Schwartz, S. 299-320. Bezemer, Jeff/ Mavers, Diane (2011): Multimodal transcription as academic practice: a social semiotic perspective. In: International Journal of Social Research Methodology 14, 3, S. 191-207. Birdwhistell, Ray L. (1970): Kinesics and context. Essays on body motion communication. Philadelphia: University of Pennsylvania Press. Deppermann, Arnulf (1999): Gespräche analysieren. Opladen: Leske und Budrich. Deppermann, Arnulf (2008): Verstehen im Gespräch. In: Eichinger, Ludwig/ Kämper, Heidrun (Hg.): Sprache - Kognition - Kultur. (= Jahrbuch des Instituts für Deutsche Sprache 2007). Berlin/ New York: de Gruyter, S. 225-261 Deppermann, Arnulf/ Schmitt, Reinhold (2009): Verstehensdokumentationen: Zur Phänomenologie von Verstehen in der Interaktion. In: Deutsche Sprache 36, S. 220-245. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 221 Erickson, Frederick (2004): Talk and social theory: ecologies of speaking and listening in everyday life. Cambridge: Polity Press. Goffman, Erving (1983): The interaction order. In: American Sociological Review 48, S. 1-17. Goodwin, Charles (1981): Conversational organization: interaction between speakers and hearers. London: Academic Press. Goodwin, Charles (1994). Professional vision. In: American Anthropologist 96, 3, S. 606-633. Heidtmann, Daniela (2009): Multimodalität der Kooperation im Lehr-Lern-Diskurs. Wie Ideen für Filme entstehen. (= Studien zur Deutschen Sprache 50). Tübingen: Narr. Heilman, Samuel C. (1979): Communication and interaction: A parallel in the theoretical outlooks of Erving Goffman and Ray Birdwhistell. In: Communication 4, S. 221-234. Jefferson, Gail (2004): Glossary of transcript symbols with an introduction. In: Lerner, Gene (Hg.): Conversation analysis. Studies from the first generation. Amsterdam: Benjamins, S. 13-31. Kallmeyer, Werner (1996): Einleitung. Was ist Gesprächsrhetorik? In: Kallmeyer (Hg.), S. 7-18. Kallmeyer, Werner (Hg.) (1996): Gesprächsrhetorik. Rhetorische Verfahren im Gesprächsprozess. (= Studien zur deutschen Sprache 4). Tübingen: Narr. Kallmeyer, Werner/ Schmitt, Reinhold (1996): Forcieren oder: Die verschärfte Gangart. Zur Analyse von Kooperationsformen im Gespräch. In: Kallmeyer (Hg.), S. 20-118. Kendon, Adam (1990): Some context for context analysis: a view of the origins of structural studies of face-to-face interaction. In: Kendon, Adam (Hg.): Conducting interaction - Patterns of behavior in focused encounters. Cambridge: Cambridge University Press, S. 15-49. Laurier, Eric (2014a): The graphic transcript: poaching comic book grammar for inscribing the visual, spatial and temporal aspects of action. In: Geography Compass 8, 4, S. 235-248. Laurier, Eric (2014b): Dissolving the dog: the home made video. In: Cultural Geographies, S. 1-12. Mondada, Lorenza (2015): The facilitator’s task of formulating citizens’ proposals in political meetings: Orchestrating multiple embodied orientations to recipients. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 16, S. 1-62. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2015/ ga-mondada.pdf (Stand: Juni/ 2016). Norris, Sigrid (2004): Analyzing multimodal interaction. London: Routledge Falmer. Pustički, Nikolina/ Schmitt, Reinhold (2015): Zu einer amüsanten Unterbrechung während einer argumentativen Auseinandersetzung. In: Dausendschön-Gay, Ulrich/ Gülich, Elisabeth/ Krafft, Ulrich (Hg.): Ko-Konstruktionen in der Interaktion. Die gemeinsame Arbeit an Äußerungen und anderen sozialen Ereignissen. Bielefeld: transcript, S. 183-208. Reinhold Schmitt 222 Putzier, Eva-Maria (2011): Das Chemieexperiment: Inszenierung im naturwissenschaftlichen Unterricht. In: Schmitt, Reinhold (Hg.): Unterricht ist Interaktion! Analysen zur De-facto-Didaktik. (= amades. Arbeitspapiere und Materialien zur deutschen Sprache 41). Mannheim: Institut für Deutsche Sprache, S. 69-107. Sacks, Harvey/ Schegloff, Emanuel A./ Jefferson, Gail (1974): A simplest systematics for the organization of turn-taking for conversation. In: Language 50, S. 696-735. Scheflen, Albert E. (1964): The significance of posture in communi-cation systems. In: Psychiatry 27, S. 316-313. Scheflen, Albert E. (1972): Body language and social order: Communication as behavioral control. Englewood Cliffs, NJ: Prentice-Hall. Schmitt, Reinhold (2001): Von der Videoaufzeichnung zum Konzept „Interaktives Führungshandeln“: Methodische Probleme einer inhaltlich orientierten Gesprächsanalyse. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 2, S. 141-192. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2001/ ga-schmitt. pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2004): Die Gesprächspause: „Verbale Auszeiten“ aus multimodaler Perspektive. In: Deutsche Sprache 32, 1, S. 56-84. Schmitt, Reinhold (2007a): Von der Konversationsanalyse zur Analyse multimodaler Interaktion. In: Kämper, Heidrun/ Eichinger, Ludwig M. (Hg.): Sprach-Perspektiven. Germanistische Linguistik und das Institut für Deutsche Sprache. (= Studien zur Deutschen Sprache 40). Tübingen: Narr, S. 395-417. Schmitt, Reinhold (2007b): Theoretische und methodische Implikationen der Analyse multimodaler Interaktion. In: Holly, Werner/ Paul, Ingwer (Hg.): Medialität und Sprache. (= Mitteilungen des Deutschen Germanistenverbandes 54, 1). Bielefeld: Aisthesis, S. 26-53. Schmitt, Reinhold (2010): Verfahren der Verstehensdokumentation am Filmset: Antizipatorische Initiativen und probeweise Konzeptrealisierung. In: Deppermann, Arnulf/ Reitemeier, Ulrich/ Schmitt, Reinhold/ Spranz-Fogasy, Thomas (Hg.): Verstehen in professionellen Handlungsfeldern. (= Studien zur Deutschen Sprache 52). Tübingen: Narr, S. 210-362. Schmitt, Reinhold (2012a): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung Online 13, S. 1-44. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2012/ ga-schmitt.pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2012b): Räumliche Grundlagen interaktiver Beteiligung. Das Konzept „Interaktionsensemble“. In: Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 56). Tübingen: Narr, S. 37-87. Schmitt, Reinhold (2012c): Störung und Reparatur eines religiösen Ritus: Die erloschene Osterkerze. In: Klein, Wolfgang/ Habscheid, Stephan (Hg.): Dinge und Maschinen in der Kommunikation. (= Sonderheft der Zeitschrift für Literaturwissenschaft und Linguistik 168), S. 62-91. Der „Frame - Comic“ als Dokument multimodaler Interaktionsanalysen 223 Schmitt, Reinhold (2013a): Zum „Be-Greifen“ relevanter Aspekte der räumlichen Umgebung. In: Shamne, Nikolaĭ Leonidovich (Hg.): Raum in der Sprache. Raum der Sprache. Raum der Interaktionen. Festschrift zum 30-jährigen Bestehen des Instituts für Philologie und interkulturelle Kommunikation der Universität Wolgograd. Wolgograd: Verlag der Universität Wolgograd, S. 13-27. Schmitt, Reinhold (2013b): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 68). Tübingen: Narr. Schmitt, Reinhold (i.Vorb.): Methodische Verfahren der multimodalen Interaktionsanalyse: „Visuelle Erstanalyse“ und „Frame-Comic“. Mannheim. Schmitt, Reinhold/ Dausendschön-Gay, Ulrich (2015): Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse. (= Arbeitspapiere des UFSP Sprache und Raum (SpurR) 4). Zürich. www.spur.uzh.ch/ research/ publications/ SpuR_Arbeitspapier_Nr04_150711.pdf (Stand: Juni/ 2016). Schmitt, Reinhold/ Deppermann, Arnulf (2007): Monitoring und Koordination als Voraussetzungen der multimodalen Konstitution von Interaktionsräumen. In: Schmitt, Reinhold (Hg.): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr, S. 95-128. Schmitt, Reinhold/ Knöbl, Ralf (2013): „Recipient design“ aus multimodaler Sicht. In: Deutsche Sprache 41, 2, S. 242-276. Schmitt, Reinhold/ Knöbl, Ralf (2014): Recipient design: Zur multimodalen Repräsentation des Anderen im eigenen Verhalten. Mannheim: Institut für Deutsche Sprache. http: / / ids-pub.bsz-bw.de/ frontdoor/ index/ index/ docId/ 3239 (Stand: Juni/ 2016). Selting, Margret et al. (1998): Gesprächsanalytisches Transkriptionssystem (GAT): In: Linguistische Berichte 173, S. 91-122. Selting, Margret et al. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 10, S. 353-402. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2009/ px-gat2.pdf (Stand: Juni/ 2016). Stivers, Tanya/ Robinson, Jeffrey, D. (2006): A preference for progressivity in interaction. In: Language in Society 35, S. 367-392. Stukenbrock, Anja (2009): Herausforderungen der multimodalen Transkription: Methodische und theoretische Überlegungen aus der wissenschaftlichen Praxis. In: Birkner, Karin/ Stukenbrock, Anja (Hg.): Die Arbeit mit Transkripten in Fortbildung, Lehre und Forschung. Mannheim: Verlag für Gesprächsforschung, S. 144-169. www.verlag-gespraechsforschung.de/ 2009/ pdf/ transkripte.pdf (Stand: Juni/ 2016). vom Lehn, Dirk (2014): Transkription und ethnomethodologische Videoanalyse. In: Moritz, Christine (Hg.): Transkription von Video- und Filmdaten in der qualitativen Sozialforschung. Multidisziplinäre Annäherung an einen komplexen Datentypus. Wiesbaden: Springer VS, S. 391-406. Reinhold Schmitt 224 Gliederung 1. Vorbemerkung......................................................................................................189 2. Frame-Comic? Eine erste Annäherung .............................................................189 3. Wie analysiert man eine Gesprächspause? .......................................................192 4. Visuelle Erstanalyse .............................................................................................196 5. Zur Begriffsbildung .............................................................................................197 6. Frame-Comic als Interaktionsdokument ..........................................................200 7. Visuelles Segmentieren........................................................................................201 7.1 Interaktionstheoretische Voraussetzungen ......................................................202 7.2 Methodisches Vorgehen ......................................................................................203 8. Das Verhältnis von Transkript und Frame-Comic ..........................................206 8.1 Vollständigkeit der Abbildung...........................................................................207 8.1.1 Spezifik/ Relevanz der Ausdrucksressource .....................................................209 8.1.2 Kontinuität und Kontiguität ...............................................................................210 8.1.3 Extraktionsweite und Seh-Arten-Potenzial ......................................................211 8.1.4 Zunehmende Detaillierung.................................................................................213 8.2 Sequenzialität (der Abbildung) ..........................................................................214 8.3 Repräsentation von Zeitlichkeit .........................................................................215 9. Potenzial und Grenzen des Frame-Comics ......................................................218 10. Literatur .................................................................................................................220 III. FALLANALYSEN ZUR REKONSTRUKTION VON INTERAKTIONSARCHITEKTUR, SOZIALTOPOGRAFIE UND INTERAKTIONSRAUM HEIKO HAUSENDORF / REINHOLD SCHMITT VIER STÜHLE VOR DEM ALTAR. INTERAKTIONSARCHITEKTUR, SOZIALTOPOGRAFIE UND INTERAKTIONSRAUM IN EINEM „ALPHA“ - GOTTESDIENST 1 1. Einleitung Wir analysieren im vorliegenden Beitrag den Beginn eines „Alpha“-Gottesdienstes, weil er uns für den Zusammenhang von Interaktionsarchitektur, Sozialtopografie und Interaktionsraum sehr aufschlussreich erscheint. Ein „Alpha-Gottesdienst“ ist ein Gottesdienst „mit dem etwas anderen Programm“, bei dem „Neugierige und Suchende [...] nicht nur Predigt und Gebet, sondern auch Anspiele und Interviews sowie jede Menge Livemusik“ erleben können (zitiert aus der Selbstdarstellung im Internet: www.ev-kircherimbach.de/ index.php? option=com_content& view=article&id= 45&Itemid=54). Wie dieses Zitat schon andeutet, ergibt sich die Bedeutung des Alpha-Gottesdienstes u.a. aus dem Kontrast zu einem unterstellten Normalfall von Gottesdienst („nicht nur Predigt und Gebet“). Dieser Kontrast manifestiert sich nicht zuletzt in der Herrichtung des Kirchenraumes, in dem das Ereignis stattfindet. Genau das macht diesen Fall, der auch für aktuelle Entwicklungen innerhalb und außerhalb konfessionell organisierter Religiosität sehr aufschlussreich ist, 2 für unser Interesse am Zusammenhang von Interaktionsarchitektur, Sozialtopografie und Interaktionsraum heuristisch interessant: In dem besonderen Aufwand speziell der Gestaltung des kirchenräumlichen Vorne kommt die Lösung von Interaktionsproblemen durch Architektur prägnant zur Geltung. Die vier Stühle vor dem Altar, die diesem Beitrag den Namen gegeben haben, sind der augenfällige Ausdruck dieses Mehr- und Extraaufwandes. 1 Der vorliegende Beitrag stellt die stark komprimierte und ergebnisorientiert fokussierte Version einer umfangreichen Fallstudie (Hausendorf/ Schmitt 2014) dar, die als „SpuR03“ des Forschungsschwerpunktes Sprache und Raum der Universität Zürich zum Download zur Verfügung steht. Ohne dass wir darauf im Fließtext immer wieder verweisen, seien Leser und Leserinnen, die sich im Hinblick auf die Analysen für mehr Begründungstiefe, Details und Les- und Sehartenexplikationen und entsprechende Literaturverweise interessieren, auf diese Fallstudie verwiesen. 2 Vgl. zur evangelikalen Tradition der „Alphakurse“ (in der Schweiz „Alphalive-Kurs“ genannt) und zu ihrer Bedeutung für die gesellschaftliche Konstruktion von Religion und Religiosität allgemein z.B. Hunt (2004) und mit einer Fallstudie eines Alphalive-Kurses Baumann-Neuhaus (2008). Heiko Hausendorf / Reinhold Schmitt 228 Die vier Stühle haben in unserem Datum 3 eine eigene Geschichte, die wir in diesem Beitrag rekonstruieren werden. Zunächst stehen die Stühle noch vor den ersten an die Gemeinde gerichteten Worten für alle eintreffenden und Platz nehmenden Anwesenden sichtbar und ungenutzt im Zentrum des erhöhten Altarraums unmittelbar vor dem Altar (siehe unten Kap. 2). Während der sprachlichen Gottesdiensteröffnung dient dann einer der Stühle als Stütze für den Sprecher, der mit seiner linken Hand den oberen Teil der Rückenlehne berührt und diesen Handkontakt mit dem Stuhl erst wieder aufgibt, als er die Eröffnung des Gottesdienstes fast beendet hat und wieder zu seinem Platz zurückkehrt (siehe unten Kap. 3). Im Anschluss an ein darauf folgendes erstes Musikstück (das wir für die Analyse ausklammern, weil die Stühle darin keine erkennbare Rolle spielen) dienen dann zwei der vier Stühle zwei Frauen als Sitzgelegenheiten im Rahmen eines von dem ersten Sprecher (ohne Verweis auf die Stühle) bereits angekündigten „Anspiels“. Bei diesem „Anspiel“ handelt es sich um ein kurzes Spiel, das in die zentrale Thematik des Gottesdienstes einführt („Wir kommen alle in den Himmel. Bleibt die Hölle leer? “). Die beiden Frauen spielen zwei Anwärterinnen, die darauf warten, namentlich für den Einlass in den Himmel aufgerufen zu werden (siehe unten Kap. 4). Darauf folgt ein weiteres Musikstück. Im Anschluss daran agiert der Sänger der Musikgruppe als Sprecher, indem er den Übergang zum folgenden Beitrag des Pfarrers moderiert, der ein Referat über „Himmel und Hölle“ halten wird. Während dieser Moderation werden die vier Stühle vom Altar weggeräumt und in die Sakristei gebracht, deren Tür sich an der Stirnseite des getäfelten Altarraumabschlusses befindet (siehe unten Kap. 5). Als der Sänger der Musikgruppe zum Ende seiner Moderation den Pfarrer namentlich aufruft, damit dieser sein Referat halten kann, ist von den Stühlen bereits nichts mehr zu sehen, und die Tür der Sakristei ist wieder geschlossen. Damit ist auch die von uns rekonstruierbare und von allen Beteiligten verfolgbare Geschichte der vier Stühle beendet (siehe unten Kap. 6). 2. Vor dem Altar vier Stühle Wir beginnen unsere Analyse mit der Rekonstruktion der interaktionsarchitektonischen Implikationen des Kirchenraums auf der Grundlage eines Standbildes (Bild 1). Dieses zeigt den Altarraum und die ersten Sitzbänke und Stuhlreihen des Kirchenraumes aus der Perspektive der Kamera, die auf der Empore platziert ist. Die Aufnahme ist zudem charakterisiert durch eine mittlere Zoomeinstellung, die z.B. den Bereich der Kirchenbänke nach mehreren Seiten „abschneidet“. 3 Es handelt sich um die audiovisuelle Aufzeichnung eines vollständigen Alpha-Gottesdienstes (Erhebung: Reinhold Schmitt und Daniela Heidtmann). Wir danken dem Pfarrer Burkard Hotz und allen weiteren Beteiligten der evangelischen Kirchengemeinde in Rimbach/ Odenwald für die Genehmigung zur Aufzeichnung und Publikation. Vier Stühle vor dem Altar 229 1 Wir nehmen dieses Standbild zum Anlass, das „Vorne“ des Kirchenraumes, das die Kamera in prinzipieller Analogie zur Ausrichtung der Sitzbankreihen fokussiert, näher in Augenschein zu nehmen. Dabei werden wir dem auf den ersten Blick sichtbaren Unterschied zwischen gebautem und gestaltetem Kirchenraum nachgehen (Kap. 2.2). Anschließend stehen dann die vier Stühle vor dem Altar im Mittelpunkt, weil sie offensichtlich einen besonders markanten Bestandteil des gestalteten Raumes darstellen (Kap. 2.3). Zuvor wollen wir aber kurz auf den durch das Standbild festgehaltenen Zeitpunkt der Aufnahme eingehen (Kap. 2.1). 2.1 Vor dem Gottesdienst Mit dem auf Bild 1 eingefrorenen Augenblick befinden wir uns in einer Phase, in der der Gottesdienst noch nicht rituell eröffnet worden ist, die ersten Besucher und einzelne an der Gottesdienstgestaltung aktiv Beteiligte aber bereits eingetroffen sind. Entsprechend erfahren wir auch aus dem Standbild selbst, dass z.B. von vorne (noch) nicht für alle Anwesenden (die nur teilweise zu sehen sind) gesprochen wird. Tatsächlich ändert sich im Hinblick auf die Sichtbarkeit des Vorne in dieser „Vorphase“ nicht viel. Aber es gibt mit Bezug auf die Hörbarkeit eine Abfolge sehr unterschiedlicher Klangereignisse, die für die Vororientierung auf die sprachliche Eröffnung hoch funktional sind (vgl. dazu auch Hausendorf/ Schmitt 2010): Unsere Dokumentation setzt zu einem Zeitpunkt ein, als die Musikgruppe einen musikalischen Probelauf mit Gesang und Instrumenteneinsatz macht, um die Lautstärkeeinstellung zu kontrollieren (Soundcheck). Diese Phase hat eine verbale Nachbereitung („Ist es denn zu laut? Kann man das gut hören? “) Heiko Hausendorf / Reinhold Schmitt 230 und dauert etwa 1: 25 Minuten. Ab diesem Zeitpunkt ist eine dezente Hintergrundmusik zu hören, welche der Sänger und Gitarrist der Gruppe als „Bandkonserve“ aktiviert. Diese Hintergrundmusik ist als alleiniger, raumfüllender Klangteppich etwa 8: 30 Minuten zu hören. Danach kommt es zu einer akustischen Überlappung mit dem einsetzenden Glockenläuten, bei dem die Hintergrundmusik nur noch leise zu hören ist. Das ist die Phase, aus der unser erstes Standbild stammt. Etwa 2: 30 Minuten später stellt der Sänger der Gruppe die Musik leiser, so dass sie nur noch ephemer und punktuell hörbar ist (Dauer etwa 7: 20 Minuten). Dann klingen die Glocken langsam aus, und kurze Zeit später stellt der Sänger die Musik ab. Ab diesem Zeitpunkt sind nur noch die langsam und leise ausklingenden Glocken zu hören, in deren letzten Glockenschlag hinein zwei der Musiker in die Musikecke zu ihren Instrumenten (Schlagzeug, Keyboard) gehen, wo der Sänger und Gitarrist, der zuvor die Musik abgedreht hat, seine Gitarre umhängt. Wenig später beginnt die Gruppe, ihr erstes Lied zu spielen. Wir haben somit einen hörbaren Übergang von einer Testphase der Musikgruppe zu einer aus dem Off ertönenden Hintergrundmusik über das überlappend einsetzende Läuten der Glocken bis zum Spielen des ersten Musikstücks im Anschluss an das Ausklingen des letzten Glockenschlages. Spätestens mit dem unüberhörbaren Glockenläuten bekommt die verstreichende Zeit eine auf den Fluchtpunkt des Gottesdienstes bezogene Relevanz. Die Charakteristik des „Alpha“-Gottesdienst, die aufgrund der Sichtbarkeit des Vorne bereits projizierbar ist, bekommt mit der Sequenz von Glockenläuten und erstem Musikstück der Band (im Kontrast zur Sequenz von Glockenläuten und Orgelspiel: Hausendorf/ Schmitt 2010) auch einen hörbaren Ausdruck: Eine im Vorne sichtbar erzeugte Musik ersetzt das in der Regel nicht sichtbare Orgelspiel (vom musikalischen Kontrast ganz abgesehen). 2.2 Gebauter und gestalteter Kirchenraum Zunächst lässt uns Bild 1 vertrautheitsabhängig das Vorne eines Kirchenraumes wiedererkennen. Indikatoren dafür sind: - die Bankreihen, die einen Mittelgang frei lassen, und dem Raum eine starke Ausrichtung verleihen („vorne“), - die erschließbare Höhe und Größe des Raumes, die diesen als Halle erkennbar macht, mit Längsseiten und Schmalseiten, - die erhöhte und durch Stufen abgegrenzte Fläche vor den Bankreihen, mit der der Raum zu einer seiner Schmalseiten hin abschließt und die weitgehend frei von fest installiertem Mobiliar ist (siehe unten), abgesehen von Vier Stühle vor dem Altar 231 einem mit einem Tuch bedeckten und aufwendig dekorierten tischartigen Block mit Platte und Unterbau, den wir u.a. aufgrund seiner mittigen Platzierung und seiner Dekoration (aufgeschlagenes Buch) als „Altar“ wiedererkennen und - ein eigens ausgestalteter Platz für die Predigt (Pult, Kanzel, ...), wie er auf den Abbildungen aufgrund der Abdeckung durch eine Projektionsfläche nur ausschnitthaft zu erkennen ist. Auch wenn wir nicht schon wissen, was ein „Altar“ ist, dass die fragliche Freifläche als „Altarraum“ definiert ist und dass es sich bei dem fraglichen Buch um die „Bibel“ handelt, können wir doch nicht umhin, Folgendes zu sehen: Wir haben einen gebauten und gestalteten Raum vor uns, der über seine mehr oder weniger voraussetzungsarm wahrnehmbare Interaktionsarchitektur hinaus gleich schon sozialtopografisch hoch vertrautheitsabhängig aufgeladen ist. Die Wahrnehmung des Raumes wird damit, Vertrautheit vorausgesetzt, zu einem Wiedererkennen. Ein Ausdruck dieser sozialtopografischen „Ladung“ ist die Fachsprachlichkeit, die wir - als mehr oder weniger mit einem Raum wie diesem vertraute Mitglieder der Gesellschaft - wie selbstverständlich in Anspruch nehmen, wenn wir ansetzen zu einer ersten Raumbeschreibung. Entsprechend stark sind die vertrautheits- und wissensabhängigen Benutzbarkeitshinweise, die eine Expertise eigener Art provozieren: etwa kirchenraumarchitektonischer Art mit Bezug auf Grundformen des Kirchenbaus (Basilika, Saal- oder Hallenkirche); oder religionswissenschaftlicher und theologischer Art mit Bezug auf die sozial-rituelle Symbolik der Plätze und Gestaltungselemente z.B. innerhalb des Altarraums (Altar, Ambo, Sedilien, ...). Die Kirche ist in diesem Sinn nicht zufällig als gebauter Text verstanden worden (vgl. mit weiterführenden Hinweisen Sigrist (2014, S. 46); siehe auch den Beitrag von Hausendorf und Kesselheim (i.d.Bd.) zur Differenzierung von Lesbarkeit und Benutzbarkeit). Auch wenn wir diese Expertise nicht in Anspruch nehmen, führt uns das Standbild einen Typ von Unterscheidungen vor Augen, der mit der Differenzierung von gebautem, gestaltetem und ausgestattetem Raum zu tun hat und sich in unterschiedlichen Graden der Manipulierbarkeit von Architektur bemerkbar macht: Offenkundig kontrastieren diesbezüglich die im Vordergrund sichtbaren Bankreihen, die fest montiert sind, mit den an verschiedenen Stellen (vor den Bankreihen, vor dem Altar) auf- und hingestellten Stühlen, die mobil sind. Ebenso kontrastieren in dieser Hinsicht der Altar und die Stehtische. Wenn man einmal dieser Perspektive folgt, drängt sich die „Überlagerung“ des gebauten und gestalteten Raumes mit Ausstattungselementen unterschiedlichster Art auf. Diese modifizieren die Interaktionsarchitektur des gebauten Raumes auf vielschichtige Weise. Besonders markant und salient sind in dieser Hinsicht etwa Heiko Hausendorf / Reinhold Schmitt 232 - der links neben dem Altar aufgestellte Stehbzw. Bistrotisch mit Mikrofonständer (Bild 2a, b): - 2a 2b die mobile Leinwand, die als Projektionsfläche des Beamers aus der rückwärtigen vertäfelten Wand eine hörsaalähnliche „Stirnwand“ macht (Bild 3a, b): - 3a 3b die Musikecke (Bild 4a, b): 4a 4b Vier Stühle vor dem Altar 233 - die vier Stühle, die vor dem Altar aufgestellt worden sind (Bild 5a, b): 5a 5b Die illustrierten Gestaltungselemente (inklusive der rechts unten ins Bild ragenden Gastronomie-Ecke mit Bistrotischen) tragen dazu bei, dass ein Großteil der sakralen Symbolik des Altarraums in den Hintergrund tritt: Die Kanzel, von der aus das Wort Gottes verkündet wird, ist weitgehend durch die Projektionsfläche des Beamers verdeckt; der Altar, das sakrale Zentrum der Kirche, wird durch vier Korbstühle „zugestellt“, die mit ihrer Sitzfläche zum Besucherraum weisen; ein Bistrotisch im linken Bereich des Altarraums mit spezifischer intersituativer Verweisqualität wird durch den Mikrofonständer zum peripheren Zentrum mündlicher Ansprache und konkurriert daher mit dem Altar und der (nicht sichtbaren) Kanzel; die Musikanlage, die Notenständer und der Lautsprecher, der unmittelbar neben dem Altar auf dem Boden steht, sowie die Bistrotische an der rechten Seite im Besucherraum, auf denen Getränke und andere Dinge zum Verzehr drapiert sind, tragen im Zusammenspiel dazu bei, dass der traditionelle Altarraum gewissermaßen „säkularisiert“ wird. Auf diese Weise wird unmittelbar anschaulich, was es heißt, wenn im Gottesdienst, wie wir eingangs aus der Selbstdarstellung der Gemeinde zitiert haben, „nicht nur Predigt und Gebet, sondern auch Anspiele und Interviews sowie jede Menge Livemusik“ Platz haben sollen. Die Programmatik eines vom institutionellen Normalfall abweichenden Spezialfalles („Alpha-“) findet ihren Ausdruck in der Überlagerung zweier interaktionsarchitektonisch und sozialtopografisch konfligierender Räume. Dabei wird das Moment der architektonischen Mittigkeit, das den traditionellen Altarraum charakterisiert (Hausendorf/ Schmitt 2010), weitgehend „aufgehoben“ und durch dezentral aufgestellte, lokal zuammengehörige Ensembles (die Projektionsfläche, die vier Stühle, der Bistrotisch, die Musikanlage, die Verköstigungsecke) ersetzt. Heiko Hausendorf / Reinhold Schmitt 234 Während die interaktionsarchitektonischen Implikationen der anderen mobilen Ausstattungsgegenstände unmittelbar eingängig sind, sperren sich allerdings die vier Korbstühle gegen eine solche prima facie Evidenz. Zusätzliche Bedeutung gewinnen sie durch ihre altarassoziierte, mittige Position. Gleichzeitig ist es nicht leicht, sich darüber klar zu werden, für welches interaktive Problem sie eine Lösung anbieten (können/ sollen). Aus naheliegenden Gründen kann man sich nicht ohne eine Reihe höchst voraussetzungsreicher Zusatzbedingungen vorstellen, dass sie einfach nur die Sitzgelegenheiten im Kirchenraum um vier zusätzliche Möglichkeiten erweitern. Und wer soll dort überhaupt Platz nehmen und in welchem Aktivitätszusammenhang? Die Stühle stellen offensichtlich hinsichtlich ihrer interaktionsarchitektonischen Implikationen mehr Fragen, als sie auf den ersten Blick zu antworten bereit sind. Sie sind in genau diesem Sinne eine interaktionsarchitektonische und sozialtopografische Provokation ersten Ranges. Unser analytischer Fokus auf die vier Stühle erwächst so gesehen aus der Spannung zwischen architektonischen Erscheinungsformen und ihrer interaktionsarchitektonischen und sozialtopografischen Funktionalität. Etwas zugespitzt formuliert: Was immer uns das Standbild auch noch sagen mag: Die analytische Relevanz der vier Stühle ist auferlegt. 2.3 Vier Stühle und ihre interaktionsarchitektonischen Implikationen Bei den fraglichen Stühlen handelt es sich um vier Korbstühle, die im Zentrum des Altarraums unmittelbar vor dem Altar nebeneinander aufgereiht stehen. Sie erstrecken sich über die gesamte Breite des Altars und sind im Hinblick auf den Teppich, der vom Altar in den Besucherraum führt, symmetrisch angeordnet (siehe oben Bild 1). Der Standort der Stühle und ihre konkrete Platzierung sind zunächst im Hinblick auf die Beziehung der Stühle zum Altar interessant. Sie sind mit ihren Rückenlehnen so nahe an die Altarvorderseite gerückt, dass zwischen ihnen und dem Altar kein begehbarer Bereich existiert. Durch diese altarnahe Platzierung der Stühle wird die Erreichbarkeit des Altars von der Vorderseite aus unmöglich gemacht. Die Stühle in ihrer unverkennbaren alltagsweltlichen Qualität blockieren also den usuellen Zugang zu dem zentralen und sakralen Ort des Gottesdienstvollzugs durch den Pfarrer. Zu beachten ist dabei, dass der Altar aufgrund seiner aufwendigen Dekoration (die brennenden Kerzen, der Blumenschmuck, das mittig platzierte Kreuz sowie das ebenfalls mittig aufgeschlagene Buch, das dort - wie sonst auch - zum Lesen bereitliegt) sehr wohl als relevanter sozial-symbolischer Bestandteil des Kirchenraumes sichtbar bleibt. Die Evidenz der altarkonformen Dekoration wird sofort klar, wenn man sich vorstellt, wie effektiv der Altar durch eine Dekoration im Sinne der Verhüllung und des Verbergens hätte „unsichtbar“ gemacht werden können. Vier Stühle vor dem Altar 235 Die Stühle schränken nicht nur die Erreichbarkeit des Altars ein. Auch die Begehbarkeit des Bereiches vor den Stühlen und die Verweilbarkeit in diesem Bereich sind in Anbetracht der unmittelbaren Nähe der ersten Altarstufe (und der damit verbundenen „Gefahr“ des Abstürzens) stark eingeschränkt. Der Bereich zwischen Stühlen und Altarstufe scheint also für Begehung oder längeres stehendes Verweilen nicht vorgesehen. So betrachtet tangieren die Stühle den zentralen („mittigen“) Altarbereich in markanter Weise. Fast hat man den Eindruck, die Stühle drängen sich in den für den gewohnten Gottesdienstvollzug zentralen Bereich des Altarraums hinein, und man ist gespannt darauf, wodurch dieses Eindringen gerechtfertigt wird, was also die Funktionalität der Stühle an dieser Stelle sein wird. In Anbetracht der massiven Einschränkungen der Nutzbarkeit des Altars durch die Stühle spricht manches für die Seh-Art einer sequenziellen Benutzbarkeit: Stühle und Altar können nicht gleichzeitig, sondern nur nacheinander genutzt werden. Soll der Altar in seiner zentralen religiösen Symbolik als Ort, an dem die Gegenwart Gottes sichtbar wird, in seiner usuellen Begehbarkeit von vorne genutzt werden (können), müssen die Stühle zuvor entfernt oder zur Seite geschafft werden. Die Simultaneität des gleichzeitig in der dokumentierten Situation Wahrnehmbaren (Stühle und Altar) wird also durch die sozialtopografisch-vertrautheitsabhängige Erwartung der Sequenzialität der Benutzung pragmatisch sinnvoll. Standort und Platzierung der Stühle verstärken so gesehen die bereits konstatierte Spannung zwischen gebaut-ausgestattetem und gestaltetem Raum. Hinzu kommt die mit der Aufstellung der Stühle (Rückenlehnen zum Altar hin) verbundene Etablierung einer Struktur gegenläufiger Sichtbarkeit zwischen den Stühlen und den für die Besitzbarkeit des Kirchenraumes dominanten Bankreihen mit Orientierung zum Altarraum. Wenn die Stühle und die Bankreihen besetzt sind, blicken maximal vier Personen einer großen Menge Vieler entgegen. Durch die Platzierung der Stühle wird also nicht nur die sozialtopografisch vorgesehene Begeh- und Benutzbarkeit des Altars empfindlich eingeschränkt. Auch die für die Interaktionsarchitektur dominante Perspektive (Blickrichtung zum Altar) wird durch die Stühle auf markante Weise gebrochen. Sozialtopografisch kann man wissen, dass es im Altarraum durchaus Positionen und ausgestaltete Plätze gibt, von denen aus die Blickrichtung zum Altar zugunsten der Blickrichtung zu den Bankreihen umgekehrt wird (z.B. die Predigtkanzel oder das Lesepult („Ambo“)). Aber das sind sozialtopografisch integrierte Positionen, die den Altar selbst in seiner Relevanz gerade nicht tangieren. Während die Struktur gegenläufiger Sichtbarkeit zwischen dem als Fokusperson agierenden Pfarrer und den Gottesdienstbesuchern also den Normalfall darstellt, verlangt die hier dokumentierte Struktur eine andere Seh-Art. Heiko Hausendorf / Reinhold Schmitt 236 Es drängt sich also auch bei einer erwartbar sequenziellen Nutzung der Stühle und des Altars unweigerlich die Frage nach möglichen Nutzern der vier Stühle und nach der Nutzungscharakteristik auf. Wir wollen uns dazu noch einmal von der Sozialtopografie des Kirchenraumes einen Moment frei machen, die für die Platzierung der vier Stühle vor dem Altar wie angedeutet von großer Bedeutung ist. Es ist auffällig, dass die Stühle nebeneinander mit gleicher Ausrichtung angeordnet sind, ohne markante Unterschiede zwischen den einzelnen Stühlen. Allenfalls zeigt sich zwischen den inneren zwei Stühlen ein größerer Abstand, und womöglich ist es der dritte Stuhl von links, der in seiner Platzierung etwas „aus der Reihe tanzt“. Aber das sind Details, die nicht so signifikant sind, dass sie den Eindruck der Reihung wirksam stören. Eher vermitteln sie eine moderate Nachlässigkeit des Hinstellens (wie auch die Korbstühle selbst von ihrer Materialität und ihrem Design her unscheinbar sind). Interaktionsarchitektonisch erwartbar gemacht wird also eine Sideby-side-Anordnung einer kleinen Gruppe. Side-by-side löst ein Problem, das damit zu tun hat, dass mehrere Personen auf engem Raum anwesend sein können, ohne dass sie permanent Gefahr laufen, Blickkontakt aufnehmen zu müssen. Side-by-side ist man besser allein als inmitten einer „Sitzgruppe“ (Linke 2012). Sozial verträglich gemacht wird das beispielsweise durch ein Geschehen, das die Sitzenden als Teil eines Publikums definiert (wie es eben auch für die Bankreihenbesetzer gilt). Dass auf den vier Stühlen ein Publikum Platz nimmt, ist gleichwohl kaum vorstellbar - ohne dass das Arrangement in ein Krisenexperiment münden würde, wie wir es von speziellen Theateravantgarden her kennen. Interaktionsarchitektonisch naheliegender in der vorliegenden Konstellation wäre deshalb, dass auf den Stühlen Aktanten Platz nehmen, die das Publikum nicht beobachten, sondern für dieses publikumsgerichtet agieren (z.B. im Sinne einer Variante von „Podiumsdiskussion“). Die Anordnung der Stühle in einer Reihe könnte als Lösung des Problems der Publikumsadressierung beim Sprechen mit anderen gesehen werden. Sie wären dann eine Hilfe bei dem Versuch, eine koordinierte Tätigkeit (wie z.B. ein Gespräch) als kleine Gruppe für das Publikum zu vollziehen. Worin diese koordinierte Tätigkeit genau besteht, ist nicht leicht zu beantworten. So verträgt sich die Anordnung der Stühle beispielsweise nicht gut mit dem Typus einer Podiumsdiskussion unter Experten. Zu nah scheinen die Stühle dafür aneinandergerückt, auch zu wenig aufeinander bezogen, zu unscheinbar wirken dafür die Stühle. Und es fehlt ein Tisch, wie er für Podiumsdiskussionen durchaus nicht untypisch ist. Wenn wir uns gezielt fragen, welche Interaktionssituation die Anordnung der Stühle in genau der Erscheinungsform, die wir vor uns sehen, ohne weitere Abstriche sinnvoll und geeignet macht, scheint eine Warte- und Übergangssitu- Vier Stühle vor dem Altar 237 ation nahegelegt. Eine solche Situation reduziert den kollektiven Interaktionsfokus auf gemeinsames Verweilen, das nicht um seiner selbst willen geschieht, sondern durch ein Telos sinnvoll gemacht wird (den Kontakt mit dem Arzt, die Ankunft des Zuges, das Ankommen an einer Haltestelle, … derjenige, der im Wartezimmer sitzt, aber nicht aufgerufen werden will, wird sozial auffällig). Derartiges Verweilen lebt also davon, vergleichsweise selbstbezogen bei und für sich zu bleiben - genau dieses Problem löst das Nebeneinander von Sitzmöbeln. Es wird nun aber in der vorliegenden Konstellation dadurch stark beeinträchtigt, dass genau das coram publico vonstattengehen soll und jedes noch so selbstbezogene Verweilen sofort in den Sog der Wahrnehmungswahrnehmung der Anwesenden gerät. Wenn es also darum ginge, dass Fokuspersonen irgendwann in das Geschehen eingreifen soll(t)en und genau darauf zu warten hätten, wären die Stühle an den Längsseiten der Kirche weit besser platziert. Das zwingt uns in seiner offenkundigen interaktionsarchitektonischen Widersprüchlichkeit beinahe die Annahme einer weitergehenden Implikation auf, die eine ganz andere Sozialtopografie als die des Kirchenraumes aufruft: die Sozialtopografie eines Bühnenbildes in einem Theater, in dem ein Stück aufgeführt werden soll. Unter diesen Spezialbedingungen ist auch die Betrachtung von Wartenden sinnvoll - sie machen aus denen, die auf den vier Stühlen Platz nehmen, nolens volens Schauspieler und aus denen, die in den Bankreihen sitzen, ein Publikum. Diese Implikation tritt sofort in Korrespondenz zu den ebenfalls aufgebauten Musikinstrumenten (mit denen sie kompatibel erscheint) und sofort in Kontrast zu der Projektionsfläche des Beamers. Dass sie mit der Sozialtopografie des Altarraums konfligiert, versteht sich von selbst. Was immer auch in dem in dieser Gestalt vorgefundenen Raum mit den vier Stühlen passieren mag: Es wird sich auf das Spannungsverhältnis gegenläufiger Sichtbarkeit in irgendeiner Weise einstellen müssen und als soziales Geschehen vor dem Hintergrund dieser Spannung „Sinn machen“. 3. Eröffnung: Ein junger Mann neben den Stühlen Bei der Beantwortung der Frage, welche Rolle die vier Stühle für die Durchführung des Alpha-Gottesdienstes spielen, betrachten wir unterschiedliche Personen, die aktiv an der Gestaltung des Gottesdienstes beteiligt sind. Dabei orientieren wir uns am zeitlichen Ablauf des Gottesdienstes und konzentrieren uns dabei darauf, wie diese Personen die Stühle in spezifischer Weise nutzen. Wir beginnen unsere Analyse mit der Positionierung und der multimodalen Eröffnung des Gottesdienstes durch einen jungen Mann, der die Anwesenden offiziell begrüßt und den Gottesdienst auch rituell eröffnet. Heiko Hausendorf / Reinhold Schmitt 238 3.1 Der Gang zum Mikrofon In den Abschluss des musikalischen Intros der Musikgruppe erhebt sich ein junger Mann von seinem Sitzplatz in der ersten vorderen Stuhlreihe. Er bewegt sich mit raumgreifenden Schritten (Bild 6) auf den Altarbereich zu, in dem der Mikrofonständer neben dem Bistrotisch steht. Dort noch nicht richtig angekommen, hebt er seine rechte Hand und seinen Arm und bewegt diese in Richtung Mikrofon (Bild 7): 6 7 Er geht in einer Art und Weise, die an der Zielgerichtetheit und Zweckmäßigkeit seiner Bewegung keinen Zweifel lässt. Die demonstrierte Vororientierung auf das Ergreifen des Mikrofons wird auf diese Weise für alle ihm zusehenden Gottesdienstbesucher ersichtlich gemacht. Die eigene Präsenz ist dabei nicht so relevant, dass dafür Darstellungsaufwand betrieben werden müsste. Vielmehr deutet die Realisierung des Gangs auf Gründe hin, die ein längeres Verweilen des Gehenden an seiner Zielposition unwahrscheinlich machen. Er präsentiert sich nicht schon als künftiger Sprecher, der dabei ist, seinen Platz einzunehmen. Die Gangart des jungen Mannes, die wir beim Nehmen gleich zweier Altarstufen eingefroren haben (Bild 6), erinnert unmittelbar an eine Gangart, die wir an anderer Stelle (Hausendorf/ Schmitt 2010, S. 74f.) beschrieben haben: In der Vorphase des Gottesdienstes und noch in „Räuberzivil“ nimmt auch der Pfarrer mit großen Schritten zwei Altarstufen auf einmal. Beide Gänge sind durch die gleiche Funktionalität charakterisiert. Sie besteht darin, sich primär ökonomisch und zweckdienlich, d.h. ohne selbst- und rückbezügliche Verweise auf das Gehen selbst (etwa durch gezielte Verlangsamung oder das Zelebrieren einzelner Schritte), von A (dem Startpunkt) nach B (dem situativen Zielpunkt) zu bewegen. Es handelt sich um ein alltagsweltliches Gehen und nicht um eine Form, die durch ihre Vollzugscharakteristik auf Religion als eigenständigen Sinnbereich verweist. Wie ein solches Gehen aussehen kann, zeigt das versammelte Schreiten des Pfarrers, wenn er mit dem Talar Vier Stühle vor dem Altar 239 bekleidet aus der Sakristei kommt und auf seinen Sitzplatz in der ersten Reihe schreitet - und dabei „natürlich“ jede Altarstufe einzeln hinabtritt. Der junge Mann gestaltet seine durch die Interaktionsarchitektur exponierte Wahrnehmbarkeit durch die Form des Gehens im kirchenräumlichen Vorne so, dass möglichst wenig Zeit verbleibt zwischen dem Aufstehen und dem Gelangen zum Mikrofon und dass kein Zweifel daran aufkommen kann, worauf sich der Aufstehende zubewegen wird. Unter der etablierten Struktur von Wahrnehmungswahrnehmung ist das eine Präsenzform, die darauf abzielt, die kommunikative Relevanz der eigenen Person möglichst zurückzustufen. Durch die Benutzung relevanter Ausstattungsgegenstände und durch die Positionierung in einem für die „normalen“ Besucher nicht zugänglichen Bereich im Altarraum zeigt er, dass er zum Personal gehört, das den Gottesdienst aktiv (mit)gestaltet. Durch die Art und Weise der Benutzung und Positionierung zeigt er jedoch gleichzeitig, dass er diese Rolle nur gleichsam ausnahmsweise und vorübergehend ausfüllt. Auf diese Anforderung gibt das beschriebene Verhalten die passgenaue Antwort. 3.2 Positionierung neben den vier Stühlen und Eröffnung 8 9 Nachdem er bereits frühzeitig seinen rechten Arm in Richtung Mikrofon ausgestreckt hatte, macht er zunächst noch einen kleinen Schritt in Richtung Mikrofonständer, um dabei auch seinen linken Arm mit seiner linken Hand zum Mikrofon zu führen (Bild 8). Während er mit seiner linken Hand den Mikrofonständer festhält, zieht er mit seiner Rechten das Mikrofon aus der Halterung (Bild 9). Dann dreht er seinen Körper und Kopf nach links in Richtung der in den Bänken sitzenden Gottesdienstbesucher. Er hält dabei das Mikrofon in seiner rechten Hand etwa in der Mitte seines Oberkörpers mit angewinkeltem Arm. Der Blick scheint etwas nach vorne und nach unten zu gehen (Bild 10). Heiko Hausendorf / Reinhold Schmitt 240 10 11 Er dreht sich dann noch weiter nach links, blickt dabei vor sich auf die Sitzfläche der Stühle und hat das Mikrofon zum Sprechen bereits an den Mund geführt (Bild 11). Damit macht er sich prospektiv zum Sprecher. Dann dreht er den Körper noch etwas weiter links ein, macht mit dem linken Bein einen kleinen Schritt nach links und nach hinten und berührt mit den Fingern seiner linken Hand den ersten Stuhl etwas unterhalb der oberen Querverstrebung der Rückenlehne (Bild 12). 12 Es wäre durchaus möglich, dass sich der Sprecher weiter nach vorne bewegt, um noch vor Sprechbeginn auf dem angefassten Stuhl Platz zu nehmen. Offensichtlich signalisiert der Sprecher, dass er die für sein Sprechen mit Mikrofon vorgesehene Position noch nicht erreicht hat: Obwohl das Mikrofon schon in Bild 12 zum Mund geführt wurde, wird noch nicht gesprochen. Das Mikrofon ist also früher „vor Ort“ als der Sprecher an der von ihm projektierten Position. Statt die für das Sprechen zur Gemeinde durch Mikrofonständer und Stehtisch eigens eingerichtete Sprechposition einzunehmen, realisiert der Vier Stühle vor dem Altar 241 junge Mann eine Positionierung, die die Stuhlreihe „thematisiert“ und diese zum Fluchtpunkt seiner Bewegung weg vom Mikrofonständer macht. Damit wird seine Positionierung jedoch zur markanten Abwahl der Position hinter dem Mikrofonständer in unmittelbarer Anbindung an den Stehtisch. Als erste Äußerung realisiert der Sprecher das Gliederungssignal so, um unmittelbar danach eine kurze Sprechpause zu machen (--). Bemerkenswert sind der frühe Zeitpunkt des Sprechens und der Beginn mit einem Gliederungssignal. Am Ende der Sprechpause im Anschluss an das Gliederungssignal hat der Sprecher seine endgültige Position neben dem Stuhl mit Auflegen des Handballens auf die Stuhllehne erreicht. Seine Bewegung hat ihn also nicht weiter nach vorne, sondern rückwärts neben den ersten Stuhl geführt (Bild 13, 14). Während Sitzen offenbar dispräferiert ist, wird eine Anbindung zur Stuhlreihe gesucht und gefunden. 13 14 (--) so 06 JM: so (--) Das Sprechen setzt ein, bevor der Sprecher seine Endposition erreicht hat und offenkundig noch in Bewegung ist. Er hat noch keinen ruhigen Stand erreicht und noch keine stabile Position eingenommen. Wie Bild 13 zeigt, ist er bei der Realisierung von so noch mitten in der Fuß- und Beinbewegung, die ihn als Endpunkt einer Rechtsdrehung seines Körpers erst in der nachfolgenden kurzen Pause in einer stabilen Position einrasten lassen wird (Bild 14). Wenn man davon ausgeht, dass so den Endpunkt der körperlichen Annäherung an die Stuhlreihe sprachlich markiert und hörbar macht und auf diese Weise der erste akustische Ausdruck der visuell wahrnehmbaren Position neben der Stuhlreihe ist, kommt das Sprechen an dieser Stelle etwas zu früh. Der Einsatz des Sprechens erfolgt jedenfalls nicht synchron zum Einnehmen der festen Sprechposition, sondern vorzeitig. Wir haben es hier interessanterweise nicht Heiko Hausendorf / Reinhold Schmitt 242 mit der oft beschriebenen „späten Verbalität“ zu tun (Mondada/ Schmitt 2010, S. 37), sondern mit einer frühen, um nicht zu sagen, „verfrühten“ Verbalität. Positiv formuliert, hebt das Gliederungssignal so den Augenblick hervor, an dem der Sprecher die Stuhllehne nach ihrer ersten Berührung kurz wieder loslässt, um sich dann mit der Hand auf dem Stuhl abzustützen. Dort wird er sie fast die gesamte Zeit seiner noch folgenden verbalen Aktivitäten belassen. So gesehen lenkt so als akustisches Signal (‘Punktierung’) die Aufmerksamkeit darauf, dass ein erster Kontakt zum Stuhl stattgefunden hat. Auch hier lässt sich eine Vororientierung des jungen Mannes erkennen: Es ist die Vororientierung auf die Stuhllehne als Ankerpunkt, die auf diese Weise durch das frühe so relevant gesetzt wird. Darin zeigt sich wieder die Orientierung des Sprechers an einer möglichst raschen Abarbeitung der Sprechvorbereitungen, denen er in seinem dargestellten Verhalten gleichsam „vorauseilt“. Dadurch entsteht der Eindruck, „nicht abwarten zu können“. Wir sehen im Detail des frühen Sprechens also eine weitere Facette der Relevanzrückstufung der eigenen visuellen Präsenz während der Sprechvorbereitung. Die nachfolgende Ansprache des jungen Mannes umfasst die Begrüßung der Anwesenden und die Ankündigung des Gottesdienstes, eine Einführung in das Thema, die Anbetung (auf die wir noch zurück kommen: siehe unten 3.3) und schließlich die Überleitung zum Lobpreis. 07 JM: einen wunderschönen ostermontagmorgen (.) 08 herzlich willkommen zum alphagottesdienst (--) 09 zum ersten mAl an einem montag (--) aber 10 deswegen hoffentlich nicht weniger interessant 11 und erfüllt mit dem heiligen geist von gott (--) 12 ich denke (.) 13 es wird auch heute spannende beiträge geben 14 es wird auch mal wieder ein anspiel geben 15 (1.0) Der Sprecher beginnt seine Ansprache mit einer Äußerung, die im Hinblick auf ihren Status nicht eindeutig ist. Das hat damit zu tun, dass wir es mit einer Art Übergang von einer Grußformel (wie „guten Tag“) zu einer Wunschformel („ich wünsche Ihnen ...“) zu tun haben. Sowohl das Adjektiv wunderschön als auch das komplexe Kompositum ostermontagmorgen stellen eine markierte Abweichung von üblichen Grußformeln dar und schwächen die Funktion der Äußerung ab, als erstes Element einer Paarsequenz gehört zu werden. Dabei wird der Wunsch nicht performativ (durch ein Verb wie wünschen) hervorgehoben und rituell inszeniert, sondern umgangssprachlich verkürzt. Die Eröff- Vier Stühle vor dem Altar 243 nung des Sprechens nach dem so, auf die hin sich die gesamte bislang rekonstruierte Sequenz seit dem Aufstehen des Sprechers zubewegt hat, wird also in ihrer Relevanz nicht eigens hervorgehoben, sondern in ihrer zeremoniellen Bedeutung eher zurückgenommen. Dabei wird auch die Begrüßung nicht performativ in Szene gesetzt („Ich heiße Sie ...“). Indem der Sprecher auf performative Wendungen verzichtet, verzichtet er zugleich darauf, seine eigene Rolle als Sprecher („Ich“) sprachlich zu markieren und auf diese Weise hörbar zu machen. Auch das steht im Einklang mit der schon beschriebenen Zurücknahme der Relevanz der eigenen Person als Funktionsträger. Gleichzeitig ist der Bezug auf das gottesdienstliche Geschehen unüberhörbar: Er steckt in der Bestimmungsform osterzur (komplexen) Grundform -montagmorgen und in der Begrüßung zum alphagottesdienst. Dabei ist das Kompositum ostermontagmorgen mit Blick auf seine vergemeinschaftende Kraft (der Anwesenden als religiös motiviert zusammengekommene Gruppe) nicht eindeutig. Man findet es deshalb auch in ganz anderen Kontexten, in denen es offensichtlich nicht signifikant ist, was die soziale Kategorisierung betrifft. Die Begrüßung zum alphagottesdienst thematisiert die Besonderheit des aktuellen Gottesdienstes und appelliert an das Vorwissen der Zuhörenden. Wissens- und vertrautheitsabhängig stellt der Sprecher mit der Thematisierung des „Alphagottesdienstes“ einen Bezug zu dem her, was für alle Anwesenden seit geraumer Zeit sichtbar und auch bereits hörbar geworden ist: die Überlagerung des gebauten Altarraumes mit mobilen und temporären Ausstattungsmerkmalen, die keinen exklusiven Sinnbezug auf die Welt des christlichen Glaubens aufweisen (siehe oben Kap. 2). Auch der Sprecher macht sich damit in besonderer Weise kenntlich als Teil des „Alphagottesdienstes“. An die Stelle der sprachlichen Markierung seiner Rolle (und sei es nur als Sprecher: „Ich“) tritt in den ersten Worten die sichtbare Verortung bei den vier Stühlen vor dem Altar als dem auffälligen Ensemble der alphagottesdienstlichen Überlagerung des Altarraums. Der Sprecher nutzt den Status der vier Stühle dafür, sich selbst nicht nur räumlich, sondern auch sozial zu positionieren: Genauso wie die vier Stühle zum Alphagottesdienst dazugehören, gehört auch der Sprecher in seiner Präsenz zum Alphagottesdienst. Wenn man hinzu nimmt, dass der Sprecher dafür nicht den Platz hinter dem Mikrofonständer und am Bistrotisch wählt und dass er weiter die Implikationen der vier Stühle nicht einlöst (indem er sich hinsetzt), sondern stattdessen eine Sekundärnutzung wählt (das Aufstützen und Verankern), erwächst aus der Positionierung überdies eine prospektive Kraft: Die vier Stühle werden für den Alphagottesdienst (noch) eine besondere Rolle spielen. Heiko Hausendorf / Reinhold Schmitt 244 Mit dem Hinweis auf ein anspiel kündigt der Sprecher dann die Einlösung der Implikationen der vier Stühle an: ‘Anspiel’ steht als Begriff im gottesdienstlichen Kontext für ein szenisches Rollenspiel, mit dem in eine für den jeweiligen Gottesdienst relevante Thematik eingeführt wird. Die vier Stühle vor dem Altar werden ihre Rolle, so der implizite Hinweis, im Rahmen des Anspiels spielen. Auch wenn dieser Hinweis sprachlich nicht explizit gegeben wird, ist er für die Teilnehmenden aufgrund der interaktionsarchitektonischen Implikationen der vier Stühle vor dem Altar und der durch den Sprecher gewählten Positionierung mit Kontakt zur Stuhlreihe situativ zu erschließen: Die Stühle werden, anders als das Ensemble aus Bistrotisch und Mikrofonständer, für das Anspiel in unmittelbarer Weise relevant sein. 3.3 Die Folgen der Positionierung für die Anbetung Der Sprecher markiert auch multimodal, dass die Anbetung der dramaturgisch zentrale Aspekt seiner Präsenz im Altarbereich ist. Wir wollen jedoch nicht den Wortlaut der Anbetung rekonstruieren, sondern uns auf die Implikationen konzentrieren, die die spezifische Positionierung neben den Stühlen für die Realisierung der Anbetung hat. Zunächst ist die Anbetung mit den interaktionsarchitektonischen Implikationen der vier Stühle vor dem Altar nicht gut vereinbar. Als Ort und Bühne des Anspiels sind die vier Stühle für eine der Kernaktivitäten des Gottesdienstes (das Gebet) offenkundig nicht geeignet. Beten wird sowohl stimmlich wie auch körperlich als Aktivität aus dem Strom des sonstigen (Alltags- und gottesdienstlichen) Verhaltens herausgehoben. Dazu gehören z.B. das Aufstehen, das Zusammenführen der Hände (wie es mit den „Betenden Händen“ von Dürer ikonografisch geworden ist) oder auch das Neigen des Kopfes. Schon körperlich ist dieser Bewegungsaufwand mit der vom Sprecher gewählten Verankerung an einer der Stuhllehnen kaum vereinbar. Gleichwohl gibt der Sprecher die Handhabung der Stuhllehne auch während der Anbetung nicht auf. Man kann aber sehen, dass er sich erkennbar versammelt, den Blick nach unten richtet, die Augen schließt, und sehr konzentriert und gleichzeitig nach innen gekehrt neben dem Stuhl steht. Schauen wir uns diese Verkörperung der Anbetung und die dabei realisierte Handhabung des Stuhles mittels der beiden folgenden Standbilder an. 44 JM (2.0) 45 ich weiß nicht wie es ihnen geht 46 aber bei mir erweckt diese vorstellung 47 den wunsch nach anbetung 48 (3.0) Vier Stühle vor dem Altar 245 15 16 49 gro ßer gott .......................................... 73 amen Während der Ankündigung der Anbetung blickt der junge Mann mit erhobenem Kopf ins Publikum, und ein Lächeln ist in seinem Gesicht erkennbar. Dies verändert sich in der Sprechpause unmittelbar vor Beginn der Anbetung: Er nimmt seinen Blick zurück und schaut nun etwas nach unten, senkt seinen Kopf und zieht erkennbar die Stirn in Falten. Vor allem die Veränderung im Blickverhalten und der Mimik verdeutlicht, dass ihm die Anbetung eine ernste Angelegenheit ist, für die er sich in manifester Weise besinnen, konzentrieren und „versammeln“ muss. Als er dann mit den Worten großer gott, die Anbetung beginnt, steht er konzentriert und in sich gekehrt mit dem Mikrofon in seiner rechten und die Stuhllehen in seiner linken Hand neben dem Stuhl (Bild 15). Diese Positur behält er die ganze Anbetung über bei und belässt die Hand auch noch dort, als er mit amen die Anbetung beendet (Bild 16). Die über die gesamte Dauer der Anbetung hinweg erkennbare Stabilität von Position und Positur und auch die geringe Varianz der Handhabung des Stuhls deuten darauf hin, dass der Stuhl als interaktive Ressource nicht in kleinschrittig-dynamischer und mit den verbalen Aktivitäten koordiniert eingesetzt wird. Vielmehr liegt die interaktionsarchitektonische Ressourcenqualität des Stuhles in erster Linie darin, dem Sprecher zu ermöglichen, sich an einer bestimmten Stelle im kirchenräumlichen Vorne und im Angesicht der Gemeinde zu verankern, die vorab nicht bereits als Sprechposition kenntlich gemacht worden war. Sozialtopografisch konnotiert die Positionierung die Nähe des Sprechers zur alphagottesdienstlichen Überformung des gottesdienstlichen Geschehens. Heiko Hausendorf / Reinhold Schmitt 246 Mit der die Anbetung rahmenden Bewegung und Haltung innerhalb der Stuhl-Position verkörpert der Sprecher die Spezifik und die Relevanz des „Dialoges“ beim Beten. Ohne eine solche Verkörperung wird die Anbetung selbst unglaubwürdig oder als etwas ganz Anderes wahrnehmbar. Er trägt nun jedoch die Konsequenzen seiner Positionierung: Indem er das Mikrofon nicht im Ständer belassen, sondern herausgenommen hat und nunmehr in der rechten Hand hält, hat er zur Anbetung nicht die Möglichkeit, eine Verkörperung zu realisieren, die typisch für Beten ist: aufrecht stehend, den Kopf leicht nach unten gerichtet, den Blick gesenkt und - das ist der relevante Aspekt - die Hände „zum Gebet gefaltet“ oder zumindest vor dem Oberkörper etwa in Bauchhöhe zusammengeführt. Mit diesen strukturell ungünstigen Verkörperungsbedingungen der Anbetung kommuniziert er erneut, dass er für das, was er tut, im Altarraum keinen angestammten und „passenden“ Platz hat. Die Anbetung ist der zentrale Moment seiner Präsenz, in der sich die Funktion, die dem Sprecher im Ablauf des Alphagottesdienstes zukommt, offenbart und in der er für die Anwesenden wichtig wird. Und genau für diese Funktion wählt er eine in mehrfacher Hinsicht prekäre Position im Altarraum. Wir sehen darin kein Defizit, sondern einen exakten Ausdruck der fraglichen sozialen Positionierung. Auch in der Anbetung bleibt der Sprecher außerhalb der rituellen Zeremonie eines normalen Gottesdienstes (genauso wie die vier Stühle vor dem Altar) als „Fremdkörper“ erkennbar. Er gehört viel eher zu denen, an die sich der Gottesdienst wendet, als zu seinen „Protagonisten“. Passgenau wird diese Präsenzfigur (Schmitt 1992a, b) in der Einleitung zum Gebet durch den Sprecher thematisiert (siehe oben): ich weiß nicht wie es ihnen geht aber bei mir erweckt diese vorstellung den wunsch nach anbetung. Das Gebet erscheint also nicht als vorbestimmter Teil der Liturgie durch den „Vorbeter“, sondern entsteht aus einem „persönlichen“ Wunsch heraus, gleichsam spontan - eben auch an einem Ort, der dafür vielleicht nicht besonders geeignet ist: am Rande der vier Stühle vor dem Altar. Der Sprecher beendet die Anbetung nach dem amen mit einem erneuten Gliederungssignal so. Wir sehen, dass er seine abgelegte Hand immer noch an der gleichen Stelle auf der Querverstrebung liegen hat und sie dort auch bis zum Ende seiner verbalen Aktivitäten belässt. Er setzt sich dann - nachdem er den Lobpreis als nächsten Programmpunkt angekündigt hat - sehr schnell in Bewegung und geht wieder mit raumgreifenden Schritten die Altarstufen hinunter (Bild 17) und nimmt auf seinem angestammten Platz in der ersten rechten Sitzreihe Platz (Bild 18). Vier Stühle vor dem Altar 247 17 18 3.4 Stühle als Positionierungshilfe Die Präsenzfigur des jungen Mannes ist durchgängig durch die Gleichzeitigkeit von aktiver (Mit-)Gestaltung des Gottesdienstes und der Relevanzrückstufung seiner eigenen Person charakterisiert. Zu keinem Zeitpunkt beansprucht er mit seiner interaktiven Präsenz im kirchenräumlichen Vorne - obwohl er situative Zuständigkeiten und Verantwortlichkeiten übernimmt, die im normalen Gottesdienst zur Aufgabe des Pfarrers gehören (Gottesdienst offiziell eröffnen, Gemeinde begrüßen, Anbetung realisieren etc.) - eine situative Relevanz, die ihn in einer pfarrerspezifische Rolle und damit in Konkurrenz zu ihm bringen könnte. Durch seine Positionierung dokumentiert er eine Präferenz für die „Alpha“-Ausstattung des Raumes, zu der sich der Stehende mit seiner Verankerung als zugehörig positioniert und die er auf diese Weise als Voraussetzung und Legitimation des eigenen, aktiven gottesdienstlichen Beitrags kenntlich macht. Die moderne Sozialform gottesdienstlicher Praxis und ihre alltagsweltliche innenarchitektonische Repräsentanz verändert für den Sprecher nicht die gestalterische Rolle des Individuums gegenüber der religiösen Sakralform bzw. ist nicht mit einem größeren individuellen Freiraum verbunden. Vielmehr bleibt der zentrale Aspekt des Gottesdienstes mit seiner im Ritus verankerten Rollenspezifik aus Sicht des jungen Mannes durchgängig erhalten. Die zentrale Erkenntnis ist also die reflexive Qualität der Präsenzfigur des jungen Mannes bezogen auf das eingangs beschriebene Spannungsverhältnis von gebauter architektonischer Traditionalität und einer modernen, alltagsweltliche Ereignisformen integrierenden religiösen Praxis in Form des Alpha-Gottesdienstes. Heiko Hausendorf / Reinhold Schmitt 248 4. Der Altarraum als Bühne: Anspiel und Stuhlnutzung In dem vom Sprecher angekündigten anspiel wird eine Wartesituation vorgeführt, in der zunächst eine Frau, später dann zwei Frauen vor der Himmelspforte auf den Einlass in den Himmel warten. Ohne auf den Ablauf des Spiels detailliert einzugehen, wollen wir zeigen, dass und wie im Anspiel die interaktionsarchitektonischen und sozialtopografischen Implikationen der vier Stühle eingelöst werden (4.1). Zusammenfassend lässt sich festhalten, dass die vier Stühle ihre für den Alpha-Gottesdienst charakteristische Funktionalität als zentrales Requisit des Bühnenbildes erfahren (4.2). 4.1 Vier Stühle vor der Himmelspforte: das „Anspiel“ Das Anspiel beginnt damit, dass eine Person aus der ersten, linken Sitzreihe aufsteht und sich auf den rechten der beiden mittleren Stühle setzt. Während diese Person nach vorne geht, geht gleichzeitig eine andere Person im Hintergrund des Altarraums hinter die Projektionsfläche, um während des gesamten Anspiels stehen zu bleiben und sich als „Stimme aus dem Off“ in gewissen Abständen in das Spiel einzuschalten (Bild 19): 19 Person (Stimme aus dem OFF) auf dem Weg hinter die Projektionsfläche Person auf dem Weg zu den Stühlen (die Projektionsfläche ist noch nicht in Betrieb) Mit dem Platznehmen auf einem der mittig positionierten Stühlen erfolgt dann nahezu synchron die Inbetriebnahme des Beamers (siehe Bilder 20-22): Damit sind gleich zwei Hinweise gegeben, dass nunmehr das Anspiel beginnt und dass dafür die vier Stühle vor dem Altar und die Projektionsfläche von Bedeutung sind. Schon der Beginn des Anspiels löst dann die bereits interaktionsarchitektonisch erwartbar gemachte Situationsspezifik ein: Die Person, die soeben Platz genommen hat, schaut demonstrativ auf ihre Uhr: Vier Stühle vor dem Altar 249 20 21 22 23 Das Auf-die-Uhr-Blicken wird durch das Anwinkeln und Anheben des linken Arms bei gleichzeitigem weiten Zurückstreifen des Ärmels mit der anderen Hand und durch das Neigen des Kopfes in Blickrichtung auf den Unterarm auffällig vorgeführt. Es will nicht nur gesehen, sondern auch verstanden werden: Die Sitzende scheint schon eine längere Zeit und auch etwas ungeduldig auf etwas zu warten. Schon der Blick auf die Uhr löst also das interaktionsarchitektonische Versprechen der vier Stühle vor dem Altar als Möblierung einer Warteraumsituation ein. Es vereindeutigt die durch das Anspiel in Szene gesetzte Situation als eine des Wartens. Worauf die Sitzende wartet, zeigt die synchron mit dem Anspiel aktivierte Projektionsfläche, auf der das Wort „Himmel“ über der Abbildung eines verschlossenen, schmiedeeisernen Gitters zu lesen ist. Es ist der durch die Stilisierung einer Himmelspforte nahegelegte Einlass in den Himmel, auf den an dieser Stelle gewartet wird. Die vier Korbstühle tragen maßgeblich dazu bei, diese religiös aufgeladene und vielfach symbolisierte Situation als alltagsweltlich-profane Wartezimmersituation in Szene zu setzen. Dazu trägt auch bei, dass im weiteren Verlauf des Anspiels ähnlich wie im Wartezimmer einer Arztpraxis Personen namentlich aufgerufen werden (Stimme aus dem Off: eva maria meier bitte). Heiko Hausendorf / Reinhold Schmitt 250 Allerdings wird die sitzende Person im Verlauf des Anspiels nicht aufgerufen, worüber sie mehr und mehr irritiert ist. Gezeigt wird diese Irritation der Wartenden durch die Mimik und das erneute Platznehmen, nachdem sie zu Beginn des ersten Aufrufs fälschlicherweise bereits aufgesprungen war. 24 25 Hörbar wird die Irritation, wenn die wieder Sitzende das aus ihrer Sicht unverhältnismäßig lange Andauern thematisiert (was dauert das nur so lange). Nach einer kurzen Pause kommt dann eine zweite Person freundlich grüßend hinzu, die ebenfalls aus der ersten Bankreihe aufgestanden ist, um den zweiten mittleren Stuhl zu besetzen (Bild 26). 26 Wie sich im weiteren Spiel im Dialog der Wartenden herausstellt, hat die schon Wartende in ihrem Koffer (steht zunächst noch ungeöffnet zwischen ihren Beinen) eine Reihe von Unterlagen mitgebracht, die ihre Eignung für den Einlass in den Himmel belegen sollen (Taufschein, die Konfirmationsurkunde, der Trauschein, ein Foto ihrer Adoptivtochter in Äthiopien etc.). Obwohl die Hinzugekommene keine solchen Belege aufweisen kann, wird gleichwohl sie als nächste durch die Stimme aus dem Off aufgerufen: Vier Stühle vor dem Altar 251 27a 27b Das Anspiel endet damit, dass die Aufgerufene tatsächlich durch das Himmelstor tritt, indem sie sich unter der Projektionsfläche hindurchbückt (ohne allerdings hinter der Projektionsfläche zu verschwinden). Das Erstaunen der vergeblich auf ihren Aufruf wartenden Person ist das letzte „Bild“ des Anspiels (Bild 27a, b). Es wird von den Zuschauern gebührend beklatscht. Noch während des Klatschens beginnen die beiden Spielerinnen, der junge Mann und der Sprecher aus dem Off damit, die vier Stühle wegzuräumen (Bild 28, 29): 28 29 Der unmittelbare Übergang zum „Bühnenabbau“ ist zugleich eine Abwahl der an dieser Position (Ende des Spiels, Würdigung des Spiels durch die applaudierenden Zuschauer) möglichen und naheliegenden Entgegennahme des Applauses durch ein Nach-Vorne-Treten mit Verbeugung. Indem die Spielerinnen dieses rituelle Schauspielelement demonstrativ auslassen und noch in den Applaus hinein mit dem Abräumen beginnen, haben sie die Schauspielerrolle bereits verlassen. Mit der Vermeidung der Entgegennahme des Applauses wird das Applaudieren zudem selbst als möglicherweise dispräferiert behandelt. Das Anspiel wird so auch nachträglich als Element des alphagottesdienstlichen Geschehens definiert - und eben nicht als eigenständiges Schauspiel. Heiko Hausendorf / Reinhold Schmitt 252 4.2 Vier Stühle als Requisit des Anspielbühnenbildes Mit dem Anspiel haben sich die vier Stühle als das zentrale Ausstattungsmerkmal für die Herstellung einer Bühne erwiesen. Ihre interaktionsarchitektonische Relevanz liegt darin, die zentrale Requisite des benötigten Bühnenbildes zu sein. In dieser Funktionalität gehen die vier Stühle eine enge Verbindung mit der Projektionsfläche des Beamers ein. Projektionsfläche und Stühle konstituieren also im bereits für den Alpha-Gottesdienst hergerichteten Kirchenraum einen speziellen Binnen-, um nicht zu sagen „Alpha-Raum“. Weder die vier Stühle noch das Ensemble aus Beamer und Projektionsfläche werden dabei allerdings exklusiv für das Anspiel genutzt. Auf der Projektionsfläche wurden etwa auch die Liedtexte präsentiert. Und die vier Stühle haben es dem ersten Sprecher erlaubt, sich selbst als Teil des Alpha-Gottesdienstvollzugs zu positionieren. Gleichwohl ist klar, dass die vier Stühle vor dem Altar erst mit Beginn des Anspiels in der Gestaltung der Situation vor der Himmelspforte als alltagsweltliche Wartesituation ihre entscheidende Kontextualisierung erfahren. Spätestens an dieser Stelle ist offenkundig, wozu die Stühle da sind: Sie versinnbildlichen das Nebeneinandersitzen im Wartezimmer und fungieren so als ein wiedererkennbarer Hinweis für die zu spielende Situation. Dass nur die beiden mittleren Stühle während des Spiels besetzt werden, stuft die Bedeutung der andern beiden Stühle nicht zurück. Vielmehr repräsentieren sie die - auf der Bühne nicht sichtbaren, jedoch für das Spiel und seine Dramaturgie wichtigen - anderen Wartenden. Für das Anspiel konstitutiv ist, dass es mehr als zwei Stühle sind und dass auf diese Weise eine Reihe angedeutet werden kann. Während des gesamten Anspiels und auch während der Präsenz der vier Stühle überhaupt bleibt für alle Beteiligten sichtbar, dass wir es mit einer nur temporär für das Anspiel hergerichteten Bühne zu tun haben. Manifester Ausdruck davon sind die leicht beweglichen Stühle, die sich nach dem Anspiel als bequem und umstandslos wegräumbar erweisen und die in ihrer Präsenz schon vor dem Anspiel einen Vorverweis auf die Alpha-Qualität des Gottesdienstes leisten können (wie ihn z.B. der erste Sprecher bei seiner Eröffnung des Gottesdienstes ausnutzen kann). In all dem zeigt sich eine interessante funktionale Analogie in sprachlich-semantischer und in interaktionsarchitektonischer und sozialtopografischer Hinsicht: Wie sich schon im Ausdruck „Anspiel“ eine Instrumentalisierung des Spieles für etwas Nachfolgendes ausdrückt, erweist sich auch das Bühnenbild als untergeordnet unter den Vollzug des gottesdienstlichen Geschehens: Es etabliert keinen eigenständigen Handlungskosmos, sondern verweist zu jeder Zeit auf das kirchenräumliche Vorne des Altarraumes als den durchgängig relevanten Interaktionsraum. Vier Stühle vor dem Altar 253 5. Wenn die Stühle ausgedient haben: Von den Stühlen zu soner bank An dem Bühnenabbau beteiligen sich insgesamt vier Personen: Die Person, die während des Anspiels hinter der Projektionsfläche stand (Stimme aus dem Off), ergreift als erster einen der vier Stühle von hinten (Bild 30). Wir erkennen auch den jungen Mann wieder, der den Gottesdienst eröffnet und die Anbetung realisiert hatte. Nachdem der Sprecher der Stimme aus dem Off den ersten Stuhl bereits vom Altar weggeholt hat, nimmt auch die erste Spielerin den zweiten Stuhl, um ihn in Richtung Sakristei wegzutragen. 30 31 Als nächste ergreift die zweite Spielerin den dritten Stuhl und orientiert sich damit ebenfalls in Richtung Sakristei. Gleichzeitig hat sich der erste Sprecher den letzten Stuhl geschnappt und geht mit diesem in der andern Richtung um den Altar herum ebenfalls in Richtung Sakristei (Bild 31). Da sich alle vier Personen zur gleichen Zeit und noch im abebbenden Applaus mit dem Wegtragen der Stühle beschäftigen, entsteht vor der Tür der Sakristei ein Stuhl- Stau. Während die erste der beiden Spielerinnen bereits wieder auf dem Weg zu ihrer Bank ist und sich der erste Sprecher zusammen mit dem Off-Sprecher und der zweiten Spielerin weiter um die Entsorgung der Stühle in der Sakristei kümmert, tritt der Gitarrist der Musikgruppe aus der Musikecke nach vorne. Bereits kurz nachdem er die Musikecke verlassen hat, beginnt er auf seinem Weg nach vorne zu sprechen (siehe Bild 32a und b). Bezieht man die Situierung des Sprechens ein, wird erkennbar, dass der Sprecher in seinen ersten Worten mit dem deiktischen so unmittelbar an das zuvor Gesehene anschließt, um eine Art Quintessenz zu ziehen. Diese Quintessenz besteht darin, dass wir … alle … in den himmel (kommen). 4 Damit wird einer- 4 Mit dieser Eröffnung gerät der Moderator nah an den Text eines Karnevalschlagers, dessen Refrain wie folgt geht: Wir kommen alle, alle, alle in den Himmel, weil wir so brav sind, weil wir so brav sind. Das sieht selbst der Petrus ein, er sagt: „Ich lass gern euch rein, ihr wart auf Erden schon die reinsten Engelein! “ Wo im Refrain das vierte alle steht, macht der Moderator eine Pause (--). Wir sehen darin auch einen Reflex auf das Sketchhafte des Anspiels, das aus der Profanisierung der Situation vor der Himmelspforte erwächst. Heiko Hausendorf / Reinhold Schmitt 254 seits der durch das Zusammenspiel von Beamerprojektion, Bühnenbild und Spiel verdeutlichte symbolische Zusammenhang der Lokalisierung der Wartesituation vor der Himmelspforte explizit genannt. Andererseits steht diese Quintessenz in krassem Widerspruch zu dem, was soeben vorgespielt worden ist: Eine der Protagonistin des Anspiels kommt ja gerade nicht in den himmel, sondern muss mitansehen, wie andere ihr vorgezogen werden und sie selbst vergeblich auf einen Aufruf wartet. Die Aussage stellt also eine echte Provokation dar, die gewissermaßen Einspruch fordert. 32a 32b 07 MO: so ist das 08 wir kommen alle alle (--) in den himmel 09 und sitzen dann hier auf so ner bank In Fortführung seiner Quintessenz geht der Sprecher zu einer konkretisierenden Situationsbeschreibung über: und sitzen dann hier auf so ner bank. Daran fällt zunächst die Suggestion einer (noch) sichtbaren Szene auf, die durch die erneute Verwendung des deiktischen so und durch den lokaldeiktischen Bezug durch hier geleistet wird. Die Szene, die hier kommentierend suggeriert wird, ist dabei an dieser Stelle bereits nicht mehr präsent und sichtbar. Der Hinweis darauf, dass es gerade etwas zu sehen gibt, was für das, was der Sprecher sagt, unmittelbar relevant ist, läuft so gesehen ins Leere. Weiter wird in diesem Kommentar, der auf direkte Weise an das Anspiel und das hier als Bühne für das Anspiel verweist, aus den vier Stühlen eine bank! Das ist bemerkenswert, werden die Stühle vor dem Altar genau an dieser Stelle überhaupt (zum ersten und gleichzeitig letzten Mal) sprachlich thematisiert. Von „vier Stühlen vor dem Altar“ ist also nur in unserer nachträglichen Analyse die Rede, nicht aber im Material selbst. Wenn sie zum Gegenstand der Kommentierung werden, wählt der fragliche Sprecher eine abweichende Referenzform, die aus diesen Stühlen eine „Bank“ macht. Erneut gibt es also einen Widerspruch zwischen Gesehenem und Beschriebenem. Das suggerierte Vor-Augen-Stellen der konkreten Anspielszene (hier so ner …) kontrastiert mit der unpassenden Nominalreferenz und legt eine verallgemeinernd- Vier Stühle vor dem Altar 255 abstrahierende Bezugnahme nahe. Offenkundig ist dabei der Zusammenhang zum tatsächlichen Wegräumen der Stühle aus dem Relevanzbereich des Geschehens: Die vier Stühle verschwinden nicht nur in ihrer sinnlich wahrnehmbaren Gestalt, sondern auch sozial-symbolisch als relevante Bezugsgröße. Im Anspiel selbst sind sie offenbar selbsterklärend durch die Aktivierung ihrer interaktionsarchitektonisch implizierten und sozialtopografisch interpretierten Benutzbarkeitshinweise. In der Rückschau auf das Anspiel sind sie dann in ihrer mobiliaren Realität so irrelevant, dass nicht einmal der Unterschied zwischen Stühlen und Bank eine Rolle spielt. Man könnte auch sagen: Der Sprecher interpretiert die interaktionsarchitektonischen und sozialtopografischen Hinweise der vier Stühle als bank. Darin bleiben einerseits die Präferenz für Sitzen und andererseits die Präferenz für Reihung enthalten, die beide auch in der Stuhlreihe manifest werden. Die bank macht aus den vier Stühlen eine Sitzreihe, ist als Referenz also passend, wenn man diese Implikation in den Mittelpunkt stellt. Wir hatten ja bereits notiert, dass für die vier Stühle als Bühnenrequisite nicht die genaue Anzahl, sondern der Aspekt der Reihe konstitutiv ist (siehe oben Kap. 4.2). Was im Übergang von den Stühlen zur Bank allerdings verloren geht, ist die sozialtopografisch konnotierte Wartezimmersituation (von anderen mit der Lexik und Semantik von bank verbundenen Bedeutungsschichten zu schweigen). Während der Übergang von den Stühlen zur Bank gleichsam hintergründig mitrealisiert wird, steht im Vordergrund der Aussage des Sprechers deutlich eine Abwertung der gespielten Szene: Sie hat einerseits mit der gleich doppelt problematischen Bezugnahme zu tun, andererseits aber auch mit dem Widerspruch in den beiden Teilen der Aussage: Wenn wir alle … in den himmel (kommen), sitzen wir ja gerade nicht hier auf so ner bank und müssen folgerichtig auch nicht darauf warten, ob und wann wir aufgerufen werden. Verkürzt gesagt: Der Sprecher wertet in seinem Einleitungsteil die Bedeutung des Anspiels systematisch ab. Dem Unsichtbar-Machen der Requisiten des Anspiels (der vier Stühle) entspricht die Abwertung des Anspiels selbst in seiner Relevanz für daraus abzuleitende Schlussfolgerungen. Die vier Stühle müssen also auch deshalb verschwinden, weil die von ihnen illustrierte Situation in ihrer thematischen Relevanz als sinnwidrig vorgeführt wird. Dazu passt, dass der Sprecher die von ihm präsentierte Vorstellung mit nein selbst widerruft, um dann im relevanzhochgestuften Teil seiner Moderation zur Ankündigung des folgenden Gottesdienstelementes überzugehen (der Predigt des Pfarrers zum Thema „Wir kommen alle in den Himmel. Bleibt die Hölle leer? “). Diese Ankündigung, mit der ein für das Geschehen als Gottesdienst sehr wichtiger Übergang moderiert wird, ist ihrerseits hoch aufschlussreich für die Rollenverteilung im „Alphagottesdienst“. Es ist der Pfarrer, der als fachmann und als bekannter Experte eingeführt wird (kurz und knackig wie Heiko Hausendorf / Reinhold Schmitt 256 wir es gewohnt sind), und es ist die Predigt, die als eine Art fachmännische Auslegung dessen angekündigt wird, was gerade im Anspiel zu sehen war. Während der beschriebenen Überleitungsmoderation dauert im Rücken des Sprechers im Türbereich der Sakristei das Verräumen der Stühle weiter an. Die Wegräumaktion hinter dem Altar und vor der Sakristei wird also durch die Moderation überlagert und verdeckt (bleibt aber im Hintergrund erkennbar). Diese Gleichzeitigkeit strahlt auf beide Aktivitäten aus: Das endgültige Wegräumen der Stühle findet nicht nur faktisch im Hintergrund statt, sondern wird auch sozial-symbolisch als nicht beachtenswerte Hintergrundaktion definiert. Gleichwohl kommt es nicht zu einer (Bühnen-)Umbaupause, sondern zu einer Art gefüllten Pause: Die Moderation füllt gewissermaßen den Zeitraum auf, den die Beteiligten zum Wegräumen der Stühle benötigen. Insofern strahlt auch das hintergründige Geschehen auf den Status der Ansprache als eine Art Übergangs- und Pausenmoderation aus. Die bereits rekonstruierte Herstellung der Ansprache als Moderation wird zusätzlich dadurch unterstützt, dass sie zeitlich mit der Endphase der Wegräumaktion überlappt und für sich keinen eigenständig ausgefüllten Fokusbereich beansprucht. Sie schiebt sich im Gegenteil vor ein noch andauerndes Geschehen, ohne dieses komplett zu überlagern. Im Vergleich zum Gehen des jungen Mannes nimmt sich der Sprecher für seinen Weg erkennbar Zeit. Er hat offensichtlich keine Eile, was an seinem schlendernden Gang zu sehen ist. Wenn man sich fragt, als was der Sprecher seinen eigenen Gang interpretiert und den Gottesdienstbesucher/ innen zur Wahrnehmung anbietet („Gehen als situierte Praktik“: Schmitt 2012), tritt der Sprecher in offensichtlich selbstpräsentativem Gestus auf: Er will gesehen werden (Bilder 33, 34, 35). 33 34 35 Diese Geh-Praktik steht auch in deutlichem Kontrast dazu, wie die beiden Spielerinnen nach erledigter Arbeit zu ihren Plätzen zurückeilen und dabei Vier Stühle vor dem Altar 257 tunlichst vermeiden, sich als aktuelle Fokusperson anzubieten. In der ihm eigenen Präsenzform mit offenem Sakko und der einen Hand in der Hosentasche wirkt der nunmehr im Fokus stehende Sänger-Gitarrist-Sprecher fast wie die Verkörperung eines Zitates demonstrativ lässiger Formen von Moderation, wie wir sie beispielsweise aus Unterhaltungskontexten wie dem Fernsehen kennen. Konstitutiv dafür ist u.a. die Wahl einer Präsenzform des Stehens, die keinen besonderen Aufwand für das dauerhafte Einhalten dieser Präsenzform erkennen lässt - die Hand in der Hosentasche des aktuellen Sprechers steht in diesem Sinne in scharfem Kontrast zur Hand auf der Stuhllehne des Eröffnungssprechers (Bild 36). Während der Eröffnungssprecher mit dieser Positur der Verankerung die Verweildauer seiner Präsenz anzeigt (also eine Art durativen Aspekt seiner Präsenz) und in diesem Sinne kein „Übergangs-Moderator“ ist, zeigt der aktuelle Sprecher im Gegenteil seine bloß temporäre Präsenz an. 36 11 MO: nein ich glaube 12 wie es mit himmel und hölle aussieht 13 dafür haben wir ja heute einen fachmann hier 37 14 der uns das genau erklären kann 15 wir freuen uns dass (--) Heiko Hausendorf / Reinhold Schmitt 258 16 burkhard hotz das uns in einer predigt 17 kurz und knackig 18 wie wir es gewohnt sind (--) 19 rüberbringt und besonders an diesem ostertag 38 20 MO: uns nochmal bewusst machen kann 21 was es heißt 39 22 den himmel sozusagen schon in der tasche zu haben 23 (1.0) 24 wir freuen uns auf burkhard hotz Erst als der Sprecher (in Z. 22) bei den himmel angelangt ist, sind alle Stühle in der Sakristei verschwunden, und der Off-Sprecher ist gerade dabei, die Tür zur Sakristei zu schließen. Die Geschichte der vier Stühle vor dem Altar ist damit definitiv abgeschlossen und unsere Analyse an dieser Stelle zu ihrem Ende gekommen. Das Zitat einer typischen „Moderatoren-Pose“ passt sehr gut zur oben festgestellten Positionierung in einem Zwischen- und Übergangsbereich: Der Sprecher positioniert sich in der aktuellen Situation als Moderator des Übergangs unterschiedlicher Elemente des Gottesdienstes. Aus der Kenntnis des Ge- Vier Stühle vor dem Altar 259 samtdokuments wissen wir, dass es der Übergang vom Anspiel zur Predigt ist, also ein Übergang von einem schon durch die Bezeichnung als Anspiel in seiner Funktionalität für ein nachfolgendes Kerngeschehen kenntlich gemachten Element zu dem fraglichen Kernelement des Geschehens selbst. Gemäß der Liturgie des protestantischen Gottesdienstes handelt es sich dabei um die Predigt. Wir haben es insofern auch mit einem für die Kontextualisierung des Geschehens zwischen Alpha-Erlebnis und normalem Gottesdienst relevanten Übergang zu tun. Diese Spannung bzw. das Oszillieren zwischen beiden Aspekten findet sich auch in der Ankündigung des Pfarrers. Hier schwankt der Moderator zwischen der alltagsweltlichen Bezeichnung ‘Fachmann’, die für Gottesdienst unspezifisch ist, und der Predigt, die - in dieser unmarkierten Form - eine konstitutive Form des Gottesdienstes darstellt. Derjenige, der die kategoriengebundenen Aktivitäten des Predigens realisiert, wird wiederum verschwiegen, die Aktivität selbst hingegen - in fast jugendsprachlichem Ausdruck - als „kurz und knackig rüberbringen“ formuliert. So pendelt sich die Perspektive des Moderators tendenziell auf der Seite der alphaspezifischen Sozialform als „egalitär-rollenunspezifisch“ ein. Dies ist zumindest so weit der Fall, dass er sich herausnimmt, den Pfarrer auf die beschriebene Art und Weise zu positionieren. In diesem Spannungsfeld, das wir bereits bei der Präsenzfigur des jungen Mannes gesehen haben, ist es kein Zufall, dass genau in diesem Übergang, den der aktuelle Sprecher verkörpert, die Stühle „aus dem Weg“ geräumt werden. Passend dazu setzt überlappend dazu eine schon durch Position und Positur kenntlich gemachte Moderation ein, mit der die Stühle, die gerade noch sichtbar sind und im Rücken des Sprechers verstaut werden, gleichsam überspielt werden: Wenn auf der Bühne vor Publikum umgebaut werden muss, ist es Aufgabe des Moderators, das Publikum durch Unterhaltung genau davon abzulenken. 6. Schlusswort Die zurückliegenden Analysen zu den vier Stühlen, ihrer Nutzung durch unterschiedliche Personen und die Art und Weise, wie ihr Verschwinden unmittelbar vor der Predigt des Pfarrers „überspielt wird“, macht in sinnbildlicher Weise einen zentralen Aspekt des Alpha-Gottesdienstes deutlich. Der Alpha- Gottesdienst als moderne Form mit seinem Potenzial individueller Gestaltung gefährdet durch den Import alltagsweltlicher Interaktionsformen und Ausstattungsgegenständen die Ritualität des traditionellen Gottesdienstes mit dem Pfarrer als einziger und dauerhafter Fokusperson. Gleichzeitig - und als gegenläufige Bewegung - zeigt sich der traditionelle Kirchenraum und die Heiko Hausendorf / Reinhold Schmitt 260 in seiner Interaktionsarchitektur inhärente Ritualität erstaunlich stabil. Sie wird in ihrer Relevanz als verhaltenssteuernde Orientierung derjenigen deutlich, die den Gottesdienst aktiv mitgestalten. Diese Spannung zwischen moderner Sozialform und traditioneller Interaktionsarchitektur wird in der Spezifik der Positionierung des jungen Mannes sichtbar. Seine Orientierung auf den Pfarrer als traditionelle Fokusperson des Gottesdienstes führt ihn zu den Stühlen, die er als Hilfsmittel nutzt. Sie „stützen“ ihn bei der Bearbeitung der Aufgabe, sich nicht nur im kirchenräumlichen Vorne zu positionieren, sondern auch in dem beschriebenen Spannungsverhältnis zu verorten und für sich darin einen adäquaten Platz zu finden. Auch bei den „Anspielerinnen“ wird die Reaktion auf das Spannungsverhältnis von moderner Sozialform und traditionell-rituellem Funktionsraum in ihrer besonderen Spielweise deutlich. Sie unterlassen alles, was dazu führen könnte, das Anspiel als für den Gottesdienst funktionalen Beitrag zu einem eigenwertigen „Stück“ im alltagsweltlichen Sinne werden zu lassen, welches sie selbst in ihrer Rolle als Schauspielerinnen zu stark hervorhebt. Und auch bei dem Moderator, der - wohl nicht nur aufgrund seiner spezifischen Aufgabe, das Verschwinden der Stühle zu überspielen, sondern auch in seiner Rolle als musikalischer Unterhalter - die mit der Sozialform verbundenen individuellen Gestaltungsmöglichkeiten am weitesten ausreizt, bleibt der zentrale Platz des Pfarrers vor der Mitte des Altars frei. Und das, obwohl er ihn in sehr alltagsweltlichen Worten ankündigt. Man kann in den Videoaufnahmen insgesamt deutlich erkennen, dass sich diese - wie wir erfahren haben, in der Gemeinde seit einigen Jahren sehr erfolgreiche - Gottesdienstform noch im Stadium der kontinuierlichen Aushandlung zwischen Alpha-Team und Pfarrer befindet. Es scheint noch nicht ganz klar, wer in welcher Funktionsrolle seinen Gestaltungswillen wie weit ausleben kann und was dies beispielsweise für die Rolle des Pfarrers im Alpha-Gottesdienst bedeutet. Solange dieses Strukturelement auch für die Gottesdienstbesucher/ innen erfahrbar bleibt, dürfte der Alpha-Gottesdienst seine durch Besucherzahlen und Zuspruch für alle Beteiligten gut dokumentierte Attraktivität behalten. Vier Stühle vor dem Altar 261 7. Literatur Baumann-Neuhaus, Eva (2008): Kommunikation und Erfahrung. Aspekte religiöser Tradierung am Beispiel der evangelikal-charismatischen Initiative ‘Alphalive’. Marburg: diagonal. Hausendorf, Heiko/ Schmitt, Reinhold (2010): Opening up openings. Zur multimodalen Konstitution der Eröffnungsphase eines Gottesdienstes. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen. Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 53-101. Hausendorf, Heiko/ Schmitt, Reinhold (2014): Vier Stühle vor dem Altar. Eine interaktionslinguistische Fallstudie zur Raumnutzung in einem „Alpha-Gottesdienst“. Arbeitspapiere des UFSP Sprache und Raum (SpuR-03). Juni 2014. Zürich. www. zora.uzh.ch/ 99117/ 1/ SpuR_Arbeitspapier_Nr03_140702-pdf (Stand: Juni/ 2016). Hunt, Stephen (2004): The alpha enterprise. Evangelism in a post-christian era. Aldershot: Ashgate. Linke, Angelika (2012): Körperkonfigurationen: Die Sitzgruppe. In: Peter Ernst (Hg.): Historische Pragmatik. Berlin/ Boston: de Gruyter, S. 186-214. Mondada, Lorenza/ Schmitt, Reinhold (2010): Zur Multimodalität von Situationseröffnungen. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen: Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 7-52. Schmitt, Reinhold (1992a): Die Schwellensteher. Sprachliche Präsenz und sozialer Austausch in einem Kiosk. (= Forschungsberichte 68 des Instituts für Deutsche Sprache Mannheim). Tübingen: Narr. Schmitt, Reinhold (1992b): Das Konzept der Präsenzfigur. Ein Beitrag zur Integration von Konversationsanalyse und objektiver Hermeneutik. In: Protosoziologie 3, S. 123-131, 141-143. Schmitt, Reinhold (2012): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung Online-Zeitschrift zur verbalen Interaktion 13, S. 1-44. www.gespraechsforschung-online.de/ fileadmin/ dateien/ heft2012/ ga-schmitt.pdf (Stand: Juni/ 2016). Sigrist, Christoph (2014): Kirchen Diakonie Raum. Untersuchungen zu einer diakonischen Nutzung von Kirchenräumen. Zürich: Theologischer Verlag. Heiko Hausendorf / Reinhold Schmitt 262 Gliederung 1. Einleitung ..............................................................................................................227 2. Vor dem Altar vier Stühle ...................................................................................228 2.1 Vor dem Gottesdienst ..........................................................................................229 2.2 Gebauter und gestalteter Kirchenraum ............................................................230 2.3 Vier Stühle und ihre interaktionsarchitektonischen Implikationen .............234 3. Eröffnung: Ein junger Mann neben den Stühlen .............................................237 3.1 Der Gang zum Mikrofon.....................................................................................238 3.2 Positionierung neben den vier Stühlen und Eröffnung..................................239 3.3 Die Folgen der Positionierung für die Anbetung ............................................244 3.4 Stühle als Positionierungshilfe ...........................................................................247 4. Der Altarraum als Bühne: Anspiel und Stuhlnutzung ...................................248 4.1 Vier Stühle vor der Himmelspforte: das „Anspiel“ ........................................248 4.2 Vier Stühle als Requisit des Anspielbühnenbildes ..........................................252 5. Wenn die Stühle ausgedient haben: Von den Stühlen zu soner bank ............253 6. Schlusswort ...........................................................................................................259 7. Literatur .................................................................................................................261 ULRICH DAUSENDSCHÖN-GAY / REINHOLD SCHMITT WARTEN IM KLASSENRAUM ALS INSTITUTIONELLE PRAKTIK 1 1. Einleitung Der auf den ersten Blick etwas seltsame Titel unseres Beitrags reflektiert in erster Linie die Spezifik unseres Falls, mit dem wir uns beschäftigen. Wir haben es nämlich mit einem Beispiel institutioneller - hier schulischer - Praxis zu tun, das sich einer klaren Klassifikation hinsichtlich seiner Aktivitätstypik und seines institutionellen Charakters zunächst widersetzt. Wir werden die Klärung dieses Problems der auffälligen Fallspezifik in folgenden Etappen angehen: Wir nähern uns in voranalytisch-beschreibender Weise der Fallspezifik so weit an (Kap. 1.1), dass wir unser Erkenntnisinteresse in hinreichender Weise durch die Spezifik des Falls motiviert formulieren können (Kap. 1.2). Dann verorten wir unseren Fall institutioneller Praktik im etablierten Forschungsfeld ‘Unterrichtsanalyse’ (Kap. 1.3). Bevor wir schließlich im analytischen Teil den Fall im ethnomethodologischen Verständnis als gemeinsame Hervorbringung der Beteiligten und als Lösung eines institutionellen Problems analysieren (Kap. 3), rekonstruieren wir die Interaktionsarchitektur des Klassenraums. Dies ist notwendig, weil die Beteiligten neben den multimodalen Ressourcen ihres interaktiven Verhaltens beim Warten zentral auf den Raum als Ressource zurückgreifen. Um die Relevanz des Raumes und die sozialtopografischen Grundlagen seiner situativen Nutzung angemessen beurteilen zu können, müssen wir die Interaktionsarchitektur des Klassenraums in seiner interaktionsvorgängigen Ressourcenausstattung rekonstruieren (Kap. 2). 1.1 Der Fall. Warten auf den Unterrichtsbeginn Der Fall dokumentiert den Aufschub eines Unterrichtbeginns, der damit zusammenhängt, dass in der vorangegangenen Stunde in einem anderen Fach und Raum eine Arbeit geschrieben wurde und deswegen zum vorgesehenen Unterrichtsbeginn noch nicht alle Schüler anwesend sind. Wir haben es also mit einer - durch die Institution Schule selbst initiierten - Verzögerung des Unterrichtbeginns zu tun. Dies ist zumindest die Sicht der Anwesenden und der nach und nach Hinzukommenden, welche die Situation in genau dieser Qualität herstellen und bearbeiten. 1 An anderer Stelle (Schmitt/ Dausendschön-Gay 2015) haben wir denselben Fall genutzt, um allgemeine methodisch-methodologische Überlegungen zur Raumanalyse anzustellen. Hier steht der Fall nun in der ihn charakterisierenden Aktivitätsspezifik und seiner institutionsreproduktiven Qualität im Fokus. Ulrich Dausendschön-Gay / Reinhold Schmitt 264 Am Anfang des Dokuments ertönt der Pausengong, mit dem üblicherweise der im Strukturschema der Institution erwartbare Beginn einer neuen Unterrichtstunde markiert wird. Hier aber hat dieses Signal keinerlei Einfluss auf das Verhalten der Anwesenden. Auch die Tür des Klassenraums, die in der Regel im unmittelbaren Anschluss an den Gong vom Lehrer geschlossen wird, bleibt weiterhin offen. Gleichzeitig betreten aber Schüler den Raum und legen Rucksäcke oder Taschen und Jacken auf den vorhandenen Tischreihen ab. Sie markieren damit den Bereich als „ihren“ Platz, nehmen diesen jedoch nicht ein. Vielmehr bewegen sie sich in Richtung Fensterfront und begeben sich dort in wechselnde kommunikative Interaktionen, an denen anfänglich auch der Lehrer teilnimmt. Die Gespräche der Schüler kreisen dabei um Themen, die weitgehend von der gerade beendeten Klausur bestimmt sind. Weiterhin wird thematisiert, dass die Schüler wegen der Klausur nach und nach „verspätet“ eintreffen und damit den Unterrichtsbeginn dieser Stunde verzögern. Der frühe Hinweis an den Lehrer lautet: wir haben gerade eine arbeit geschrieben herr fabian da können sie [eh länger] warten (Z. 35-36). Der Lehrer bleibt, von kleinen Sequenzen abgesehen, mit seinen verbalen Beiträgen weitgehend auf Themen orientiert, die funktional für den Unterricht sind. Er gibt damit seinerseits den strukturellen Rahmen für das Ereignis ab, das wir vor allem deshalb ‘Warten’ genannt haben. Der Raum füllt sich in der Folge zunehmend mit Schülern, die sich entweder direkt oder nach Ablage ihrer Taschen und Jacken in die „Fenstergesellschaft“ und den dort konstituierten Interaktionsraum 2 integrieren. Ab einem bestimmten Zeitpunkt lösen die Schüler den Interaktionsraum am Fenster auf, begeben sich auf ihre Plätze und machen so ihrerseits den Unterrichtsbeginn möglich, der dann auch tatsächlich stattfindet. Dieses Ereignis kann einerseits nicht problemlos als konstitutives Element von Unterricht rekonstruiert werden, zumal offenkundig die anwesenden Schüler mit ihrer „Fensterkommunikation“ sowie der Lehrer am Fokuspersonenplatz unterschiedliche Orientierungen zu erkennen geben. Andererseits ist es auch nicht möglich, die Situation als Verlängerung einer regulären Pause zu verstehen. Dazu fordert der Gong doch zu eindeutig zum Beginn von Unterricht auf, ist auch der Lehrer dauerhaft zu eindeutig auf Unterricht orientiert und legitimieren die Schüler gegenüber dem Lehrer zu oft ihre fehlende Bereitschaft zum Unterrichtsbeginn. 2 Zum Konzept ‘Interaktionsraum’ siehe Mondada (2007); Schmitt/ Deppermann (2007); Müller/ Bohle (2007) sowie Schmitt (2013). Mondada (2007) bietet eine detaillierte Diskussion, in welchem Verhältnis das Konzept ‘Interaktionsraum’ zu etablierten Vorstellungen wie ‘Situation’ oder ‘Kontext’ steht. Warten im Klassenraum als institutionelle Praktik 265 Wir haben uns angesichts dieser Sachlage bei der Typisierung des Geschehens für ‘Warten’ entschieden. Wir konzeptualisieren dieses Warten als eine interaktive Anforderung an die Anwesenden und Hinzukommenden, die institutionellen Charakter besitzt und im Rahmen institutioneller Relevanzen bearbeitet wird. Wir sehen darin also nicht etwa eine subversive Alternative, die situativ die Relevanzen der Institution außer Kraft zu setzen versucht. Es handelt sich vielmehr um eine Ausnahme vom reibungslosen Betrieb, die jedoch durchaus Bestandteil der institutionellen Praxis ist. Bei der interaktiven Bearbeitung von Ausnahmen können die Beteiligten nicht fraglos auf ihre habituellen Handlungsgrundlagen zurückgreifen, sondern müssen ihr Verhalten an den Ausnahmebedingungen ausrichten und sich dies auch wechselseitig anzeigen. Für die konkrete Art und Weise, in der die Beteiligten dies tun, ist es wichtig zu wissen, dass es sich bei dem Unterricht um die Ausbildung von betrieblichen Ausbildern (AdA) handelt. Es handelt sich also um erwachsene und berufstätige Schüler, mehr oder weniger im gleichen Alter wie der Lehrer. 1.2 Der Fall im Feld der Unterrichtsforschung Unterrichtskommunikation ist ein fest etablierter und hinsichtlich des empirischen Aspektreichtums gut untersuchter Gegenstand. Wir begnügen uns hier damit, auf den aktuellen Überblick in Putzier (Kap. 2.2.3, 2016) zu verweisen und die spezifische Qualität unseres Falls - das Warten als institutionelle Praktik - in seiner Kontrastqualität zu etablierten Fragestellungen und unseren eigenen Unterrichtsanalysen zu verdeutlichen. Für unser Erkenntnisinteresse spielen organisationsstrukturelle Aspekte der Institution Schule und/ oder deren gesellschaftlicher Bildungsauftrag keine Rolle. Wir analysieren auch keine Verfahren oder Prozesse, in denen Lehr- und Lerninhalte im Unterricht fach- und klassenspezifisch vermittelt werden. Auch die strukturelle Gefährdung dieses Lehr- und Lernprozesses durch nicht unterrichtskonforme Eigeninitiativen der Schüler/ innen in Form von Störungen, Nebenkommunikation und struktureller Unaufmerksamkeit steht nicht in unserem Erkenntnisfokus. Der aktuelle Fall hat wenig damit zu tun, multimodal gestaltete und raumerzeugende Interaktion als die konstitutive Grundbedingung von Unterricht erkennbar zu machen 3 oder Lernen als gemeinsam gestaltete, kulturelle und situierte Praxis im ‘Lernort Schule’ zu modellieren. 4 3 Eigene Arbeiten zu diesem Aspekt sind Schmitt (2009); Heidtmann/ Schmitt (2011); Kindermann et al. (2011); Schmitt (2011a, b; 2011 (Hg.); 2012a, b, c; 2013); Schmitt/ Knöbl (2013, 2014). 4 Siehe diesbezüglich und für den Bereich des zweisprachigen Unterrichts in der Primarstufe Dausendschön-Gay (2006, 2010 und 2012). Ulrich Dausendschön-Gay / Reinhold Schmitt 266 Der Fall, den wir nachfolgend analysieren werden, hat seine besondere Qualität darin, dass er zwischen den strukturellen Einheiten des institutionellen Ablaufs ‘Unterricht’ und ‘Pause’ „hängt“. Er verdeutlicht die Notwendigkeit, grundsätzlich alles, was im Rahmen der Institution Schule passiert, unter den Verdacht der institutionellen Reproduktion zu stellen. Indem man die gemeinsame Gestaltung von Wartephasen als institutionelle Praktik ins Auge fasst, bekommt man einen realistischen Einblick in die faktische Permanenz institutioneller Reproduktivität und in den Reichtum der Formen und der Komplexität des institutionsspezifischen kommunikativen Alltags. 1.3 Unser Erkenntnisinteresse Wir wollen mit unseren nachfolgenden Analysen das gemeinsame Warten als institutionelle Praktik fallanalytisch genau unter die Lupe nehmen. Dabei interessiert uns zum einen die Etablierung des Wartens in Reaktion auf situative Relevanzen, die offenkundig dazu führen, dass der geplante Unterricht, zu dessen Realisierung die Beteiligten im Klassenraum zusammentreffen, aufgeschoben werden muss. Wie also sehen die Verlaufstruktur und die interaktive Dynamik der Etablierung, der Aufrechterhaltung und des Übergangs zum thematischen Unterricht (die eigentliche Zielrealisierung des Wartens) im Detail aus? Zum anderen fokussieren wir die interaktive Hervorbringung des Wartens als gemeinsame Leistung der Anwesenden und als Ergebnis der Bearbeitung situativer Anforderungen, die mit der Verzögerung des Unterrichtbeginns zusammenhängen. Welche Verfahren und Ressourcen setzen die Wartenden in Abhängigkeit von ihrer rollenspezifischen Beteiligung als Schüler und Lehrer zur Realisierung dieses offiziellen Aktivitätszusammenhangs ein? Auf welche Ressourcen greifen sie dabei zu welchem Zeitpunkt der Entwicklung des Wartens zurück? ‘Warten’ wird von uns als eine transitorische Interaktionsphase verstanden, die von den im Klassenraum Anwesenden aktives Interaktionsengagement verlangt: Warten bedeutet nicht, einfach nichts zu tun. Institutionen mögen durch organisatorische Vorkehrungen versuchen, Wartephasen im Prozess ihrer Zielrealisierung zu verhindern; vermeiden lassen sie sich nicht. Sie sind vielmehr konstitutiver Bestandteil des institutionellen Alltags. Daher gehen wir davon aus, dass sich auch in der Art und Weise, wie gewartet wird, die Relevanzen der Institution reproduzieren. Warten ist kein geplanter Bestandteil des institutionellen Programms. Vielmehr gehört es zur Logik des Wartens, dass es situativ emergiert und projektiv auf die Realisierung einer anderen institutionellen Aktivität (hier Unterricht) bezogen ist. Warten wird durch die situative Unmöglichkeit der Realisierung dieser Kernaktivität motiviert und projiziert diese. Lassen sich - Warten im Klassenraum als institutionelle Praktik 267 und wenn ja, in welcher Form - im wartenden Verhalten der Beteiligten projektive Verweise auf die nachfolgende Kernaktivität finden? Etwas allgemeiner formuliert kann man unser Erkenntnisinteresse in folgender Frage zusammenfassen: Wie muss man sich unter Wahrnehmungswahrnehmungsbedingungen (Hausendorf 2003) in einem institutionellen Funktionsraum, der für die Realisierung spezifischer Kernaktivitäten hergerichtet ist, als Vertreter und als Nutzer der Institution verhalten, wenn sich aufgrund situativer (durch die Institution selbst initiierter) Relevanzen die Realisierung der Kernaktivität, die die zentrale Voraussetzung für die gemeinsame Anwesenheit im Funktionsraum darstellt, hinausschiebt? Bei dem Versuch, zumindest einige dieser Fragen zu beantworten, rekonstruieren wir als erstes die interaktionsarchitektonische Angebotsstruktur des institutionellen Funktionsraums, in dem das Warten realisiert wird. Erst im Anschluss analysieren wir die situative Herstellung, Aufrechterhaltung und Auflösung des Wartens. Diese methodische Entscheidung ist zwingend. Nur so kann das Ausmaß der Kontrastqualität der faktischen Raumnutzung 5 beim Warten gegenüber den Benutzbarkeitshinweisen der Interaktionsarchitektur in der notwendigen Klarheit deutlich werden. Die Raumnutzung der Anwesenden ist zentraler Bestandteil der interaktiven Bearbeitung des Wartens, vor allem in Form einer Verkörperung der „Legitimität des fensterseitigen Interaktionsraums“ dem anwesenden Lehrer gegenüber. Diese wird kontinuierlich verkörpert, unabhängig von der zwischen den Schülern konstituierten verbalen Interaktion. Daher ist im multimodalen Interaktionsverständnis eine analytische Konzentration auf das Verbale bei der Rekonstruktion der interaktiven Hervorbringung des Wartens - auch aufgrund der Datenspezifik - inadäquat. 6 Ein wesentlicher Aspekt dieser Datenspezifik besteht darin, dass über weite Strecken im Detail nicht zu verstehen ist, worüber die Mitglieder der Fensterfraktion sprechen. Wir folgen hier also - mit der Fokussierung auf die körperlich-räumliche Symbolisierung des Wartens - der konversationsanalytischen Orientierung, relevante Aspekte und Kategorien der empirischen Analyse „from the data themselves“ zu entwickeln (Schegloff/ Sacks 1973, S. 291). 5 Als Überblick zur Raumnutzung siehe Hausendorf et al. (Hg.) (2012) und zum aktuellen Stand der Forschung Schmitt (2013). Für eine ältere Konzeption unter dem Stichwort „la construction de l‘espace interactionnel“ vgl. Krafft/ Dausendschön-Gay (1999). Schmitt (2013, S. 43) sieht „Raum als eine von mehreren Ressourcen, auf die Interaktionsbeteiligte bei der lokalen Bearbeitung grundlegender Anforderungen der Interaktionskonstitution in gleicher Weise zurückgreifen wie beispielsweise auf Verbalität“. 6 Unter ‘multimodaler Interaktion’ verstehen wir die konstitutive Eigenschaft von Interaktion, multimodal zu sein. ‘Multimodale Interaktionsanalyse’ hingegen verweist auf die Analyseperspektive, die von den Beteiligten eingesetzten multimodalen Verfahren der Interaktionskonstitution herauszuarbeiten. Ulrich Dausendschön-Gay / Reinhold Schmitt 268 1.4 Methodische Konsequenzen der Fragestellung Bei der Videoaufnahme handelt es sich nicht um ein speziell für raumanalytische Erkenntnisinteressen konstituiertes Dokument. 7 Ursprüngliches Ziel der Aufnahmen war es vielmehr, Unterricht mit einem Schwerpunkt auf die lehrerspezifischen Aktivitäten und Beteiligungsweisen zu dokumentieren. Aufgrund des dafür realisierten Aufnahmedesigns wurde nicht der gesamte Klassenraum verkabelt, sodass die verbalen Aktivitäten der Fensterinteraktion nicht durchgängig akustisch wahrnehmbar sind. Durchgängig visuell wahrnehmen kann man jedoch die Raumnutzung der Beteiligten und ihre körperlichen Aktivitäten. Eine solche Datenlage mag aus klassisch-konversationsanalytischer Sicht und der damit verbundenen Konzentration auf monomodal-verbale Konstitutionsleistungen der Beteiligten als „Behinderung“ erscheinen. Für unser Erkenntnisinteresse ist dieser Aspekt der Datenspezifik jedoch aus zweierlei Gründen kein Problem: Zum einen befinden wir uns hinsichtlich der eingeschränkten akustischen Teilhabe am Fenstergeschehen in einer vergleichbaren Lage wie der Lehrer. So wie wir, muss auch er primär auf der Grundlage visueller Wahrnehmung einschätzen, inwieweit das Verhalten der Schüler im Fensterbereich Hinweise auf die Kontinuierung des Interaktionsraums liefert, den sie für das Warten als adäquates Territorium konstituiert haben. Er muss sich auf seine visuelle Wahrnehmung hinsichtlich der Frage verlassen, ob sich bereits Vororientierungen auf die Kernaktivität ausmachen und dann entsprechend zur Vorbereitung und Etablierung des Unterrichts nutzen lassen. Zum anderen spielen verbale Aktivitäten aufgrund der Eigenlogik des Wartens als institutioneller Praktik nicht zu jedem Zeitpunkt die gleiche wichtige Rolle. So ist beispielsweise in der Etablierungsphase des Wartens eine explizite Aushandlung über die Ausnahmesituation und die damit zusammenhängenden Implikationen und Anforderungen für die Beteiligten ohne die Ressource Verbalität schlichtweg kaum möglich. Ist die Situation in ihrer Ausnahmequalität jedoch verbindlich ausgehandelt, verringert sich die Notwendigkeit, für deren Aufrechterhaltung verbal aktiv zu werden. Hier treten dann visuell wahrnehmbare Kontinuierungsaktivitäten in den Vordergrund. Wir beantworten die Frage der methodischen Adäquatheit (Garfinkel/ Wieder 1992) aus einer konsequent multimodal-interaktionsanalytischen Perspektive, die sich auch in methodischer Hinsicht aus der wechselseitigen Dynamik von Datenspezifik und Erkenntnisinteresse vom Primat monomodal-verbaler Ressourcen und damit verbundener Analyseverfahren verabschiedet. Dabei 7 Unter Bezug auf Hausendorf/ Schmitt (2013) wird die „problematische“ Datenlage für raumanalytische Untersuchungen in Schmitt (i.Vorb. a) reflektiert. Zu einer speziell auf die Konstitution raumanalytischer Dokumente ausgerichteten Erhebung (Kirchenbesichtigungen) siehe Schmitt (i.Vorb. b). Warten im Klassenraum als institutionelle Praktik 269 erhalten die eingesetzten Ressourcen ihre analytische Zuwendung nicht aufgrund einer vorgängigen methodischen Entscheidung, sondern aufgrund ihrer Bedeutung, die ihnen die Beteiligten selbst bei der Bearbeitung des Wartens im Klassenraum situativ zuschreiben. 2. Die Interaktionsarchitektur des Klassenraums Das Forschungsprogramm der ethnomethodologischen Konversationsanalyse formuliert als eine wesentliche Aufgabe für die Beschäftigung mit Interaktionsdaten, dass die Analyse in der Lage sein muss, die Bedingungen für die Herstellung von Wirklichkeit zu rekonstruieren, die von den Beteiligten im Moment des gemeinsamen Handelns geschaffen und als Ressource für ihr Handeln genutzt werden. Auch wir folgen dieser analytischen Mentalität bei der Rekonstruktion der situativen Herstellungsleistungen derjenigen, die in dem Videoausschnitt, den wir der Analyse zugrundelegen, im Klassenraum gemeinsam warten. 2.1 Eine kurze methodologische Bemerkung Der zentrale Unterschied zur konversationsanalytischen Arbeitsweise besteht aber darin, dass der initiale Analysezugang nicht bereits auf Interaktion abzielt. Er fokussiert vielmehr das Angebot für Interaktion, das durch die architektonische Verfasstheit des Raums nahegelegt wird (Stichwort ‘Benutzbarkeitshinweise’). Die architektonische „Verfasstheit“ eines Raums verstehen wir - ganz im Sinne der Ethnomethodologie - als ein Angebot zur Lösung rekurrent auftretender praktischer Probleme. Die Verfasstheit des Raums wird also nicht über die Beobachtung de facto stattfindender Interaktionen rekonstruiert, sondern als Implikation der Architektur selbst konzipiert. Mit einer solchen Konzeption beschreiten wir einen methodischen Weg, der uns relativ weit von der analytischen Mentalität der klassischen Konversationsanalyse entfernt. Denn wir fragen gezielt nach den Voraussetzungen für Interaktionsereignisse, so, als gäbe es dabei „Unhintergehbares“: Das Warten im Klassenraum erhält für die Beteiligten seinen Sinn dadurch, dass sie auch beim Warten auf die „Basisfunktion“ des Raums und die damit usuell erwartbare Interaktion orientiert sind. Ein solcher analytischer Zugang erfordert eine eigenständige Methodologie, die wir nicht im Repertoire der üblichen konversationsanalytischen oder ethnografischen Instrumente finden. Wir finden sie jedoch in dem von Hausendorf/ Schmitt (i.d.Bd.) beschriebenen Verfahren der „interaktionistischen Standbildanalyse“. 2.2 Interaktionsarchitektonische Basiskonzepte Als empirische Grundlage der interaktionsarchitektonischen Rekonstruktion nutzen wir zwei Standbilder, die den Klassenraum zum selben Zeitpunkt aus Ulrich Dausendschön-Gay / Reinhold Schmitt 270 gegenläufigen Perspektiven zeigen. Bild 1 zeigt die Perspektive der Kamera, die in der hinteren linken Ecke platziert war und sich speziell auf den Lehrer und seinen Aufenthaltsbereich an seinem Tisch und vor der Tafel konzentrierte. Bild 2 (Gegenschuss) gibt die Sicht der Kamera wieder, die aus der linken vorderen Ecke des Raums das Geschehen in den Tisch- und Sitzreihen festhielt. Im hiesigen Kontext können wir die mit der jeweiligen Kameraperspektive verbundene, eigenperspektivische Modellierung des Raums außer Acht lassen und beide Sichtweisen als additive, wechselseitige Stützung nutzen. 8 1 2 8 Unter einem methodologischen Erkenntnisinteresse haben wir uns in Schmitt/ Dausendschön- Gay (2015) bewusst nur für die Perspektive des zweiten Bildes entschieden, um beide Perspektiven nicht zu mischen. Warten im Klassenraum als institutionelle Praktik 271 Die Rekonstruktion der klassenräumlichen Architektur erfolgt mit dem Ziel, die zentralen interaktionsarchitektonischen Basiskonzepte (Hausendorf/ Schmitt i.d.Bd.) des institutionellen Funktionsraums zu identifizieren und diese im Hinblick auf ihre Verweisqualität auf bestimmte Kernaktivitäten zu befragen. Die Standbildanalyse hat vor allem vier Basiskonzepte als relevant ausgewiesen: Verweilbarkeit, Besitzbarkeit, Sichtbarkeit und Begehbarkeit. 2.2.1 Verweilbarkeit 9 Der erste Eindruck, den die gesamte innenarchitektonische Ausstattung des Raums vermittelt, bezieht sich auf die zeitliche Dauer des Aufenthaltes, die mit der Anwesenheit usueller Raumnutzer im Klassenraum verbunden ist. Sowohl die architektonischen Ensembles der Tisch- und Stuhlreihen, über die eine deutliche Präsenzform des ‘Sitzens’ nahegelegt wird, als auch die große, wandfüllende Tafel und die Projektionsfläche des Overheadprojektors weisen den Raum in erster Linie als einen „Verweil-Raum“ aus. Man assoziiert dieses Verweilen auch sofort mit bestimmten Kernaktivitäten, die durch die zeitliche Dauer ermöglicht werden. Verweil-Räume kontrastieren diesbezüglich in erkennbarer Weise mit Transitionsräumen (Umkleidekabine, Wartezimmer beim Arzt, Bahnschalter). Nutzer des Raums sollen nicht nur kurz eintreten, sondern sich für eine längere Zeit in dem Raum aufhalten. Und sie sollen dies in einer für all diejenigen, die an den Tischen sitzen, einheitlichen Weise tun: mit dem Blick nach vorne, ausgerichtet auf speziell angebrachte Schreib- und Projektionsflächen. Das Verweilen soll also in einer qualifizierten Weise erfolgen. Diese ist mit einer Vorstrukturierung der visuellen Wahrnehmung verbunden, legt als spezifische Präsenzform das Sitzen nahe und ist für einen Kernaktivitätszusammenhang hergerichtet, der sich in erster Linie an den Tischen realisiert. Aufgrund der Gegenläufigkeit der Tischreihen und des Einzeltisches im Vorne wird weiterhin deutlich, dass sich das Verweilen in der Grundkonstellation „many faces to one face“ vollziehen wird. Das Verweilen ist also nicht mit einer einheitlich gültigen Ausrichtung auf das Vorne verbunden, sondern in seiner Grundstruktur gegenläufig. 9 Wir sind mit dem Begriff ‘Verweilbarkeit’ nicht sehr glücklich. ‘Verweilen’ besitzt eine Konnotation, die in Richtung „sich Zeit lassen“, „es sich gemütlich machen“ und „ausruhen“ verweist. Wir nehmen diesen Umstand jedoch mangels einer adäquateren Bezeichnung für das uns interessierende Phänomen in Kauf. Ulrich Dausendschön-Gay / Reinhold Schmitt 272 2.2.2 Besitzbarkeit Besitzbarkeit ist ein qualitativer Aspekt der Verweilbarkeit und implementiert ‘Sitzen’ als präferierte Präsenzform der Stühle- und Tischfraktion. Die Stühle sind von gleicher Beschaffenheit und mit einer hellen Rückenlehne und Sitzfläche ausgestattet, die ineinander übergehen. Getragen wird die Sitzmöglichkeit durch eine Stahlkonstruktion, die für Stabilität sorgt. Die Stühle sind alle gleich ausgerichtet und weisen mit ihrer Sitzfläche von der Wand weg auf das Vorne. Tische und Stühle sind arrangiert, in Reihen geordnet und mobil (Bild 3). Trotz des erkennbaren Ensemblecharakters sind Tische und Stühle variabel einsetzbar, sodass wir die aktuelle Anordnung nicht als einzige Möglichkeit des Arrangements verstehen. 3 Stühle und Tische bilden ein funktionales Architekturensemble und sind unter handlungsfunktionaler Sicht architektonische Grundelemente. Ihre Form und Farbe demonstrieren funktionale Schmucklosigkeit, die man auch bei der Decken- und Wandgestaltung sehen kann. Es handelt sich sowohl bei den Stühlen als auch den Tischen primär um Elemente einer Arbeitsumgebung, auf keinen Fall jedoch um bequeme Sitzmöglichkeiten, bei denen man beispielsweise Armlehnen und Sitzpolsterung erwarten würde. 4 Warten im Klassenraum als institutionelle Praktik 273 Besitzbarkeit als wesentliches interaktionsarchitektonisches Basiskonzept und die spezifische Weise, in der es in der hier vorliegenden Architektur realisiert ist, liefern deutliche kernaktivitätsspezifische Hinweise. Diese sind hinsichtlich des Einzeltisches und Einzelstuhls unspezifischer als bei den gegenläufig positionierten Reihen. Anders als bei den nach vorne ausgerichteten Sitzenden verfügt die Vorne-Person über einen größeren Bewegungsfreiraum und damit über die Möglichkeit, zwischen einer sitzenden, stehenden oder räumlich dynamischen Präsenzform zu wählen (Bild 4). Das ermöglicht der Vorne-Person, ihre Positionierung im Raum selbstbestimmt auf jeweilige situative Anforderungen abzustimmen. Auch dies betonen die bereits deutlich gewordenen Aspekte ‘Gegenläufigkeit’, ‘strukturelle Differenz’ und ‘Arbeitsteilung’. 2.2.3 Sichtbarkeit Eine weitere interaktionsarchitektonische Implikation des Klassenraums ist Sichtbarkeit. Sichtbarkeit muss im Rahmen der gerade betonten Gegenläufigkeit als bidirektional konzipiert werden. Das, was durch die Anordnung der Stühle und Tische für visuelle Wahrnehmung angeboten wird, ist zunächst einmal das Vorne. Dieses Vorne besteht - als Pendant zu den Stuhl- und Tischreihen - aus einem gegenläufig ausgerichteten Tisch, der mittig an die erste Tischreihe anstößt, und einem Stuhl, der eng an den Tisch herangerückt ist. Soll dieser zum Sitzen genutzt werden, muss er dafür erst einmal in Position gebracht werden. Es ist unschwer zu erkennen, dass an diesem Tisch nur eine Einzelperson Platz findet, die durch die architektonisch implementierte Struktur von Wahrnehmungswahrnehmung automatisch in den Fokus der an den Tischen Sitzenden gerückt wird. Diese Person wird durch die Interaktionsarchitektur darin unterstützt, die Sitzenden auf sich und das eigene Verhalten zu orientieren (Bild 5). Wir haben es hier also mit der interaktionsarchitektonischen Konstitution einer Fokusperson zu tun. Als Teil der interaktionsarchitektonischen Unterstützung der Fokusperson verfügt das Vorne über einen großzügigen, frei begehbaren Bereich. Dieser stattet die Fokusperson mit territorialer Freiheit und einem großen Bewegungsradius aus. In den Fokus visueller Wahrnehmung der Sitzenden werden zudem eine dreiteilige Tafel und die Projektionsfläche eines Overheadprojektors gerückt. Die Orientierung der visuellen Wahrnehmung hat demnach ihre Funktionalität im Sehen und Lesen von Informationen, die auf diese Flächen projiziert und angeschrieben werden. Die Interaktionsarchitektur trägt strukturell auch zur Lösung des Problems der Informationsvermittlung und der Vermittlung von Wissensinhalten bei. Demgegenüber ist der Bereich der Fensterfront (Bild 6), Ulrich Dausendschön-Gay / Reinhold Schmitt 274 an dem man sich stehend aufhalten kann, hinsichtlich der interaktionsarchitektonischen Bearbeitung des Sichtbarkeitsproblems deutlich rückgestuft. Die Relevanz der Fensterfront hat nichts mit Sichtbar-Machen zu tun, sondern liefert selbst eher eine Voraussetzung dafür, dass die visuelle Wahrnehmung des Vorne unterstützt wird. 5 Wie man sehen kann, lädt sie jedoch auch dazu ein, sich der Außenwelt zuzuwenden. Dieser Bereich ist allerdings aufgrund des Fehlens von Sitzgelegenheiten nicht für eine längere Verweildauer vorgesehen. Die mit der visuellen Durchlässigkeit der Fensterfront verbundene Sichtbarkeit der Außenwelt hat nicht die Qualität eines interaktionsarchitektonischen Basiskonzeptes. Sie ist vielmehr die Folge der Entscheidung, die auf die Funktionsrealisierung bezogene Bearbeitung des Sichtbarkeitsproblems durch eine Reihe von Fenstern zu bewerkstelligen. 6 Der zweite Aspekt der bidirektionalen Sichtbarkeit besteht in der Tatsache, dass die Vorne-Person einen guten Überblick über die an den Tischen Sitzenden hat. Sie kann jederzeit wahrnehmen, verfolgen und kontrollieren, was an und auf den Tischen geschieht. So, wie sie in den Wahrnehmungsfokus der Stuhl- und Tischfraktion gerückt wird, wird diese wiederum zum Gegenstand der Wahrnehmung der Fokus-Person. Einer solchen Struktur von Wahrnehmungswahrnehmung, bei der eine Person vielen Personen gegenübertritt Warten im Klassenraum als institutionelle Praktik 275 und durch die Interaktionsarchitektur dabei unterstützt wird, wahrzunehmen, was diese tun, ist der Aspekt von Kontrolle strukturell inhärent. Der Hinweis auf die Unterstützung der Kontrolle durch die Interaktionsarchitektur ist dabei wichtig, weil er die Grundlage darstellt, Situationen mit gleicher Wahrnehmungswahrnehmung in sozialhaltiger Weise zu differenzieren. So macht es einen Unterschied, ob die Interaktionsarchitektur tatsächlich eine Draufsicht auf die Tische ermöglicht, oder ob die Sicht auf die Tische interaktionsarchitektonisch verhindert wird. Bei gleicher Struktur der Wahrnehmungswahrnehmung etablieren genau solche interaktionsarchitektonischen Aspekte die sozialen Differenzen zwischen Klassenraum, Kirche und Vorlesungssaal. Hier ist es vor allem die „flache Organisation“ des Klassenraums, deren spezifische Implikativität deutlich wird, wenn man sie mit den aufsteigenden Sitzreihen eines Vorlesungssaals und den damit einhergehenden Veränderungen der bidirektionalen Sichtbarkeit vergleicht. 2.2.4 Begehbarkeit Die statusimplikative Ausdifferenzierung, die wir bereits wiederholt thematisiert haben, wird auch hinsichtlich des Basiskonzeptes ‘Begehbarkeit’ deutlich. Die begehbaren Bereiche des Klassenzimmers sind zum einen so organisiert, dass die Schüler ihre Plätze in den Tisch- und Stuhlreihen von zwei Seiten erreichen können: von einem begehbaren Bereich vor der Fensterfront und einem vor der gegenüberliegenden Wand. Das ist gewissermaßen die „Zubringerfunktion“ der Begehbarkeit, die sich in dem Moment realisiert hat, in dem die Schüler zu Beginn der Stunde ihre Plätze sitzend eingenommen und diese - am Ende der Stunde - wieder verlassen haben. Von dieser Zubringerfunktion ist die Funktionalität des begehbaren Bereichs im Vorne des Klassenraums zu unterscheiden. Dieser Bereich wird zwar auch für die Transition bei der Sitzplatzeinnahme und beim Verlassen des Raumes genutzt. Seine Primärfunktion ist jedoch eine andere: Er stellt der Fokusperson und der Person, die sich in der Fokusposition aufhält, einen Bereich zur Verfügung, in dem die an der Stirnwand befestigten Arbeitsgeräte (Tafel, Overheadprojektor) vom Tisch aus ungehindert erreicht werden können. Darüber hinaus unterstützt diese frei begehbare Fläche die dynamische Positionierung und die damit verbundene unterschiedliche Fokussierung eines Teils der Tischreihen. Allein schon die Möglichkeit, Präsenzformen frei wählen zu können, unterscheidet in sozial implikativer Weise die Vorne-Person von den Sitzenden. In diesem Sinne definiert die ungleiche Verteilung frei begehbarer Flächen und die ungleiche Zugänglichkeit dieser Flächen in gleicher Weise funktionale Differenzierung, wie dies der gegenläufige Einzeltisch und der privilegier- Ulrich Dausendschön-Gay / Reinhold Schmitt 276 te Zugang zur Tafel und zum Projektor tun. Während wir also im Vorne- Bereich Mobilität als Voraussetzung vielfältiger Formen der Raumnutzung vorfinden, sind die Möglichkeiten zwischen den Tischen einseitig auf das Sitzen und Nach-vorne-Schauen begrenzt. Die interaktionsarchitektonische Gestaltung bearbeitet also auch Anforderungen, die eher sozialsymbolische Qualität besitzen, zu denen beispielsweise die Verdeutlichung funktional differenzierter Rollen gehört. Schüler und Lehrer sind unter dieser Perspektive immer schon interaktionsarchitektonisch repräsentiert. In gewisser Weise überdauern sie in dieser interaktionsarchitektonischen Repräsentanz die ephemeren Situationen ihrer faktischen Präsenz in institutionsreproduktiver Weise. 2.3 Ästhetische Merkmale In ästhetischer Hinsicht wird die gesamte Innenarchitektur durch eine funktionale Schlichtheit bestimmt, wie sie für viele institutionelle Funktionsräume charakteristisch ist. Die vorherrschende Farbe ist ein neutral-unauffälliges Eierschalenweiß, das für die Gestaltung der Wände und Decken eingesetzt wird und sich auch bei den Tischen wiederfindet. Es produziert eine einfarbige und unstrukturierte Flächigkeit, aus der kein Objekt heraussticht, das sich einer gesonderten Wahrnehmung anböte (Bild 7). Die Architektur steht selbst nicht im Blickpunkt; sie besitzt keine Eigenwertigkeit, die Attraktion entwickeln und von der Realisierung der jeweiligen Kernaktivitäten ablenken würde. Sie ist darüber hinaus auch nicht geeignet, als statussymbolisierend mit prestigehaltigen Implikationen missverstanden zu werden. Die Ästhetik der Innenausstattung des Klassenraums spielt ihre Rolle eindeutig und vollständig als funktionale Dienerin der Realisierung institutionsspezifischer Kernaktivitäten. Wesentliche Aspekte sind in diesem Zusammenhang Schlichtheit, farbliche Unauffälligkeit sowie Rekurrenz und Symmetrie der Architekturelemente und ihrer Anordnung. Insgesamt herrscht eine architektonische Gestaltungsorientierung vor, die dazu führt, dass man sich in dem Raum nicht über die Maßen gemütlich fühlt bzw. einrichtet - gleichwohl man zum längerzeitigen Verweilen aufgefordert ist. 7 Warten im Klassenraum als institutionelle Praktik 277 2.4 Verweise auf Kernaktivität(en) Hinsichtlich der handlungsfunktionalen Implikationen der Benutzbarkeitshinweise der Architektur haben wir es mit einem institutionellen Funktionsraum zu tun, der für die Realisierung bestimmter Kernaktivitäten hergerichtet wurde. Die durch die Interaktionsarchitektur nahegelegte Interaktion besteht dabei für die Vielen primär in einer sitzenden Tätigkeit, für welche die Tische als Arbeitstische für Schreiben, Lesen und sonstige - eher kognitiv orientierte - Handlungstypen wesentlich sind. Die Beteiligungsweise an diesen kognitiv strukturierten Kernaktivitäten unterliegt dabei einer Arbeitsteilung von ‘Lehren und Lernen’, ‘Produzieren und Rezipieren’, ‘Sprechen und Zuhören’, ‘Strukturieren und Folgen’. Der institutionelle Funktionsraum ist also erkennbar auch für die Realisierung von Statusunterschieden, Hierarchien, Funktionsrollen, Arbeitsteilung und damit zusammenhängenden multimodalen Beteiligungsweisen ausgestattet. Eine durch den Raum implementierte Grundkonstellation, bei der eine einzelne Person vielen anderen Personen entgegentritt, ist ohne solche sozialen Implikationen der Kernaktivitätsrealisierung kaum denkbar. 3. Fallanalyse Nachfolgend rekonstruieren wir, wie das Warten als alternative Situationsdefinition explizit ausgehandelt wird, dann kollektiv als institutionelle Praktik vollzogen wird und wie sich die Wartenden schließlich auf den Unterrichtsbeginn orientieren und diesen dann gemeinsam herstellen. 3.1 Segment 1: Alternative Situationsdefinition Wir beginnen die analytische Rekonstruktion mit den ersten Reaktionen bereits anwesender Schüler auf die Situation, dass - obwohl der Unterrichtsbeginn unmittelbar bevorsteht - der überwiegende Teil der Klasse noch mit dem Abschluss der Klassenarbeit beschäftigt ist. 3.1.1 Ankündigung des Rauchers Wir steigen in die verbale Analyse zu dem Zeitpunkt ein, zu dem sich der Lehrer und der Aufnahmeleiter unterhalten. In die Abschlussphase dieses Gesprächs integriert sich der Schüler Sören (SÖ) mit folgender Äußerung: 32 SÖ: herr FAbian (1.0) 10 33 ich geh no_mal schnell rAUchen 34 sonst bin ich nich AUfnahmefähig ne 10 Die Transkription erfolgt in Anlehnung an Selting et al. (2009). Ulrich Dausendschön-Gay / Reinhold Schmitt 278 Bei dieser Äußerung handelt es sich um die zweite Initiative des Schülers, sich zum Rauchen abzumelden. Die erste Initiative geh aber DANN eine RAUchen [ne? ] (Z. 16) blieb ohne Folgen, da sie in Konkurrenz zur etablierten Interaktionsdyade von Lehrer und Aufnahmeleiter realisiert wurde. Betrachtet man das Verhältnis der beiden Initiativen, fällt Folgendes auf: Der erste Versuch wurde von der Tür aus, aus größerer Distanz zum Lehrer, formuliert und hat die Form einer Mitteilung, die jedoch strukturell durch die tag question ne? auf Ratifikation angelegt ist. Der zweite Versuch ist keine Mitteilung mehr, sondern als Vorschlag realisiert und explizit an den Lehrer adressiert, herr Fabian (Z. 32). Damit ist klar, dass Sören vom Lehrer eine Ratifikation einfordert. An der Äußerung sind weiterhin folgende Aspekte interessant: Die zeitliche Spezifizierung der Abwesenheit, ich geh no_mal schnell rAUchen, sowie die anschließende Begründung sonst bin ich nich AUfnahmefähig und die Platzierung der Ratifikationsaufforderung ne am Äußerungsende. Die Thematisierung des Rauchens erfolgt also weiterhin im Modus der Mitteilung, wohingegen die Begründung im Sinne einer institutionellen Orientierung erfolgt, aufnahmefähig zu sein. Es ist zwar nicht ausschließlich der letzte Teil, der zur Ratifikation angeboten wird, eine Relevanzmarkierung hinsichtlich der Ratifikationserwartung des Schülers ist damit jedoch verbunden. Zudem wird unterstellt, die Erlaubnis zum Rauchen zu bekommen. Verlässt man die Ebene der Verbalität und schaut sich an, wie das multimodale Gesamtverhalten des Schülers organisiert ist, wird eine Form modalitätsspezifischer Arbeitsteilung deutlich. 32 SÖ: herr FAbi an (1.0) Warten im Klassenraum als institutionelle Praktik 279 33 ich geh no_mal schnell r AU chen 34 sonst bin ich nich AUfnahme fä hig ne Während der Schüler verbal eine Ratifikation des Lehrers einfordert - und damit grundsätzlich auch mit einer Ablehnung rechnen muss - ist er, während er sich dem Lehrer annähert, bereits mit der Vorbereitung seines Abgangs beschäftigt. Dies verdeutlicht vor allem die Beschäftigung mit dem Schal als Kleidungsstück, das er draußen - genauso wie seine Jacke, die er noch trägt - beim Rauchen benötigt. Nimmt man seine körperliche und blickliche Beschäftigung mit dem Schal ernst, dann muss man Gründe annehmen, die Sören davon ausgehen lassen, dass er seitens des Lehrers auf seinen Rauchwunsch (und den damit verbundenen Abgang aus dem Klassenzimmer) keine Ablehnung erfährt. Es ist Carsten, einer von drei anwesenden Mitschülern, der für diese Annahme die Begründung liefert: 35 CA: ja wir ham grad ne Arbeit geschrieben 3.1.2 Erklärende Unterstützung Diese Begründung wirkt sich jedoch nicht auf das weitere Gespräch aus, denn der Lehrer reagiert nun auf den Wunsch des Rauchers und bringt dadurch eine argumentative Aushandlung in Gang. Ulrich Dausendschön-Gay / Reinhold Schmitt 280 36 FA: WO gehen sie hin? 37 SÖ: no_ma RAUchen 38 FA: RAUchen? 39 SÖ: sonst bin ich nicht 40 AUFnahme[fähig] 41 FA: [Ä: HM] Auf die Frage des Lehrers WO gehen sie hin? antwortet der Schüler mit no_ma RAUchen, und auf die erstaunte Nachfrage RAUchen? wiederholt Sören invariant und mit gleicher Akzentsetzung seine bereits zuvor formulierte Begründung, sich dadurch die Voraussetzungen zu schaffen, für den kommenden Unterricht aufnahmefähig zu sein. Es ist zu sehen, dass er simultan zur verbalen Bearbeitung seines Wunsches seinen Schal bereits um den Hals gelegt hat und somit die Voraussetzungen, den Raum erlassen zu können, weiter vorangetrieben hat. Dann schiebt er eine neue Begründung nach, die spezifische Verstehensvoraussetzungen verlangt: Warten im Klassenraum als institutionelle Praktik 281 42 SÖ: außerdem is die hälfte EH noch 43 [oben Über die hälfte] Seine Begründung, die durch das einleitende außerdem als zusätzliche markiert ist, ist ein Hinweis darauf, dass Über die hälfte der Klasse in einem anderen Raum (oben) noch mit dem Abschluss der Klassenarbeit beschäftigt ist. Diesen Verweis realisiert Sören deutlich, bevor er ihn formuliert, bereits gestikulatorisch: Er zeigt mit dem ausgestreckten Zeigefinger seiner linken Hand in Richtung Decke (und damit zur oberen Etage). Sören nutzt also die Abwesenheit seiner Mitschüler wegen des Klausurabschlusses als zentrales Argument für seinen Rauchwunsch. Beide Begründungen arbeiten mit Aspekten, die verdeutlichen, dass sich der Schüler an den Relevanzen der Institution orientiert, um sich noch eine Zigarette genehmigen zu lassen und damit den Raum verlassen zu können. 3.1.3 Argumentative Aushandlung Der Lehrer wird nun - nachdem er bislang nur Nachfragen gestellt hat - aktiv und eröffnet eine argumentative Aushandlung über den Wunsch des Schülers. 44 FA: [ne: herr ALberts ] des is 45 SCHLECHT (.) DENN 46 FA: [in EIner miNUte] gehen die Ulrich Dausendschön-Gay / Reinhold Schmitt 282 47 SÖ: [Über die hälfte] FEHLT noch 48 TO: ja werre EH net PÜNKTlisch komme 49 CA: EIne miNUte 50 SÖ: <<f> SEHN SIE DOCH die SCHREIBEN 51 alle noch> Der Lehrer problematisiert den Wunsch des Schülers (des is SCHLECHT) mit der mit DENN eingeleiteten Begründung in EIner miNUte gehen die, die jedoch nicht zu Ende formuliert wird. Man kann jedoch schließen, dass die Begründung und die Zeitangabe (in EINner miNUte) ablauforganisatorische Relevanzen verdeutlichen und auf den Beginn der nachfolgenden Unterrichtsstunde verweisen. Sören wiederholt teilweise simultan zur Äußerungsentwicklung des Lehrers seinen letzten Verweis auf die noch fehlenden Mitschüler [Über die hälfte] FEHLT noch. Damit wiederholt er sein implizites Argument, dass er aufgrund der offensichtlich fehlenden Voraussetzungen für den vom Lehrer in einer Minute angekündigten Unterrichtsbeginn problemlos noch eine Zigarettenpause einlegen kann. Genau in diesem impliziten Argument wird er sowohl von Torsten (TO) (werre EH net PÜNKTlisch komme) als auch von Carsten (CA) (EIne miNUte) unterstützt. Beide bearbeiten auf je unterschiedliche Weise die fehlenden Voraussetzungen, zum geplanten Zeitpunkt mit dem Unterricht beginnen zu können. Sören fasst die Argumente gegen einen pünktlichen Unterrichtsbeginn in der laut gesprochenen Äußerung <<f> SEHN SIE DOCH die SCHREIBEN alle noch> zusammen. Dabei setzt er zur Verdeutlichung der Offensichtlichkeit der fehlenden Voraussetzungen ein interessantes Verfahren ein: Er beschreibt den Grund für die Abwesenheit der Mitschüler als faktisch visuell wahrnehmbar und produziert mit weit ausgebreiteten Armen eine Evidenzgeste, die wir auch bei Carsten sehen. Er tut dabei so, als könne der Lehrer den oben schreibenden Schülern tatsächlich zusehen. Seine Mitschüler verfolgen die Argumentation in der Dyade kontinuierlich mit ihren Blicken. Warten im Klassenraum als institutionelle Praktik 283 3.1.4 Raucherlaubnis und Legitimierung Der Lehrer ratifiziert schließlich angesichts des noch weitgehend leeren Klassenraums den Wunsch des Schülers nach einer Zigarettenpause. 52 FA: dann rauchen se SCHNELL bit te 53 SÖ: ja (.) hätt ich ja EH gema ch t 54 is ja KALT (.) ne In seiner ratifikatorischen Äußerung taucht mit dem akzentuierten SCHNELL (Z. 52) erneut Zeit als relevantes Element auf, wodurch der Lehrer seine Orientierung auf den zeitnah beginnenden Unterricht zum Ausdruck bringt. Der Schüler reagiert hierauf mit ja (.), womit er die Ratifikation auch hinsichtlich des Zeitaspektes akzeptiert. Seine inhaltliche Reaktion betont demgegenüber mit hätt ich ja EH gemacht is ja KALT (.) ne die eigene Perspektive und Verantwortlichkeit und damit die Unnötigkeit des Zeithinweises durch den Lehrer. Der Schüler orientiert sich relativ früh - als bereits klar ist, dass er den Raum zum Rauchen verlassen kann - vom Lehrer weg. Bei dessen bitte (Z. 52) beginnt er sich bereits in Richtung Tür zu bewegen und spricht dann seine abschließende Äußerung gänzlich vom Lehrer abgewandt, in Richtung Tür gehend. In gewisser Weise kommt er mit diesem Verhalten der vom Lehrer eingeforderten Schnelligkeit nach. Ulrich Dausendschön-Gay / Reinhold Schmitt 284 55 CA: herr fabian (.) in einer 56 miNUte is hier EH noch keiner 57 TO: Eben 58 FA: auf (.) auf ZWEI (sind? )=se DURCH bitte In den Abgang des Schülers hinein spricht nun auch Carsten den Lehrer namentlich an. Er greift dabei dessen zeitlichen Hinweis mit in einer miNUte auf und betont nochmals die für den Unterrichtsbeginn fehlenden Voraussetzungen mit is hier EH noch keiner. Dabei wird er von Torsten unterstützt, der seinerseits mit Eben die Evidenz dieser fehlenden Vorraussetzungen hervorhebt. Der Lehrer reagiert jedoch auf keinen dieser Beiträge, sondern schickt dem rauchwilligen Schüler mit der Äußerung auf (.) auf ZWEI (sind? )=se DURCH bitte nochmals den Hinweis hinterher, sich mit dem Rauchen nicht zu viel Zeit zu lassen. 3.1.5 Warten als institutionell akzeptierte Aktivität Als Sören den Raum bereits verlassen hat, wiederholt Tobias noch einmal seinen Hinweis auf die geschriebene Klassenarbeit. Diese Thematisierung ist jetzt keine Unterstützung des Rauchwunsches von Sören mehr, sondern hat nun einen eigenen, reflexiven Wert. 59 TO: wir ham grad ne [ AR beit 60 [((Pausengong ertönt)) 61 TO: geschrieben herr fabian 62 da können sie jetz [EH länger ] 63 FA: [JA: ich weiß] 64 TO: warten Er wiederholt dabei wörtlich seinen Hinweis von Zeile 35, es fehlt lediglich das einleitende ja, mit dem er sich in der vorherigen Situation an die Ausführungen Sörens angeschlossen hatte. Mit dem abschließenden Hinweis da kön- Warten im Klassenraum als institutionelle Praktik 285 nen sie jetz EH länger warten thematisiert er erstmalig explizit die Konsequenzen, die sich aus der Klausur für den Unterrichtsbeginn ergeben, nämlich das Warten. Diese Konsequenzen realisieren sich jetzt nicht mehr nur in der individuellen Möglichkeit Sörens, den Raum zum Zweck des Rauchens noch einmal zu verlassen. Vielmehr werden der Unterrichtsaufschub und das dadurch etablierte Warten durch das nochmalige Thematisieren, nachdem Sören den Raum bereits verlassen hat, als eine verbindliche soziale Qualität etabliert. Nunmehr reagiert der Lehrer erstmalig auf Torsten und dessen Hinweis. Seine zögerliche Haltung dem Raucher gegenüber hat nicht primär mit der geschriebenen Klausur und dem damit verspäteten Unterrichtsbeginn zu tun, sondern mit der Tatsache, dass er den Unterricht heute selbst früher beenden muss. 65 FA: NE: aber das probLEM is ich muss 66 heute auch früher SCHLUSSmachen] 67 ((Pausengong endet))] Dadurch gerät er gewissermaßen von zwei Seiten unter Druck. Es ist zu sehen, dass seine drei Adressaten jeweils mit selbstkoordinativen Aktivitäten beschäftigt sind und keinen Beteiligungsstatus als Adressaten verkörpern. Mit der erteilten Raucherlaubnis ist der Aufschub des geplanten Unterrichtsbeginns offiziell und das Warten auf die Nachzügler als temporär gültiger Aktivitätszusammenhang etabliert. Wie zu sehen ist, wählt Sören das Verlassen des Klassenraums als eine Möglichkeit, das Warten zu gestalten. Seine drei anwesenden Mitschüler hingegen entscheiden sich dafür, im Raum zu bleiben. Sie warten also in Gegenwart des Lehrers gemeinsam mit ihm darauf, dass durch die eintreffenden Nachzügler die Voraussetzungen für den verspäteten Unterrichtsbeginn irgendwann gegeben sind. Ihre Etablierung an der Fensterfront kann in diesem Zusammenhang bereits als eine für die Anforderung des gemeinsamen Wartens adäquate Positionierung im Funktionsraum verstanden werden. Dabei ist es vor allem die Abwahl der Stuhl- und Ulrich Dausendschön-Gay / Reinhold Schmitt 286 Tischreihen als Aufenthaltsbereich, der in sozialtopografisch relevanter Weise für das Warten einen adäquaten Interaktionsraum schafft. Wir haben es hier also mit zwei unterschiedlichen Modellen zur Lösung des Warteproblems zu tun: einem Abwesenheitsmodell in Form einer Pausenverlängerung mit gänzlich eigener Gestaltung außerhalb des Klassenraums und einem Anwesenheitsmodell mit koordinativen Anforderungen bei der gemeinsamen Gestaltung des Wartens im Raum unter Strukturen von Wahrnehmungswahrnehmung. 3.2 Segment 2: Interaktionsräumliche und thematische Grundlagen des Wartens Während sich die drei anwesenden Schüler an der Fensterfront positioniert und sich zunächst mit jeweils individuellen Orientierungen dort eingerichtet haben, unterhält sich Torsten mit dem Lehrer, der an seinem Tisch Unterlagen ordnet. Das Gespräch, von Torsten selbst initiiert, dreht sich um seine aktuelle Motivation (ich hab kee luscht). Es ist eine dialogische Angelegenheit zwischen den beiden und wird erkennbar frotzelnd realisiert. Nur einmal reagiert Carsten mit einem situationsreflexiven Kommentar auf einen gekonnten Spielzug des Lehrers. Mit dem Abschluss des dialogischen Austauschs holt der Lehrer den Overheadprojektor von der vorderen Fensterfront und stellt ihn in der rechten Hälfte der ersten Tischreihe an einen der Tische. Noch während er mit dem Einrichten des Projektors beschäftigt ist und sich auch blicklich auf das Gerät orientiert, initiiert er ein Gespräch mit allen Schülern an der Fensterseite. 109 FA: wa s ham sie denn geschrieben Seine Frage greift den Aspekt auf, der zum Aufschub des Unterrichts und zum Warten als alternativen Aktivitätsrahmen geführt hat. Die Schüler sind zunächst noch mit individuellen Aktionen beschäftigt, nur Torsten ist blick- Warten im Klassenraum als institutionelle Praktik 287 lich und körperlich auf den Lehrer orientiert. Das ändert sich schnell im Laufe des Gesprächs, und alle drei stehen dann mit den Rücken zum Fenster an die Wand gelehnt, haben ihre Hände (oder zumindest eine Hand) in den Hosentaschen und blicken in dieser lässig-freizeitmäßigen Positur verweilend zum Lehrer. Man kann den Eindruck gewinnen, dass ein Gespräch mit dem Lehrer, das nicht nur einen von ihnen, sondern sie alle drei involviert, aus Sicht der Schüler nicht ganz oben auf der Präferenzliste der Verhaltensweisen steht, die sie selbstbestimmt zur Bearbeitung des kollektiven Wartens einsetzen würden. Die Schnelligkeit, mit der sie sich jedoch auf dieses Gespräch einlassen, ist ein Hinweis auf ihre Orientierung, auf lehrerseitige Initiativen zur Gestaltung des Wartens ohne Verzug einzusteigen. Ihre lässig-freizeitmäßige Positur und ihr rücken- und hüftseitiges Anlehnen an der Fensterfront verkörpern hingegen stärker ihre eigenpräferenzielle Gestaltung des Wartens durch Distanzierung von einer typischen, schülerseitigen und kernaktivitätsspezifischen Beteiligungsweise. 128 FA: sie se hen ja das ist alles be: we: el 129 was sie machen Der Lehrer hingegen beteiligt sich einerseits verbal an der Mitgestaltung des Wartens, während er andererseits körperlich mit der Manipulation des Overheadprojektors „category bound activities“ 11 vollzieht, die der Präparation des Unterrichts dienen. Auch hier haben wir es wieder mit einer modalitätsspezifischen Arbeitsteilung zu tun. 11 Siehe hierzu beispielsweise Sacks (1992); Meyer/ Oberzaucher (2009) und Oberzaucher/ Dausendschön-Gay (2014). Ulrich Dausendschön-Gay / Reinhold Schmitt 288 3.3 Segment 3: Warten im Freiraum Mit der Etablierung der Gesprächsrunde mit dem Ensemble, das der Lehrer mit den drei Schülern in einem gemeinsamen Interaktionsraum bildet, der im Wesentlichen für den Bereich zwischen der Fensterseite mit Gang und dem Fokusplatz gebildet wird, entsteht eine prinzipiell mehrdeutige Situation für Neuankömmlinge. Diese waren während der Aushandlung zwischen dem Lehrer und dem Raucher noch nicht anwesend und kennen daher die Bedingungen der von ihnen vorgefundenen Situation nicht vollständig: - Sie betreten den Raum im Wissen um ihre Verspätung, die von einigen Schülern dem Lehrer gegenüber eigens durch den Hinweis auf die gerade geschriebene Arbeit begründet wird; - sie wissen um das Ausmaß ihrer Verspätung, weil wir annehmen können, dass sie als institutionelle Profis den Pausengong gehört haben; - sie finden bei ihrem Eintreffen eine geöffnete Tür vor, die als Hinweis verstanden werden kann, dass aktuell noch kein Unterricht stattfindet; - sie betreten einen Raum, in dem eine Videoaufnahme vorbereitet ist, die den Unterricht, und vermutlich nicht das Warten auf seinen Beginn mitschneiden soll; - die hörbaren Gesprächsaktivitäten des Interaktionsensembles zwischen Fenster und Fokusplatz geben Hinweise darauf, dass mit dem Beginn des Unterrichts unmittelbar nicht zu rechnen ist. Sie haben daher theoretisch die Option, a) sich an ihren Platz zu begeben und dort die Wartezeit zu verbringen, b) sie können aber auch an beliebiger Stelle im Raum eine weitere Gesprächsgruppe bilden oder c) sich in das Interaktionsensemble einfügen und den fensterseitigen Interaktionsraum vergrößern. Im Videomitschnitt können wir beobachten, dass alle Neuankömmlinge die letzte Option wählen, und zwar ohne zu zögern. Wenn wir über die Gründe dafür nachdenken, so lässt sich feststellen, dass das bereits bestehende Ensemble zwei wichtige Vorteile bietet: Zum einen verleiht die Beteiligung des Lehrers am Ensemble dieser „Runde“ eine starke Legitimität, die sich eine neu gebildete Gesprächsrunde erst noch erarbeiten müsste. Zum anderen befördert die Integration in eine bereits bestehende Gesprächsrunde die Gruppenvergesellschaftung als Solidar- oder „Leidens“-Gemeinschaft nach der überstandenen Klausur, die ja auch Gegenstand des sprachlichen Austausches zwischen dem Lehrer und den Schülern ist. Es ist nicht unwahrscheinlich, dass die Ankömmlinge dies mitbekommen. Der optische Eindruck einer Sogwirkung, die von der Gruppe am Fenster ausgeht, erklärt sich auf diese Weise also gleich auf mehreren Beschreibungsebenen. Warten im Klassenraum als institutionelle Praktik 289 Von entscheidender Bedeutung für die weitere Entwicklung des gemeinsamen Wartens ist die Ankunft des Schülers Stefan (ST), der mit einem anderen Schüler gleichzeitig den Raum betritt. Er wählt für den Weg zu seinem Platz (erste Reihe außen am Fenster) den Weg durch den Fokusplatzbereich zwischen Pult und Tafel und geht somit hinter dem Rücken des Lehrers vorbei. Der andere Neuankömmling geht zwischen zwei Tischreihen hindurch, legt seine Tasche ab und bewegt sich in Richtung Fenster. In dieser Situation ist außer dem Lehrer und den drei Schülern noch ein weiterer Neuankömmling anwesend, der sich bereits in den etablierten Interaktionsraum integriert hat. Das Gespräch zwischen dem Lehrer und den Schülern hat mit der lehrerseitigen Bemerkung sie sehen ja das ist alles be: we: el was sie machen und dem „Nachschlag“ in Zeile 131/ 132 (des ist nur als technische schule getarnt) den Stand eines Topikabschlusses erreicht. Die Fortsetzung des Gesprächs bedürfte an dieser Stelle einer neuen thematischen Initiative. Allerdings weiß der neuankommende Schüler ST dies nicht, sodass die Platzierung seiner Bemerkung an dieser strukturell günstigen Stelle (weil er keine Unterbrechung produziert) als Zufall gewertet werden muss. Gleichwohl hat sie eine bemerkenswerte Konsequenz. Der Lehrer wendet sich dem hinter ihm hergehenden Schüler in dem Moment kurz zu, als dieser mit seiner Bemerkung voll die baulischtenstückliste en kack hey beginnt, die mit Kopfhaltung und Gehbewegung deutlich an die anwesenden Mitschüler adressiert ist: 134 ST: voll die baulischtenstücklis te en kack hey 135 TO: wer hats verkackt? 136 ST: isch Der Mitschüler Torsten reagiert auf Stefans Bemerkung, Herr Fabian schaut ihn zu Beginn von dessen Äußerung kurz an, um sich dann aber sofort wieder seinen Unterlagen zuzuwenden. Dass er sich an diesem neuen Gesprächsgegenstand (der sich u.a. auf den affektiven Teil der Schülererfahrungen während der zurückliegenden Klausur bezieht) nicht beteiligen will, macht er dadurch deutlich, dass er, wie schon zu Beginn der Aufnahme, zwei Schritte auf den Aufnah- Ulrich Dausendschön-Gay / Reinhold Schmitt 290 meleiter zugeht und die Aufnahmesituation thematisiert, nachdem er 16 Sekunden lang seine Papiere sortiert und abschließend zu einem Stapel geformt hat. Er etabliert damit eine Gesprächsdyade parallel zu dem Interaktionsensemble am Fenster, aus dem er sich in zwei Modalitäten zurückzieht: zum einen sprachlich durch die Adressierung seiner Äußerung an den Aufnahmeleiter; zum anderen körperlich durch die Beschäftigung mit den Unterrichtsunterlagen, die damit verbundene Abwendung von der Gruppe und die folgende Zuwendung zu seinem links von ihm stehenden Gesprächspartner. [...] 142 FA: ja des ist jetzt natürlich Echt schade (-) 143 dadurch dass die jetzt ne arbeit 144 geschrieben haben (1.0) kommen die 145 jetzt alle en bisschen später und 146 wir müssen en bischen früher schluss machen Herr Fabian und die Schüler haben auf diese Weise gemeinsam eine Situation hergestellt, in der die Beteiligten ihre unterschiedlichen Orientierungen, die sie von Beginn an erkennbar gemacht haben, nun nicht mehr in einer gemeinsamen Aktivität ‘Warten’ in einem Interaktionsraum koordinieren - unter Nutzung der Möglichkeiten, die sich durch die funktionale Ausdifferenzierung der Modalitäten ergeben. In dem Moment, in dem der Lehrer das Interaktionsensemble der Fensterfraktion verlässt, ohne gleichzeitig die dort Anwesenden zu einer neuen Aktivität aufzurufen (wozu er durchaus in der Lage und autorisiert wäre), gibt er den Fensterraum für selbstverantwortete und autonome Aktivitäten der Schüler frei. Der Interaktionstyp ‘Warten’ wird damit auf eine neue Weise realisiert, bei der zwar die Orientierung an den institutionellen Erwartungen bei allen Akteuren erhalten bleibt, der Rückzug des Lehrers aus dem Interaktionsensemble am Fenster aber eine maximale Autonomie der Schüleraktivitäten erzeugt. Warten im Klassenraum als institutionelle Praktik 291 Unter der Perspektive der Interaktionsraumanalyse haben wir dies an anderer Stelle die „Schaffung eines Freiraums“ genannt (Schmitt/ Dausendschön- Gay 2015): Die relevanten Beteiligten an dem kommunikativen Austausch sind ausschließlich Schüler; ihr Interaktionsraum konstituiert sich im begehbaren Fensterbereich und an den Enden der angrenzenden Tische. Sie stehen oder lehnen sich an die den Stühlen abgewandten Tischseiten, niemand nimmt eine Position ein, mit der eine Bereitschaft zum Beginn der institutionell vorgesehenen Kernaktivität signalisiert würde (am Tisch sitzen). Hingegen manifestiert sich die Orientierung des Lehrers an der Kernaktivität weiterhin durch Stehen, Sortieren der Papiere in gebeugter Haltung (folgendes Bild) und die damit verbundene Abwendung vom Geschehen im Fensterbereich, was ja durch das kurze Gespräch mit dem Aufnahmeleiter noch verstärkt wird. Wir sprechen von ‘Freiraum’, weil offenbar alle Bezüge zur Grundfunktionalität der interaktionsarchitektonisch nahegelegten Nutzung des Gesamtraums schülerseitig suspendiert sind. Natürlich können wir uns auch vorstellen, dass die Schüler auf andere Weise im Raum eine Suspendierung vornehmen. Dies könnte durch die Versammlung um einen Tischbereich von beiden Seiten geschehen, durch das Herbeirücken von Stühlen oder vergleichbare Maßnahmen. Diese Lösungen des Problems, den Zeitraum bis zum Beginn des Unterrichts zu „überbrücken“, hätten jedoch den Nachteil, dass sie durch die Nutzung der funktional vordefinierten Objekte (Stühle) und das Verbleiben in dem funktional vordefinierten Raumbereich (Tischreihen) eine, wenn auch lose, Verbindung zu der vom Lehrer beibehaltenen Orientierung auf die Kernaktivität behalten würden. Der Fensterbereich, in dem stehend geredet wird, hat also den Vorteil des maximalen Kontrastes zur Funktionsbestimmung des architektonischen Arrangements. Die Wahl des Fensters, zunächst als Aufenthaltsort, dann als Interaktionsraum, hat auch mit seinen Eigenschaften zu tun, die im Hinblick auf die Kernaktivität des Raums sozusagen funktional „leer“ sind: Ulrich Dausendschön-Gay / Reinhold Schmitt 292 - Das Fenster ist ein entlegener Ort im Klassenraum, der weder Eintretende noch die Fokusperson in ihren Aktivitäten behindert; - es gibt keine funktionale Ausstattung, und der Aufenthalt dort ist nur stehend oder sich anlehnend möglich; - das Fenster ist Schnittstelle nach „draußen“ und ermöglicht für die im Raum Bleibenden eine ähnliche Orientierung, wie sie der Raucher durch sein Rausgehen deutlich gemacht hat; - die Transparenz des Fensters gibt dem Interaktionsraum dort ästhetische Qualitäten, die an keiner anderen Stelle des Raums möglich wären; - die Fensterseite liegt „quer“ zur architektonischen Struktur des Raumes, sie hat in diesem Sinne kein „Vorne“ und kein „Hinten“; damit ist sie für die Symbolisierung von Statusdifferenzen neutralisiert. Das Konzept ‘Freiraum’ als eine spezifische Form des Interaktionsraums ist nur sinnvoll im Zusammenhang mit Nutzungserwartungen in Funktionsräumen. Diese Erwartungen speisen sich aus dem sozialtopografischen, erfahrungsbasierten Wissen der Benutzer von Räumen, deren spezifisches architektonisches Arrangement von ihnen „gelesen“ werden kann als ein Ensemble von Hinweisen auf die Art der Interaktion, die in diesem Raum üblicherweise stattfindet. Freiräume können dann geschaffen werden, wenn die Nutzungserwartungen temporär suspendiert werden. Werden sie jedoch durch ein Neuarrangement, zum Beispiel des Mobiliars, dauerhaft verändert, wird ein neuer Funktionsraum geschaffen, aber kein Freiraum. Freiräume sind Interaktionsräume. Zu ihrer Konstituierung bedarf es der koordinierten Herstellung eines Zustandes, in dem in spezifischer Weise die Nutzungserwartungen an den Funktionsraum suspendiert und dabei u.a. auch die in Funktionsräumen übliche asymmetrische Interaktionsrollenverteilung vorübergehend außer Kraft gesetzt werden. Die Bedingungen für die Schaffung von Freiräumen emergieren aus den konventionell erwartbaren Abläufen und Interaktionsformen der Institution. In unserem Beispiel betreffen diese Konventionen die zeitlichen Abläufe der Unterrichts- und Pausenzeiten, die durch den Gong öffentlich in Erinnerung gehalten werden und eine „einklagbare“ Strukturierung des Interaktionsgeschehens konstituieren; ferner die kategoriengebundenen Aktivitäten und Zuständigkeiten der Beteiligten, die aktivitätstypischen Posituren, Plätze und Aufmerksamkeitsausrichtungen sowie die funktionstypischen Arbeitsmaterialien und Bewegungsräume. Freiraum zu schaffen bedeutet, diese Bedingungen nicht dauerhaft außer Kraft zu setzen, sondern sie zu suspendieren. Warten im Klassenraum als institutionelle Praktik 293 3.4 Segment 4: Übergang zum Beginn des Unterrichts Im Freiraum am Fenster finden wir im Verlauf der nächsten Minuten unserer Aufnahme wechselnde kommunikative Konstellationen. Die Schüler bilden Dyaden und Triaden, einige beteiligen sich nur als „Zuschauer mit verbaler Abstinenz“ (Heidtmann/ Föh 2007). Neuankömmlinge gehen in der Freiraumsituation nicht mehr selbstverständlich zur Fensterfraktion, sondern sondieren zunächst, um ihre deutliche Verspätung wissend, die Bedingungen. Aus Platzgründen, aber auch wegen der bifokalen Konstellation (Lehrer versus Schülergruppe) gibt es nun auch Zweiergespräche zwischen den Tischreihen oder stehend von Platz zu Platz, am Fenster bilden sich mehrere Gesprächsrunden. Die räumliche „Diffundierung“ des Freiraums, die nach und nach zu seiner Auflösung führt, wird unterstützt durch eine latente Instabilität des neu gebildeten Ensembles, das von „draußen“ relativ schnell irritiert werden kann. Wenn die Stimme des Lehrers gut hörbar ist, zum Beispiel während der kurzen Sequenz mit dem Aufnahmeleiter (siehe oben Z. 142-146), wenden sich die Schüler ihm zu, vermutlich um abzuklären, ob es für sie relevante Informationen gibt. Bemerkenswert erscheint uns als Analytikern, dass der Lehrer keinerlei Anstrengungen unternehmen muss, um die Schüler dazu zu bewegen, sich auf ihre Plätze zu setzen, die Kleingruppengespräche einzustellen und sich als ‘Schüler im Unterricht’ zu konstituieren. Die Fraglosigkeit, mit der sich der Freiraum allmählich auflöst und die Plätze eingenommen werden, verstehen wir als Hinweis auf das geteilte Institutionenwissen. Demzufolge kann Unterricht dann beginnen, wenn der Lehrer anwesend und eine „kritische“ Menge von Schülern im Raum versammelt ist. Diese Bedingungen werden von Herrn Fabian thematisiert, wenn er sich zunächst mit der Frage an einen der Schüler wendet, ob jemand fehlt (Z. 155: fehlt heute irgendjemand? ), die er wenig später präzisiert zu ist denn irgendjemand dA der jetzt aber noch nicht da ist? Wir können nicht beobachten, dass es einen direkten kausalen Zusammenhang zwischen diesen Äußerungen und der Bewegung der Schüler zu ihren Plätzen gibt, wohl aber dürfen wir diese Sequenzen als Beiträge zu Destabilisierung des Freiraums werten, ohne dass Herrn Fabian direkte Intentionalität unterstellt werden muss. Wir dokumentieren den Übergang zum Unterricht mit drei Standbildern: Die Personenkonstellationen haben dazu geführt, dass Oliver (OL), einer der Schüler der ersten Dreiergruppe, alleine steht (Bild); Ulrich Dausendschön-Gay / Reinhold Schmitt 294 die an die Allgemeinheit adressierte Frage des Lehrers, ob jemand fehlt, wird aus der Gruppe „nebenbei“ beantwortet, die nächste Frage aber etabliert eine Dyade zwischen Herrn Fabian und Oliver, der zu ihrer Beantwortung an seinen Platz geht: [...] 161 FA: wer hat denn des klassenbuch 162 OL: (...)(...)(...) 163 FA: also oben wars nicht Neuankömmlinge sehen nun einige Schüler am Fenster, andere an ihren Tischen, Herr Fabian unterhält sich mit dem vor ihm stehenden Oliver. Bei seiner Ankunft, oder besser „Rückkehr“, geht der „Raucher“ ohne zu zögern zu seinem Platz und setzt sich, allerdings nicht ohne einen kurzen verbalen Austausch mit Herrn Fabian: [...] 187 SÖ: sehen se (…) 188 FA: ja (-) sie haben recht herr alberts Warten im Klassenraum als institutionelle Praktik 295 189 (.) ich tat ihnen unrecht 190 SÖ: ich hab äh immer recht 191 FA: ah (.) s würd ich jetzt so nich formulieren Herr Fabian betreibt in den letzten Minuten vor Unterrichtsbeginn durchgängig Monitoring über die Situation im Raum. Er steht aufrecht, blickt herum, hält Papiere in der Hand, widmet sich ihnen aber nun nicht mehr. Sein Körperdisplay dokumentiert deutlich, dass er anfangen kann, es ergeht aber keine Aufforderung an die Schüler. Wenn auch die letzten Teilnehmer der Fensterfraktion auf ihren Stühlen sitzen, beginnt der Unterricht mit den dafür vorgesehenen Aktivitäten, mit denen die Wartephase endgültig abgeschlossen wird: Herr Fabian blickt auf die Uhr, thematisiert den verspäteten Beginn im Hinblick auf die Aufnahme, macht organisatorische Ankündigungen, verteilt Unterrichtsmaterialien und ruft kurze Zeit später eine Gruppe von Schülern auf, die heute mit ihrer Präsentation dran sind. [...] 227 FA: [.h, h al so 228 ((blickt auf Armbanduhr))] 229 das (.) is jetz natürlich_n 230 bisschen SCHAde (--) denn gerade Ulrich Dausendschön-Gay / Reinhold Schmitt 296 231 hEUte (.) wo wer auch wieder (.) 232 auf sendung sin (.) ähm (-) ham se 233 jetz ne arbeit gschrieben (.) 4. Resümee 4.1 Fallspezifisch In dem ausgewählten Videoausschnitt geht es um die Organisation eines verspäteten Unterrichtsbeginns, der von der Institution selbst erzeugt worden ist (Verlängerung der Bearbeitungszeit für eine Klassenarbeit). Die Beteiligten haben also die Verspätung nicht zu verantworten: weder der von Beginn an anwesende Lehrer noch die nach und nach eintreffenden Schüler. Wir haben den analysierten Aktivitätstyp als ‘Warten’ klassifiziert und den Raum, in dem diese Aktivität stattfindet, als ‘Klassenzimmer’ rekonstruiert. Wir haben gezeigt, dass sich die anwesenden Personen gegenseitig als Lehrer, Aufnahmeleiter und Schüler kategorisieren und das Warten gemeinsam in einer wechselnden Folge von Interaktionsensembles konstituieren, wozu sie jeweils passende Interaktionsräume bilden. Die sozialtopografischen Voraussetzungen der Warteszene haben wir durch die Analyse der interaktionsarchitektonischen Angebotsstruktur des Raums bezogen auf erwartbare Kernaktivitäten und mit ihnen verbundene Rollenverteilungen ermittelt. Unsere Beschreibungen haben wir dann im Hinblick auf die Basiselemente Verweilbarkeit, Besitzbarkeit, Sichtbarkeit und Begehbarkeit sowie für den Aspekt der Raumästhetik strukturiert. Wir konnten davon ausgehen, dass mit der Anwesenheit einer Fokusperson im für sie vorgesehenen Fokusbereich und mit der Anwesenheit von Schülern im Prinzip die notwendigen Bedingungen für den Unterrichtsbeginn erfüllt sind, woraus sich ein Erklärungsbedürfnis für den Nicht-Beginn ergibt. Wir haben die Wartephase unter der Fragestellung betrachtet, ob die „funktionale Parenthese“ des Wartens auf den Unterrichtsbeginn in den Tätigkeiten der Beteiligten eine Orientierung auf die institutionell erwartbare Kernaktivität erkennbar (für uns Analytiker) und ‘accountable’ (für die Beteiligten) macht. Dabei hat uns besonders beschäftigt, welche modalen Ressourcen für die Erkennbar-Machung eingesetzt werden und welche „modalitätsspezifischen Arbeitsteilungen“ dabei realisiert werden. Es wurde deutlich, dass der Lehrer verbal und körperlich eine prioritäre Orientierung auf den Unterrichtsbeginn beibehält. Eine Ausnahme davon bildet lediglich seine explizite körperliche Zuwendung (mit Verlassen des Fokusplatzes) und seine verbale Adressierung des Aufnahmeleiters. Dieser symbo- Warten im Klassenraum als institutionelle Praktik 297 lisiert eine parallele Aufgabe der Unterrichtsstunde: Sie soll wegen eines Forschungsinteresses des Aufnahmeleiters dokumentiert werden. In allen übrigen Sequenzen behält der Lehrer seine Unterrichtsorientierung auch dann bei, wenn er sich mit den Schülern unterhält. Die Schüler hingegen sind primär darauf ausgerichtet, die Wartephase für schülerseitige Vergesellschaftung (ohne Unterricht! ) zu nutzen. Gleichwohl lassen sie aber punktuell eine Orientierung auf die institutionellen Erwartungen erkennen. Dies wird deutlich, wenn sie sich mit Blicken und Körperwendungen der lauten Stimme des Lehrers zuwenden, der sich mit dem Aufnahmeleiter unterhält. Für die Organisation der Wartephase haben die Schüler offenbar zwei Optionen: rausgehen (und rauchen, also die Pause verlängern), oder drinbleiben. Die erste Option wird explizit mit dem Institutionenvertreter ausgehandelt. Für die zweite beziehen die Schüler aus dieser Lösung einen Teil der Legitimität ihres Aufenthalts im Fensterbereich und der Bildung des Freiraums, der besonders prägnant die Qualität der „funktionalen Parenthese“ dieser Sequenz verdeutlicht. Unter der analytischen Perspektive eines ‘Interaktionssystems’ betrachtet werden die Erwartungen hinsichtlich der Kernaktivität (Unterricht machen), der Interaktionsform (Gleichförmigkeit der schülerseitigen Tätigkeiten, Arbeitsteilung zwischen Schülern und Lehrer) und der interaktionsarchitektonischen Basiskomponenten (begehbare Bereiche lediglich als Zugang zu den Tischen, Verweilen an den Funktionsplätzen, Relevanz und Asymmetrie der Sichtbarkeit) nicht erfüllt. Wir haben demgegenüber die Bearbeitung zwei paralleler Aufgaben festgestellt (Orientierung am Unterrichtsbeginn und vergesellschaftendes Warten), zu der unterschiedliche Ressourcen eingesetzt werden, die in stark differierender Verteilung auf die funktionale und kategoriale Ausstattung der Akteure verweisen. Aus methodischer Sicht haben wir zeigen können, dass eine Konzentration auf die verbalsprachliche Realisierung von Tätigkeiten wesentliche Aspekte des Geschehens unter der uns interessierenden Fragestellung nicht erfasst hätte. Insbesondere gilt das für die modalitätsspezifische Arbeitsteilung, die im ethnomethodologischen Sinne als eine Methode zur Lösung paralleler Aufgabenanforderungen mit bifokaler Orientierung verstanden werden kann. Wir haben ferner absichtlich auf ein strenges sequenzanalytisches Vorgehen verzichtet, um uns auf die zentralen Ereignisse bei der Entwicklung der Wartesituation, der Herausbildung und Diffundierung des Freiraums und die emergierende Auflösung der Wartesituation zu konzentrieren. Der Verzicht auf größere Transkriptausschnitte ist dabei keine Abwahl der Analytiker; sie ergibt sich vielmehr aus der modalitätsspezifischen Arbeitsteilung, derer sich die Beteiligten bei der Lösung der anstehenden Aufgaben bedienen. Ulrich Dausendschön-Gay / Reinhold Schmitt 298 4.2 Falltranszendierend Dass alle Beteiligten während der Wartephase an den Anforderungen der Institution orientiert bleiben, ist nicht weiter verwunderlich. Bemerkenswert und von analytischem Interesse ist hingegen die Art und Weise, in der die Wartephase gleichzeitig für die Vergesellschaftung einer der beteiligten Gruppen genutzt wird. Hierin spiegelt sich eine wesentliche Bedingung der Institution, nämlich die funktionale Asymmetrie der Beteiligten: Der Freiraum entsteht nur unter der Bedingung, dass der Lehrer sich zurückzieht und den Raum für die spezielle Form der schülerseitigen Vergesellschaftung freigibt, an der er qua Funktion nicht teilhaben kann. Für die Organisation einer funktionalen Parenthese in einer Institution stehen den sozialtopografisch erfahrenen Beteiligten offenbar eine Reihe von Methoden zur Verfügung, mit denen sie die Orientierung an den Anforderungen der Institution und die Gestaltung eines Interaktionsfreiraums gleichzeitig bewältigen können. Es geht also allgemein um die Ermittlung von Methoden der bifokalen Orientierung in Institutionen. Dies dürfte auch in anderen Institutionen beobachtbar sein, sofern die Grundbedingungen institutionellen Handelns erfüllt sind: die Existenz eines architektonischen Arrangements, das sozialtopografisch gespeiste Erwartungen an Kernaktivitäten und Rollenverteilungen erzeugt, und die Anwesenheit von Personen, die in der Lage und autorisiert sind, die Kernaktivitäten zu vollziehen. Die architektonischen Arrangements und das mit ihnen verbundene sozialtopografische Wissen der „kulturell Erfahrenen“ scheinen uns wesentliche Bedingungen für die ständige Präsenz einer Institution in allen Tätigkeitsbereichen zu sein, die in ihr stattfinden. Daraus ergibt sich für uns die Notwendigkeit, einen analytischen Zugang zu wählen, der mit Interaktionsarchitektur, Sozialtopografie und Interaktionsraumanalyse drei methodische Instrumente miteinander kombiniert. Dieser geht über den üblichen Rahmen der Gesprächsanalyse, der Ethnografie der Kommunikation und der Ethnomethodologie hinaus. Wir hatten die Frage angeschnitten, was das Fenster zu einem besonders geeigneten Ort für die Organisation der Vergesellschaftung und die Konstitution des Freiraums macht. In diesem Zusammenhang hat unser Kollege Michael Guggenheim bei den gemeinsamen Diskussionen einen interessanten Aspekt formuliert: In der Architekturtheorie gibt es Hinweise darauf, dass bei der Planung von Bauwerken und insbesondere bei Funktionsbauten wie Schulen oder Verwaltungsgebäuden eine Tendenz zu beobachten ist, einen „Überschuss an Raum“ zu produzieren. Die Planer scheinen eine - möglicherweise unbewusste - Vorstellung davon haben, dass es nicht sinnvoll ist, alle räumlichen Bereiche eines Gebäudes funktional aufzuladen. Das gilt zum Warten im Klassenraum als institutionelle Praktik 299 Beispiel für Fensterecken in Fluren, in denen häufig Zweiergespräche zu beobachten sind, deren Inhalt nicht notwendig auf die Kernaktivitäten der Beteiligten bezogen sein muss. Gebäude, und die Räume in ihnen, hätten auf diese Weise ein Kontingent an nicht funktional definierten Bereichen, die sich problemlos für verschiedene Arten von Aktivitäten nutzen lassen, also auch für etwas, das wir funktionale Parenthese genannt haben. Diese Überlegungen aus der Architekturtheorie konvergieren mit unserer Feststellung, dass die Orientierung auf die Funktionalität der Tätigkeiten erhalten bleibt, auch wenn Nicht-Funktionales geschieht. In unseren Analysen wie auch in diesen Überlegungen ist bedeutungsvoll, dass die Kategorie „nicht-funktional“ überhaupt nur Sinn ergibt auf der Erwartungsfolie der Kernaktivitäten, die durch das architektonische Arrangement nahegelegt werden. 5. Literatur Dausendschön-Gay, Ulrich (2006): Pratiques communicatives et appropriation de langues à l’école primaire. In: Faraco, Martine (Hg.): La classe de langue. Théories, méthodes et pratiques. Aix-en-Provence: PUP, S. 71-91. Dausendschön-Gay, Ulrich (2010): La construction interactive d’objets. In: Le Français dans le Monde 48, S. 98-110. Dausendschön-Gay, Ulrich (2012): Wie wir zu den Wörtern und wie die Wörter zu uns kommen. In: Ayaß, Ruth/ Meyer, Christian (Hg.): Sozialität in Slow Motion. Theoretische und empirische Perspektiven. Festschrift für Jörg Bergmann. Wiesbaden: Springer, S. 201-216. Garfinkel, Harold/ Wieder, Lawrence, D. (1992): Two incommensurable, asymmetrically alternate technologies of social analysis. In: Watson, Graham/ Seiler, Robert, M. (Hg.): Text in context. Contributions to ethnomethodology. Newbury Park: Sage Publications, S. 182-206. Hausendorf, Heiko (2003): Deixis and speech situation revisited. The mechanism of perceived perception. In: Lenz, Friedrich (Hg.): Deictic conceptualisation of space, time and person. Amsterdam: Benjamins, S. 249-269. Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopografie. Umrisse einer raumlinguistischen Programmatik. (= Arbeitspapiere des UFSP „Sprache und Raum“, SpuR 01). Zürich: Universität Zürich. www.zora.uzh.ch/ 78153/ 1/ SpuR_Arbeitspapiere_Nr01_Mai2013.pdf (Stand: Juni/ 2016). Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2012): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr. Heidtmann, Daniela/ Föh, Marie-Joan (2007): Verbale Abstinenz als Form interaktiver Beteiligung. In: Schmitt (Hg.), S. 263-292. Heidtmann, Daniela/ Schmitt, Reinhold (2011): Interaktives Diktieren. Komplexe Anforderungen im Epochen-Unterricht. In: Schmitt (Hg.), S. 179-224. Kindermann, Thorsten/ Kühner, Patrizia/ Schmitt, Reinhold (2011): Die Bearbeitung eines brisanten Themas im Englischunterricht. In: Schmitt (Hg.), S. 31-67. Ulrich Dausendschön-Gay / Reinhold Schmitt 300 Krafft, Ulrich/ Dausendschön-Gay, Ulrich (1999): Système écrivant et processus de mise en mots dans les rédactions conversationnelles. In: Langages 134 (Themenheft „Interaction et langue étrangère“), S. 51-67. Meyer, Christian/ Oberzaucher, Frank (2009): Positionierungs- und Kategorisierungsanalyse. Zwei Verfahren zur Untersuchung von Text und Interaktion. Manuskript. Universität Bielefeld. Mondada, Lorenza (2007): Interaktionsraum und Koordinierung. In: Schmitt (Hg.), S. 55-93. Müller, Cornelia/ Bohle, Ulrike (2007): Das Fundament fokussierter Interaktion. Zur Vorbereitung und Herstellung von Interaktionsräumen durch körperliche Koordination. In: Schmitt (Hg.), S. 129-165. Oberzaucher, Frank/ Dausendschön-Gay, Ulrich (2014): Kategorisieren. In: Bergmann, Jörg R./ Dausendschön-Gay, Ulrich/ Oberzaucher, Frank (Hg.): Der Fall. Studien zur epistemischen Praxis professionellen Handelns. Bielefeld: transcript, S. 345-379. Putzier, Eva-Maria (2016): Wissen - Sprache - Raum: Zur Multimodalität der Interaktion im Chemieunterricht. (= Studien zur Deutschen Sprache Band 71). Tübingen: Narr. Sacks, Harvey (1992): The MIR categorization device. In: Gail, Jefferson (Hg.): Lectures on conversation 1. Oxford: Blackwell. Schegloff, Emanuel A./ Sacks, Harvey (1973): Opening up closings. In: Semiotica 8, S. 289-327. Schmitt, Reinhold (Hg.) (2007): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr. Schmitt, Reinhold (2009): Schülerseitiges Interaktionsmanagement: Initiativen zwischen supportiver Strukturreproduktion und Subversion. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 10, S. 20-69. www.gespraechsforschung-ozs.de/ heft2009/ ga-schmitt.pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2011a): Unterricht ist Interaktion. Eine Rahmung. In: Schmitt (Hg.), S. 7-30. Schmitt, Reinhold (2011b): Didaktik aus interaktionistischer Sicht. Das Konzept „Defacto-Didaktik“. In: Schmitt (Hg.), S. 225-238. Schmitt, Reinhold (Hg.) (2011): Unterricht ist Interaktion! Analysen zur De-facto- Didaktik. (= amades. Arbeitspapiere und Materialien zur deutschen Sprache 41). Mannheim: Institut für Deutsche Sprache. Schmitt, Reinhold (2012a): Zur Multimodalität von Unterstützungsinteraktion. In: Schmitt, Reinhold (Hg.): Analytische Perspektiven auf Interaktion (= Themenheft Deutsche Sprache 40), S. 343-371. Schmitt, Reinhold (2012b): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 13, S. 1-44. www.gespraechsforschung-ozs.de/ fileadmin/ dateien/ heft2012/ gaschmitt.pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2012c): Räumliche Grundlagen interaktiver Beteiligung. Das Konzept „Interaktionsensemble“. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 37-87. Warten im Klassenraum als institutionelle Praktik 301 Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion (= Studien zur Deutschen Sprache 68). Tübingen: Narr. Schmitt, Reinhold (i.Vorb. a): Methodische Grundlagen der multimodalen Interaktionsanalyse: „Visuelle Erstanalyse“ und „Frame-Comic“. Manuskript. Mannheim. Schmitt, Reinhold (i. Vorb. b): Zur Konstitution von Dokumenten für raumanalytische Erkenntnisinteressen: Ein Praxisbericht. Ms., Mannheim. Schmitt, Reinhold/ Dausendschön-Gay, Ulrich (2015): Freiraum schaffen im Klassenzimmer: Fallbasierte methodologische Überlegungen zur Raumanalyse. (= Arbeitspapiere des UFSP „Sprache und Raum“, SpuR 04). Zürich: Universität Zürich. www.spur.uzh.ch/ research/ publications/ SpuR_Arbeitspapier_Nr04_150711.pdf (Stand: Juni/ 2016). Schmitt, Reinhold/ Deppermann, Arnulf (2007): Monitoring und Koordination als Voraussetzungen der multimodalen Konstitution von Interaktionsräumen. In: Schmitt (Hg.), S. 95-128. Schmitt, Reinhold/ Knöbl, Ralf (2013): „Recipient Design“ aus multimodaler Sicht. In: Deutsche Sprache 41, 2, S. 242-276. Schmitt, Reinhold/ Knöbl, Ralf (2014): Recipient Design: Zur multimodalen Repräsentation des Anderen im eigenen Verhalten. Mannheim: Institut für Deutsche Sprache. http: / / ids-pub.bsz-bw.de/ files/ 3239/ Schmitt-Knöbl-Recipient Design_2014.pdf (Stand: Juni/ 2016). Selting, Margret et al. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung 10, S. 353-402. www.gespraechsforschung-ozs.de/ heft2009/ px-gat2.pdf (Stand: Juni/ 2016). Ulrich Dausendschön-Gay / Reinhold Schmitt 302 Gliederung 1. Einleitung ..............................................................................................................263 1.1 Der Fall. Warten auf den Unterrichtsbeginn ....................................................263 1.2 Der Fall im Feld der Unterrichtsforschung ......................................................265 1.3 Unser Erkenntnisinteresse ..................................................................................266 1.4 Methodische Konsequenzen der Fragestellung...............................................268 2. Die Interaktionsarchitektur des Klassenraums................................................269 2.1 Eine kurze methodologische Bemerkung .........................................................269 2.2 Interaktionsarchitektonische Basiskonzepte ....................................................269 2.2.1 Verweilbarkeit.......................................................................................................271 2.2.2 Besitzbarkeit..........................................................................................................272 2.2.3 Sichtbarkeit............................................................................................................273 2.2.4 Begehbarkeit..........................................................................................................275 2.3 Ästhetische Merkmale .........................................................................................276 2.4 Verweise auf Kernaktivität(en)...........................................................................277 3. Fallanalyse .............................................................................................................277 3.1 Segment 1: Alternative Situationsdefinition.....................................................277 3.1.1 Ankündigung des Rauchers ...............................................................................277 3.1.2 Erklärende Unterstützung ..................................................................................279 3.1.3 Argumentative Aushandlung.............................................................................281 3.1.4 Raucherlaubnis und Legitimierung...................................................................283 3.1.5 Warten als institutionell akzeptierte Aktivität .................................................284 3.2 Segment 2: Interaktionsräumliche und thematische Grundlagen des Wartens ...........................................................................................................286 3.3 Segment 3: Warten im Freiraum.........................................................................288 3.4 Segment 4: Übergang zum Beginn des Unterrichts ........................................293 4. Resümee.................................................................................................................296 4.1 Fallspezifisch.........................................................................................................296 4.2 Falltranszendierend .............................................................................................298 5. Literatur .................................................................................................................299 EVA-MARIA PUTZIER AM EXPERIMENTIERTISCH: POSITION UND POSITIONIERUNG IM CHEMIEUNTERRICHT 1. Einleitung Chemieunterricht ist im Gegensatz zu anderen Unterrichtsfächern untrennbar mit experimentellen Tätigkeiten verbunden, die sich organisierend auf die Lehrer-Schüler-Interaktion auswirken. Dabei gehört der Lehrerdemonstrationsversuch zu einer Unterrichtsmethode, die häufig praktiziert wird. Hier obliegt es dem Lehrer als zentrale Fokusperson (Schmitt/ Deppermann 2007), Experimente durchzuführen, die in der Regel der Vermittlung fachspezifischen Wissens dienen. Nicht selten hängt die Entscheidung, ein Experiment als Lehrerversuch statt als Schülerversuch zu erarbeiten, mit den räumlichen Bedingungen zusammen: In den meisten Schulen gehören Chemiesäle zum üblichen Inventar, die durch den zentralen Experimentiertisch und die darauf ausgerichtete abgestufte Anordnung von Sitzreihen für das ‘Demonstrieren’ auf der einen Seite und das ‘Schauen’ auf der anderen Seite prädestiniert sind. Ausgehend von einer multimodalen Konzeption von Interaktion (vgl. Schmitt/ Hausendorf i.d.Bd.), die soziale Bedeutungskonstitution im Allgemeinen und damit das Unterrichtsgeschehen im Speziellen als von allen Interaktionsbeteiligten gemeinsame Herstellung und Aushandlung begreift, laufen Demonstrationsphasen jedoch nicht in dieser Zweidimensionalität ab: Einer demonstriert und die anderen schauen. Der dem Beitrag zugrundeliegende Videoausschnitt zeigt eine Unterrichtssequenz, in der Lehrer und Schüler ein Experiment zur Herstellung von Alkohol gemeinsam entwickeln. Der Fall ist besonders interessant, da der Lehrer den Versuch zwar dem klassischen Demonstrationsexperiment entsprechend selbst durchführt, sich dabei aber ganz in den Dienst der Schüler stellt. Er setzt die Beiträge und Anweisungen der Schüler stellvertretend praktisch um. Diese hochgradig schüleraktivierende Vorgehensweise birgt allerdings die Gefahr, dass die Beiträge der Schüler vom Thema wegführen und das Unterrichtsziel nicht erreicht werden kann. Die Herausforderung für den Lehrer besteht daher einerseits darin, die Beiträge der Schüler aufzunehmen und umzusetzen, gleichzeitig ist er jedoch mit der Aufgabe konfrontiert, die Schüler so zu steuern, dass dies im Rahmen seiner handlungspraktischen Ziele erfolgt. Eva-Maria Putzier 304 Während der Beschäftigung mit dem fraglichen Ausschnitt zeigte sich, dass die Positionen und Posituren des Lehrers bei der Steuerung von Schülerbeiträgen eine zentrale Rolle spielen: Je nach Entwicklungsstand des Experiments nimmt der Lehrer unterschiedliche Positionen und Posituren im Raum ein, die für die Schüler mit verschiedenen Beteiligungsstatus verbunden sind. Diese implizite Form der Steuerung zeigt sich auch in seinem verbalen Verhalten: In keinem der besprochenen Fälle nimmt der Lehrer explizite Korrekturen oder Evaluationen vor. Er verdeutlicht den Schülern vielmehr implizit, wie ihre Beiträge zu bewerten sind. Die Funktionalität, die der Nutzung spezifischer Positionen und Posituren in der Interaktion zukommt, setzt eine besondere Form der Wahrnehmungswahrnehmungssituation (Hausendorf 2003) voraus: Fast alles, was am Experimentiertisch stattfindet, fällt unter Beobachtungsverdacht. Der Lehrer führt Experimente nicht zum Selbstzweck durch, sondern nutzt sie für die Wissensvermittlung. So kann er gezielt spezifische Positionierungen vornehmen, weil sie an dem Ort realisiert werden, der für Wahrnehmung und Beobachtung hergerichtet ist. Im vorliegenden Beitrag werde ich nach einigen methodischen und begrifflichen Vorüberlegungen (Kap. 2 und 3) der Frage nachgehen, mit welchen Implikationen der (unbesetzte) Chemiesaal durch seine Herrichtung und Ausstattung für Interaktion verbunden ist (Kap. 4). In einem zweiten Schritt soll anhand von vier Standbildern die Raumnutzung des Lehrers unter besonderer Berücksichtigung seiner Positionen und Posituren deskriptiv erfasst und sozialtopografisch ausgedeutet werden (Kap. 5). Abschließend erfolgt dann die Konstitutionsanalyse des Interaktionsgeschehens (Kap. 6). 2. Methodische Vorüberlegungen Die vorliegenden Daten wurden nicht für das spezifische Erkenntnisinteresse an interaktionsarchitektonischen und sozialtopografischen Aspekten erhoben, sondern zur Analyse des interaktiven Unterrichtsgeschehens. Die spezifische Dokumentation des Chemiesaals ist dabei nicht zufällig: Die Kamera ist mittig, am Ende eines Mittelgangs platziert und erkennbar auf ein Vorne (Tafel, Experimentiertisch etc.), d.h. die Stirnseite des Raums, ausgerichtet. Sie folgt in dieser Ausrichtung genau der Orientierung, die Schüler einnehmen, wenn sie auf den Stühlen Platz nehmen. Die methodische Vorgehensweise folgt der sogenannten Gesamtbildanalyse (ebd.): Bei der Analyse lasse ich mich von der Struktur des Standbildes selbst leiten, durch das einzelne Raumaspekte relativ zur Erkenntnisperspektive stärker hervorgehoben werden als andere. Den sozialtopografischen Aspekten des Raums gehe ich anhand von Standbildern nach, die jeweils eine spezi- Am Experimentiertisch: Position und Positionierung im Chemieunterricht 305 fische Raumnutzung des Lehrers zeigen. Im Gegensatz zu ‘Frame-Comics’ bildet nicht die Sequenzialität die Konstitutionsgrundlage für die Interaktionsdokumente. Die Standbilder folgen zwar sequenziell aufeinander, jedoch stellen sie keine „konsistenten und gestalthaften, thematisch-pragmatische Ausschnitte“ (Schmitt i.d.Bd.) dar. Die Auswahl und Ordnung der Standbilder folgt dem Prinzip der Sichtbarmachung und Vollständigkeit interaktionsarchitektonischer Relevanzen (ebd.). Beim Chemiesaal handelt es sich um einen hochgradig vorstrukturierten Funktionsraum, der in seiner Ausstattung auf ein ‘Vorne’ ausgerichtet ist. Das zentrale Elemente des ‘Vorne’ ist der Experimentiertisch, der aufgrund seiner interaktionsarchitektonischen Relevanz ein leitendes Kriterium für die Auswahl der Standbilder darstellt. Er legt durch seine spezifische Materialität und Platzierung unterschiedliche Positionen und Posituren nahe, die im Grunde alle als Positionen ‘am Experimentiertisch’ zusammengefasst werden können. Positionen und Posituren sind eng mit der Aktivitäts- und Handlungsstruktur verbunden und werden im Bezug auf ihre Implikationen für Interaktion untersucht. 3. Position, Positur und Positionierung ‘Position’ und ‘Positur’ sind per definitionem an Raum gebunden und können nicht losgelöst von der physischen Präsenz einzelner Personen gedacht werden. 1 Wenn ein Raum von Personen genutzt wird, nehmen sie unvermeidlich bestimmte Positionen und Posituren ein. ‘Position’ wird als Gegenbegriff zu ‘Ort’ verwendet, der als objektiv gegebener und interaktionsunabhängiger Schnittpunkt im Raum definiert wird. ‘Position’ wird hingegen als interaktionistischer Begriff gefasst, der als „Endpunkt einer Bewegung eines Interaktionsbeteiligten von A nach B“ (Schmitt 2013, S. 273) definiert ist. Der Begriff ‘Position’ impliziert daher eine Analyseperspektive, die nach dem Raum als interaktive Ressource fragt. Unter ‘Positur’ verstehe ich eine von Beteiligten eingenommene Körperhaltung, die meist funktional auf den jeweiligen Handlungszusammenhang ausgerichtet ist. Während eine interaktionsräumliche Perspektive zu relativ präzisen Aussagen über mögliche Positionen im Raum kommen kann, sind (potenzielle) Posituren durch diese Perspektive nur begrenzt zugänglich. Posituren sind vor allem an die Körperlichkeit der Beteiligten gebunden, die unabhängig von räumlichen Strukturen besteht. Untersucht man Posituren jedoch vor allem unter dem Blickwinkel ihrer funktionalen Bezogenheit auf den aktuellen 1 Wenn man Position nicht als Lage eines Punktes im Raum, sondern personenbezogen begreift. Eva-Maria Putzier 306 Handlungszusammenhang, kann die Interaktionsarchitektur durchaus wichtige Hinweise liefern, wie Beteiligte den Raum durch Einsatz ihrer Hände, ihres Kopfes und ihres Oberkörpers nutzen können. ‘Positionierung’ setzt im Gegensatz zu den Begriffen der ‘Position’ und ‘Positur’ Interaktion voraus. Der Begriff ‘Positionierung’ soll hier in Anlehnung an das verbalsprachliche Konzept der Identitätskonstruktion genutzt werden, das seine Ursprünge in der discursive psychology (Hollway 1984; Harré/ van Langenhove (Hg.) 1999) hat und in der Konversationsanalyse (‘positioning’) vor allem im Hinblick auf das Erzählen genutzt und entsprechend modifiziert wurde (Lucius-Hoene/ Deppermann 2004): Positionierung bezeichnet zunächst ganz allgemein die diskursiven Praktiken, mit denen Menschen sich selbst und andere in sprachlichen Interaktionen aufeinander bezogen als Personen her- und darstellen, welche Attribute, Rollen, Eigenschaften und Motive sie mit ihren Handlungen in Anspruch nehmen und zuschreiben, die ihrerseits funktional für die lokale Identitätsher- und -darstellung im Gespräch sind. (ebd., S. 168) Für das Konzept der ‘Positionierung’ ist Interaktion also konstitutiv und fragt zunächst nach sprachlichen Handlungen, mit welchen Personen bestimmte Eigenschaften für sich und andere in Anspruch nehmen. Das ursprünglich verbale Konzept soll im vorliegenden Beitrag durch den multimodalen 2 Ansatz erweitert werden. Im vorliegenden Beitrag geht es nicht um allgemeine Selbst- und Fremdpositionierungen beispielsweise als Lehrperson oder als Sch ü ler, welchen in der Interaktion unterschiedliche Rechte und Pflichten zukommen, sondern um situative, funktional auf die spezifische Aktivitäts- und Handlungsstruktur bezogene Identitätskonstruktionen aller Beteiligten im Rahmen der spezifischen experimentell strukturierten Aktivität. Hier erfolgt dann auch die ‘Synthese’ mit den vorangegangenen interaktionsarchitektonischen und sozialtopografischen Untersuchungen: Die Ausstattung des Raums legt bestimmte Positionen und Posituren nahe, deren tatsächliche Nutzung bereits mit Implikationen für die in der Interaktion realisierte Positionierungsaktivitäten verbunden ist. Ausgehend von klassischen Studien, die neben Gesten auch die Koordination von Körperbewegung und Körperpositur untersuchen, 3 gibt es im Rahmen der multimodalen Forschungspraxis inzwischen zahlreiche Studien, die sich mit Körperbewegung (Goodwin 1981, 2003; Haddington et al. (Hg.) 2013; 2 Ein Überblick zur multimodalen Konversationsanalyse und Interaktionsanalyse siehe Putzier (2016). 3 Siehe Condon (1971); Kendon (1990); Schegloff (1998). Am Experimentiertisch: Position und Positionierung im Chemieunterricht 307 Heath 1984; Mondada 2007; Schmitt 2012; Schmitt/ Deppermann 2010) und in diesem Zusammenhang auch mit Körperposituren und -positionierungen in der Interaktion beschäftigen 4 (z.B. ‘posture shift’: Avital/ Streeck 2011; Kendon 1990, S. 104). Jedoch versuchen nur wenige Studien, den Einsatz von Körperposi-tion und -positur in systematischer Weise 5 zu untersuchen (Kendon 1990; Heath 1984, 1986; Schmitt i.Vorb.). Heath (1986) untersucht beispielsweise im Rahmen von Arzt-Patienten-Interaktion, wie Beteiligte durch Körperpositur und Blickverhalten ihre Verfügbarkeit hinsichtlich folgender Aktivitäten für die anderen Beteiligten deutlich machen: It is useful to refer to the way in which a person may present himself through gaze and sometimes posture towards another as a display of recipiency. Through a display of recipiency an interactant may show that he is ready and prepared to receive an action or activity from another person. (ebd., S. 29) So zeigt auch der Lehrer durch seine Positur und sein Blickverhalten an, ob er - wie in diesem Fall - für den nächsten Handlungsvorschlag seitens der Schüler bereit ist. Im Hinblick subversiver Schüleraktivit ä ten zeigt sich, dass Schüler immer wieder die Situationen nutzen, in welchen der Lehrer durch sein körperlich-räumliches Verhalten deutlich macht, dass er gerade nicht verfügbar ist (vgl. Kap. 6.5). Körperpositur und -positionierung sind darüberhinaus Gegenstand einiger Studien zur Unterrichtsforschung (Merola/ Poggi 2003; Putzier 2016; Tabensky 2013). Merola und Poggi zeigen, wie Lehrer systematisch Positions- und Positurwechsel zur Verdeutlichung von thematisch-pragmatischen Transitionen vornehmen. In der dem Beitrag zugrundeliegenden Videoaufnahme zum Chemieunterricht ist der Positions- und Positurwechsel des Lehrers systematisch mit einem Wechsel in der Aktivitätsstruktur verbunden. 4. Am (unbenutzten) Experimentiertisch 6 Der Chemiesaal gehört in Schulen zu den hochgradig ausgestatteten Räumen und wird daher nicht zufällig als „Fachraum“ bezeichnet: Chemieunterricht ist unweigerlich an eine (fach)spezifische Ausstattung gebunden. Das zentrale Raumelement bildet hierbei der Experimentiertisch, der hinsichtlich seiner interaktionsarchitektonischen Implikationen im Folgenden untersucht werden soll. 4 Bohle (2013) bietet einen Überblick über multimodale Studien, die die Koordination von Körperbewegungen und Körperpositur in der Interaktion fokussieren. 5 Ein Überblick findet sich bei Müller et al. (Hg.) (2013). 6 Viele der nachfolgenden Aspekte können in detaillierter, ausgearbeiteter Weise in meiner Dissertationsschrift nachgelesen werden (Putzier 2016). Eva-Maria Putzier 308 1 Der Experimentiertisch befindet sich vor der Tafel, einen halben Meter nach rechts abgesetzt. Er ist nicht nur Teil der Stirnseite, sondern steht im Zentrum des Vorne und unterscheidet sich signifikant von allen anderen Elementen der Stirnseite. Eine zentrale Voraussetzung zur Nutzung des durch die spezifische Gestaltung des Experimentiertischs nahegelegten Potenzials 7 ist die Begehbarkeit bzw. Bestehbarkeit des Lehrertischs. Im Gegensatz zum Raumbereich der Sitzreihen ist das Vorne mit einer wesentlich großzügiger begehbaren Fläche ausgestattet. Der Abstand zwischen dem Lehrertisch und der ersten Sitzreihe ist auffällig groß, vergleicht man dies mit herkömmlichen Unterrichtsräumen, in welchen der Lehrertisch oft unmittelbar an die Schülertische anschließt (vgl. Schmitt/ Dausendschön i.d.Bd.). Die Tischplatte ist ein Stück höher als die der Schülertische und liefert daher Hinweise darauf, dass Beteiligte an diesem Tisch im Stehen und nicht im Sitzen (inter)agieren. Auch die im Kontrast zu den Sitzreihen auffällige Abwesenheit von Stühlen (bis auf den neben dem Overheadprojektor platzierten Stuhl, der aufgrund seiner Position und Ausrichtung eher abgestellt als hingestellt erscheint) verdeutlicht die interaktionsarchitektonisch nahegelegte Präsenzform des Stehens oder Gehens im Raumbereich des Vorne. Obgleich der Lehrertisch von allen Seiten begehbar und bestehbar ist, sind die möglichen Positionen präferenziell gewichtet: Der Lehrer steht aus Sicht der Schüler hinter dem Lehrertisch, sodass sich eine ‘face-to-faces-Konstellation’ ergibt und die Nutzung des Tisches durch den Lehrer für die Schüler sichtbar und vor allem wahrnehmbar ist. Eine längerfristige ‘back-to-faces-Konstellation’ wäre mit weitreichenden Implikationen für die Interaktion verbunden, die der „Normalformerwartung“ (Cicourel 1975) der Lehrerrolle im Unterricht entgegenstünden. 7 Zur Materialität und Ausstattung des Experimentiertischs siehe Putzier (2016). Am Experimentiertisch: Position und Positionierung im Chemieunterricht 309 Im Bezug auf die Basiskonzepte kann die Interaktionsarchitektur des Experimentiertischs wie folgt beschrieben werden: 1) Sichtbarkeit: Die Platzierung des Experimentiertischs in der Mitte des Raumbereichs und seine im Vergleich zu den Schülertischen höher gesetzte Tischplatte ermöglichen eine uneingeschränkte Wahrnehmung der praktischen Aktivitäten. Dabei erfolgt durch die visuelle Undurchlässigkeit der Frontseite und die kontrastive Farbgebung der Tischplatte eine zusätzliche Fokussierung auf das, was auf dem Tisch geschieht. 2) Begreifbarkeit/ Handhabbarkeit: Die spezifische Ausstattung des Experimentiertischs gibt zahlreiche Hinweise auf einen (ermöglichten) praktischen Handlungszusammenhang. Im Bezug auf die Positur des Lehrers ist daher anzunehmen, dass er Hände und Arme entsprechend für experimentelle Aktivitäten einsetzen wird. 3) Begehbzw. Bestehbarkeit: Die Begeh- und Bestehbarkeit des Experimentiertischs ist eng mit dem Basiskonzept der Begreifbarkeit verknüpft: In praktisch dominierten Handlungszusammenhängen ist das Stehen oft die präferierte Präsenzform, zumal es für die Durchführung des Chemieunterrichts notwendig ist, Gegenstände zu holen, zu arrangieren und wegzuräumen, wofür in der Regel Laufwege zurückgelegt werden müssen, die eine gute Begehbarkeit des Lehrertisches voraussetzen. Unter Berücksichtigung der optimalen Sichtbarkeit liegt es besonders nahe, wenn der Lehrer mittig am Experimentiertisch positioniert ist, um Experimente durchzuführen. 5. Der Lehrer am Experimentiertisch In diesem Kapitel soll auf der Grundlage von vier Standbildern der Frage nachgegangen werden, wie der Lehrer die unterschiedlichen Raumbereiche des ‘Vorne’ nutzt. Analysefokus bilden dabei in erster Linie Position und Positur des Lehrers: - Welche Positionen nimmt der Lehrer im vorderen Bereich des Chemiesaals tatsächlich ein? - Nutzt er die architektonisch nahegelegten Positionen im Raum? Welche Posituren realisiert er dabei? - Inwiefern geben Position und Positur Auskunft über den entsprechenden Aktivitätszusammenhang? - Mit welchen Implikationen sind die Positionen für die Interaktion verbunden? - Welche Implikationen ergeben sich für den Beteiligungsstatus der Schüler? Eva-Maria Putzier 310 5.1 Hinter dem Experimentiertisch (I) Das vorliegende Standbild (Bild 2) zeigt die Nutzung des Bereichs hinter dem Experimentiertisch. Der Lehrer steht jedoch nicht unmittelbar am Experimentiertisch, sondern - soweit das auf dem Standbild erkennbar ist - etwa einen Schritt vom Experimentiertisch entfernt. Die physische Distanz zum Experimentiertisch ist im Hinblick auf die Aktivitätsstruktur implikativ: Er nutzt den Raumbereich aktuell nicht für experimentelle Tätigkeiten, sondern realisiert eine Präsenzform (Stehen), die auf den ersten Blick statisch erscheint, im Gegensatz zum dynamischen Einsatz beim Experimentieren. 2 Diese Annahme wird durch die spezifische Positur des Lehrers zusätzlich verstärkt. Während der rechte Arm locker nach unten hängt, hat er die linke Hand in die Hosentasche gesteckt. Die für experimentelle Tätigkeiten zentralen ‘Werkzeuge’ sind also ‘verankert’ und nicht unmittelbar für experimentelle Tätigkeiten einsetzbar. Darüber hinaus verdeutlicht der auf die Klasse gerichtete Blick seine (momentane) Orientierung auf die Schüler. Wenngleich Position und Positur des Lehrers weitgehend statisch erscheinen, wird der übergeordnete experimentelle Handlungszusammenhang in unterschiedlicher Weise sichtbar. Begreift man die Position des Lehrers als Abwahl anderer möglicher Positionen, wie etwa die Position vor dem Experimentiertisch, rücken besonders die zahlreichen Gegenstände auf dem Experimentiertisch in das Blickfeld. Der Lehrer gibt durch seine Position den Blick auf die Gegenstände frei und verdeckt sie nicht durch seinen Körper, wie es etwa der Fall wäre, wenn er vor dem Experimentiertisch stünde. Die zahlreichen fachspezifischen Gegenstände wie etwa ein mit einer roten Flüssigkeit gefüllter Erlenmeyer-Kolben, ein Becherglas, ein Gasbrenner und eine Weinflasche zeugen von experimentellen Aktivitäten. Darüber hinaus trägt der Lehrer einen weißen Laborkittel, der als zentrale Ausstattung eines Chemikers gilt und daher einen experimentellen Handlungszusammenhang nahelegt. Am Experimentiertisch: Position und Positionierung im Chemieunterricht 311 Zusammenfassend gibt die sozialtopografische Nutzung des Raums hier zweierlei Relevanzen preis: Der Raum wird einerseits für experimentelle Tätigkeiten genutzt, wie es etwa durch die zahlreichen fachspezifischen Objekte auf dem Experimentiertisch sichtbar wird. Aktuell ist der Lehrer jedoch auf die Schüler orientiert und nimmt (zeitweise) von dem Experiment buchstäblich ‘Abstand’. 5.2 Hinter dem Experimentiertisch (II) Die folgende Raumnutzung (Bild 3) erfolgt ca. 1 Minute später und zeigt den Lehrer wieder hinter dem Experimentiertisch. Seine Position und seine Positur unterscheiden sich jedoch erheblich zu denjenigen im zweiten Standbild (vgl. Bild 2). Er steht mittig, unmittelbar hinter dem Experimentiertisch, an dem er mit der Hüfte sogar angelehnt ist. Der Oberkörper ist nach vorne gebeugt und sein Kopf nach unten gesenkt. Er folgt blicklich seiner praktischen Tätigkeit, die dem interaktionsarchitektonisch nahegelegten Aktivitätszusammenhang entspricht: Der Lehrer ist offensichtlich dabei, ein Experiment durchzuführen. Mit seiner rechten Hand hält er eine weiße Tüte, aus der er etwas in den Erlenmeyer-Kolben schüttet, welchen er mit der linken Hand am Flaschenhals fixiert. 3 Die mittige Position des Lehrers und die Art und Weise, wie er die Objekte manipuliert, sind für maximale Sichtbarkeit ausgerichtet. Er führt das Experiment also nicht nur im Beisein der Schüler als weitere Raumnutzer durch, sondern so, dass alle Schüler seinen Aktivitäten blicklich folgen können. Dadurch erhält sein Tun eine demonstrative Qualität, die über das bloße Umfüllen von Substanzen hinausgeht. Weiterhin liefert der nach oben gerichtete Zeigefinger einer Schülerin starke Hinweise dafür, dass hier eine gemeinsame Aktivität stattfindet, die die Schülerin in irgendeiner Form veranlasst, verbal aktiv zu werden. Eva-Maria Putzier 312 Auf der Grundlage der demonstrativen Qualität seiner Aktivität ist der Blick des Lehrers auf die von ihm manipulierten Objekte nicht nur unter dem Aspekt der Selbstkoordination zu verstehen. Er fokussiert selbst das, was auch von den Schülern zu fokussieren ist. In diesem Sinne kann der Blick als „deictic gaze“ (Argyle/ Cook 1976) interpretiert werden, also im Sichtbarmachen dessen, was er selbst sieht. 5.3 Vor dem Experimentiertisch I (Verankerung) 4 Das vorliegende Standbild (Bild 4) dokumentiert eine Raumnutzung des Lehrers, die 43 Sekunden nach der Raumnutzung erfolgt, die im dritten Standbild gezeigt wurde. Der Lehrer steht nun unmittelbar vor dem Experimentiertisch. Die Tischkante links unten im Bild lässt darauf schließen, dass der Lehrer etwa mittig am Experimentiertisch steht. Er lehnt sich mit dem Unterkörper an der Tischplatte des Experimentiertisches an, wobei seine Beine übereinander geschlagen sind oder zumindest sichtbar nahe beieinander stehen. Seine Arme liegen nahe am Körper an und seine Hände sind nicht sichtbar, weil er sie hinter dem Rücken etwa auf der Höhe der Tischplatte hält. Die vorliegende Raumnutzung zeigt einige Parallelen zu der Raumnutzung im zweiten Standbild (Bild 2). Wieder nimmt der Lehrer eine statische Präsenzform ein, die aufgrund der Verankerung beider Arme und der an den Tisch anlehnenden Haltung noch stärkere Hinweise gibt, dass es sich um eine Raumnutzung handelt, die über einen längeren Zeitraum hinweg stabil bleibt. Die ‘Verankerung’ ist in diesem Standbild ebenfalls besonders manifest, da nicht nur beide Arme nahe am Körper anliegen, sondern sogar die Hände nicht mehr sichtbar sind und damit die zentralen Werkzeuge für das Experiment buchstäblich aus dem Sichtfeld gelangen. Blicklich ist der Lehrer auch hier zur Klasse orientiert. Am Experimentiertisch: Position und Positionierung im Chemieunterricht 313 Im Gegensatz zum zweiten Standbild steht der Lehrer jedoch vor dem Experimentiertisch und ist in Gänze sichtbar. Während die experimentellen Aktivitäten in den Hintergrund rücken und die Sichtbarkeit auf einzelne Gegenstände durch den Körper des Lehrers eingeschränkt ist, rückt er näher an die Schüler heran. Gleichzeitig ist diese Form der Raumnutzung auch mit Implikationen für die Schüler verbunden. Sie sind nicht mehr als Beobachter und Schauende gefragt, sondern als Gesprächspartner, die sich verbal am Unterrichtsgeschehen beteiligen. 5.4 Vor dem Experimentiertisch II (Demonstration) 5 Das letzte Standbild dokumentiert wieder eine Raumnutzung des Lehrers vor dem Experimentiertisch (Bild 5), die 31 Sekunden nach dem vierten Standbild erfolgt. Während der Lehrer wieder mittig positioniert ist, steht er hier jedoch etwa einen halben Meter vom Experimentiertisch entfernt. Vor seinem Körper hält er den Erlenmeyer-Kolben mit der roten Flüssigkeit fest, der im zweiten Standbild - noch ohne Gummistopfen - auf dem Experimentiertisch stand (vgl. Bild 2). Sein Blick ist nicht mehr zur Klasse orientiert, sondern auf den Erlenmeyer- Kolben gerichtet, den er mit beiden Händen leicht schräg hält, wobei die linke Hand nur den Boden des Gefäßes fasst, so dass sein Inhalt sowohl für die Schüler als auch für den Lehrer gut sichtbar ist. Ähnlich wie im vierten Standbild hat sein Blickverhalten eine demonstrative Qualität, die durch die spezifische Position des Lehrers zusätzlich verstärkt wird. Während er bei der Raumnutzung im dritten Standbild aufgrund seiner experimentellen Tätigkeit notwendigerweise auf den Erlenmeyer-Kolben blicken musste, ist eine entsprechende Blickorientierung in diesem Aktivitätszusammenhang nicht erforderlich. Eva-Maria Putzier 314 Seine körperliche Nähe zu den Schülern und die Art und Weise wie er den Erlenmeyer-Kolben in der Hand hält, geben starke Hinweise dafür, dass er den Gegenstand im Sinne einer Demonstration manipuliert und den Schülern vor Augen führt. Die spezifische Manipulation des Erlenmeyer-Kolbens gibt insofern Aufschluss über den thematisch-pragmatischen Handlungszusammenhang, als sie die zentrale Relevanz des Objekts für die aktuelle Unterrichtssituation nahelegt. Gleichzeitig ist sie für die Schüler hinsichtlich ihres Beteiligungsstatus implikativ, die nun wieder als Schauende und Beobachtende gefragt sind. 6. Interaktionsanalyse Unter der sozialtopografischen Perspektive wurde bereits deutlich, wie der Lehrer unterschiedliche Positionen hinter und vor dem Experimentiertisch nutzt. Seine Position und Positur waren jeweils mit Implikationen für den Beteiligungsstatus der Schüler verbunden. Dies soll nun unter interaktionistischer Perspektive beleuchtet werden. Der Lehrer kann durch die spezifische Form der Raumnutzung die Schüler in ihrem Verhalten steuern und ihnen implizit verdeutlichen, welcher Beteiligungsstatus ihnen im Verlauf des Experiments zukommt. Gleichzeitig wird die Analyse zeigen, wie die Schüler ihr Verhalten bezogen auf die Positionierungen des Lehrers selbst ausrichten. Der folgende Ausschnitt zeigt eine Situation, in der Lehrer und Schüler gemeinsam experimentelle Schritte erarbeiten, um die alkoholische Gärung des Kirschsafts in Gang zu setzen. Nachdem die Kirschen püriert und in einen Erlenmeyer-Kolben gegeben wurden, fragt der Lehrer die Schüler, welcher experimentelle Schritt als Nächstes notwendig ist, um aus dem Kirschsaft Wein herzustellen. Hier steigen wir in die Analyse ein. Die Schüler liefern unterschiedliche Beiträge, die durch das körperlich-räumliche und sprachliche Verhalten des Lehrers als handlungsrelevant eingestuft oder zurückgewiesen werden. Während der erste Beitrag der Schülerin Michaela als Reaktion auf eine konkrete vom Lehrer formulierte Frage erfolgt, sind die Beiträge von Ruben und Julius selbstinitiiert. Interessant ist dabei der Zeitpunkt, zu dem sich die beiden Schüler verbal einbringen, weil sie jeweils Gesprächspausen des Lehrers, die durch seine experimentellen Aktivitäten zustande kommen, für ihre eigenen Zwecke nutzen. Am Experimentiertisch: Position und Positionierung im Chemieunterricht 315 6.1 Initiierung des gemeinsamen Experiments und Beitrag von Michaela Wir steigen in die Analyse der Sequenz ein, als der Lehrer das gemeinsame Experiment verbal initiiert. Zu Beginn seiner Äußerung nimmt er den Erlenmeyer-Kolben mit dem Kirschsaft, den er zuvor mittig auf dem Experimentiertisch platziert hat, in die Hand und hebt ihn auf Brusthöhe an. 21 LE: h. aber was BRAU chen=wir damit wir das (.) Durch die Manipulation des Erlenmeyer-Kolbens rückt der Lehrer das Objekt und die damit verbundene Fragestellung nach der Produktion von Alkohol in den Aufmerksamkeitsfokus der Schüler. Stukenbrock (2015) bezeichnet diese Form von Deixis als ‘Zeigen an Objekten’, da die Objekte hier nicht als Zeigeinstrument dienen, sondern selbst das Zeigeziel konstituieren. Hinsichtlich des Gesprächsbeitrags des Lehrers wird nun auch deutlich, worauf der Lehrer mit dem Demonstrativpronomen das (Z. 21) referiert. Er bezieht sich auf den Kirschsaft im Erlenmeyer-Kolben und die damit verbundene Fragestellung, wie daraus Alkohol gewonnen werden kann. Während der folgenden Äußerungseinheit (Z. 22) stellt er den Erlenmeyer- Kolben wieder mittig auf dem Experimentiertisch ab. Das Abstellen des Erlenmeyer-Kolbens hat hier wie das Anheben deiktische Qualität, da der Lehrer das Objekt durch die spezifische Platzierung („placing“), (Clark 2003) erneut in den Aufmerksamkeitsfokus rückt, bzw. den Aufmerksamkeitsfokus der Schüler entsprechend aufrechterhält. Zu diesem Zeitpunkt wird also bereits deutlich, dass alle folgenden Aktivitäten im Dienste dieses Objektes stehen. Am Gesprächsbeitrag des Lehrers ist dabei besonders interessant, dass er diese Aktivitäten als gemeinschaftliches Unternehmen rahmt, indem er das Personalpronomen wir (Z. 22) verwendet. Er nimmt die Schüler dadurch implizit in die Pflicht, sich an dem Geschehen Eva-Maria Putzier 316 aktiv zu beteiligen. Es ist nicht er alleine, der das Experiment als Experte durchführt, sondern die Schüler können und sollen ihren eigenen Beitrag leisten. 22 LE: ge ZIE: LT steuern können Unterstützt wird dies durch die spezifische Positur des Lehrers: Während er mit der rechten Hand den Erlenmeyer-Kolben manipuliert, hat er die linke Hand in der Hosentasche. In der anschließenden Äußerungseinheit (Z. 23) macht er außerdem einen Schritt nach hinten Richtung Tafel und lässt den rechten Arm hängen. Durch die Distanz zum Experimentiertisch und das Ruhigstellen seiner Hände, die ihm im Experiment als zentrale Werkzeuge dienen, positioniert der Lehrer sich als Wartender, der sich buchstäblich selbst zurücknimmt, um die Schüler als aktiv Beteiligte zu fordern. 23 LE: dass da wirklich, Am Experimentiertisch: Position und Positionierung im Chemieunterricht 317 24 (1.13) Nachdem der Lehrer seine Fragestellung (Z. 21-22) mit der folgenden Äußerungseinheit was (.) FEHlt hier noch alles; (Z. 25) reformuliert, ruft er Michaela auf, die sich bereits seit einiger Zeit meldet. 25 LE: MIchaela - 26 (--) Michaela formuliert daraufhin ihren Beitrag: 27 MI: mh=ich glAUB das hat was damit zu tun; 28 dass (-) das 29 (1.35) 30 äh LUFTdicht abgeschlossen sein muss? 31 =also nicht nur (.) 32 dauernd SAUerstoff=irgendwie kommt- 33 dann [ ] glaub ich- 34 LE: [mhm? ] 35 MI: und wenn=es (---) geSCHLOSSen ist 36 und dann=eine weile rumsteht, Eva-Maria Putzier 318 37 (-) 38 <<p>ist=es nicht so; > Michaela rahmt ihre Äußerung zunächst als Vermutung (glAUB (Z. 27) glaub ich (Z. 33)) und formuliert dann eine Erklärung für ihre Vermutung in der Form eines Konditionalsatzes (wenn [...] dann [...] (Z. 35-36)). Michaela nennt in ihrem Beitrag keine konkreten Materialien, die der Lehrer einsetzen könnte, um den Erlenmeyer-Kolben LUFTdicht (Z. 30) abzuschließen. Ihre anschließende Konkretisierung, die SAUerstoff-Zufuhr (Z. 32) müsse ausgeschlossen werden und der Saft müsse dann=eine weile rumstehen (Z. 36) zeigt jedoch, dass Michaela zwei handlungsrelevante Hinweise gibt, die das gemeinsame Experiment voranbringen (können). Die thematische Relevanz ihres Beitrags steht auch im Zusammenhang mit ihrer (selbstinitiativen) Wortmeldung, die bereits vor der erneuten Fragestellung des Lehrers (Z. 21-22) erfolgte. 6.2 Stellvertretendes Experimentieren durch den Lehrer Verbal reagiert der Lehrer erstmals auf den Beitrag von Michaela, als sie die Äußerungseinheit dann [ ] glaub ich- (Z. 33) realisiert. Das bestätigende Rezeptionssignal mhm? (Z. 34) erfolgt simultan zu Michaelas Beitrag, wobei ihre Äußerung hier unverständlich bleibt. Unter multimodaler Perspektive zeigt sich jedoch, dass der Lehrer bereits vorher reagiert, indem er simultan zu Michaelas Äußerung dauernd (Z. 32) den Kopf zur rechten Seite dreht und kurz darauf in diese Richtung läuft: 32 MI: dau ernd SAUerstoff=irgendwie kommt- 33 MI: dann [ ] glaub ich- Am Experimentiertisch: Position und Positionierung im Chemieunterricht 319 34 LE: [ mhm? ] 35 MI: und wenn=es (---) geSCHLOSSen ist Der Lehrer fokussiert mit seinem Blick also relativ früh den Chemikalientisch (vgl. Kap. 5.2), der neben dem Experimentiertisch steht und auf dem sich eine Reihe unterschiedlicher Gegenstände und Chemikalien befindet. Mit dem Begriff LUFTdicht (Z. 30) liefert Michaela aus seiner Sicht bereits ein wichtiges Stichwort, das ihn veranlasst, nach einem entsprechenden Gegenstand zu suchen (hier: Gummistopfen), mit dem man den Kolben verschließen kann. Die Schülerin kann das Blickverhalten und den Laufweg des Lehrers natürlich wahrnehmen und bekommt daher relativ früh durch sein körperlich-räumliches Verhalten Hinweise darauf, dass er ihren Beitrag für die experimentelle Fragestellung als relevant erachtet. Der Lehrer macht also aus dem Beitrag von Michaela, der zunächst „nur“ als Vermutung und Erklärung formuliert war, durch sein spezifisches Verhalten einen konkreten Handlungsvorschlag. Das Verhalten des Lehrers kann dabei als implizite Positivevaluation (Putzier 2016) des Beitrags der Schülerin gelten. Neben dem bestätigenden Rezeptionssignal mhm? (Z. 32) wird der Schülerin implizit durch das lehrerseitige Verhalten die handlungspraktische Relevanz ihres Beitrags verdeutlicht. Das Eva-Maria Putzier 320 Blickverhalten und der Laufweg des Lehrers haben, weil sie in einer Position realisiert werden, die hochgradig für Wahrnehmungswahrnehmung ausgerichtet ist, demonstrative Qualität. Bis Michaela ihren Gesprächsbeitrag beendet hat, behält der Lehrer seine Position am Chemikalientisch unverändert bei und blickt abschließend wieder zu Michaela: 36 MI: und dann=eine weile rum steht , 37 MI: (-) 38 <<p>ist=es nicht so ; > Michaelas Beitrag ist mit strukturellen Zwängen für den Lehrer verbunden. Er muss sich dazu in irgendeiner Form verhalten. Er reagiert zunächst verbal mit der bestätigenden Partikel okay (Z. 39), die ihm gleichzeitig auch als Segmentierungsmarker dient. Simultan zur Äußerung ich hol= (Z.40) streckt er den linken Arm nach hinten in Richtung Tür, die er unmittelbar im Anschluss öffnet: Am Experimentiertisch: Position und Positionierung im Chemieunterricht 321 39 LE: okay 40 ich hol =mal was zum verSCHLIEßen- 41 (0.83) 42 EINen (1.82) GUMMistopfen- Der Lehrer reagiert nicht nur verbal, sondern auch körperlich-räumlich auf Michaelas Beitrag. Sein körperliches und verbales Verhalten ist dabei koordiniert und im Sinne der Modalitätssynchronisierung (Putzier 2012) inhaltlich aufeinander bezogen. Die inhaltliche Beschreibung was zum verSCHLIEßen (Z. 40) zu holen, ist zunächst relativ allgemein und umgangssprachlich formuliert. Erst im Anschluss nimmt der Lehrer mit der Verwendung des Begriffes GUMMistopfen (Z. 42) eine Konkretisierung vor und verwendet das entsprechende fachsprachliche Vokabular. In der anschließenden Gesprächspause „verschwindet“ der Lehrer kurz im hinteren Raum. Als der Lehrer wieder mit dem Gummistopfen zurück in den Chemiesaal kommt, verschließt er den Erlenmeyer-Kolben und positioniert sich wieder einen Schritt vom Experimentiertisch entfernt. Diesmal hat er seine Hände jedoch nicht in den Hosentaschen, sondern stützt beide Arme auf der Hüfte ein und blickt zu den Schülern. Eva-Maria Putzier 322 44 LE: VIEL besser, 45 (1.04) Seine abschließende Evaluation VIEL besser (Z. 44) weist durch unterschiedliche Aspekte, die hier nur kurz genannt werden sollen, wie etwa der lässige Laufweg zurück zum Chemikalientisch, das demonstrative Einsetzen des Gummistopfens, das Lächeln des Lehrers und die schwunghafte Positionierung eine inszenatorische, fast ironische Qualität auf. So wie der Lehrer sein körperlich-räumliches Verhalten zu inszenatorischen Zwecken besonders „groß“ darstellt, ist auch seine verbale Evaluation eine Übertreibung. 8 Das bloße Verschließen des Kolbens mit einem Gummistopfen reicht nicht aus, um das Experiment gezielt (Z. 22) steuern zu können. Die Positur des Lehrers ist, ähnlich wie zu Beginn der Sequenz, dadurch charakterisiert, dass er seine Hände verankert und implizit die Schüler in die Pflicht nimmt, eigene Handlungsvorschläge einzubringen. Das beidseitige Einstützen der Arme und der Blick in die Klasse haben dabei verstärkt Aufforderungscharakter. 6.3 Beitrag von Ruben (selbstinitiiert) Unmittelbar nachdem der Lehrer die Äußerung VIEL besser (Z. 44) realisiert hat, meldet sich Markus (MA), der vom Lehrer aus gesehen in der ersten Reihe rechts außen sitzt: 8 Zum Verfahren der Inszenierung im Chemieunterricht siehe Putzier (2011). Am Experimentiertisch: Position und Positionierung im Chemieunterricht 323 Der Lehrer blickt zu Markus und der Schülergruppe, die sich während der kurzzeitigen Abwesenheit des Lehrers miteinander unterhalten hatten. Während der Lehrer zunächst auf eine nicht mehr rekonstruierbare Schüleräußerung reagiert (Z. 46), nickt er Markus kurz zu (Z. 47), korrigiert sich jedoch und nimmt Ruben dran, dem er durch eine Zeigegeste signalisiert, dass er an der Reihe ist (Z. 49). 46 LE: das schaff=ich auch noch; 47 (---) 48 äh: : (erstmal den) 49 (1.05) 50 .hh <<lachend> tschuldigung MArkus; > 51 du hast=es ja schon fast- 52 (---) 53 ja Interessant ist die folgende Äußerung des Lehrers du hast=es ja schon fast- (Z. 51). Der Lehrer hat das Gespräch unter den drei Schülern mitbekommen, die sich offenbar über das Experiment unterhalten haben. Durch seine Äußerung verdeutlicht er Ruben, wie nah seine Idee bereits an die Lösung der Problemstellung herankommt. Eva-Maria Putzier 324 Während Ruben seinen Beitrag formuliert, behält der Lehrer die Position und Positur unverändert bei, die er schon bereits vor dem Aufruf von Ruben eingenommen hatte: 54 RU: achso man=muss noch die bakTERien 55 da rein tun, 56 vielleicht vorher noch- 57 (--) die (.) ähm bakTERien raustun; 58 die ich nicht will durch ABkochen- 59 oder so. 60 LE: mhm Der Handlungsanweisung Rubens, Bakterien in die Lösung hineinzugeben und ungewünschte Bakterien durch Abkochen zu entfernen, wird vom Lehrer zunächst nur flüchtig mit mhm (Z. 60) kommentiert. Mit der statischen, invarianten Positur verdeutlicht der Lehrer Ruben, dass er nicht im Begriff ist, dessen aktuellen Handlungsvorschlag umzusetzen. Als Ruben daraufhin schließlich äußert, man könne auch ZUCKer reintun- (Z. 61-62), um mehr Alkohol zu erhalten, verändert der Lehrer seine Positur und blickt nach rechts in Richtung Chemikalientisch. Interessant ist dabei die Abstufung der Modalisierung in Rubens Beitrag. Nachdem er die Handlungsanweisung man=muss noch die bakTERien da rein tun (Z.54-55) formuliert hat, verwendet er im zweiten Äußerungsteil seines Gesprächsbeitrags das Modaladverb vielleicht (Z.56) und rahmt seine Äußerung im Gegensatz zur vorangegangenen Äußerung „nur“ als Vermutung. Den letzten Äußerungsteil seines Beitrags, Zucker in die Lösung zugeben (Z.62), rahmt Ruben schließlich als Option (wenn man noch MÖCHte (Z. 61). Mit seiner folgenden Erklärung, damit (---) man noch ein=bisschen (--) mehr AL- Kohol hinterher [hat; ] (Z.63-64), schließt Ruben seinen Gesprächsbeitrag ab. 61 RU: und wenn man noch MÖCHte 62 kann man auch ZUCKer reintun- Am Experimentiertisch: Position und Positionierung im Chemieunterricht 325 63 damit (---) man noch ein=bisschen (--) 64 mehr ALKohol hinterher [hat; ] 65 LE: [ah: : ] Das körperliche Verhalten des Lehrers auf Rubens Beitrag dient in ähnlicher Weise wie in Michaelas Fall als Verdeutlichung seiner Interpretation des schülerseitigen Beitrags. Er verändert seine Positur und Position erst, als ein aus seiner Perspektive adäquater Aspekt formuliert wird, dessen praktische Umsetzung lohnend ist. Damit zeigt er gleichzeitig den Schülern implizit an, ob ihre Beiträge zur Lösung der Fragestellung beitragen können oder nicht. 6.4 Stellvertretendes Experimentieren durch den Lehrer Die Umsetzung des Handlungsvorschlags von Ruben und Michaela weist eine vergleichbare Struktur auf (vgl. Kap. 6.2). Der Lehrer realisiert auch hier die bestätigende Partikel okay (Z. 67), die gleichzeitig wieder als Segmentierungsmarker dient. Die verbale Aushandlung ist abgeschlossen und es erfolgt die praktische Umsetzung durch den Lehrer. 66 RU: oder so[was ] 67 LE: [okay] Eva-Maria Putzier 326 Während der folgenden Äußerungseinheit, in der er den Vorschlag Rubens reformuliert (Z. 68), läuft er zum Chemikalientisch. Die inszenatorische Qualität der Äußerung entspricht dabei der witzig-ironischen Art und Weise, mit der er den Gummistopfen auf den Erlenmeyer-Kolben gesetzt hatte (vgl. Kap. 6.2). Sie ist in erster Linie darauf zurückzuführen, dass der Lehrer viermal das Wort ‘Zucker’ mit der gleichen Akzentuierung verwendet. Dieser „Überschuss“ an Verbalität gibt seinem körperlich-räumlichen Verhalten eine gewisse Dramaturgie: 68 LE: noch=mehr ZUCKer rein . 69 ZUCKer hab ich hier ZUCKer; 70 (---) 71 mehr ZUCKer - Im Gegensatz zu Michaelas Beitrag kann der Lehrer Rubens Handlungsanweisung umsetzen, ohne den Raum zu verlassen, da er Zucker bereits auf seinem Chemikalientisch bereitgestellt hat. Er nimmt die Zuckertüte und geht Am Experimentiertisch: Position und Positionierung im Chemieunterricht 327 unmittelbar zum Experimentiertisch zurück, wo er simultan zur vierten Wiederholung des Wortes Zucker die Tüte abstellt. Seinen Blick richtet er sowohl während des Laufweges zum Chemikalientisch als auch bei seiner Positionierung am Experimentiertisch nicht mehr auf. Er blickt stattdessen kontinuierlich auf die Zuckertüte. Mit seinem gesamten körperlich-räumlichen Verhalten zeigt er an, dass es nun um die praktische Umsetzung und nicht den verbalen Austausch geht. Besonders deutlich wird dies in der folgenden Gesprächspause, als er sämtliche Ausdrucksmodalitäten wie etwa Blickverhalten, Manipulation, Körperpositur, Körperposition etc. auf die praktische Aktivität ausgerichtet sind: 72 (5.47) 6.5 Beitrag von Julius Während der Lehrer den Zucker in den Erlenmeyer-Kolben gibt und weitgehend von seiner praktischen Aktivität absorbiert ist, ergreift Julius (JJ) die Gelegenheit, selbstinitiiert und ohne Wortmeldung einen Beitrag einzubringen: 73 JJ: wir können ihn auch ein fach BRENnen, 74 =und so und dann=haben wir- 75 (--) Eva-Maria Putzier 328 Die sequenzielle Position seines Beitrags ist im Bezug auf zwei unterschiedliche Aspekte interessant: 1) Julius könnte sich über die Relevanz seines Beitrags unsicher sein und nutzt daher einen sequenziell „unauffälligen“ Zeitpunkt, um seinen Beitrag zu formulieren. Da sich Julius nicht gemeldet hat und/ oder offiziell vom Lehrer aufgerufen wurde, riskiert er keine direkte Evaluation seines Beitrags. Das Formulierungsformat seines Beitrags gibt ebenfalls einen Hinweis auf Julius’ Unsicherheit im Bezug auf die Relevanz seines Beitrags. Mit dem Modalverb können (Z. 73) verdeutlicht er, dass es sich um eine mögliche Idee handelt, die aus seiner Sicht umgesetzt werden kann. 2) Julius nutzt die Absorbiertheit des Lehrers, um seine eigenen Relevanzen einzubringen. Das BRENnen (Z. 73) weist zwar durchaus einen thematischen Bezug auf, reicht jedoch über die spezifische Fragestellung des Lehrers hinaus. Der Lehrer richtet sich während des Beitrags von Julius nicht auf, sondern gibt weiterhin Zucker in den Kolben. Durch seine invariante Position und Positur zeigt er zunächst keinerlei Reaktion auf den Beitrag von Julius. Stattdessen wird Markus (MA) aktiv, der zu der Schülergruppe vorne rechts gehört, die sich sehr rege am Unterricht beteiligt. Auch Markus′ Wortmeldung ist selbstinitiiert. Er dreht sich zu Julius um und erklärt ihm, dass man in diesem Fall nicht Wein, sondern Schnaps erhalten würde. 76 MA: dann ist es aber kein WEIN mehr ; 77 das haben wir schon sonst haben wir SCHNAPS Es ist also nicht der Lehrer, der auf den Beitrag von Julius reagiert, sondern Markus, der sich mit seiner Äußerung als fachlich kompetent positioniert und Julius implizit verdeutlicht, welchen Denkfehler er gemacht hat. Am Ende der ersten Äußerungseinheit von Markus (mehr (Z. 76)) richtet sich der Lehrer auf. Die Änderung seiner Positur zu diesem Zeitpunkt zeigt je- Am Experimentiertisch: Position und Positionierung im Chemieunterricht 329 doch, dass es sich dabei nicht um eine Reaktion auf das Gespräch unter den Schülern handelt, sondern der Lehrer seine praktische Aktivität abgeschlossen hat. Nun bringt sich auch Anna ein, die sich zeitgleich zu Markus nach Julius umgedreht und bereits vorher gemeldet hat. Mit dem Begriff WEINbrand (Z. 78) nennt sie ein Synonym für den von Markus gewählten Begriff SCHNAPS (Z. 77). Auch sie positioniert sich damit als kompetente Beiträgerin. Ihre Äußerung formuliert sie jedoch zum Lehrer gewandt, der sich zu diesem Zeitpunkt vollständig aufgerichtet hat und in die Klasse blickt: 78 AN: WEIN brand ; 79 JJ: ja eben (.) wir wollen ja [SCHNAPS]- An der unmittelbar anschließenden Reaktion von Julius, ja eben (.) wir wollen ja [SCHNAPS] (Z. 79) wird deutlich, dass der Beitrag von Julius funktional nicht mit den Beiträgen von Michaela und Ruben vergleichbar ist. Die vom Lehrer durch sein körperlich-räumliches und verbales Verhalten angezeigte Absorbiertheit nutzt Julius, um seine eigenen Relevanzen einzubringen. Diese sind zwar im weiteren Sinne thematisch relevant, zeugen aber ebenso gut von einer gewissen Subversivität (Schmitt 2009), mit der Julius sein Interesse am Weinbrennen einbringt. In dieser Sequenz wird deutlich, dass Schüler ‘Interaktionsspezialisten’ sind und genau wissen, wann sie ihre eigenen Relevanzen einbringen können. Ihr Beteiligungsstatus ist abhängig von der jeweiligen Lehreraktivität. Experimentelle Phasen, in welchen der Lehrer aufgrund seiner praktischen Aktivität absorbiert ist, stellen hierfür nicht grundsätzlich geeignete Möglichkeiten dar. In vielen Fällen sind Schüler gerade dann als Beobachter und „stille Beteiligte“ gefragt. In dem vorliegenden Fall jedoch unternimmt der Lehrer im Vorfeld keine Aktivitäten, um das Umschütten des Zuckers als wahrnehmungsrelevant zu verdeutlichen. Im Gegenteil wirkt seine vorangehende verbale Äußerung, die inszenatorische Qualität besitzt (vgl. Z. 68-71), bezogen auf die praktische Aktivität Relevanz rückstufend. Eva-Maria Putzier 330 7. Fazit Die vorliegende Analyse verdeutlicht, wie sich Positionierungen in einem für visuelle Wahrnehmung hergerichteten Funktionsraum organisierend auf die Interaktionsstruktur auswirken. In einem ersten Schritt wurde der leere Chemiesaal hinsichtlich seines interaktionsarchitektonischen Potenzials ausgedeutet, wobei der Fokus auf dem Experimentiertisch als zentralem Raumelement lag. Die Ausstattung des Raumes mit der gestuften Anordnung und Ausrichtung der Sitzreihen, die mittige Installation des Tisches und seine rote Verkachelung sind prädestiniert für die Demonstration von Experimenten einerseits und deren Beobachtung andererseits. Auf der Grundlage der interaktionsarchitektonischen Basiskonzepte wurden Positionen und mit ihnen verbundene Posituren rekonstruiert, die durch die spezifische Herrichtung des Raumes besonders nahegelegt sind. Die Positionen, die der Lehrer am Experimentiertisch de facto einnimmt, wurden anhand von Standbildern unter einer sozialtopografischen Perspektive verdeutlicht. Das sozialtopografische Wissen über die Nutzung eines so hochgradig funktional ausgestatteten Raums wie dem Chemiesaal gehört zum ‘common ground’. Der enge Zusammenhang der vom Lehrer eingenommenen Positionen und der Aktivitätsstruktur ist den Schülern weitgehend bekannt. Der fragliche Ausschnitt zeigte eine Sequenz aus dem Chemieunterricht, in dem der Lehrer mit den Schülern gemeinsam experimentelle Schritte herleitet und durchführt. Der Lehrer stellt sich dabei ganz in den Dienst der Schüler und führt die von ihnen vorgeschlagenen experimentellen Schritte stellvertretend durch. Das sich daraus ergebende Spannungsverhältnis zwischen der Umsetzung des geplanten Unterrichtsziels und der kaum antizipierbaren Handlungsvorschläge der Schüler löst der Lehrer unter anderem, indem er durch die Nutzung spezifischer Positionen im Raum die Schüler in ihrer Beteiligung steuert. Er macht sich also das geteilte Wissen über sozialtopografische Strukturen zunutze: Da Schüler die mit bestimmten Positionen verbundene Aktivitätsstruktur interpretieren können, kann er implizit arbeiten. Das verschafft ihm in praktischer Hinsicht eine ökonomische Umsetzung seiner Handlungsziele. Gleichzeitig kann er dadurch seine soziale Orientierung beibehalten und sich weitgehend auf die Handlungsvorschläge der Schüler einlassen, ohne sein Unterrichtsziel aus den Augen zu verlieren. Am Experimentiertisch: Position und Positionierung im Chemieunterricht 331 8. Literatur Argyle, Michael/ Cook, Mark (1976): Gaze and mutual gaze. Cambridge/ New York: Cambridge University Press. Avital, Sharon/ Streeck, Jürgen (2011): Terra incognita: social interaction among blind children. In: Streeck, Jürgen/ Goodwin, Charles/ LeBaron, Curtis (Hg.): Embodied interaction. Language and body in the material world. Cambridge: Cambridge University Press, S. 169-181. Bohle, Ulrike (2013): Body posture and movement in interaction: participation management. In: Müller et al. (Hg.), S. 1301-1310. Cicourel, Aaron V. (1975): Sprache in der sozialen Interaktion. München: List. Clark, Herbert (2003): Pointing and placing. In: Sotaro, Kita (Hg.): Pointing. Where language, culture and cognition meet. Hillsdale, NJ: Erlbaum, S. 243-268. Condon, William S. (1971): Speech and body motion synchrony of the speaker-hearer. In: Horton, David L./ Jenkins, James (Hg.): Perception of language. Columbus: Merrill, S. 150-173. Goodwin, Charles (1981): Conversational organization: interaction between speakers and hearers. New York: Academic Press. Goodwin, Charles (2003): The body in action. In: Coupland, Justine/ Gwyn, Richard (Hg.): Discourse, the body, and identity. Hampshire: Palgrave Macmillan, S. 19-42. Haddington, Pentti/ Mondada, Lorenza/ Nevile, Maurice (Hg.) (2013): Interaction and mobility. Language and the body in motion. Berlin: de Gruyter. Harré, Rom/ van Langenhove, Luk (Hg.) (1999): Positioning theory. Oxford: Blackwell. Hausendorf, Heiko (2003): Deixis and speech situation revisited. The mechanism of perceived perception. In Lenz, Friedrich (Hg.): Deictic conceptualisation of space, time and person. Amsterdam/ Philadelphia: Benjamnis, S. 249-269. Heath, Christian (1984): Talk and recipiency. Sequential organization in speech and body movement. In: Atkinson, John M./ Heritage, John (Hg.): Structures of social action. Studies in conversation analysis. Cambridge: Cambridge University Press, S. 247-265. Heath, Christian (1986): Body movement and speech in medical interaction. Cambridge: Cambridge University Press. Hollway, Wendy (1984): Gender difference and the production of subjectivity. In: Henriques, Julian/ Hollway, Wendy/ Urwin, Cathy/ Venn, Couze/ Walkerdine, Valerie (Hg.): Changing the subject. London: Methuen, S. 227-263. Kendon, Adam (1990): Movement coordination in social interaction: some examples described. In: Kendon, Adam (Hg.): Conducting interaction - patterns of behavior in focused encounters. Cambridge: Cambridge University Press, S. 91-115. Lucius-Hoene, Gabriele/ Deppermann, Arnulf (2004): Narrative Identität und Positionierung. In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion, S. 166-183. http: / / www.gespraechsforschung-online.de/ fileadmin/ dateien/ heft2004/ ga-lucius.pdf (Stand: Juni/ 2016). Eva-Maria Putzier 332 Merola, Georgio/ Poggi, Isabella (2003): Multimodality and gestures in the teacher’s communication. Gesturebased communication in human-computer interaction. 5th International Gesture Workshop. Genova, Italy. April 2003 Conference paper. http: / / host.uniroma3.it/ docenti/ poggi/ cursitopdf/ poggiteacher.pdf (Stand: Juni/ 2016). Mondada, Lorenza (2007): Interaktionsraum und Koordinierung. In: Schmitt, Reinhold (Hg.): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr, S. 55-94. Müller, Cornelia/ Cienki, Alan/ Fricke, Ellen/ McNeill, David (Hg.) (2013): Body - Language - Communication. An international handbook on multimodality in human interaction. (= Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK)). Berlin/ Boston: de Gruyter Mouton. Putzier, Eva-Maria (2011): Das Chemieexperiment: Inszenierung im naturwissenschaftlichen Unterricht. In: Schmitt (Hg.), S. 69-107. Putzier, Eva-Maria (2012): Der Demonstrationsraum als Form der Wahrnehmungsstrukturierung. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 275-315. Putzier, Eva-Maria (2016): Wissen - Sprache - Raum. Zur Multimodalität der Interaktion im Chemieunterricht. (= Studien zur Deutschen Sprache 71). Tübingen: Narr. Schegloff, Emanuel A. (1998): Body torque. In: Social Research 65, 3, S. 536-596. Schmitt, Reinhold (2009): Schülerseitiges Interaktionsmanagement: Initiativen zwischen supportiver Strukturreproduktion und Subversion. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 10, S. 20-69. www.gespraechsforschung-ozs.de/ heft2009/ ga-schmitt.pdf. (Stand: Juni/ 2016). Schmitt, Reinhold (2012): Gehen als situierte Praktik: „Gemeinsam gehen“ und „hinter jemandem herlaufen“. In: Gesprächsforschung - Onlinezeitschrift zur verbalen Interaktion 13, S. 1-44. www.gespraechsforschung-online.de/ fileadmin/ dateien/ heft2012/ ga-schmitt.pdf (Stand: Juni/ 2016). Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 64). Tübingen: Narr. Schmitt, Reinhold (i.Vorb.): Zur Konstitution von Dokumenten für raumanalytische Erkenntnisinteressen: Ein Praxisbericht (unveröff. Ms.). Schmitt, Reinhold/ Deppermann, Arnulf (2007): Monitorung und Koordination als Voraussetzungen der multimodalen Konstitution von Interaktionsräumen. In: Schmitt, Reinhold (Hg.): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübinge: Narr. Schmitt, Reinhold/ Deppermann, Arnulf (2010): Die Transition von Interaktionsräumen als Situationseröffnung. In: Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Situationseröffnungen: Zur multimodalen Herstellung fokussierter Interaktion. (= Studien zur Deutschen Sprache 47). Tübingen: Narr, S. 335-386. Stukenbrock, Anja (2015): Deixis in der face-to-face-Interaktion. Berlin/ Boston: de Gruyter. Tabensky, Alexis (2013): Gestures, postures, gaze, and other body movements in 2nd language classroom interaction. In: Müller et al. (2013) (Hg.), S. 1426-1432. Am Experimentiertisch: Position und Positionierung im Chemieunterricht 333 Gliederung 1. Einleitung ..............................................................................................................303 2. Methodische Vorüberlegungen..........................................................................304 3. Position, Positur und Positionierung ................................................................305 4. Am (unbenutzten) Experimentiertisch .............................................................307 5. Der Lehrer am Experimentiertisch ....................................................................309 5.1 Hinter dem Experimentiertisch (I).....................................................................310 5.2 Hinter dem Experimentiertisch (II) ...................................................................311 5.3 Vor dem Experimentiertisch I (Verankerung)..................................................312 5.4 Vor dem Experimentiertisch II (Demonstration).............................................313 6. Interaktionsanalyse ..............................................................................................314 6.1 Initiierung des gemeinsamen Experiments und Beitrag von Michaela .......315 6.2 Stellvertretendes Experimentieren durch den Lehrer.....................................318 6.3 Beitrag von Ruben (selbstinitiiert) .....................................................................322 6.4 Stellvertretendes Experimentieren durch den Lehrer.....................................325 6.5 Beitrag von Julius .................................................................................................327 7. Fazit ........................................................................................................................330 8. Literatur .................................................................................................................331 WOLFGANG KESSELHEIM SCHAURAUM/ SPIELRAUM: EINE STANDBILDBASIERTE FALLSTUDIE ZUR ROLLE DES GEBAUTEN RAUMS IN DER INTERAKTION 1. Einleitung In dem folgenden Beitrag möchte ich dem Zusammenspiel von gebautem Raum und Interaktion anhand eines Falles nachgehen, in dem die Interaktion in ganz besonderem Maße an den gebauten Raum gebunden ist, in dem sie stattfindet, und zwar derart, dass sie außerhalb dieses speziell für sie hergerichteten, semiotisch besonders reichhaltigen Raums nicht stattfinden kann. Die Rede ist vom gemeinsamen Museumsbesuch. Gegenstand der Fallstudie ist eine kurze Episode innerhalb des gemeinsamen Museumsbesuchs dreier Personen: Mutter Natalie, Schwiegermutter Mona und Kleinkind Tommy. 1 Die drei Personen befinden sich im Untergeschoss des Zoologischen Museums der Universität Zürich und haben sich gerade eine Vitrine zum Thema ‘Meerestiere’ angeschaut. Auf dem Weg zu einem neuen potenziellen Betrachtungsziel kommt es zu der mich interessierenden Episode, in deren Verlauf die gemeinsame Betrachtungsaktivität für eine gewisse Zeit suspendiert wird und der Raum auf eine spezielle, nicht mit den Zielen der Institution zu vereinbarende Weise genutzt wird. Diese Episode erscheint mir im Kontext dieses Sammelbands deshalb interessant zu sein, weil hier Normalitätserwartungen im Hinblick auf die angemessene Raumnutzung aus der Differenz heraus sichtbar werden. Im Mittelpunkt der Analyse steht die Frage nach der „Interaktionsarchitektur“ (Hausendorf/ Schmitt 2013) des Museumsraums: (Wie) strukturiert der Museumsraum die Art und Weise vor, wie Menschen in ihm interagieren? Welche Formen von Interaktion macht er erwartbar und welche ‘blockt er ab’? Um diese interaktionsarchitektonischen Fragen empirisch beantworten zu können, bediene ich mich des Konzepts der ‘Benutzbarkeitshinweise’, wie es in Hausendorf/ Kesselheim (2013) und in Kesselheim (2014) entwickelt und ausführlich beschrieben worden ist. 1 Die Daten, auf denen dieser Beitrag beruht, entstammen einem Korpus von Videoaufnahmen ungesteuerter Museumsbesuche, das ich im Rahmen meines Habilitationsprojekts erhoben habe. Für eine genaue Beschreibung siehe Kesselheim (2014, Kap. 5.1) - Die Namen sind anonymisiert. Wolfgang Kesselheim 336 Die grundlegende Idee ist dabei die folgende: Personen, die einen Raum im Rahmen von Interaktion oder auch „einsam“ nutzen, 2 verstehen den Raum selbst und die Dinge, die sie in ihm vorfinden, als Material gewordene Lösungen von wiederkehrenden Problemen. Dies können Probleme sein wie „Wo sollen die Nutzer entlanggehen, wo sollen sie stehenbleiben, wo dürfen sie (nicht) hinein? “, „Wo liegen die äußeren Grenzen des Raums, wie ist er untergliedert? “ oder „Für welche Aktivitäten, welche Handlungen, welche Formen von Interaktion ist dieser Raum ‘gemacht’? “. Die Raumnutzerinnen und -nutzer werten den Raum und die in ihm wahrnehmbaren Dinge nun als Hinweise darauf aus, welche Form der Nutzung der Raum ihnen nahelegt, was also mögliche, angemessene, vom Raum suggerierte oder gar geforderte Formen der Raumnutzung sein können. 3 Diese Auswertung schlägt sich nicht nur in mentalen Vorgängen nieder, sie findet häufig einen körperlichen Ausdruck. Wir können die Bewegungen der Personen durch den Raum als sichtbar gemachte Auswertung von Hinweisen verstehen: das Öffnen einer Tür als Auswertung des Hinweises, dass hier ein Zutritt gestattet ist, das Stehenbleiben an einer Stelle des Raums als Auswertung des Hinweises, dass hier ein Stehenbleiben möglich oder sogar erwartbar ist usw. Wichtig ist, dass mit dem Hinweiskonzept keinesfalls die Vorstellung verbunden ist, dass der Raum als objektive Tatsache einfach gegeben sei und er über die Benutzbarkeitshinweise das Verhalten „seiner“ Nutzer determiniere (Drew/ Heritage 1992, S. 19 sprechen hier pointiert von der „‘bucket‘ theory of space“). Benutzbarkeitshinweise sind nicht einfach „einfach da“, sie sind nicht in den Raum „eingeschrieben“, wo sie nur noch „gelesen“ werden müssen. Die Benutzbarkeitshinweise gehen zwar von etwas im Raum sinnlich Wahrnehmbarem aus, aber als Hinweise emergieren sie erst in dem Moment, in dem ein Raumnutzer ein solches wahrnehmbares Element als Hinweis auf eine erwartete, suggerierte, angemessene Form der Raumnutzung auswertet. Das Konzept der Benutzbarkeitshinweise ist also mit der konversationsanalytischen Grundüberzeugung vereinbar, dass Raum prinzipiell in der Interaktion konstruiert wird (siehe McIlvenny et al. 2009 für eine pointierte Formulierung), aber auch mit Vorstellungen von Architektur als einem Prozess der Kommu- 2 Das Konzept der Benutzbarkeit fragt allgemein danach, welche Art der Nutzung ein Raum erwartbar macht; Interaktionsarchitektur dagegen fragt enger nach der Nutzung im Rahmen von Interaktion. Die Grundidee der Hinweise lässt sich aber problemlos auf den Fall der Raumnutzung in und für Interaktion übertragen. 3 Diese enge Orientierung an den sinnlich wahrnehmbaren Erscheinungsformen im Raum führt zu einer Form der kleinteiligen Raumanalyse, die stark mit solchen Analysen kontrastiert, die sich für nur global erfassbare Wechselwirkungen von Raum und Raumnutzung interessieren und dafür mit Konzepten wie ‘Atmosphäre’ oder ‘Gestimmtheit’ arbeiten bzw. an Diskursen über Raum-Typen interessiert sind (siehe etwa Guggenheim 2013 oder Bauriedl 2007). Schauraum / Spielraum: Eine standbildbasierte Fallstudie 337 nikation, wie sie in der Sozialpsychologie (Kruse/ Graumann 1978, S. 190) oder in der Architektursemiotik (Preziosi 1979) vertreten worden sind. Wenn das Konzept der Benutzbarkeitshinweise kein „neu eingekleideter“ Raumdeterminismus ist, dann muss es auch möglich sein, sich gegen die im Raum signalisierten Nutzungserwartungen zu verhalten und gleichsam gegen die Hinweisstruktur des Raums anzuarbeiten. Genau dies geschieht in der im Anschluss analysierten Episode. Wir werden dort sehen, wie unterschiedliche Formen der Raumnutzung an je unterschiedliche Hinweise anknüpfen und wie die Frage, welche Hinweise im Raum als die dominanten aufzufassen sind, von den Interaktionsbeteiligten gemeinsam ausgehandelt werden - gerade auch vor dem Hintergrund von kulturell vermittelten Formen institutionenspezifischer Raumnutzung. Der Verweis auf institutionenspezifische Formen der Raumnutzung macht schon deutlich, dass Hinweise nicht nur aus dem Wissen um die menschlichen Wahrnehmungs- und Bewegungsmöglichkeiten zu gewinnen sind, sondern eben auch aus kulturspezifischem Wissen um Nutzungsregeln, die mit besonderen Räumen verbunden sind. Tatsächlich können Raumnutzer Benutzbarkeitshinweise aus drei „Quellen“ gewinnen: - aus dem Bezug auf die physiologische Grundausstattung des Menschen, seine Wahrnehmungs- und Bewegungsmöglichkeiten; - aus Sprache („Zutritt für Unbefugte verboten! “, „Nicht berühren! “); - und schließlich aus der alltäglichen Vertrautheit mit Räumen und der in ihnen ablaufenden Interaktionen, mit kulturellen Normen der Raumnutzung, mit Diskursen über architektonische Elemente oder Raumtypen usw. (Hier finden wir das, was Hausendorf/ Schmitt 2013 als „Sozialtopographie“ bezeichnen). Wenn bisher Analysen der Interaktionsarchitektur überwiegend auf die erste dieser drei Quellen Bezug genommen haben, heißt das nicht, dass die anderen beiden Quellen für die Interaktion im gebauten Raum unerheblich wären. Bei unserer Fallanalyse werden wir mit den wahrnehmungs- und bewegungsbasierten Hinweisen beginnen, um dann den genauen Punkt bestimmen zu können, an dem weitere Quellen herangezogen werden müssen, damit die konkrete Raumnutzung in dem Fallbeispiel verstanden werden kann. Ziel der Fallstudie ist nicht nur, Einsichten in das spezielle Verhältnis von Museumsraum und der in diesem Raum stattfindenden Interaktion zu gewinnen. Ebenso wichtig ist für mich hier, die Fruchtbarkeit einer auf Standbilderfolgen fußenden Raumanalyse auszuloten: Wie viel kann man aus den Standbildern darüber erfahren, wie die Interaktionsbeteiligten in ihrer Interaktion an ihrer räumlichen Umwelt anknüpfen? Wolfgang Kesselheim 338 Im Unterschied zu Fotografien, die eigens dafür erhoben worden sind, um die Hinweisstruktur eines Raums zu untersuchen, 4 verfügen Standbilder über eine spezielle „Dokumentqualität“ (Reinhold Schmitt, persönliche Mitteilung, 25. März 2015). Sie sind Teil der ursprünglichen Dokumentation der zu untersuchenden Interaktion. In ihnen schlagen sich die situativen Bedingungen des damaligen Interaktionssettings nieder, und es können sowohl die Reaktionen der Interaktionsbeteiligten auf die Anwesenheit der Kamera sichtbar werden als auch die Online-Interpretation des interaktiven Geschehens durch die Kameraperson. Doch sind mit dem Übergang von Video zu Standbildfolge Veränderungen verbunden, die aus dem Standbild ein Datum mit völlig eigenen Eigenschaften machen. Das Standbild hebt die Bewegung der Interaktionsbeteiligten sowie der Kamera auf. Die hierfür angemessene Metapher scheint mir nicht das ‘Einfrieren’ des Interaktionsgeschehens zu sein (denn dann stünde das „eingefrorene“ Interaktionsgeschehen uns als unbewegtes Ganzes für unsere Betrachtung zur Verfügung); das Standbild „schneidet“ viel eher einen Moment aus dem Interaktionsgeschehen „heraus“, verbirgt sein Vorher und Nachher also vor unseren Augen. 5 Gerade aus dieser Ausschnitthaftigkeit des Standbilds, die den gewohnten Blick auf das Interaktionsgeschehen verfremdet, scheint mir die analytische Potenz einer auf Standbilderfolgen basierenden Raumanalyse zu erwachsen. Die Raumanalyse beginnt schon mit der Auswahl der Standbilder. Diese umfasst eine dreifache Selektion: die Selektion der zu untersuchenden Interaktionsepisode, eine zeitliche sowie eine räumliche Selektion. - Selektion der Interaktionsepisode: Um den abweichenden Charakter der Raumnutzung in der mich interessierenden Episode im Kontrast besser sichtbar zu machen, habe ich die vorausgehende Interaktionsphase hinzugenommen: die Suche nach einem neuen gemeinsamen Betrachtungsziel im Museumsraum. - Zeitliche Selektion: Die ausgewählten Standbilder sollen diejenigen Momente dokumentieren, die für das Verhältnis von Interaktion und Raum besonders relevant zu sein scheinen, beispielsweise weil die auf dem Standbild sichtbare Raumsituation vorher nicht erkennbare Bewegungsoptionen eröffnet oder weil sich das Verhältnis eines der Teilnehmenden zur räumlichen Umwelt in relevanter Form ändert. - Räumliche Selektion: Ich habe Standbilder ausgewählt, auf denen möglichst viel vom umgebenden Raum zu sehen war; Videostills, die kaum 4 So etwa in Kesselheim/ Hausendorf (2007) oder Kesselheim (2014, Kap. 4). 5 Insofern reiht sich die Standbildanalyse trotz ihrer scheinbaren Statik in eine Reihe von Analyseverfahren ein, die versuchen, Raum über die „Praktiken des Gehens“ zu rekonstruieren (de Certeau 1988, S. 179-208, 215-238). Schauraum / Spielraum: Eine standbildbasierte Fallstudie 339 mehr als die Teilnehmerinnen und Teilnehmer erkennen ließen, erschienen mir für die Raumanalyse nicht geeignet; gleichzeitig habe ich versucht, eine gewisse Überlappung zwischen den Standbildern sicherzustellen, um es so der Leserin oder dem Leser zu ermöglichen, zumindest eine annähernde Vorstellung von der gesamten ‘Interaktionsbühne’ zu entwickeln. Die Analysen der Fallstudie sind (mit einigen lokalen Abweichungen) wie folgt gegliedert. Zunächst untersuche ich jedes Standbild daraufhin, welche allgemeinen Benutzbarkeitshinweise sich aus dem Raumausschnitt gewinnen lassen, der auf dem betreffenden Standbild zu sehen ist. Dann frage ich danach, ob es interaktionsarchitektonisch relevante Hinweise gibt, also Benutzbarkeitshinweise, die auf eine Raumnutzung im Rahmen von Interaktion gerichtet sind. In diesen beiden Schritten gehe ich nicht auf die räumliche Konfiguration ein, die von den Interaktionsbeteiligten eingenommen wird, denn in ihnen interessiere ich mich für die Potenziale der Raumnutzung, wie sie durch die Hinweise sichtbar gemacht werden, und nicht für faktische Nutzungsvorgänge. 6 Erst im dritten Schritt der Analyse eines Standbilds gehe ich auf die räumliche Konfiguration der auf dem Standbild abgebildeten Interaktanten ein, ihren „Interaktionsraum“ (siehe dazu etwa Hausendorf 2010). Die zentrale Frage ist dabei, was die vorausgegangene Hinweisanalyse zum Verständnis des dokumentierten Interaktionsmoments beitragen kann. Wenn die Analyse auch lange bei dem gebauten Raum verweilt, ist es doch keine Architekturanalyse. Es geht nicht um die Architektur des Museumsraums, sondern um das Zusammenspiel von Architektur und Museumsbesuch. 2. Die Fallstudie Das erste, was bei der Betrachtung von Bild 1 ins Auge fällt, ist, dass es hier sehr viel zu sehen gibt. Dieser Eindruck wird durch die große Zahl von Objekten geweckt, die in Form und Größe beträchtlich variieren und die scheinbar zufällig im Raum verteilt zu sein scheinen. All dies führt dazu, dass sich die Objekte der Erfassung mit einem flüchtigen Blick widersetzen. Anders als im Fall einer Batterie gleicher Produkte im Regal eines Supermarkts, die sich mit einem Blick erfassen lässt, ist es in dem hier dokumentierten Raum nötig, jedes Objekt einzeln in den Blick zu nehmen. Durch mehrere Phänomene zugleich signalisiert der Raum, dass er ganz wesentlich auf das Sehen ausgerichtet ist, konkret: durch die Allgegenwart von Glas, durch die auf eine spezielle Beleuchtung und die Ausrichtung der Gehbereiche auf Raumbereiche, die mit der Aktivität des Sehens verbunden sind. 6 So versucht die Analyse, dem ‘Plausibilitätssog’ zu widerstehen, der dadurch entsteht, dass auf dem Standbild eine einzige von all den potenziell vom Raum erlaubten oder erwartbar gemachten Nutzungsmöglichkeiten auf dem Standbild faktisch realisiert wurde. Wolfgang Kesselheim 340 Bild 1: V0300, 02: 19: 10 Glas kann als starker Hinweis auf die Relevanz des Sehens aufgefasst werden. Seine Transparenz lädt dazu ein, die visuelle Aufmerksamkeit auf das zu richten, was hinter dem Glas liegt. Die Glasfronten, die auf dem Standbild zu sehen sind, lenken den Blick nun nicht ins Freie, sondern auf genau die Raumbereiche, in denen die schon erwähnten Objekte zu finden sind. Die Breite der Glasfronten sorgt für die maximale Sichtbarkeit der Vitrinenobjekte: Es handelt sich gerade nicht um Guckkästen, die einen verstohlenen Einblick in ansonsten verschlossenen Schränke gewähren. Das lässt sich besonders im Fall der annähernd halbkreisförmigen Vitrine im Vordergrund zeigen, die fast vollständig aus Glas besteht. Nichts kann den Blick ins Vitrineninnere behindern, jedes der enthaltenen Objekte kann und soll von allen Seiten betrachtet werden. Allerdings legt die Tatsache, dass auch die Rückwand der Vitrine aus Glas ist, nicht nur ein In-die-Vitrine-Schauen nahe, sondern in gleichem Maße ein Durch-die-Vitrine-hindurch-Schauen. So wird der Raumnutzer noch während er betrachtend vor dieser Vitrine steht, zu den visuellen Angeboten im entfernteren Ende des Raums „gelockt“. Das zweite Element im Raum, das die Bedeutung des Sehens herausstellt, ist die Beleuchtung. Während der Rest des Raums durch ein diffuses, eher schwaches Licht ausgeleuchtet wird, sind die Vitrinen durch eine eigene Innenbeleuchtung in helles Licht getaucht. Diese Beleuchtung kann als Signal für die Bedeutsamkeit der Objekte im Vitrineninnern verstanden werden, aber auch spezifischer als Hinweis darauf, dass die Objekte in all ihren Feinheiten betrachtet werden sollen, die nur bei gutem Licht zu sehen sind. 7 7 Die Lesart, dass das Vitrineninnere ausgeleuchtet ist für eine Person, die auf dem Standbild noch nicht zu sehen ist, aber später den ausgeleuchteten Raum betreten wird (analog zu einer Schauraum / Spielraum: Eine standbildbasierte Fallstudie 341 Schließlich stehen auch diejenigen Raumbereiche, die sichtbar dem Betreten- Werden dienen, in einer klaren funktionalen Beziehung zum Betrachten der Objekte. Sie reichen nahezu ausnahmslos an die Bereiche an, die durch Glas und Beleuchtung als Zentren der visuellen Aufmerksamkeit ausgewiesen worden sind. Die betretbaren Flächen geben sich damit als Bereiche zu erkennen, deren Funktion es ist, Raumnutzerinnen und -nutzer so nah wie möglich an die Positionen im Raum zu führen, von denen aus die Objekte im Vitrineninnern zu betrachten sind. 8 Der auf dem Standbild dokumentierte Raum arbeitet also darauf hin, die Bewegungen der Raumnutzerinnen und -nutzer zu den Vitrinen und ihren Objekten zu lenken, wo jene im Wesentlichen nur eines können und sollen: die Objekte betrachten. Der untersuchte Raum ist also ganz wesentlich ein Schau-Raum. Im gesamten hier dokumentierten Raumausschnitt gibt es nur ein Objekt, das in der Lage ist, die Aufmerksamkeit von den Vitrinendingen abzulenken: die Computerstation im Bildvordergrund. Solange man nämlich die Bedienposition einnimmt, die durch die Neigung des Bildschirms und die an die Computerstation herangeschobene Bank gekennzeichnet wird, befindet sich keines der in der Vitrine platzierten Objekte im zentralen Gesichtsfeld des Nutzers. Der Raum, wie er auf Bild 1 dokumentiert ist, ist erkennbar für eine größere Zahl gleichzeitiger Nutzungsvorgänge gemacht. Hierfür spricht die Breite der Geh- und Verweilzonen. Auch die Tatsache, dass die Objekte so platziert sind, dass sie von vielen Standpunkten zugleich betrachtet werden können, spielt dieser Art von Nutzung in die Hände. Aber ist mit „gleichzeitiger Nutzung“ auch eine Nutzung im Sinne fokussierter Interaktion gemeint? Ins Auge fällt zunächst, dass auf Bild 1 keine Bereiche zu sehen sind, die ein gemeinsames Verweilen in besonderer Weise erwartbar machten, etwa im Sinn eines Zuschauerbereichs im Theater, eines Kirchenschiffs mit seinen nach ‘vorne’ orientierten Bänken, im Sinn eines Klassenzimmers usw. Zwar stellen die freien Flächen genügend Raum zur Verfügung, um den Aufenthalt einer größeren Gruppe von Personen in einem „focused gathering“ (Goffman 1963) zu gestatten. Aber der Raum weist keine Stelle als besonders geeignet für fokussierte Interaktion aus. Die Teilnehmer selbst müssten also eine Stelle im Raum wählen und den erforderlichen Interaktionsraum durch ihre körperlichen und sprachlichen Ressourcen selbst hervorbringen. Hinzu kommt der „Sog“ zu den Vitrinenobjekten, die auf vielfache Bühne, die vor Konzertbeginn schon beleuchtet ist, deren Beleuchtung aber den auftretenden Künstlern gilt), wird durch die Tatsache blockiert, dass Spots auf einzelne Vitrinenobjekte gerichtet sind. Die Objekte sind also die ‘Protagonisten’, denen die Aufmerksamkeit gelten soll. 8 Das Glas wirkt hier als „Filter“ (Norberg-Schulz 1968): Es lässt die Blicke passieren, die die Voraussetzung dafür sind, dass die Vitrinenobjekte als Bewegungsziele „locken“ können, verhindert aber gleichzeitig deren Berührung. Wolfgang Kesselheim 342 Weise darauf aufmerksam machen, dass sie das dominante Nutzungsangebot im Raum darstellen. Eine gemeinsame Interaktionsfläche, die nicht auf eines dieser Objekte ausgerichtet wäre, wäre nach allem im Raum Signalisierten überraschend. Eine auf ein Vitrinenobjekt ausgerichtete Viel-Personen-Interaktion träfe aber bald auf die Grenzen der Sichtbarkeit: Je größer die Gruppe, desto weniger ist von dem fraglichen Objekt zu sehen. Wenn man also die Frage stellt, welche Art von Interaktion dieser Raum suggeriert, dann handelt es sich am ehesten um Interaktionen in kleinen Gruppen, die der Betrachtung der Objekte gewidmet sind - wobei die Weitläufigkeit des Raums und die Vielzahl der Objekte es möglich macht, dass viele dieser Kleingruppen gleichzeitig den Raum nutzen können, ohne in fokussierte Interaktion miteinander eintreten zu müssen (vgl. Goffmans „multifokale Interaktion“, Goffman 1971). Aber auch für diese Kleingruppen beantwortet der Raum nicht die Frage, wo genau sie ihre Interaktion stattfinden lassen sollen. Dies macht er ihnen zur Aufgabe, die sie interaktiv lösen müssen. Er hilft den Interagierenden nur insofern bei der Herstellung ihres Interaktionsraums, indem er zwei unterschiedliche Raumbereiche voneinander scheidet: Verweil- und Betrachtungszonen einerseits und Gehzonen andererseits (siehe Kesselheim 2014). Die Form des Interaktionsraums im Verweil- und Betrachtungsraum wird durch die Platzierung der relevanten Objekte in der Vitrine vorstrukturiert: Sie legt eine Positionierung side-by-side nahe, bei der die Raumnutzerinnen und -nutzer so nahe nebeneinander stehen, dass sie die Unterstellung gemeinsamer Wahrnehmungen am betrachteten Objekt aufrecht erhalten können. 9 In den Gehzonen dagegen kann der Abstand der Interaktionspartner voneinander größer sein, da das gemeinsame Tun dort kein Betrachten, sondern ein Auf-das-nächste-Betrachtungsziel-Zugehen ist. Weder in den Vitrinen noch von einer Vitrine zur nächsten wird eine präferierte Betrachtungsreihenfolge signalisiert. Das ist funktional, um einer größeren Anzahl von Menschen die gleichzeitige Nutzung des Raums und seiner Objekte zu ermöglichen. Indem diese nämlich ihre Betrachtungsstandorte und die Reihenfolge des Betrachtens frei wählen können, können sie flexibel auf die Anwesenheit anderer Betrachter reagieren. Dabei unterstützt sie die Transparenz des Raums: Sie erlaubt es von beinahe jedem Punkt des Raumes aus, die Anwesenheit anderer zu registrieren und die eigenen Bewegungen darauf abzustimmen, lange bevor man sich bei der Raumnutzung gegenseitig 9 Auf die Frage, ob die Interaktionspartner beim gemeinsamen Betrachten der Objekte auch miteinander sprechen „sollen“, lassen sich keine Hinweise gewinnen. Anders als die Relevanz des Betrachtens wird die Relevanz des Sprechens durch den Raum nicht als relevant gekennzeichnet, aber es lassen sich auch Vorrichtungen finden, die das gemeinsame Sprechen und Zuhören sichtbar behinderten, etwa separierte Betrachtungskabinen oder beide Ohren bedeckende Kopfhörer. Schauraum / Spielraum: Eine standbildbasierte Fallstudie 343 stören könnte. Andererseits aber lässt der Raum seine Nutzerinnen und Nutzer mit ihren Bewegungsentscheidungen weitgehend allein. Jedes Mal, wenn sie die Betrachtung eines der Vitrinenobjekte für sich abgeschlossen haben, stellt sich ihnen die Frage „Wohin jetzt? “, ohne dass der Raum darauf fertige Antworten liefern würde. Welche Bewegungsmöglichkeiten eröffnet der im Vordergrund von Bild 1 abgebildete Raumausschnitt? Der gerade Verlauf der Vitrinenfront spricht in Verbindung mit der angrenzenden länglichen Betretfläche für ein Voranrücken an der Scheibe entlang. Da aber im gebauten Raum keine Hinweise darauf zu finden sind, welche Objekte in welcher Reihenfolge zu betrachten sind, ist das Vorrücken nach links oder rechts von der lokal ausgehandelten Attraktivität der einzelnen Objekte abhängig. Löst man sich von der Vitrine, bietet der Raum drei unterschiedliche Bewegungsziele an: den Weg zur schon besprochenen Computerstation, den Weg zum sich rechts anschließenden Bereich (wo man die Fortführung sowohl der Glaswand als auch der Bodenfläche vermutet), oder aber die Treppe links, deren unterste Stufe auf dem Standbild zu erkennen ist. Wie lässt sich nun die räumliche Konfiguration der auf dem Standbild abgebildeten Personen, der von ihren Körpern gebildete Interaktionsraum, im Licht der bis hierher rekonstruierten Interaktionsarchitektur des Ausstellungsraums verstehen? Anstatt nur sagen zu können, dass sich die beiden abgebildeten Personen auf dem Weg zu einer Treppe befinden, können wir ihre Anwesenheit im Raum nun als eine Abwendung von den Objekten in der Vitrine und dem von ihnen ausgehenden Betrachtungsangebot beschreiben: Ihre Blicke sind nicht der Vitrine zugewandt, sondern richten sich auf den Raum vor ihnen. Ihre Bewegung entfernt sie von der Verweil- und Betrachtungszone unmittelbar vor der Glasfront, die für ein Studieren der Vitrinenobjekte optimal wäre. Indem Mutter und Sohn eine vom Raum ausgewiesene Gehzone nutzen, kann ihre Bewegung als ein Gehen verstanden werden, das hochwahrscheinlich der Wahl eines neuen Betrachtungsziels gilt (insofern die Gehzonen typischerweise in Betrachtungszonen münden). Vor dem interaktionsarchitektonischen Hintergrund erhält auch die Tatsache, dass die Mutter ihr Kind an den Händen hält, eine alternative Lesart: Sie bewahrt nicht nur das Kind vor dem Stolpern, sondern kann auch als lokale Bearbeitung der von dem Raum gerade nicht gelösten Aufgabe verstanden werden, nämlich in der Offenheit der Gehzone eine gemeinsame Bewegung auf das nächste Betrachtungsziel hin zu bewirken. Wolfgang Kesselheim 344 Bild 2: V0300, 02: 39: 10 Bild 2 dokumentiert die Raumsituation vom oberen Ende der Treppe aus. Wer die Treppe emporsteigt, läuft auf eine Wand zu, die mittig von einer großen Projektionsfläche gebildet wird und von zwei hohen Vitrinen flankiert ist. Der Weg zur Wand ist jedoch durch eine Art Geländer versperrt, die den Raum oberhalb der Treppe in zwei längliche „Streifen“ unterteilt. Der vordere dieser beiden „Streifen“ präsentiert sich als Durchgangsraum. Er fordert den die Treppe Hochsteigenden die Entscheidung ab, ob sie sich nach links oder nach rechts wenden wollen, entweder um sich den Vitrinen zuzuwenden oder um das Geländer zu umsteuern und das vom Bildschirm unterbreitete Kommunikationsangebot anzunehmen. Ein Stehenbleiben und Eintreten in fokussierte Interaktion ist hier nicht zu erwarten, da dies an dieser Engstelle den Durchgang für andere Raumnutzer blockieren würde. Vom hinteren „Streifen“ gehen widersprüchliche Signale aus. Seine längliche Form und die Tatsache, dass er sich genau zwischen zwei Vitrinenwänden befindet, weisen ihn als Durchgangszone aus. Aber gleichzeitig signalisieren die flachen, schwarzen Bänke, dass es sinnvoll ist, an dieser Stelle länger zu verweilen, wobei das schon beschriebene Geländer als Rückenlehne fungiert. Nimmt man diese Position ein, dann kann man sowohl den Bildschirm betrachten als auch die Hörer nutzen, die aus den Pfosten des Geländers herausragen. Die Bänke sind also klar dem Bildschirm zugeordnet und können als interaktionsarchitektonische Vorrichtung verstanden werden, die darauf ausgerichtet ist, zu mehreren ein Geschehen auf der Projektionswand verfolgen zu können. Ihre Breite sowie die Zahl der Hörer gibt einen Hinweis auf die erwartete Maximalzahl gleichzeitiger Zuschauer und Zuhörer, wobei die Tatsache, dass die Hörer an nur ein Ohr zu halten sind, dafür spricht, dass die Schauraum / Spielraum: Eine standbildbasierte Fallstudie 345 Nutzung des Hörers ein Sich-Unterhalten mit anderen, gleichzeitig Anwesenden nicht unterbinden soll. Konkretisiert werden diese interaktionsarchitektonischen Erwartungen durch die Aufschrift „Start der Show auf Knopfdruck“, die dann lesbar wird, wenn man an die Wand herantritt, und die Überschrift „Zoogeografie“, die das Thema angibt, mit dem sich die „Show“ beschäftigen wird. An dieser Stelle im Raum wird nicht nur ein Verweilangebot unterbreitet, sondern das Angebot, in eine spezifische Form medial vermittelter Kommunikation einzutreten. Anders als im übrigen Raum, den wir als Schauraum identifiziert haben, haben wir es hier also mit einem Zuschauerraum zu tun, mit einer Projektionsfläche als ‘Bühne’, auf der sich ein zeitlich begrenztes ‘Schauspiel’ ereignen wird. Wenn man auf die gängige Annahme zurückgreift, dass räumliche Nähe thematische Nähe bedeutet, gibt das Anlass zu der Vermutung, dass es in den Vitrinen, die sich links und rechts an den Bildschirm anschließen (und möglicherweise im gesamten restlichen Raum), um das gleiche oder ein ähnliches Thema gehen mag. Und tatsächlich lassen sich die Objekte, die wir in den hier sichtbaren Vitrinenausschnitten sehen können, thematisch mit dem Wortbildungselement Zooverbinden, sobald wir in ihnen Tiere erkennen. Wer über zoologische Spezialkenntnisse verfügt (oder die „Show“ aufmerksam verfolgt hat), kann in der Aufschrift „ ORIENTALIS “ auf der Vitrine rechts (etwa in Kopfhöhe des Orang-Utans) sogar eine der „zoogeografischen Großregionen“ erkennen, was die Hypothese erlaubt, dass es sich dabei um das grundlegende Ordnungsprinzip handelt, dem die Platzierung der Tiere in den verschiedenen Vitrinen gehorchen mag. Auf Bild 2 sehen wir die beiden Interaktionspartner weiterhin in Bewegung, die gemeinsame Ausrichtung ihrer Becken und Füße lässt vermuten, dass sie sich immer noch koordiniert einem nächsten potenziellen Betrachtungsziel nähern. Den Blick der Mutter Natalie können wir in Verbindung setzen mit den Nutzungshinweisen von Vitrine und Zuschauerbereich, die wir gerade beschrieben haben: also als ein Sondieren von möglichen Betrachtungszielen, die sich als Ziel des gemeinsamen Durch-den-Raum-Gehens anbieten. Analog dazu ist die Position des Jungen Tommy nicht nur als Ergebnis eines Schwenks nach links zu verstehen, sondern als eine Nicht-Berücksichtigung des von Projektionsfläche und Hörern ausgehenden Angebots, in eine Form von orts-, aber nicht anwesenheitsgebundener Kommunikation einzutreten, sowie als ein Abwählen der Verweil- und Betrachtungshinweise, die von den Vitrinen links und rechts von jener Projektionsfläche ausgehen. Für seine Abwahl der nahe liegenden Bewegungsziele nutzt Tommy die sichtbar von dem vorderen ‘Streifen’ ausgehenden Bewegungshinweise, die tatsächlich eine rasche Querbewegung an den Kommunikationsangeboten vorbei wahrscheinlich machen. Wolfgang Kesselheim 346 Diese Beschreibung der räumlichen Positionierung der beiden Personen im Raum ergibt sich, wie schon im Fall von Bild 1, aus dem In-Beziehung-Setzen der Benutzbarkeitshinweise im Raum und der konkret eingenommenen Positionen der Interaktionsbeteiligten, die daraufhin überprüft werden, ob sie als eine körperlich signalisierte Auswertung dieser Hinweise verstanden werden können. Ohne die vorausgehende interaktionsarchitektonische Raumanalyse ließe sich diese Konfiguration lediglich als ein Gemeinsam-nach-Links- Schwenken beschreiben. Bild 3 dokumentiert die Raumsituation, die sich am linken Ende des auf Bild 2 zu sehenden Geländers bietet (bei der unscharfen Form am linken Bildrand handelt es sich um eine Betonsäule). Hier bestehen im Groben drei Bewegungsmöglichkeiten. Eine scharfe Rechtswendung um den letzten Pfosten herum, die zu dem auf Bild 2 zu erkennenden Zuschauerbereich führt, eine Fortsetzung der Vorwärtsbewegung links an der in der Mitte erkennbaren Vitrine vorbei oder eine Vorwärtsbewegung rechts an dieser Vitrine vorbei und hinein in eine Art Gang, die von eben dieser Vitrine und der Vitrinenwand rechts gebildet wird. Bild 3: V0300, 02: 47: 18 Beide Möglichkeiten werden vom Raum als Fortführungen des Themas Zoogeografie ausgewiesen, nämlich durch je eine auf das Vitrinenglas aufgetragene Überschrift „ NEARKTIS “. Der Weg in den Gang hinein erscheint mir als derjenige, der von der Raumsituation, wie sie das Standbild präsentiert, am ehesten nahegelegt wird. Der Gang impliziert ein ‘Versprechen’ auf eine stetige Fortsetzung der Reihe von potenziellen Betrachtungsobjekten, während die Mittelvitrine vom Standpunkt der Kamera aus sehr kurz wirkt, was eine baldige Neuentscheidung und Neuorientierung erwartbar macht (hier sieht Schauraum / Spielraum: Eine standbildbasierte Fallstudie 347 man: Vitrinen können als Hinweise auf sinnvolle Untereinheiten der Raumnutzung verstanden werden). Für die Orientierung an der rechten Vitrinenwand spricht auch die Tatsache, dass die Tiere der Wandvitrine einem von der Treppe kommendem Betrachter ihre Vorderseite zuwenden, während die Tiere in der kleineren Vitrine demjenigen, der den Weg links an der Vitrine vorbei wählt, den Rücken zuwenden würden. Für die scharfe Rechtswendung spricht auf diesem Standbild nichts. Diese Aussage muss man aber revidieren, sobald man die Tatsache ernst nimmt, dass die Standbilder keine zeitstabilen Zustände dokumentieren, sondern Ausschnitte eines interaktiven Prozesses sind, der das eigentliche Zentrum des Analyseinteresses ist. 10 Versteht man in diesem Sinn Bild 4 als Dokument einer Raumsituation, die nach Bild 3 zu sehen war, dann erlaubt das eine Neubewertung der Bewegungsentscheidungen auf Bild 3. Die Rechtswendung gewinnt ihre Attraktivität dann aus dem Kommunikations- und Verweilangebot der Projektionsfläche-Hörer-Bänke-Kombination. Gegenteiliges gilt für den Weg links an der freistehenden Vitrine vorbei: Nimmt man das auf Bild 3 folgende Bild 4 hinzu, so erkennt man, worin die Attraktivität der Wende nach links liegen könnte: im Erreichen eines freien Raums, der auf eine Vitrinenwand hinführt, die mit spektakulären Objekten prunkt (einem riesigen Narwal mit seinem „Einhorn“ und einem eindrucksvoll auf die Hinterbeine aufgerichteten Eisbär). Das heißt nun nicht, dass der Eindruck von der räumlichen Hinweisstruktur, der aus der Analyse der „starr gestellten“ Situation eines Standbilds zu gewinnen ist, prinzipiell verfälscht, weil ausschnitthaft wäre. Tatsächlich dokumentiert das Standbild ja nicht nur einen Moment der gefilmten Interaktion, zu dem die Raumnutzer tatsächlich für ihre Bewegungs- und Wahrnehmungsentscheidungen in etwa über die auf dem Standbild zu sehende räumliche Information verfügten und zu dem sie diese Entscheidungen auf genau dieser Grundlage treffen mussten. 11 Auch dass wir Wege nur ausschnittsweise sehen können, dass wir also am Anfang des Wegs nicht über vollständige Informationen zu seinem Verlauf und Ende zu verfügen, ist keine Besonderheit von Standbildern. Die Betonsäule, die auf Bild 3 links im Vordergrund zu erahnen ist, verstellt nicht nur demjenigen den Blick auf den dahinterliegenden offenen Raum, der das Standbild analysiert, sondern auch den Besucherinnen und 10 Das ist der Unterschied zu einer Foto-Analyse. Die dort nacheinander präsentierten Fotografien repräsentieren keine zeitliche Folge, sie kommen einfach additiv zu den davor analysierten Raumdokumenten hinzu. 11 Ich denke an kurzfristige Entscheidungen vom Typ ‘Wohin setze ich den nächsten Fuß? ’ ‘Wohin schaue ich im nächsten Augenblick? ’ Denn nicht zu jedem von der Kamera registrierten Sekundenbruchteil stehen „große“ Entscheidungen an wie ‘Gehen wir zum Mammut im Erdgeschoss? ’ oder ‘Verlassen wir das Museum? ’. Wolfgang Kesselheim 348 Besuchern, die den Nutzungshinweisen der beiden „Streifen“ folgen. Anders ist nur, dass die Kadrierung des Bilds schärfere Grenzen hervorbringt als die natürlichen, unscharfen Ränder des menschlichen Gesichtsfelds: Wer sich an der auf Bild 3 abgebildeten Position befindet, dürfte also aus dem Augenwinkel mehr Informationen über den Raum rechts neben sich erhalten, als wir sie über die Betrachtung des Standbilds gewinnen können. Entscheidend dürfte aber sein, dass derjenige, der durch den Raum an die dokumentierte Position gelangt ist, zuvor die Raumsituation gesehen haben wird, die auf Bild 2 dokumentiert ist, und dass ihm die Möglichkeiten, die ein Sich-scharf-nach-rechts- Wenden eröffnet, in seinem Raumgedächtnis zur Verfügung stehen. Wenn sich also auch die Standbildanalyse auf die ortsfesten Raumelemente und Gegenstände im Raum konzentriert, so sind die Standbilder doch Ausschnitte im Rahmen von Interaktion entstandener, sequenziell geordneter Raumnutzungsprozesse. Die Hinweisstruktur, die wir auf einem Standbild sehen, ist eingebettet in einen durch die Bewegung der Raumnutzer in ihrer Interaktion erzeugtem Fluss von Hinweisen, deren Sequenzialität bei der Analyse mitbedenken müssen. Der schmale Streifen Boden, den man auf Bild 3 hinter der freistehenden Vitrine sieht, muss also als eine sich mit der Bewegung der von der Treppe kommenden Raumnutzer stetig verbreiternde Bodenfläche verstanden werden, als ein parallaktisches Sich-Öffnen, das den sich Bewegenden ein Hinzukommen neuer Bewegungs- und Wahrnehmungsoptionen verspricht (und das genau daraufhin überprüft werden wird: „Was tut sich jetzt hier? “). Bild 4 gibt den Endpunkt dieser Öffnung wieder. Bild 4: V0300, 02: 53: 06 Schauraum / Spielraum: Eine standbildbasierte Fallstudie 349 Die schon erwähnte Wandvitrine mit Eisbär und Narwal stellt ein außerordentlich verlockendes Bewegungsziel dar. Die Helligkeit der Vitrine, die Größe ihrer Exponate und deren auffallende Form machen diese Vitrine zu einem der auffälligsten Bewegungsziele im untersuchten Raum. Gleichzeitig aber ist zu sehen, dass man an vielem vorbeigehen muss, wenn man direkt auf diese Vitrine zusteuert, was bedeutet, dass man den Raum und seine Betrachtungsangebote sichtbar unvollständig ausschöpft. Alternativ könnte man links an der Vitrine im Vordergrund entlanggehen und die dort ausgestellten Vogelpräparate betrachten. So vermeidet man ein Überspringen von Betrachtungsangeboten im Raum und setzt, wie die Aufschrift „ NEARKTIS “ lesbar macht, das Thema ‘Zoogeografie’ fort. Andererseits sieht man auf diesem Weg die Tierpräparate von hinten: ein starkes Signal dafür, dass man die Vitrine von ihrer dispräferierten ‘Rückseite’ her betrachtet. Wie lässt sich nun die räumliche Konfiguration der Personen auf den Bildern 3 und 4 verstehen, wenn man den von den drei Personen gebildeten Interaktionsraum auf die zuvor analysierten Nutzungsangebote des Raums bezieht? Bild 3, wiederholt In Bild 3 hat Schwiegermutter Mona die Kameraperson überholt und koordiniert ihr Gehen sichtbar mit dem ihrer Schwiegertochter Natalie, was wieder als Bearbeitung der spezifischen Aufgabe in der Gehzone verstanden werden kann, angesichts der vorübergehenden Abwesenheit eines gemeinsamen Betrachtungsziels die fortbestehende Teilnahme an einer gemeinsamen Interaktion sichtbar kundzugeben. Die Kopfhaltung der beiden Erwachsenen lässt den Schluss zu, dass beide die Betrachtungsangebote der Objekte in den Vit- Wolfgang Kesselheim 350 rinen unbeachtet lassen. Natalies Beckenausrichtung lässt sich klar als Abwahl der Hinweise sehen, die zum Betreten des Gangs zwischen Wandvitrine und freistehender Vitrine einladen. Aber auch für eine Orientierung an den von der Projektionsfläche und den Bänken ausgehenden Hinweisen spricht hier nichts. Natalie hat gerade den letzten Pfosten passiert; der Weg zum Zuschauerbereich wäre nun frei, wenn Natalie sich stark nach rechts wenden würde. Doch die Ausrichtung ihres Körpers lässt eine solche Kehrtwendung nicht erwarten. Stattdessen visieren sie und Mona den freien Raum links neben der freistehenden Vitrine an. Ihre Körperausrichtung macht eine Fortsetzung ihrer Bewegungen in diese Richtung erwartbar. Bild 4 zeigt Natalie und ihre Schwiegermutter in einer statischen Position in unmittelbarer Nähe der freistehenden Vitrine. Ihre Bewegung durch den Raum ist zum Stillstand gekommen, und sie befinden sich in einer „F-Formation“ (Kendon 1990) in Form des Großbuchstabens L. Vom Standpunkt der analysierten Benutzungshinweise, die von der Vitrine ausgehen, erscheint ihre Position im Raum etwas ungewöhnlich. Sie haben nicht an derjenigen Seite Halt gemacht, die die Vitrine als ihre Vorderseite markiert, sondern an der wenig attraktiven Rückseite. Auch steht Mona nicht vor der Vitrine, sondern seitlich versetzt neben ihr, sodass sie weniger in die Vitrine als an ihr vorbei zu schauen scheint. Hinzu kommt, dass Natalies Becken nicht auf die Vitrine ausgerichtet ist - üblicherweise signalisiert die Ausrichtung des Beckens längerfristige Orientierungen im Raum (Kendon 1990). Es ist also unklar, inwieweit die beiden Frauen auf das Betrachtungsangebot orientiert sind, das ihnen hier von der Vitrine unterbreitet wird. Eine mögliche Erklärung ergibt sich aus Natalies Blickrichtung. Wenn ihr Blick tatsächlich auf ihren Sohn Tommy gerichtet ist, können wir ihn als einen elterlichen Überwachungsblick zu verstehen versuchen, der eine bestimmte Raumnutzung sanktioniert. Tommy hat sich nämlich unterdessen von seinen erwachsenen Begleitpersonen entfernt, und zwar so sehr, dass seine Bewegung nicht mehr als Bewegung zu einem gemeinsamen nächsten Betrachtungsziel zu sehen ist. Seine Bewegungen und die statische Position seiner Begleiterinnen kontrastieren, die Blickrichtungen können nicht auf ein gemeinsames Betrachtungsobjekt bezogen werden. Tommy hat sich durch sein Vordringen in den offenen Raum links von der Vitrine im Wortsinn einen Freiraum erobert und ist für Beobachter nicht mehr als Teil der koordiniert durch das Museum schreitenden Gruppe zu erkennen. Dabei nutzt das Kind den Raum keineswegs entgegen seiner Hinweise. Tatsächlich signalisiert ja der offene Raum: Nutze mich zum schnellen Voranschreiten! Dass sich hier die Besuchergruppe aufgelöst hat, ist nicht das Ergebnis einer grundsätzlich unangemessenen Nutzung des Raums durch das Schauraum / Spielraum: Eine standbildbasierte Fallstudie 351 Kind, sondern Ausfluss der Tatsache, dass der Raum eben viele alternative Bewegungs- und Betrachtungsmöglichkeiten anbietet. Der Blick der Mutter kann auf die Notwendigkeit bezogen werden, interaktiv eine sichtbare Gemeinsamkeit des Museumsbesuchs herzustellen, eine Aufgabe, die - wie gezeigt worden ist - hier gerade nicht vom Raum übernommen wird. 12 Er signalisiert, dass zwar die Gemeinsamkeit des Besuchsvorgangs, im Sinne eines koordinierten, sukzessiven Betrachtens von Exponaten, gegenwärtig suspendiert ist, die elterliche Kontrolle aber fortbesteht. 13 Bild 5: V0300, 02: 03: 11 Bild 5 gibt einen Ausschnitt des „Gangs“ wieder, dessen Anfang man schon auf Bild 3 sehen konnte (wenn auch dort großenteils durch die Personen verdeckt). Die Kamera befindet sich nun näher an der Wandvitrine. Das erlaubt uns, einen genaueren Blick auf die Vitrinenobjekte zu werfen. Obwohl die Vitrine eine große Zahl von Objekten beherbergt und obwohl die Vitrine hier von einem extrem stumpfen Winkel aus aufgenommen worden ist, der die Objekte optisch zusammenrücken lässt, können wir doch die meisten der in diesem Segment aufgestellten Vitrinenobjekte sehen. Dies belegt die anlässlich der Analyse von Bild 1 geäußerte Vermutung, dass die großzügige Aufstellung als Hinweis auf die Maximierung der Sichtbarkeit der Vitri- 12 Man denke etwa an die Leistung einer Sitzgruppe oder eines Esstischs: Sitzen dort mehrere Personen, ist es schwer, sie nicht als gemeinsam dort Sitzende wahrzunehmen. Die Nicht-Teilnahme an der gemeinsamen Interaktion muss eigens demonstriert werden, etwa indem man sich eine Zeitung vor das Gesicht hält. 13 So deutlich Tommy auch nicht mehr am gemeinsamen Betrachten von Exponaten teilnimmt, so unwahrscheinlich ist es, dass er als „verloren gegangenes“ Kind zur Aufsicht begleitet würde. Durch Natalies Blick ist er sichtbar Teil einer Familiengruppe. Wolfgang Kesselheim 352 nenobjekte verstanden werden kann. Dass es in der Vitrine nicht um ein flüchtiges visuelles Erfassen geht oder gar um ein Registrieren des bloßen Vorhandenseins eines bestimmten Objekts (wie in einem Vorratsschrank), das wird durch die geringe Tiefe der Vitrine unterstützt, die im Verein mit der erhöhten Grundplatte und den neutralgrauen Sockeln die Objekte möglichst nahe an die Augen derjenigen heranbringt, die sich den Bewegungshinweisen des Raums folgend vor dem Vitrinenglas aufgestellt haben. Bei der Betrachtung der Vitrinenobjekte kommt es also auf jedes Detail an! Aus all diesen Beobachtungen kann man folgern, dass die Objekte in der Vitrine nicht einfach wie Objekte in einem Lager hingestellt oder gar wie Objekte in einer Rumpelkammer abgestellt sind, sondern dass sie ausgestellt worden sind: Es handelt sich um Objekte, deren primäre Nützlichkeit im Betrachtet-Werden liegt. Aus der Nähe erkennbar wird nun auch das vielfache Vorhandensein von Schrift, und zwar in unmittelbarer Nachbarschaft zu je einem Schau-Objekt in der Vitrine. Wenn man auf dem Standbild auch nicht lesen kann, was auf den kleinen Tafeln steht, so weckt allein schon die Anwesenheit von Schrift den Verdacht, dass hier kommuniziert werden soll, und die räumliche Nachbarschaft von Schrift und je einem Schau-Objekt lässt vermuten, dass beide auch inhaltlich aufeinander bezogen sind: Nicht zufällig wird Schrift erst sichtbar, wenn man sich in einer der von der Vitrine nahegelegten Betrachtungspositionen befindet, also dicht vor dem Vitrinenglas. Aus diesem Vorkommen von Schrift kann also der Hinweis gewonnen werden ‘Es gibt etwas über die Exponate zu sagen’, die Schau-Objekte werden als Gegenstand von Kommunikation gekennzeichnet. Die körperliche Ausrichtung von Nathalie und ihrer Schwiegermutter, wie sie auf Bild 5 dokumentiert ist, erzeugt einen Interaktionsraum, der eindeutig auf das Schau-Angebot in der Vitrine ausgerichtet ist und damit den institutionellen Benutzbarkeitshinweisen folgt, die diese Raumnutzung an dieser Stelle massiv nahelegen. Nimmt man das Gesprochene hinzu - hier werden die ersten Worte in dieser Interaktionsepisode gesprochen - gewinnt die räumliche Konfiguration der Körper der Erwachsenen eine zusätzliche Bedeutungsebene hinzu (die Raute markiert den in Bild 5 dokumentierten Zeitpunkt): NA: eigentlich wenn man #WEGschaut, kommt er dann irgendwann NACH. Die Positionierung der Erwachsenen im Raum demonstriert dem noch nicht in die Institution Museum einsozialisierten Jungen Tommy die dort angemessene Form der Raumnutzung. Der blickliche Ausschluss aus dem gemeinsamen Interaktionsraum dient dazu, den Jungen zur Rückkehr und Fortsetzung des gemeinsamen Betrachtungs-Rundgangs zu bewegen: Nur wenn er die de- Schauraum / Spielraum: Eine standbildbasierte Fallstudie 353 monstrativ signalisierte Aufmerksamkeitsausrichtung der Erwachsenen übernimmt, kann er wieder an der gemeinsamen fokussierten Interaktion teilhaben. Bild 6: V0300, 03: 29: 24 Bild 6 ist beinahe exakt vom gleichen Standpunkt aufgenommen worden wie Bild 5, nur wurde die Kamera ein wenig nach links geschwenkt. Die räumliche Konstellation der Personen auf diesem Bild fordert, die Benutzungshinweise des Raums noch einmal völlig neu zu lesen. Der Blick fällt nun nicht auf die Transparenz der Vitrine, sondern im Gegenteil auf die Undurchsichtigkeit der metallenen Vitrinensockel, die flache, nahe am Boden liegende Versteckmöglichkeiten hervorbringen. Wenn zuvor die Vitrinen als Hindernisse analysiert worden sind, die sich einem schnellen Durch-den-Raum-Gehen entgegenstemmen, indem sie Betrachtungspositionen schaffen, so kommen sie nun als Hindernisse in den Blick, die den direkten Weg zu einer Position hinter der Vitrine verunmöglichen und so strategisch genutzt werden können, um ein Erreicht-Werden zu verhindern. Auch der Gang zwischen Wandvitrinen und der freistehenden Vitrine erfährt eine Neubewertung. Er wird nun daraufhin ausgewertet, welche Fangstrategien er ermöglicht: hier eine Zangenbewegung von Mutter und Großmutter, die ein Entkommen des Kinds erschwert. Und schließlich treten diejenigen Benutzungshinweise des offenen Raums in den Vordergrund, die jenen nicht mehr als Gehzone kennzeichnen, die eine Annäherung an die Exponate im hinteren Raumbereich ermöglicht und nahelegt, sondern als Freiraum, der sich für eine schnelle Flucht vor dem Zugriff der Mitspieler anbietet. Die Neubewertung der Benutzungshinweise wird zum einen ausgelöst durch die sprachlichen Äußerungen der Interaktionsbeteiligten. Tommy unterbricht Wolfgang Kesselheim 354 Nathalies explizite Aufforderung, sich ihrem gemeinsamen Betrachten anzuschließen (viens VOIR tOmmy VIENS, allez Vite) mit einem glucksenden, von Lachen begleiteten HALlo; , mit dem er die Erwachsenen auffordert, seine Entfernung von der Gruppe als lustiges Spiel zu behandeln. Tommys Oma bewegt sich daraufhin um die Vitrine herum auf ihn zu und kommentiert dabei aHA, HAB ihn schon., was aus ihrer Bewegung einen „Fangversuch“ werden lässt. Mit dem Erreichen der auf Bild 6 abgebildeten Position ruft sie ! DA! ; und macht so aus der Herstellung des Sichtkontakts den Endpunkt des Versteckspiels, die Entdeckung des Versteckten. Doch selbst wenn man bei der Analyse konsequent bei dem auf den Standbildern Sichtbaren verbleibt, lassen sich Argumente für die Notwendigkeit einer Neu-Analyse der Benutzbarkeitshinweise finden. So lässt sich die räumliche Konfiguration der auf dem Standbild zu sehenden Personen nicht mehr als Auswertung der zuvor beschriebenen Hinweise verstehen: Ihre Positionen sind für die Betrachtung der Schau-Objekte dysfunktional. Ihr Abstand voneinander blockiert die Unterstellung eines gemeinsamen Wahrnehmungsraums und macht es unmöglich, die drei Personen als Gruppe wahrzunehmen, die gemeinsam das Betrachtungsangebot der Vitrinen nutzt. Gleichzeitig sind die drei Personen doch über ihre Blicke und über die Ausrichtung ihrer Körper weiterhin deutlich aufeinander bezogen. Dies lässt nach einem alternativen Verständnis ihrer Konfiguration suchen, das ihre spezifische Raumnutzung accountable macht. Die gemeinsame Teilnahme an einem Versteckspiel (mit den daraus resultierenden Rollen des Sich-Versteckenden und der Sucher) erlaubt es, die Position der Teilnehmer mit den Hinweisen im Raum in Verbindung zu setzen. Durch ihre Auswertung der Benutzungshinweise, die in der Position und Ausrichtung ihrer Körper sichtbar wird, machen sie ihre räumliche Umwelt zum Spielraum und suspendieren seine Nutzung als Schauraum, die bisher als ihre dominante Orientierung zu erkennen war. Die Tatsache, dass sich allein aus der sichtbaren Positionierung der Museumsbesucher im Raum so viel über ihre institutionskonforme oder eben nicht konforme Nutzung des Raums erfahren lässt, zeigt, wie wichtig die Sichtbarkeit der Raumnutzer für diesen konkreten Typ von Interaktion ist. 14 Auch wenn die drei Personen nach Maßgabe ihres Interaktionsraums nicht mehr an der museumsspezifischen Form der Interaktion, dem gemeinsamen Rundgang, teilnehmen, so heißt das nicht, dass ihre Interaktion nicht mehr mit ihrer räumlichen Umwelt verbunden wäre. Im Gegenteil: Der von der Dreiergruppe gebildete Interaktionsraum macht in seiner Konfiguration erkennbar, dass ihre Interaktion keineswegs zufällig in dieser Umwelt stattfindet und dass sie nicht von dieser unabhängig ist. Doch nutzt sie Hinweise, die 14 Dieser Befund bestätigt die historischen Analysen von Bennett (1995), der die Sichtbarkeit der Besucher in den Ausstellungsräumen als Mittel sozialer Kontrolle beschrieben hat. Schauraum / Spielraum: Eine standbildbasierte Fallstudie 355 deutlich nicht die im Raum dominierenden sind. So sind die undurchsichtigen Zonen nur ‘Inseln’ in einem auf maximale Sichtbarkeit und Durchsichtigkeit ausgerichteten Umfeld. Zusätzlich sind sie auf Bereiche beschränkt, die sich in Bodennähe befinden, die also für ihre Nutzung eine spezielle Anstrengung, ein Sich-Hinkauern erforderlich machen. Übertrieben wäre es jedoch, hier von einer subversiven (oder „transgressiven“, Scollon/ Scollon 2003, Kapitel 9) Nutzung des Raums zu sprechen, wie es beispielsweise Fußballspielen wäre. Dies würde ein aktives Angehen gegen die Benutzungshinweise des Raums erfordern, die von der zergliederten Bodenfläche, der Zerbrechlichkeit des Glases, der angezeigten Schutzbedürftigkeit der Exponate usw. ausgehen. Bild 7: V0300, 04: 14: 18 Bild 8: V0300, 04: 29: 20 Für die Einschätzung, dass wir es hier mit einem nur geringfügigen Verstoß gegen das vom Raum signalisierte angemessene Verhalten zu tun haben, spricht die Beiläufigkeit der Korrekturaktivitäten durch die beiden Erwachsenen. Bild 7 zeigt: Beide haben sich Tommy so weit genähert, dass die Gruppe wieder durch ihre Nähe und die übereinstimmende Bewegungsrichtung als ‘auf dem Weg zu einem Exponat’ gesehen werden können. Darüber hinaus stellt die Großmutter Mona durch eine Zeigegeste eine deutliche Verbindung zum Betrachtungsangebot des Raums her. Die Tonspur weist in die gleiche Richtung. Natalie schließt Tommys abweichende Raumnutzung mit einem entschiedenen BIEN ab und fordert ihn auf viens VOIR, (--) le tigre et le #MONtre mois le TIGre. (die Raute signalisiert den in Bild 7 dokumentierten Interaktionsmoment). Das Verb voir benennt hier wieder die Aktivität, die von der Institution gefordert wird: die Nutzung des Raums als Schau-Raum. Und tatsächlich nehmen die drei Besucher kurze Zeit später, wie auf Bild 8 dokumentiert, eine Position ein, die wir als gemeinsames Betrachten von Exponaten sehen können (siehe dazu Kesselheim 2012). Hinweise darauf sind: die Nähe der Interaktionspartner zueinander, ihre Nähe zum Vitrinenglas, ihre Ausrichtung auf eine Stelle, die einen guten Blick auf mindestens eines der ausgestellten Objekte gewährt. Mit der Herstellung dieses spezifischen für die gemeinsame Betrachtung der Vitrinenobjekte funktionalen Interaktionsraums ist die Versteck-Episode sichtbar zum Ab- Wolfgang Kesselheim 356 schluss gekommen, und die Raumnutzung der Dreiergruppe entspricht wieder dem, was wir als die dominant im Raum signalisierte, von der Institution geforderte Nutzungsform beschrieben haben. 3. Fazit Was haben wir aus der Fallstudie über die Interaktionsarchitektur des Museumsraums erfahren können? Die Standbildanalyse hat den untersuchten Museumsraum als einen Schau- Raum gezeigt, dessen primäre Nützlichkeit darin besteht, dass er die gründliche, am Detail orientierte Betrachtung der im Raum arrangierten Schau-Objekte möglich und wahrscheinlich macht. Nur an einer Stelle des Raums gibt es Hinweise darauf, dass er für fokussierte Interaktion hergerichtet ist: im Zuschauerbereich vor der Projektionswand, auf der die ‘Show’ zum Thema ‘Zoogeografie’ zu sehen ist. Doch lässt sich hieraus nicht ableiten, dass im restlichen Raum fokussierte Interaktion unerwünscht wäre: Die Breite der Gehzonen sowie der Verweil- und Betrachtungszonen erlaubt die Anwesenheit mehrerer Personen zugleich, und die Transparenz des Raums ermöglicht die Wahrnehmung anderer Raumnutzer als Voraussetzung für eine Kontaktaufnahme. Welche Form von Interaktion legt der Raum außerhalb des Zuschauerbereichs also nahe? Die erwartbare Form der Interaktion ergibt sich aus der im Raum signalisierten Ausrichtung auf das Betrachten der Schau-Objekte. Will man den Raum im Rahmen von Interaktion nutzen, dann legt die geringe Größe vieler Schau-Objekte zunächst eine Raumnutzung in kleinen Interaktionsgruppen nahe. Denn die Objekte können in aller Regel nur von wenigen Personen zugleich betrachtet werden. Die Form des Interaktionsraums, den die Betrachtungshinweise der Vitrinenobjekte erwartbar machen, ist eine sideby-side-Konfiguration unmittelbar vor der Vitrinenscheibe, bei der die Interaktionsbeteiligten gemeinsam in die Vitrine blicken. Dabei dürfen die Interaktanten nur so weit voneinander entfernt sein, dass die Unterstellung einer geteilten Wahrnehmung des betrachteten Objekts aufrechterhalten werden kann. Das Arrangement der Schau-Objekte in den Vitrinen gibt keine Hinweise auf eine präferierte Betrachtungsreihenfolge. Ähnliches gilt für die Bewegungen durch den Raum: Die Abfolge, in der die große Zahl potenzieller Betrachtungsziele anzusteuern ist, wird im Raum kaum signalisiert. Für die Interaktion heißt das, dass der Interaktionsraum von den Beteiligten selbst aufrecht erhalten werden muss: Ihr Zusammenbleiben als Gruppe während ihrer Bewegungen von einem Betrachtungsstandort zum nächsten wird vom Raum nicht gefördert, sondern muss dauerhaft durch ihre eigenen Aktivitäten der Koorientierung und Koordination (siehe Hausendorf 2010) hervorgebracht Schauraum / Spielraum: Eine standbildbasierte Fallstudie 357 werden. Diese Tatsache scheint mir für die leicht „soziofugale“ (Hall 1976) Eigenschaft des Museumsraums verantwortlich zu sein: Wenn ein Besucher sich trotz der zahlreichen Betrachtungsalternativen im Raum genau neben eine fremde Person stellt und beginnt, das gleiche Objekt zu betrachten, ist das als Entscheidung dieser Person zu erkennen und als solche rechtfertigungsbedürftig - speziell, wenn sich diese Koordinierung der Bewegungen über mehrere Betrachtungsetappen hinweg erstrecken sollte. Die Tatsache, dass aufgrund der vielen Glasflächen ein Gutteil des Raums überblickt werden kann, lässt sich daher eher als Hinweis darauf verstehen, dass sich in diesem Raum Menschen aus dem Weg gehen können, dass also viele gleichzeitige, aber eben separate Nutzungsvorgänge vorgesehen sind. Was lässt sich nun im Licht der Fallstudie zur Methode der standbildbasierten Raumanalyse mit Hilfe des Konzepts der Benutzbarkeitshinweise sagen? Die Fallstudie zeigt, dass eine Analyse, die von der Rekonstruktion der Benutzbarkeitshinweise des auf einer Standbildfolge zu sehenden Raums ausgeht, fruchtbare Einsichten in den Zusammenhang von Raum und Interaktion gestattet. Eine vorgängige Analyse der Benutzbarkeitshinweise eröffnet neue Beschreibungsmöglichkeiten des sichtbaren Verhaltens der Interaktionspartner im Raum: Das, was sich ohne Berücksichtigung der Hinweise im Raum lediglich als ‘Schwenk nach links’ beschreiben ließe, konnte bei Berücksichtigung der Hinweise im Raum als ‘Abwahl der von einer Vitrine signalisierten Betrachtungsangebote’ analysiert werden, ein ‘Gehen durch den Raum’ konnte daraufhin untersucht werden, ob es als ‘Gehen zu neuen Betrachtungszielen’ gesehen werden kann, usw. Als analytisch fruchtbar hat sich auch die Strategie erwiesen, zunächst nur solche Benutzbarkeitshinweise zu berücksichtigen, die sich aufgrund der Kenntnis der Möglichkeiten und Grenzen des menschlichen Wahrnehmungs- und Bewegungsapparats auswerten lassen und unsere Vertrautheit mit dem untersuchten Raum und seinen Objekten so lange wie möglich aus der Analyse ‘herauszuhalten’. Diese Strategie hat es erlaubt, Tommys Nutzung des Ausstellungsraums als Spiel- Raum als eine Form der Nutzung zu erkennen, die von dem Raum durchaus ermöglicht (und möglicherweise sogar nahegelegt) wird, solange man zur Auswertung der Bewegungsimplikationen des Raums lediglich wahrnehmungsbasierte Benutzbarkeitshinweise heranzieht. Die Fallstudie hat aber auch auf Gefahren hinweisen können, die mit der Standbildanalyse verbunden sind. So darf bei der Analyse nicht vergessen werden, dass die Standbilder keine Zustände dokumentieren, sondern Ausschnitte aus einem dynamischen Prozess der Interaktion. Jede auf dem Standbild repräsentierte Hinweiskonstellation ist daher nur als eine momentane Konstellation zu verstehen, die auf eine vorausgehende Konstellation folgt (die den Interagierenden noch präsent ist) und die spätere Konstellationen Wolfgang Kesselheim 358 projiziert - man denke an die Analyse des sich öffnenden Wegs in Bild 3. Darin besteht gerade ein wichtiges Spezifikum der Standbilder im Vergleich zu Fotografien, das in der Analyse ausgenutzt werden kann, um Hypothesen über Voraussetzungen zu entwickeln, die zu der dokumentieren räumlichen Konfiguration geführt haben, sowie solche über folgende räumliche Konfigurationen, die die dokumentierte Konfiguration erwartbar macht. Die Statik des Standbilds soll im Sinn einer methodischen Verfremdung dazu genutzt werden, den Blick auf genau diese ausgeblendeten oder ‘abgeschnittenen’ Voraussetzungen und Folgen zu lenken. Eine zweite Gefahr besteht darin, die auf einem Standbild dokumentierte Nutzung des Raums durch die Interaktionsbeteiligten als die ‘natürliche’, in besonderem Maße erwartbare Nutzung misszuverstehen. Die analytische Fruchtbarkeit der Standbildanalyse scheint mir gerade daraus zu resultieren, dass sie es erlaubt, auch Spannungen zu sehen zwischen dem, was der Raum an potenziellen Nutzungsmöglichkeiten eröffnet, und der auf einem Standbild sichtbar dokumentierten Nutzung durch die Gefilmten. Die Standbildanalyse muss also immer aufpassen, dass sie angesichts der Evidenz der sichtbaren Raumnutzung nicht ihre Ausrichtung auf ein Explizieren der potenziellen, erwartbaren, nahegelegten Raumnutzung aufgibt. Andererseits hat aber gerade bei der Analyse von Bild 6 die sichtbare Konfiguration der Interaktionsbeteiligten den Anlass gegeben, nach den nicht-dominanten Hinweisen im Raum zu fragen, die die auf dem Standbild zu sehende alternative Form der Raumnutzung erlauben. Dies scheint mir darauf hinzudeuten, dass es fruchtbar sein kann, die Rekonstruktion der Nutzungspotenziale zu nutzen, um die Struktur tatsächlicher Raumnutzungen zu verstehen, und die Analyse der tatsächlichen Raumnutzung, um hieraus ein Korrektiv für allzu glatte, nur auf das offensichtlichste fokussierende Hinweis-Analysen zu gewinnen. So hat ja gerade die Beschäftigung mit dem ‘abweichenden’ Fall der Nutzung des untersuchten Raums als Spiel-Raum unseren Blick dafür geöffnet, dass es im untersuchten Raum durchaus Nutzungen gibt, die abseits dessen liegen, was uns der Raum mit seinen dominanten Benutzbarkeitshinweisen als die einzig denkbare Form der Raumnutzung suggerieren will. Auch diese alternativen Nutzungen setzen an der Auswertung von Benutzbarkeitshinweisen an, allerdings an solchen, die im Raum weniger prominent sind - weil sie beispielsweise auf bestimmte, weniger leicht zugängliche Raumbereiche beschränkt sind (in der Fallstudie: der Bodenbereich neben Vitrinen) oder weil sie sich an ‘implizite Benutzer’ richten, an die wir bei der Analyse weniger gedacht haben (Kinder, Sehbehinderte, Analphabeten usw.). Die Feststellung, dass es unterschiedlich auffällige Benutzbarkeitshinweise im Raum gibt, lenkt den Blick darauf, dass Benutzbarkeitshinweise nicht ein- Schauraum / Spielraum: Eine standbildbasierte Fallstudie 359 fach ‘da’ sind, sondern dass sie erst emergieren, wenn Raumnutzer im Raum Wahrnehmbares (auch in Abhängigkeit vom Grad ihrer Vertrautheit mit dem betreffenden Raumtypus, wie das Tommy-Beispiel gezeigt hat! ) als Hinweise auswerten und ihr sichtbares Verhalten auf sie abstellen. Genau dies ist der Mechanismus, der es Raumnutzern erlaubt, im Zuge ihrer Interaktion ‘ein und denselben Raum’ auf verschiedene Art und Weise zu nutzen, nämlich indem sie unterschiedliche Hinweise für ihre Nutzung des Raums relevant setzen und diese Relevantsetzung interaktiv durchsetzen. So lässt sich Tommys Raumnutzung, die wir auf Bild 6 sehen konnten, als ein Relevantsetzen alternativer Benutzbarkeitshinweise verstehen, die den Raum im Hinblick auf seine Eignung für ein Versteckspiel auswerten. Interaktiv wirksam wird diese durch seine Körperposition sichtbar gemachte Auswertung von Benutzbarkeitshinweisen aber erst durch die Reaktion seiner Begleitpersonen, die den Raum nun ebenso ‘lesen’ wie Tommy (Wo kann Tommy Schutz suchen, wo kann er entkommen? ) und damit füreinander sichtbar die Rolle als ‘Sucher’ oder ‘Fänger’ akzeptieren. Die standbildbasierte Analyse der Benutzbarkeitshinweise im Museumsraum hat es möglich gemacht, den Mechanismen auf die Spur zu kommen, mit denen die Beziehung von Interaktion und Raum temporär verschoben worden sind, um aus einem Schaueinen Spiel-Raum zu machen. 4. Literatur Bauriedl, Sybille (2007): Räume lesen lernen. Methoden zur Raumanalyse in der Diskursforschung. In: Forum Qualitative Sozialforschung 8, 2, Art. 13. Bennett, Tony (1995): The birth of the museum. History, theory, politics. London: Routledge. Certeau, Michel de (1988): Kunst des Handelns. Berlin: Merve. Drew, Paul/ Heritage, John (1992): Talk at work. Interaction in institutional settings. Cambridge: Cambridge University Press. Goffman, Erving (1963): Behavior in public places. Notes on the social organization of gatherings. New York: Free Press. Goffman, Erving (1971): Relations in public. Microstudies of the public order. New York: Basic Books. Guggenheim, Michael (2013): Unifying and decomposing building types: how to analyze the change of use of sacred buildings. In: Qualitative Sociology 36, S. 445-464. Hall, Edward T. (1976): Die Sprache des Raumes. Düsseldorf: Schwann. Hausendorf, Heiko (2010): Interaktion im Raum. Interaktionstheoretische Bemerkungen zu einem vernachlässigten Aspekt von Anwesenheit. In: Deppermann, Arnulf/ Linke, Angelika (Hg.): Sprache intermedial. Stimme und Schrift, Bild und Ton. (= Jahrbuch des Instituts für Deutsche Sprache Mannheim 2009). Berlin/ New York: de Gruyter, S. 163-197. Wolfgang Kesselheim 360 Hausendorf, Heiko/ Kesselheim, Wolfgang (2013): Können Räume Texte sein? Linguistische Überlegungen zur Unterscheidung von Lesbarkeits- und Benutzbarkeitshinweisen. (= Arbeitspapiere des Universitären Forschungsschwerpunkts „Sprache und Raum“, SpuR02). Zürich: Universität Zürich. www.zora.uzh.ch/ 84555/ 1/ SpuR_ Arbeitspapiere_Nr02_Aug2013.pdf (Stand: Juni/ 2016). Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopographie. Umrisse einer raumlinguistischen Programmatik. (= Arbeitspapiere des Universitären Forschungsschwerpunkts „Sprache und Raum“, SpuR01). Zürich: Universität Zürich. www.zora.uzh.ch/ 78153/ 1/ SpuR_Arbeitspapiere_Nr01_Mai2013. pdf (Stand: Juni/ 2016). Kendon, Adam (1990): Spatial organization in social encounters. The F-formation system. In: Gumperz, John J. (Hg.): Conducting interaction. Patterns of behavior in focused encounters. Cambridge: Cambridge University Press, S. 209-237. Kesselheim, Wolfgang (2012): Gemeinsam im Museum: Materielle Umwelt und interaktive Ordnung. In: Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr, S. 187-231. Kesselheim, Wolfgang (2014): Ausstellungskommunikation. Eine linguistische Untersuchung multimodaler Wissenskommunikation im Raum. Habil. Deutsches Seminar, Univ. Zürich. Kesselheim, Wolfgang/ Hausendorf, Heiko (2007): Die Multimodalität der Ausstellungskommunikation. In: Schmitt, Reinhold (Hg.): Koordination: Analysen zur multimodalen Interaktion. (= Studien zur Deutschen Sprache 38). Tübingen: Narr, S. 339-375. Kruse, Lenelis/ Graumann, Carl Friedrich (1978): Sozialpsychologie des Raumes und der Bewegung. In: Hammerich, Kurt/ Klein, Michael (Hg.): Materialien zur Soziologie des Alltags. Kölner Zeitschrift für Soziologie und Sozialpsychologie, Sonderheft 20. Opladen: Westdeutscher Verlag, S. 177-219. McIlvenny, Paul/ Broth, Mathias/ Haddington, Pentti (2009): Communicating place, space and mobility. In: Journal of Pragmatics 41, S. 1879-1886. Norberg-Schulz, Christian (1968): Logik der Baukunst 15. Aufl. Gütersloh: Bertelsmann. Preziosi, Donald (1979): Architecture, language, and meaning. The origins of the built world and its semiotic organization. Den Haag: Mouton. Scollon, Ron/ Scollon, Suzie Wong (2003): Discourses in place: Language in the material world. London: Routledge. Gliederung 1. Einleitung ..............................................................................................................335 2. Die Fallstudie ........................................................................................................339 3. Fazit ........................................................................................................................356 4. Literatur .................................................................................................................359 LORENZA MONDADA/ FLORENCE OLOFF IM RADIOSTUDIO ARBEITEN: VIELGESTALTIGE HANDLUNGEN IN EINEM FLEXIBEL ARCHITEKTURIERTEN 1 RAUM 1. Einleitung Dieses Kapitel befasst sich mit dem Zusammenspiel von Raum und Interaktion und konzentriert sich auf die dynamischen Organisationsformen sozialer Handlungen unter Berücksichtigung verbaler und sichtbarer Ressourcen. Durch die Untersuchung eines spezifischen Settings - professionelle Interaktionen in einem Radiostudio - werden wir empirisch beschreiben und konzeptualisieren, wie ein gebauter bzw. stark architekturierter Raum im Rahmen institutioneller Praktiken genutzt und relevant gesetzt wird. So soll zu aktuellen Überlegungen zu Interaktionsraum und -architektur, zu Raum als Ressource sowie als materiellem Umfeld beigetragen werden. Unsere ethnomethodologische und konversationsanalytische Perspektive wird von aktuellen Debatten über den sogenannten spatial turn in der interaktionalen Forschung beeinflusst (Kap. 1.1). Auf Grundlage eines in einem Radiostudio erstellten Videokorpus (Kap. 1.2) wird zunächst die Verbindung zwischen einem architektonisch und technologisch komplexen Umfeld und dem interaktionalen Handeln der Teilnehmer skizziert (Kap. 2.1, Kap. 2.2). Es folgt die detaillierte Analyse eines Einzelfalls (Kap. 3), in dem die Radiomoderatoren einen Text für den nächsten Sendeabschnitt vorbereiten. Hier werden die räumlichen Charakteristika sichtbar, die bei der Arbeit nach und nach relevant gesetzt werden (Kap. 4). 1.1 Der spatial turn in der interaktionalen Forschung Der spatial turn der letzten Jahrzehnte hat dazu geführt, dass sich die Geistes- und Sozialwissenschaften aus verschiedenen Perspektiven, mit unterschiedli- 1 In diesem Beitrag benutzen wir den Neologismus architekturiert, um einen Raum zu bezeichnen, der nicht nur gebaut, sondern auch auf besondere Art konzipiert wurde, so wie es beim Radiostudio der Fall ist. Mit anderen Worten bezieht sich der Begriff auf Details der Innenausstattung, die nicht einfach nur materiell gebaut, sondern auch in ihrer materiellen Form funktional entworfen wurden in Bezug auf die Aktivitäten, die in diesem Umfeld stattfinden sollen. Das bedeutet nicht, dass architekturierter Raum a priori an die tatsächlich in ihm stattfindenden Aktivitäten angepasst ist. Wie wir in unserer Analyse zeigen, gibt es Aktivitäten, die diesen Raum nutzen, aber auch solche, die ihm widerstehen - wie es dem Konzept der Interaktionsarchitektur entspricht (siehe dazu den Beitrag von Hausendorf/ Schmitt im Theorieteil des vorliegenden Bandes). Lorenza Mondada / Florence Oloff 362 chen Definitionen und unter diversen theoretischen Annahmen mit dem Begriff des Raumes auseinandersetzen (Crang/ Thrift (Hg.) 2000). In der Sprachwissenschaft wurde Raum beispielsweise in der Psycholinguistik, der Typologie oder der anthropologischen Linguistik untersucht. Raum wurde hier typischerweise als in verschiedenen Sprachsystemen und soziokulturellen Praktiken unterschiedlich ausgedrückter oder gar „kodierter“ Referent erforscht (für eine Übersicht siehe Levinson 1996). In der Dialektologie wurde Raum jedoch auch als ein Territorium verstanden, innerhalb dessen sich Sprecher durch die Wahl einer ortstypischen Sprachvariante positionieren (Britain 2001; Auer/ Schmidt 2009). Semiotik, Textanalyse sowie literacy studies ihrerseits interessieren sich für den Darstellungsraum (z.B. Karten, Textaufbau, Layout) und berücksichtigen so die Materialität von Dokumenten (Goody 1977). In all diesen Fällen bezieht sich Raum auf unterschiedliche Dinge und Abstufungen (Mondada 2005a, 2011), zudem gibt es Variationen in seiner theoretischen Konzeptualisierung: Für einige Forscher besteht Raum unabhängig von Sprache, die sich lediglich auf ihn beziehen kann, für andere wiederum wird Raum durch den Akt der Bezugnahme reflexiv hergestellt. Für manche Dialektologen und Soziolinguisten steht der Herkunftsort einer Person mit einer Festlegung auf bestimmte sprachliche Formen in Verbindung, andere jedoch gestehen Sprechern eine freie Wahl lokaler Akzente oder regionaler Varianten zu, mit deren Hilfe sich diese eine wandelbare Identität erschaffen können. An Schreib- und Lesekompetenzen interessierte Forscher sehen in der Textverteilung auf dem Blatt eine Steuerung von Denkstrukturen, für andere jedoch ist Textaufbau etwas, mit dem die Schreibenden Eigenschaften des semiotischen Raumes bewusst nutzen. Wie diese Beispiele zeigen, wird Raum sowohl als prä-existent als auch als Ergebnis eines Herstellungsprozesses gedacht, als etwas, das menschliches Handeln determiniert, oder als Produkt eben dieses Handelns. Über dieses Spannungsfeld wurde im Rahmen der interaktionalen Forschung produktiv nachgedacht. In der Ethnomethodologie wird bereits lange über die Bedeutung von Kontext diskutiert, wobei sowohl berücksichtigt wird, dass soziales Handeln durch Anpassung an den Kontext organisiert wird, als auch, dass dieses Handeln seinerseits eine strukturierende Wirkung auf den Kontext ausübt. Dies zeigt sich in der Konzeptualisierung interaktionaler Praktiken wie dem Sprecherwechsel als gleichzeitig kontextunabhängig und kontextgebunden (Sacks et al. 1974) sowie in der Idee, dass soziales Handeln durch den Kontext geformt wird und diesen zugleich beständig erneuert (Heritage 1984). Dieses Konzept der ‘Reflexivität’ (Garfinkel 1967; Garfinkel/ Sacks 1970) wird häufig genutzt, um das Zusammenspiel von institutionellem Im Radiostudio arbeiten 363 Kontext und Gesprächen zu beleuchten (Drew/ Heritage 1992). Erst seit Kurzem wird dieses Konzept ebenfalls auf die Verbindung zwischen Materialität, Raum und Gesprächsorganisation angewendet (Goodwin 2000; Hausendorf et al. (Hg.) 2012; Haddington et al. (Hg.) 2013). In gewisser Hinsicht hat der spatial turn in der Konversationsanalyse und Ethnomethodologie sehr früh begonnen, so z.B. mit Schegloffs (1972) Beitrag zu Ortsformulierungen oder Psathas’ (1979, 1990) Arbeit zu Wegbeschreibungen. Diese Untersuchungen haben zu einem tiefergehenden Verständnis von Raumbeschreibungen in der Interaktion sowie zur Idee einer reflexiven Beziehung zwischen Raumbeschreibung und dessen Konfigurierung beigetragen (siehe auch Mondada 2000; Garfinkel/ Sacks 1970). Ein anderer, weitaus radikalerer spatial turn in diesem Feld interessiert sich jedoch nicht für den Raum als gezeigtes und beschriebenes Objekt, sondern für Raum als materiellen Kontext, in dem sich soziales Handeln vollzieht (Hausendorf et al. (Hg.) 2012; Haddington et al. (Hg.) 2013). Diese Sichtweise wurde unter dem Begriff des ‘Interaktionsraumes’ entwickelt (Mondada 2005b, 2007a, 2009; Schmitt 2012), also der Raum, der durch die Anordnung und Orientierung der Körper der Interaktanten relevant gesetzt wird. Dieses Verständnis wurde beeinflusst u.a. von Goffmans Studien zum Verhalten im öffentlichen Raum (1963), Scheflens (1975) Arbeit zu sozialen Territorien, Kendons (1990) Beschreibung der ‘F-formation’ sowie nicht zuletzt von Goodwins Überlegungen zur aktiven, physischen Herstellung des Teilnehmerrahmens, bei der auch Objekte zur Kontextkonfigurationen beitragen (Goodwin/ Goodwin 2004; Goodwin 2000, 2007). Dem ethnomethodologischen und konversationsanalytischen Primat der Handlung folgend, bezieht sich der Begriff des Interaktionsraumes auf den Raum als Ressource: Merkmale des materiellen Raumes werden in und durch soziale Interaktion relevant gesetzt, diese stellen gleichzeitig Ressourcen dar, die die Organisation sozialen Handelns ermöglichen und zugleich einschränken. Die Materialität der Umgebung wird nicht ignoriert, sondern in Zusammenhang mit den Handlungen und verkörperten Orientierungen der Teilnehmer behandelt. Eine komplementäre Sichtweise auf die Materialität der Umgebung wurde von anderen interaktionsorientierten Studien eingenommen: Die Begriffe der ‘Interaktionsarchitektur’ (Hausendorf/ Schmitt 2013) sowie der ‘Sozialtopografie’ (Schmitt 2013) befassen sich mit den Möglichkeiten und Einschränkungen, die im gebauten Raum enthalten sind, sowie mit dem kulturellen und sozialen Wissen, das Menschen durch und über die Nutzung des sozialen Raumes besitzen. Während der Interaktionsraum sich auf die gemeinsame, interaktive Herstellung des relevanten Raumes bezieht, beschäftigt sich die Interaktionsarchitektur mit den im Raum enthaltenen Handlungspotenzialen. Es geht also um zwei komplementäre Aspekte von Raum; einerseits des- Lorenza Mondada / Florence Oloff 364 sen praxeologische, durch menschliches Handeln situiert hergestellte Dimension, andererseits die präexistenten Bedingungen und Potenziale menschlichen Handelns. Die erste Sicht untersucht bevorzugt offene Räume, in denen sich Körper in unterschiedlichsten Konfigurationen anordnen können, so z.B. in öffentlichen (Mondada 2009) oder mobilen Räumen (Haddington et al. (Hg.) 2013; Mondada 2014), die zweite beschäftigt sich vorzugsweise mit stark strukturierten, gebauten Umgebungen wie Universitätshörsälen (Hausendorf 2012) oder Kirchen (Hausendorf/ Schmitt 2013). Der vorliegende Beitrag ist stärker von der ersten, interaktionsräumlichen Sichtweise geprägt, setzt sich in der Analyse jedoch mit einer Umgebung auseinander, die auch die zweite, interaktionsarchitektonische Sichtweise interessiert. Auf diese Weise soll er dazu beitragen, das Zusammenspiel von Architektur, gebauter Umgebung und sozialer Interaktion zu reflektieren. Der Raum des Radiostudios wirft zudem Fragen nach der Beziehung zwischen einem spezifischen Arbeitsplatz sowie bestimmten institutionellen Interaktionsformen auf. Auch die Rolle verschiedener technischer Artefakte wird berücksichtigt, die sowohl im gebauten Raum verwurzelt sind als auch situiert innerhalb bestimmter interaktionaler Momente und für professionelle Handgriffe genutzt werden. Wie bereits erwähnt, richten Studien zum Interaktionsraum ihr Augenmerk insbesondere auf Körperbewegungen, Arbeiten zur Interaktionsarchitektur verstärkt auf einschränkende materielle Umgebungen, jedoch hat keine dieser Ausrichtungen sich primär damit befasst, dass Technologie stark zur Komplexität der Umgebung beiträgt, was eher in der Tradition der workplace studies (Heath/ Luff 2000), z.B. unter dem Begriff der ‘centres of coordination’ (Suchman 1996), diskutiert worden ist. Dies hat grundlegende Überlegungen zu einer Vielzahl an Interaktionsarten hervorgebracht, so z.B. in mit Computern gefüllten Räumen (Luff et al. (Hg.) 2000), über einfache Videokonferenzsysteme (Mondada 2007b; Licoppe/ Relieu (Hg.) 2007) oder virtuelle Arbeitsplätze (z.B. in Kontrollräumen öffentlicher Verkehrsmittel, Heath/ Luff 1992; oder bei Finanzgeschäften, Heath et al. 1995). Diese Studien haben gezeigt, dass ein von Technik durchsetztes Umfeld neue Formen von Asymmetrie hervorbringt (Heath/ Luff 1992) sowie Bewegung, Gesten und Positionierung im Raum beeinflussen kann (Luff et al. 2013). Indem wir berücksichtigen, wie soziale Interaktion innerhalb eines komplexen materiellen Umfelds wie dem Radiostudio organisiert wird - ein Umfeld, das innerhalb der Tradition der workplace studies, der Ethnomethodologie und der Konversationsanalyse noch nicht erforscht worden ist (siehe auch Mondada 2015; Mondada/ Oloff 2015, i.Dr.) - zielen wir auf mindestens drei Dimensionen ab, die innerhalb der Literatur im Rahmen eher unterschiedlicher Traditionen behandelt wurden: a) das Zusammenspiel von Architektur Im Radiostudio arbeiten 365 und sozialer Interaktion, b) das Zusammenspiel von Technik, Raum und sozialer Interaktion in institutionellen Settings, c) das Zusammenspiel von Teilnehmerrahmen und Interaktionsraum. 1.2 Datenbeschreibung: Interaktionen in einem Radiostudio Die in diesem Beitrag analysierten Daten wurden von den Autorinnen im Oktober 2012 aufgezeichnet. Innerhalb eines Tages wurden in den Räumlichkeiten eines lokalen Radiosenders der deutschsprachigen Schweiz verschiedene Arbeitssituationen gefilmt. Aus diesen Daten wurde ein Setting ausgewählt, das zwei Moderatoren bei der Durchführung der „Morgenshow“ zeigt (6 bis 10 Uhr). Die Show wird von diesem Team in einem der Senderstudios gemeinsam gestaltet und moderiert. Im Studio wurden zwei Kameras eingesetzt: Eine fest installierte Kamera (Bild 1), die den gesamten Raum inklusive der beiden Moderatoren filmte, sowie eine mobile Kamera (Bild 2), die sich zumeist auf die Arbeit der regieverantwortlichen Moderatorin am Mischpult fokussierte und teilweise an bestimmte Elemente dieses Arbeitsplatzes heranzoomte. Der Ton der immobilen Kamera wurde über ein Kabel mit dem gesendeten Radiosignal verbunden. Die Sendung besteht hauptsächlich aus der Übertragung zeitgenössischer, internationaler Hits, beinhaltet aber auch Nachrichtensendungen im Halbstundentakt (im Wechsel auf Deutsch und Schwyzerdütsch) sowie Wettervorhersagen, Werbeblöcke, Jingles und kurze Moderationen des Studioteams auf Schwyzerdütsch. Die mobile Kamera hingegen hat die Klangkulisse innerhalb des Studios aufgezeichnet, zu denen also nicht nur die live moderierten Abschnitte gehören, sondern auch die den Moderationen vorangehenden Gespräche und der Smalltalk der Moderatoren unter sich oder mit Kollegen. Der von uns gewählte Ausschnitt zeigt einen kurzen, typischen Arbeitsablauf innerhalb der Morgenshow: Vorbereitung der nächsten Moderation, bei der die Moderatoren sich stiller, individueller Arbeit an ihrem Computer bzw. mit Dokumenten widmen, mögliche Themen und Formulierungen miteinander besprechen und kurz danach mit den erarbeiteten Elementen auf Sendung gehen (siehe Mondada/ Oloff i.Dr.). 2. Interaktionen im Radiostudio: Ein flexibel architekturierter Raum für vielfältige Aktivitäten Dieser Beitrag beschäftigt sich mit professionellen Aktivitäten von Radiojournalisten und mit der Frage, wie diese im Studio multimodal hergestellt werden. Wir interessieren uns einerseits dafür, wie genau die Körper der Teilnehmer durch den architekturierten Raum ihres Arbeitsplatzes eingeschränkt Lorenza Mondada / Florence Oloff 366 werden, wie sie diesen ausnutzen oder ihm widerstehen, andererseits auch für die räumlichen Besonderheiten dieses Arbeitsplatzes und deren interaktionale Relevanz. In diesem Abschnitt beschreiben wir einige der affordances und Herausforderungen dieses Raumes mit Hinblick auf soziale Interaktion. 2.1 Architektur des Radiostudios Anhand zweier Standbilder des leeren Studios (Bild 1 und 2) möchten wir zunächst auf einige interaktionsarchitektonische Elemente des Raumes eingehen. Hierbei werden wir nicht nur für dieses Setting spezifische Details kommentieren, sondern auch auf verschiedene analytische Fragen eingehen, die eine solche Architektur aufwirft. Das Radiostudio ist ein eindeutig für „radiorelevante“ Aktivitäten konzeptualisierter Raum, ein komplexes Umfeld, das insbesondere der Klangisolierung und -übertragung dient. Das Studio ist inmitten eines größeren, offenen Raumes positioniert, das Gebäude selbst aber wurde ursprünglich für Börsengeschäfte entworfen. Architektur kann also durch Umbau neuen Funktionen angepasst werden, ein typischer Prozess urbaner Erneuerung und neuer architektonischer Praxis (Göbel 2015; Schittich (Hg.) 2003). Der gebaute Raum des Studios ist kreisförmig, klangisoliert, durch die Fenster rundherum jedoch auch sichtbar transparent. Diese architektonische Disposition dient der schnellen Erkennung von im Studio anwesenden Personen und dort ablaufenden Aktivitäten. Diese öffentliche Nachvollziehbarkeit ist auch durch das rote oder grüne Licht außen an der Studiotür gewährleistet, das anzeigt, ob das Studio gerade sendet oder nicht. 1 Bild 1: Leeres Studio aus Kameraperspektive 1 (immobil) Im Radiostudio arbeiten 367 2 Bild 2: Leeres Studio aus Kameraperspektive 2 (mobil) Auch der gestaltete Raum ist eindeutig für professionelles Senden konzipiert. Der rote Teppich weist auf die Erschaffung einer geräuscharmen Umgebung hin, es gibt nur wenig Möbelstücke sowie keine dekorativen Elemente. Zentral in diesem Raum ist die doppelte Arbeitsplatte: Der tiefliegenden, großen linken Platte liegt eine wesentlich kleinere, höher liegende Platte gegenüber (Bild 1). Diese Asymmetrie zeigt, dass die linke Platte der Hauptarbeitsplatz, die andere Seite hingegen komplementär dazu ist. Die erhöhte Position auf der rechten Seite ermöglicht es, auf den Hauptarbeitsplatz zu blicken und sich so an diesem zu orientieren - es handelt sich also um einen Platz für Teilnehmer, die mit der Person am Tisch links zusammenarbeiten. Die Tischposition impliziert zwar eine mögliche face-to-face-Konstellation, jedoch schränkt die Raumausstattung die Sicht deutlich ein. Auch die restliche Raumausstattung weist darauf hin, dass dieser Raum eher für konzentriertes Arbeiten einer einzelnen Person geschaffen ist, da die meisten technischen Geräte (vier Bildschirme und Tastaturen, Mischpulte, Bild 2) auf der großen Platte positioniert sind. Dies ist der wichtigste Platz im Raum, von wo aus der Sendevorgang gesteuert werden kann, wohingegen am Arbeitsplatz rechts eine Tastatur zur Computersteuerung fehlt. Auch die (hier nicht sichtbare) Wanduhr befindet sich an der Wand gegenüber der großen Arbeitsplatte. Die Anzahl der Mikrofone weist auf mögliche Arbeitskonstellationen in diesem Studio hin: Links sitzt nur eine Person, wohingegen rechts bis zu zwei Personen arbeiten können. Somit ist der Raum für 1 + 1 + 1 Teilnehmer konzipiert. Die hohe Anzahl technischer Artefakte weist klar auf den Arbeitskontext hin: Computer, Mikrofone, Kopfhörer, Mischpulte, und auch hier gibt es ein Lichtsignal, das rot oder grün anzeigen kann (siehe links in Bild 2). Gebauter, gestalteter und ausgestatteter Raum implizieren daher Folgendes: - Dieser Raum dient insbesondere der Herstellung von Klang und dessen Sendung, wie die Reduktion auf funktionale Elemente zeigt. Lorenza Mondada / Florence Oloff 368 - Er wurde für zeitlich präzises, konzentriertes und störungsfreies Arbeiten konzipiert. - Er ist für die individuelle Arbeit einer Person konzipiert, kann aber bei Bedarf noch bis zu zwei zusätzliche Mitarbeiter aufnehmen. - Er wurde nicht primär für soziale Interaktionen konzipiert, die über die „Klangarbeit“ hinausgehen (dies steht in klarem Kontrast zu Radiostudios, die für den öffentlichen Empfang - mit oder ohne Publikum - wichtiger Gäste konzipiert wurden). Die äußere Hülle des Studios zeigt also Relevanzen auf, die auch im inneren Raum sichtbar sind. Das Studio zeichnet sich durch ein Arrangement von Tischen, Mischpulten, Mikrofonen, Computern und Tastaturen aus. Dies ergibt ein eher gefülltes Umfeld, in dem viele Objekte dauerhaft in der Architektur verankert sind. Allerdings sind diese Objekte auch relativ mobil, so befinden sich z.B. die Mikrofone und Computerbildschirme an beweglichen Armen (Bild 1). Wir können daher von einem architekturierten, aber dennoch flexiblen Raum sprechen. Im Gegensatz zu anderen öffentlichen Gebäuden, die für eine breite und für deren Nutzung sozialisierte Öffentlichkeit konzipiert wurden (wie z.B. das Museum für Bürger, Bahnhöfe für Reisende, Kirchen für Gläubige), sind Arbeitsplätze nicht immer sofort für eine visuelle Analyse verfügbar. Manche Details können entweder rein architektonisch oder aber funktional bedingt sein, andere können unter ästhetischen Gesichtspunkten entworfen worden sein, aber funktional genutzt werden. Die Funktionalität von Details kann sorgfältig a priori geplant werden, jedoch auch kreativ a posteriori etabliert werden, wie die Umwandlung des Gebäudes in neue Nutzungseinheiten zeigt. Dies weist auf die Bedeutung einer Raumarchäologie hin, die dabei helfen kann, die historische Schichtung des Raumes zu verstehen (vgl. Arnold et al. 2012; Linke 2012). In Abwesenheit von historischem Wissen kann die konkrete Nutzung eines Raumes dazu beitragen, seine praxeologischen Funktionalitäten zu verstehen. Der Radiostudioraum ist besonders geeignet, um über das Zusammenspiel von Architektur und Interaktion in Bezug auf Klang-Management nachzudenken. Das Studio ist „Klangarchitektur“, in der die paradoxe Beziehung zwischen Schall und Sichtbarkeit deutlich wird. Klang ist unsichtbar, aber seine Regulierung ist in gewissen Details der Studioarchitektur enthalten, so im grünen bzw. roten Licht, das Klang quasi sichtbar macht, oder auch in der Gestaltung von Oberflächen, die Schall absorbieren oder reflektieren. Unter den materiellen Klangartefakten befinden sich mobile Objekte, die in der Architektur eingebettet und zugleich autonom sind. Beispielsweise sind Mikrofone und Kopfhörer mit dem PC, dem Mischpult, den Verstärkern verbunden, ermöglichen aber mobile Nutzung. Daher tragen auch Klangarchitektur und mobile Klangwerkzeuge zur Spezifizität des Radiostudios als Arbeitsplatz bei. Im Radiostudio arbeiten 369 Diese ersten interaktionsarchitektonischen und sozialtopografischen Elemente zeigen, dass das Radiostudio nicht einfach nur als Arbeitsraum, sondern insbesondere als „Klangraum“ konzipiert wurde. Auch Zeitlichkeit ist, ähnlich den mobilen „Klangwerkzeugen“, nicht direkt im gebauten Raum sichtbar, sondern wird von verschiedenen Artefakten impliziert: Zeit ist von der Wanduhr sowie von einigen der Bildschirme abzulesen, auf denen der sekundengenaue Programmablauf nachvollziehbar und modifizierbar ist (ein Zeitbalken zeigt die verbleibende Zeit des aktuellen Musikstücks an und ändert mit Ablauf der Zeit seine Farbe von grün zu rot). Es ist daher ersichtlich, dass im Studio Klang- und Zeitraum artikuliert werden. Wie genau in diesem Raum Klang unter Zeitdruck hergestellt wird und ob bzw. wie sich die Nutzung der Architektur unter Zeitdruck verändert, kann daher beschrieben werden, wenn in einem gewissen Zeitraum die detaillierte (Nicht-)Nutzung des Raumes und der Artefakte betrachtet wird. Die Beschreibung des Interaktionsraumes kann so dazu beitragen, auch Zeit als wichtige „Raumdimension“ sichtbar zu machen. 2.2 Das Radiostudio als Interaktionsraum Der Radiostudioraum ist vor allem für Sendetätigkeiten konzipiert worden, insbesondere, um auf Sendung in das Mikrofon zu sprechen. Innerhalb einer interaktionalen, praxeologischen Perspektive stellt sich die Frage, wie genau diese Architektur mit den im Radio ablaufenden Aktivitäten in Verbindung steht. Wir werden später sehen, dass Studioarbeit durch eine Vielzahl von Tätigkeiten vollzogen wird, beispielsweise durch klangproduzierende Handlungen, jedoch auch durch berufsbezogene Gespräche oder Smalltalk. Das bedeutet, dass nicht jede (berufsbezogene) Aktivität den architekturierten Studioraum mobilisiert. Inwieweit ist der architekturierte Raum eine Ressource oder ein Hindernis für die in ihm ablaufenden Tätigkeiten? Welches Konzept von Radioarbeit ist in der Architektur implementiert, und welche Eigenschaften dieser Klangarchitektur werden bei der Arbeit mit Klang überhaupt genutzt? Unsere Analyse setzt sich damit auseinander, wie Teilnehmer die materiellen Eigenschaften des Studios nicht nur mobilisieren, sondern auch ignorieren oder neutralisieren können, und zwar in Abhängigkeit von den momentan relevanten Aktivitäten, den dynamischen Übergängen zwischen Aktivitäten oder von Multiaktivität. Innerhalb dieser Aktivitäten verschmelzen interaktionaler Raum und Architektur und (re)konfigurieren sich gegenseitig, was illustriert, wie wichtig die Berücksichtigung von Gesten, Blicken und anderem sichtbaren Verhalten innerhalb von Architektur ist. Dies zeigt sich auch im Zusammenspiel von Immobilität und Mobilität, z.B. bei Mikrofonen oder Kopfhörern, eine Form mobiler und gleichzeitig tragbarer Architektur. Lorenza Mondada / Florence Oloff 370 Um einen ersten Eindruck der Aktivitäten und ihrer (Nicht-)Einbettung in die lokale Studioarchitektur zu erhalten, folgen nun einige kontrastierende Beispiele von Raumnutzung innerhalb diverser Aktivitäten. Standbilder von Live-Übertragungen zeigen (Bilder 3 und 4), dass auf Sendung die Eigenschaften des architekturierten Studios maximal mobilisiert werden. 3 4 Durch das Tragen der Kopfhörer sind die Teilnehmer auditiv klar auf den gesendeten Ton fokussiert, sie sprechen entweder sitzend (Bild 4) oder stehend (Bild 3) in das vor ihnen positionierte Mikro. Das rote Licht über dem Mikro zeigt an, dass sie gerade auf Sendung sind. Die Person jeweils rechts nutzt Papierdokumente (Bild 3) oder den Computerbildschirm (Bild 4) als Unterstützung bei der Produktion gesendeter Sprache. Die Moderatorin jeweils links ist für das Mischpult verantwortlich und organisiert das Klangmaterial (Musik, Werbung, Interviewaufnahmen usw.). Spricht der andere ins Mikro, überwacht sie aufmerksam die Sprachproduktion (siehe ihren Blick zu der Person rechts in Bild 3 und 4). Monitoring und gegenseitige Sichtbarkeit spielen demnach während des Sendevorgangs eine große Rolle. Sichtbarkeit ist sowohl für Interaktion on air sowie off air von grundlegender Bedeutung. Diese Eigenschaft ist nicht per se architekturiert, da sie sich nicht auf ein bestimmtes Artefakt stützt, sondern Köperbewegungen und den Raum zwischen den Artefakten nutzt. 5 6 Gegenseitiger Blickkontakt während des Sendens (Bild 5) unterscheidet sich deutlich von der Situation off air (Bild 6). Auf dem ersten Bild schauen sich die Teilnehmer nicht bloß an, sie mobilisieren gleichzeitig eine Reihe von für die Im Radiostudio arbeiten 371 Radioübertragung notwendigen Artefakten. Blickkontakt alterniert mit anderen Blicken, meist auf Bildschirme, oder wird in diese eingebettet. Das gebaute Studio scheint dies durch die asymmetrisch positionierten Tische zu fördern, da die Teilnehmer sich so über die Bildschirme hinweg anschauen können. Die off-air-Interaktion (Bild 6) hingegen kann die technische Ausstattung des Studios ignorieren: Durch die stehende Position maximiert die Person links den visuellen Zugang zum Interaktionspartner, löst sich aber von technikbasierten Aktivitäten (siehe ihre Hand- und Armposition). Der Kontrast zwischen Bild 5 und 6 zeigt, dass der Begriff des face-to-face räumlich sehr unterschiedlich hergestellt werden kann. Die vorangegangenen Standbilder zeigen Teilnehmer, die in gemeinsame Aktivitäten eingebunden sind, im Studio kann off air jedoch gemeinsames Sprechen (Bild 7) genauso gut auftreten wie isoliertes Arbeiten (Bild 8). Während die Teilnehmer beim Gespräch (Bild 7) direkten Blickkontakt bevorzugen, ist bei der individuellen Arbeit (Bild 8) jeder auf sein eigenes technisches Umfeld konzentriert. Durch die Anordnung der Bildschirme entstehen so tendenziell isolierte Arbeitsplätze. 7 8 Somit stellt sich die Frage, ob das Studio eher für individuelles als für gemeinsames Arbeiten konzipiert wurde - oder für beides. Individuelle Arbeit umfasst das Lesen und Schreiben am PC oder auf Papier sowie, für die Person links, das Abmischen und Vorbereiten von Sounddateien. Technik kann beim gemeinsamen Arbeiten ebenfalls genutzt werden, bei Gesprächen, insbesondere bei informellem Smalltalk, kommt sie hingegen weniger zum Einsatz. In diesem Setting kontrastieren berufliches und privates Gespräch weniger, da Aufgaben meist in einer Mischung aus Alltags- und Berufsgespräch bearbeitet werden (siehe Mondada 2015). Manche Aktivitäten im Radiostudio sind also stark auf technische Geräte und das materielle Umfeld angewiesen, wohingegen andere essenziell auf face-to-face-Interaktionen basieren. Für letztere könnte daher die Mobilität mancher Artefakte und architektonischer Elemente wichtig sein, so z.B. die Möglichkeit, das Mikrofon oder Bildschirme zu verschieben. Dieser erste Überblick betont die mögliche Bedeutung gewisser Gegensatzpaare: Individuelle vs. gemeinsame Arbeit, Interaktionen mit Bezug auf Arbeitsthemen vs. auf Alltagsthemen, Interaktionen auf Sendung vs. nicht auf Sendung. Lorenza Mondada / Florence Oloff 372 Die Studioarchitektur scheint vor allem für individuelle, berufliche Tätigkeiten sowie die Herstellung von on air-talk gedacht zu sein und andere Arten von Aktivitäten zu vernachlässigen. Dies kann jedoch nicht anhand einer einfachen Handlungstypologie festgestellt werden, so wie wir sie hier anhand einiger kontrastiver Bilder umrissen haben, weshalb wir nun analysieren möchten, was sich in situ und in vivo im Studio bzw. in und mit dessen Architektur abspielt. 3. Eine praxeologische und interaktionale Analyse der situierten Nutzung der Studioumgebung Der von uns gewählte und transkribierte 2 Auszug zeigt die Vorbereitung eines kleinen Sendeabschnitts der Radioshow. Seine Analyse soll zeigen, wie die Teilnehmer die Studioarchitektur, spezifische Eigenschaften und Objekte des materiellen Umfelds dynamisch und schrittweise mobilisieren. Die von uns untersuchte Episode dauert ca. dreieinhalb Minuten und erstreckt sich von der letzten bis zur nächsten Live-Moderation. Während dieser Zeit sind die Teilnehmer in verschiedene Aktivitäten involviert, von denen die wichtigste die Suche nach dem Thema der nächsten Live-Moderation ist. Es handelt sich hier um ein neues, bisher noch nicht erwähntes Thema, den an diesem Tag stattfindenden internationalen „Coming Out Day“ (11. Oktober). Für dieses Ereignis wurden u.a. Interviews mit homosexuellen Persönlichkeiten in der Armee oder im Sport vorab aufgenommen und auch als Textdokumente aufbereitet (bezüglich der Genderthematik dieses Auszugs siehe Mondada/ Oloff 2015). Unsere Analyse folgt der zeitlichen Entwicklung der Moderationsvorbereitung Schritt für Schritt und zeigt, wie innerhalb der jeweiligen Episoden bestimmte Eigenschaften des Raumes mobilisiert und (re)konfiguriert werden. 3.1 Planung der nächsten Moderation durch Nutzung verschiedener Studioelemente und Materialien Der erste Abschnitt folgt unmittelbar auf die letzten live gesendeten Gesprächselemente. Isa (links im Bild) und Oli (rechts) haben noch ihre Kopfhörer auf und widmen sich individueller Arbeit, die mit dem Computer (Oli) oder Papierdokumenten (Isa) verbunden ist (Bild 9). Beide zeigen ihre Orientierung zur nächsten Tätigkeit (die Vorbereitung des neuen Sendethemas), 2 Für die Verbaltranskripte wurden die Konventionen der ICOR-Gruppe für gesprochenes Französisch verwendet, sowohl von Jeffersons Arbeit als auch von den GAT-Konventionen inspiriert (siehe http: / / icar.univ-lyon2.fr/ projets/ corinte/ bandeau_droit/ convention_icor.htm). Die multimodalen Annotationen folgen Mondadas Konventionen (siehe https: / / franz.unibas. ch/ fileadmin/ franz/ user_upload/ redaktion/ Mondada_conv_multimodality.pdf). Im Radiostudio arbeiten 373 definieren und organisieren diese aber unterschiedlich: Während Isa einige Dokumente als Grundlage für den nächsten Beitrag nimmt, sind Oli die Tonausschnitte wichtig, die jedoch nur über Isas Mischpult gespielt werden können. Beide projizieren so Handlungsverläufe, die vom räumlichen Umfeld des Studios anders Gebrauch machen. Zu Beginn des Auszugs positioniert Oli seinen Kopfhörer auf den Schultern, schaut zu Isa und initiiert eine neue Sequenz, in der er sie bittet, eines der aufgenommenen Interviewstücke (Tön, Z. 2, Bild 10) zu spielen. Auszug 1 (Noch 3: 35 Minuten bis zur nächsten Live-Moderation) 1 #(2.1) ⊥(0.2)⊥ (1.2)+(0.5)# bild #b.1 #b.2 isa >>schaut nach unten auf Dokumente--------> l.10 oli ⊥Kopfhörer runter, auf Schulter⊥ oli +...blickt zu ISA--> 9 10 2 OLI zeigsch mir schnäll d tön/ 3 (0.3)+(0.3) ● (0.6) ● oli " isa ● Kopfhörer weg vom linken Ohr ● 4 ISA ja du hesch s kop ● iert/ und (.) isa ● nimmt Dokumente, zeigt sie OLI--> 5 mir: (.) ent: - (0.2) mi: mir ● gäh/ ● isa --- ● " ● 6 (0.5) + (0.5) oli +blickt zu ISA-> 7 OLI ● nei spielsch schnäll d tön\ °mein i° isa ● ordnet Dokumente zu zwei Stapeln---> 8 (0.3) 9 ISA do +lueg oli ->+schaut runter auf seine Dokumente-> Lorenza Mondada / Florence Oloff 374 10 (0.7)* ● (0.6) + isa -> ● gibt OLI einen Stapel-> isa -->*....blickt zu OLI--> oli -->+blickt zu ISA-> 11 ISA °do° 12 OLI °mh° 13 (0.2) *(0.3) # (0.5) ● * isa --> ● isa ->*schaut zu Programmbildschirm* bild #b.11 11 14 OLI *°aber° chasch schnäll/ isa *sieht nach unten--> 15 (0.1)+*(0.2) oli -->+schaut auf Dokumente->> isa -->*schaut auf Dokumente->> 16 ISA >jäjä< 17 (3.4) ● (0.2) isa ● ...linke Hand zur Maus-->> Beide Moderatoren zeigen eine Orientierung zum vorausgegangenen Abschluss des „Radiotalks“ (indem sie den Kopfhörer komplett (Oli) oder teilweise (Isa, Z. 3) abnehmen) und zur nächsten Aufgabe, jedoch mit Bezug auf unterschiedliche Materialien: Oli fragt Isa nach Tonmaterial, Isa hingegen ist weiterhin mit Textmaterial beschäftigt und führt ihren Handlungsverlauf fort, auch wenn sie Oli antwortet und einen Bezug zu seiner Frage herstellt, indem sie ihm Dokumente zeigt (Z. 4-5). Diese Asymmetrie ist durch ihre jeweilige Position im Raum bedingt: Isa hat als einzige direkten Zugang zum Mischpult, Olis Zugang zum Soundmaterial hängt also von ihr ab. Auch nach Wiederholung der Bitte (Z. 7) führt Isa ihre eigene Arbeit fort und sortiert die Papiere in zwei Stapel. Ihr Umgang mit den Dokumenten zeigt, dass sie dies Im Radiostudio arbeiten 375 nicht nur für sich, sondern auch für Oli tut, was sie wiederum verstärkt legitimiert, ihre eigene Aktivität bis zu ihrer Vollendung weiterzuführen. Isa übergibt ihm anschließend einen Stapel über die Bildschirme hinweg und zwischen den Mikrofonen hindurch (Z. 10, Bild 11). Obwohl Oli die Dokumente nimmt, formuliert er seine Frage ein drittes Mal (Z. 14). Während Isa wieder hinunter auf ihre Dokumente schaut, antwortet sie mit einem schnellen jäjä (Z. 16), was Olis Bitte als möglicherweise nicht vollkommen legitim behandelt (Stivers 2004): Wieder tritt eine positive Antwort gemeinsam mit einer anderen, nicht-alignierten Handlung auf (wie in Z. 4). Isa formatiert ihre gegenwärtige Aktivität also als etwas, das legitim Vorrang gegenüber Olis Sequenz hat, initiiert aber nach einer Verzögerung eine mögliche Antwort, da sie nach dem Blick auf den Programmbildschirm zur Maus greift (Z. 17). In diesem ersten kurzen Auszug befassen sich beide Teilnehmer mit Aktivitäten, die das nächste zu sendende Stück vorbereiten. Beide Handlungsstränge sind sequenziell organisiert und projizieren Handlungselemente, die Raum und Körper unterschiedlich in Anspruch nehmen: Isa ist manuell und visuell mit den Papieren auf Tisch und Tastatur beschäftigt, die eine gemeinsame Quelle für den weiteren Sendungsverlauf sind; Oli initiiert eine neue Handlung und formuliert eine Bitte, da das Tonmaterial betreffende Handlungen nur von Isa ausgeführt werden können. Während sie ein Recht darauf beansprucht, ihre momentane Handlung weiter- und zu Ende zu führen, beansprucht Oli ein Recht darauf, eine sofortige Antwort von ihr zu erhalten. Isas Dokumente bedecken den Arbeitsplatz auf dem Tisch und die Tastatur, was andere Aktivitäten am Bildschirm unmöglich macht, daher rivalisieren Isas und Olis Handlungen sowohl zeitlich als auch räumlich. 3.2 Scherzen: Eine andere verkörperte Nutzung des Raumes Als Isa auf Olis Bitte antworten will, initiiert er eine neue Sequenz, diesmal einen Witz. Diese Scherzsequenz ist umso interessanter, als es sich hier um eine nicht-berufliche Aktivität handelt, die keinerlei Technologie benutzt. Hier mobilisiert Oli den Raum auf ganz andere Weise als während der vorangegangenen, berufsgebundenen Tätigkeiten. Auch Isa löst ihren Bezug zum materiellen Umfeld auf und wendet sich vollständig dem Gespräch zu. Auszug 2a (Noch 3: 20 Minuten bis zur nächsten Live-Moderation) 17 (3.1) ⊥ (0.5) oli ⊥dreht sich zu ISA und lächelt--> 18 OLI weisch du/ Lorenza Mondada / Florence Oloff 376 19 (0.3)# ⊥ (2.2)# oli -->⊥lehnt sich über seinen Bildschirm-> bild #b.12 #b.13 12 13 20 OLI is⊥abe ● lle ● oli ->⊥versteckt sich hinter Dokumenten--> isa >>Maus ● L.Hand lässt Maus los ● 21 ● (0.4) isa ● nimmt Kopfhörer ab-> 22 ISA *ÄH: / ● *# isa --> ● isa *....*blickt zu OLI--> bild #b.14a/ b 23 (0.6) 14a 14b Oli schaut zu Isa (Z. 17), lehnt sich nach seiner Frage über den Bildschirm (Z. 19, Bilder 12-13), greift dann während seines summons (Z. 20) nach einigen Blatt Papier und „versteckt“ sich dahinter (Bild 14a-b). Durch diese auffällige Sequenzinitiierung zielt Oli auf Isas volle Aufmerksamkeit ab und projiziert so eventuell problematische oder intime Inhalte. Durch das Vorbeugen nutzt Oli die Mikroarme nicht als Werkzeuge, sondern als Objekte, zwischen denen man sich positionieren kann; auch ist nicht der Text auf den Papieren relevant, sondern deren Materialität - als Oberfläche, hinter der man sich verstecken kann. Isa antwortet schrittweise: Erst beim summons lässt sie die Maus los Im Radiostudio arbeiten 377 (Z. 20), nimmt ihren Kopfhörer komplett vom Kopf (Z. 21) und schaut dann zu Oli (Z. 22, Bild 14a/ b). Ihre Antwort (Z. 22) ist eindeutig auf ein Gespräch ausgerichtet, da sie sich durch ihren Blick zu Oli, beidhändiges Frisieren und Aufrichten des Oberkörpers (Bild 15) klar von arbeitsrelevanten Artefakten (Maus, Kopfhörer) abwendet. Auszug 2b (Noch 3: 13 Minuten bis zur nächsten Live-Moderation) 24 OLI i ge es ● te: / isa ● ordnet ihr Haar, blickt zu OLI--> 25 (1.1) 26 OLI heisst/ # (.) weisch was heisst ● gäll/ ● isa ● nickt ● bild #b.15 27 (0.6) 28 ISA [ah ● 29 OLI [im ● generalstab= isa -> ● arrangiert weiter Frisur, schaut runter zu Dok.-> 30 ISA =ah/ jo genau# im generalstab bild #b.16 15 16 31 OLI bi +de queer+ offi ● cers heissts in gebückter oli +blickt zu Dok.+ isa -> ● ordnet Haar, blickt zu OLI--> 32 stellung ha ha 33 ISA HUm (.) ha ha: .h: / du weisch dass⊥mir gfilmt wärde oli >>versteckt sich hinter Dokumenten⊥steht auf, lacht-> 34 gäll/ = 35 OLI =das isch dr eltischti joke und xx was/ + oli -->+Blick Dok.-> 36 ISA wür*klich/ isa ->*schaut auf Bildschirm---->> 37 OLI jo d- ● isa -> ● linke Hand auf Maus-> Lorenza Mondada / Florence Oloff 378 38 ● (1.3) isa ● ...schiebt Mikro zur Seite, Blick Programmbildsch.-> 39 OLI willkomme +im ges[trüpp + 40 RAD [((Interview-Aufnahme--->)) oli -->+blickt zu ISA+blickt auf Programmbildsch-> 41 (2.1) 42 OLI i ge es te/ im gestrüpp 43 (1.6) ● (0.2)] ● [(0.5) ● (1.5) 44 RAD >((Interview))] [((Interview-Aufnahme lauter)) isa -> ● l.Hand Vol. up ● " ● 45 [(0.9) + 46 RAD [((lautere Musik))+ oli --->+ 47 ISA eü: : 48 (0.5) Oli beginnt den Witz, indem er nach der Bedeutung der Abkürzung i Gst fragt (Z. 24). Auf seine eingeschobene Frage (Z. 26) antwortet Isa eher vage (Z. 28) und sucht unterdessen die mögliche Antwort mit einem Blick auf den Text vor sich (Z. 29, Bild 16). Isa liest auch weiter, als sie durch die Wiederholung von Olis Antwort ein Wiedererkennen signalisiert (Z. 29-30). Ihre Körperhaltung entspricht einem „body torque“ (Schegloff 1998), da sie zwar arbeitsrelevante Aktivitäten ausgesetzt hat, andererseits aber die Antwort in einem Arbeitsdokument sucht, sie ist daher sowohl im Arbeitsraum engagiert als auch körperlich von diesem abgewandt. Der eigentliche Witz besteht in der nun von Oli gelieferten Alternativinterpretation der Abkürzung bei den queer officers (Z. 31-32). Sein kurzer Blick zu den Papieren in seiner Hand stellt eine Beziehung zwischen dem Witz und dem aktuellen Arbeitsthema her. Nach kurzem gemeinsamen Blickkontakt und Lachen (Z. 31-33) lässt Oli das Dokument in seiner Hand sinken und steht auf, wohingegen Isa die Anwesenheit der Kameras erwähnt (Z. 33-34). Dies zeigt retrospektiv, dass es bei Olis Verwendung der Papiere auch um ein „Verstecken“ ging. Anschließend schaut Oli zurück zu seinen Dokumenten und normalisiert den Scherz, auch Isa wendet sich wieder Bildschirm und Maus zu (Z. 35-37). Ihre Körperhaltung wird zurück auf die Arbeit ausgerichtet, da sie das Mikro zur Seite schiebt und so freien Blick auf den rechten Bildschirm erhält (Z. 38). Die nächste Handlung zeigt gut, dass sich die Teilnehmer in einem Kontext von Multiaktivität befinden (Haddington et al. (Hg.) 2014): Oli formuliert eine weitere scherzhafte Deutung der Abkürzung und schaut kurz zu Isa (Z. 39), Im Radiostudio arbeiten 379 währenddessen aktiviert sie über den Programmbildschirm den zuvor von Oli verlangten Interviewausschnitt (Z. 40, siehe Auszug 1). Oli schaut prompt auf den gleichen Bildschirm rechts von ihm und hört sich den Auszug an, während er gleichzeitig den letzten Witz wiederholt (Z. 42). Isa dreht kurzzeitig die Lautstärke bei der Wiedergabe hoch (Z. 43-44), was darauf hinweist, dass sie den Witz nun als Störung ihrer gemeinsamen Zuhöraktivität behandelt. Durch den Witz entsteht eine Interaktion, die die gegenseitige Orientierung der Teilnehmer über den architekturierten Raum hinweg maximiert. Durch Blick und Körperhaltung distanzieren sie sich von arbeitsrelevanten Handgriffen im technischen Umfeld. Während Isa sich vom Arbeitsplatz abwendet, weiß Oli das Umfeld sowie die Materialität der Arbeitsdokumente alternativ zu nutzen, um sich zu „verstecken“ und den Scherz in seiner Relevanz hoch zu stufen. Beide wenden sich nach dem Witz jedoch relativ zügig dem Programmbildschirm zu. Dieser schnelle Übergang vom Scherz zur Arbeit hat die Mobilisierung diverser Studioelemente zur Folge. 3.3 „Back to Business“: Konfigurierung verschiedener Arbeitsplätze Nach Abschluss der Witzsequenz wenden sich die Teilnehmer wieder der Planung der nächsten Moderationselemente zu. Dieser Abschnitt zeigt, wie sie durch Körperhaltung sowie (Nicht-)Nutzung von Artefakten jeweils einen individuellen Arbeitsplatz konstituieren, auch wenn sie miteinander sprechen. Von Beginn des Ausschnitts an schaut Oli hauptsächlich auf die auf dem Bildschirm seines Laptops positionierten Dokumente (Z. 50, siehe Bild 17), Isa beschäftigt sich mit den vor ihr liegenden Papieren, kündigt durch ihr also (Z. 49) jedoch hörbar einen weiteren Arbeitsschritt an. Auszug 3 (Noch 2: 46 Minuten bis zur nächsten Live-Moderation) 49 ISA aso-\ 50 ● (0.1) ● (0.2) ● (0.15) +(0.25) isa >>Blick Dokumente-> ● schnippt ● ● rückt nach vorn auf Stuhl--> oli >>Blick Dok. auf Laptop+...Programmbildsch.3--> 51 OLI °hm: : \° 52 (0.3)+(2.4) ● (0.5)# ● (0.3) oli " Blick Dok. auf Laptop--> isa --> ● schnippt ● bild #b.17 53 ISA maches ● echli underm motto: \ #jo: ebbe ● isa ● ..Hände an Stirn--------------- ● bild #b.18 Lorenza Mondada / Florence Oloff 380 17 18 54 ISA zweitusend zwölf/ ● d akzeptanz vo: : °: : °\ (0.5) ● isa ● legt Dokumente weg--------- ● 55 ● vo homosexuelle #in uns*r gsellschaft isch isa ● ..Hände zur Tastatur, wählt Text auf Bildsch.2 aus-> *..Blick OLI--> bild #b.19 56 eiglich (.) ● disch eiglich *°rächt° höch/ ● isa --> ● ..schiebt Mikro nach rechts ● -->*..Blick Dok. links--> 57 wie sehts us .h: : : : in dr armee\ (0.5) oberscht 58 im generalstab ● be#at *steinmann\ (0.2) °wie seit isa ● Hände auf Tastatur, schreibbereit--> --->*....Blick OLI--> bild #b.20 59 me denn/ ° (0.6) OB ● erscht IM generalstab\= isa ● löscht Text, tippt ‘O’-> 19 20 60 OLI =ja= 61 ISA =+IN generalstab\= oli >+..Blick ISA--> 62 OLI =nei* IM isa -->*..Blick Bildsch.2/ Worddokument--> Im Radiostudio arbeiten 381 63 ● (0.6)+(0.2) isa > ● ...tippt in Worddok. ‘Oberst im General’-->> oli "Blick Dok. auf Laptop-->> 64 ISA (°ebbe°) 65 (1.6) 66 ISA ● °sta: : b° ● # isa ● tippt ‘stab’ ● bild #b.21 21 22 67 *(0.2) ● (0.2) isa >*..Blick Dok. links, Blickwechsel Dok./ Word->> ● tippt ‘Beat’-> 68 #bea ● t (.) ● st: : °ein⊥mann\° ● isa --> ● ● tippt ‘Steinmann’ ● oli ⊥..lehnt sich zurück--> bild #b.22 69 ● (0.5) ● (1)⊥+(0.15) ● (0.35) ● isa ● tippt ‘wie’ ● ● löscht ‘wie’ ● oli -->⊥+..Blick Programmbildschirm->> 70 ISA H: : 71 (0.8) ● (0.5) isa ● tippt ‘- Sie sind’-->> 72 ISA °s: : ie s[ind\°] Beide Teilnehmer konstituieren hier sicht- und hörbar Displays konzentrierter, individueller Arbeit. Oli wirft einen kurzen Blick zum Programmbildschirm rechts von ihm und lässt ein langgezogenes hm ertönen (Z. 49-51), Isa schnippt mit den Fingern der rechten Hand, rückt an den Schreibtisch heran, beugt sich tiefer zu ihren Papieren, stützt ihre Unterarme am Schreibtisch ab und schnippt erneut, diesmal mit beiden Händen (Z. 49-52, Bild 17). Der Arbeitstisch wird durch die Nichtnutzung des Equipments (Papierdokumente, die Tastatur und Bildschirm abdecken) zum „Leseplatz“. Diese kurze Arbeitsphase führt zu einem Vorschlag, den Isa im Plural formuliert und daher auch Lorenza Mondada / Florence Oloff 382 eindeutig an Oli adressiert (Z. 53), auch wenn ihre zur Stirn geführten Arme das Display des konzentrierten Nachdenkens aufrecht erhalten (Bild 18). Sie formuliert den Beginn einer möglichen Anmoderation des Interviewausschnittes (Z. 54-58). Während des Redebeitrags löst sich Isa immer mehr aus ihrer vorherigen Haltung und geht dazu über, das technische Equipment um sie herum zu nutzen: Sie legt zunächst die Papiere links von sich ab (Z. 54), führt ihre Hände zur nun freigewordenen Tastatur und wählt den dort bereits geschriebenen Text aus (Z. 55, Bild 19). Isas verwandelt so ihren „Leseplatz“ wieder in einen informatischen Arbeitsplatz, da die informatischen Geräte wieder nutzbar sind. Sie schiebt das vor ihr hängende Mikro nach rechts, so dass sie freien Blick auf die Papiere links und das PC-Dokument hat (Z. 56-58, Bild 20). Obwohl Isa ihre Hände startbereit auf der Tastatur positioniert, blickt sie nun zu Oli und initiiert eine Reparatursequenz bezüglich des militärischen Titels der interviewten Person (Z. 58-59). Parallel hierzu löscht sie den ausgewählten Text im Textdokument und beginnt zu tippen (Z. 59). Auch wenn Oli jetzt zu ihr aufschaut (Z. 61), entsteht kein gemeinsamer Arbeitsraum, da Isa durch ihre Körper- und insbesondere Handhaltung eine permanente Orientierung zu ihrem Computerarbeitsplatz und dem dort geöffneten Dokument zeigt. Der gegenseitige Blick endet mit der Reparatursequenz, da beide sich wieder ihren jeweiligen Dokumenten zuwenden (Z. 62-63). Nachdem Isa die richtige Titelbezeichnung von Oli erfahren hat, fährt sie damit fort, den Text einzugeben. Diese private Arbeitsphase wird durch den parallel zum Tippen gesprochenen Text sowie durch ihren zwischen Papier und Bildschirm hin- und hergehenden Blick gut veranschaulicht (Z. 63-72, Bild 21-22). In diesem Abschnitt ist zu sehen, wie die Teilnehmer ihren Arbeitsplatz lokal transformieren können und dies sowohl durch Körperhaltung, (Nicht-)Benutzung bestimmter technischer Elemente sowie verbal füreinander anzeigen. Beim „Leseplatz“ geht es dabei nicht nur um die Nicht-Benutzung der technischen Ausstattung, sondern insbesondere um deren Zweckentfremdung (Laptopbildschirm als Lesepult, Tastatur als Papierablage). Für den „Schreibplatz“ am Computer wird momentan nicht relevantes Equipment wie das Mikro bewegt, um die Sicht auf das für den nächsten Arbeitsschritt relevante Material freizugeben. Der Arbeitsplatz am Tisch wird hier eindeutig nicht als „Sendeplatz“ konfiguriert und genutzt. 3.4 „Bitte nicht stören“: Das Studio als Arbeitsraum, nicht als Interaktionsraum Im nächsten Arbeitsschritt widmen sich Isa und Oli einer Internetrecherche bezüglich des neuen Moderationsthemas. Interessant ist hier nicht nur, wie sie weiterhin das Studio als individuellen oder gemeinsamen Arbeitsraum Im Radiostudio arbeiten 383 konfigurieren, sondern auch, wie der Raum während eines Kollegenbesuchs im Studio konfiguriert wird. Im folgenden Ausschnitt lösen sich die Moderatoren weder verbal noch körperlich von den Vorbereitungen auf die näher rückende Moderation, so dass dem Smalltalk mit dem Kollegen wortwörtlich kein Platz gewährt wird. Zwar ist der Studioraum als solcher für Interaktionsmöglichkeiten mit Kollegen konzipiert, solange vor der Tür grünes Licht leuchtet, jedoch werden diese Interaktionsmöglichkeiten dann aktiv von den in diesem Raum Arbeitenden geformt. Dass nur noch wenig Zeit bis zur kommenden Moderation verbleibt, drückt sich hier in der Nicht-Herstellung eines Interaktionsraumes mit der hereinkommenden Person aus. Auszug 4 (Noch 2: 15 Minuten bis zur nächsten Live-Moderation) 72 ISA °s: : ie s[ind\°] 73 OLI [+isch das] eigentlich international (.) isa >>tippt‘-Sie sind Präsident vom’--> oli -->+..Blick ISA--> 74 dr coming out day\ °scho jo/ ° ● 75 (0.2) ● (1.1) ● + isa --> ● greift zur Maus ● oli -->+ 76 ISA ⊥ich han nid mol gwüsst das es de git\ oli ⊥..nimmt Dok. vom Laptop weg-> 77 (0.8)*#(0.4) isa *klickt, neue Webpage-> bild #b.23 23 24 78 OLI jetz weischs 79 (0.8)⊥#(0.2) ● (2.2) ● (3.4) ● (2.2)%(2)*(0.4) ● #(0.4)* oli -->⊥Hände zur Tastatur, arbeitet an Laptop--> isa ● tippt ● ..Hand zur Maus-->> --> ● Google Ergebnisse ● Wikipedia> -->Blick Bildsch.2-*Kopf zu KOL" Lorenza Mondada / Florence Oloff 384 kol %..tritt ins Studio--> %..Blick mob. Kamera-> bild #b.24 #b.25 80 ISA morge/ % isa >Blick Bildsch.2--->> kol -->% 81 (1.3) 82 KOL z’sam%me %Studiotür schließt sich oli >Blick Laptop-> 83 +(0.8) # + (0.2)+ oli >+..Blick KOL"+ bild #b.26 25 26 84 OLI (von: dr UNI/ )# bild #b.27 85 (0.8) 86 ISA am wieviel-/ ah ⊥oktober elfter ja\ oli ⊥....Hände zum Kopfhörer-> 87 (0.3) 88 ISA au ● (.) inter+nationa⊥li\# isa -> ● schließt Wiki, zurück zu Worddokument--->> oli >Blick Laptop-+..Blick KOL--->> -->⊥Kopfhörer auf Kopf-->> bild #b.28 27 28 Im Radiostudio arbeiten 385 Während Isa sich noch hörbar der Redaktion ihrer Anmoderation widmet (Z. 72), löst Oli seinen individuellen Arbeitsraum auf, indem er sich auf dem Stuhl zurücklehnt, die Hände auf der Tischplatte ablegt sowie nach rechts zum Programmbildschirm schaut, was sich verbal in seiner an Isa gerichteten Frage manifestiert (Z. 73). Isa setzt daraufhin ihre Schreibtätigkeit aus, greift zur Maus (Z. 75) und beginnt, die Frage über eine Internetrecherche zu beantworten (Z. 77, Bild 23), wodurch ein weiterer informatischer Arbeitsraum relevant gemacht wird. Sie klickt sich durch verschiedene Seiten, gibt eine Suchanfrage nach dem „Coming Out Day“ ein (Z. 79) und kommt schließlich zum entsprechenden Wikipedia-Eintrag. Die für Rechtshänder unpraktische Position der Maus (Bild 23) zeigt, dass die Nutzung des virtuellen Arbeitsraumes üblicherweise eher kurz bzw. punktuell ist. Oli modifiziert nun seinerseits seinen Arbeitsplatz. Er legt die Papiere vor seinem Laptop-Bildschirm zur Seite (Z. 76-78) und führt seine Hände zur Tastatur (Z. 79, Bild 24), was eine Texteingabeaktivität projiziert. Als die Tür des Studios aufgeht und ein Kollege hereinkommt (Z. 79, Bild 25), sind beide Moderatoren also sichtbar in ihren individuellen Arbeitsräumen positioniert. Isa wendet ihren Blick zwar kurz vom aufgerufenen Wikipedia- Eintrag ab (Z. 79, Bild 25), lässt aber ihre rechte Hand an der Maus. Dieser „body torque“ (Schegloff 1998) projiziert eine schnelle Wiederaufnahme der Hauptaktivität: Bei ihrer minimalen Begrüßung blickt Isa bereits wieder auf den Bildschirm (Z. 80). Oli hebt erst deutlich nach dem Gruß den Kopf und blickt zum Kollegen (Z. 82-83, Bild 26), auch er lässt jedoch seine Hände auf der Tastatur ruhen. Als Oli ihm in minimaler Form die Anwesenheit der Person mit der mobilen Kamera im Studio erklärt (Z. 84), schaut auch er bereits wieder auf seinen Bildschirm. Dass das Studio insbesondere in diesem Moment von den Moderatoren klar als Arbeitsraum konfiguriert ist, illustrieren ihr verbaler Minimalismus und ihre körperlichen Displays auch im weiteren Verlauf. Isa vertieft sich in ihre Internetlektüre und stützt ihr Kinn mit der linken Hand ab, wodurch sie sich klar von eventuell von links kommenden Redebeiträgen abschottet (Z. 84, Bild 27). Dann beginnt sie, laut aus dem Wikipedia-Eintrag vorzulesen (Z. 86, 88) und schließt so die von Oli initiierte Frage-Antwort-Sequenz ab. Währenddessen schließt sie den Internetbrowser und kehrt zum Textdokument zurück, ohne zum Kollegen zu blicken (Z. 88, Bild 28). Auch Oli manifestiert keine Verfügbarkeit für ein Gespräch, da er zum Kopfhörer greift (Z. 86) und ihn auf den Kopf setzt (Z. 88, Bild 28). Zwar schaut er kurz in Richtung Tür und somit zum Kollegen, projiziert aber durch das Aufsetzen des Kopfhörers eindeutig die nahende Moderationsphase bzw. manifestiert nur eine partielle Verfügbarkeit. Dies stellt für den Kollegen eine letzte Möglichkeit dar, eventuell das Wort an Oli zu richten; diese wird aber nicht genutzt, da er kurz darauf das Studio verlässt. Lorenza Mondada / Florence Oloff 386 Durch eine sichtbare Fokussierung auf ihren jeweiligen Arbeitsplatz und ihre aktuelle Aufgabe (Internetrecherche) stellen Isa und Oli eine reduzierte Verfügbarkeit für ein Gespräch mit ihrem Kollegen zur Schau. Das Studio wird von ihnen klar als Arbeitsraum konfiguriert, der für Interaktionen, die für den Vorbereitungsprozess nicht relevant sind, nicht zur Verfügung steht. Die gegen Ende hergestellte Verbindung zwischen Körper und technischer Ausstattung des Studios (Olis Griff zum Kopfhörer, Z. 86) projiziert die nächste Transformation in einen phonisch abgeschlossenen und für verbale Interaktionen daher noch stärker eingeschränkten Raum. 3.5 Planung des Einstiegs: Verringerung des Gesprächsraums und Transformation in einen Senderaum Bereits während ihr Kollege das Studio verlässt, wenden sich die Moderatoren wieder der kollektiven Planung der nächsten Sendungselemente zu. Weniger als zwei Minuten vor der nächsten Livemoderation sind letzte Gesprächssequenzen mit minimaler gegenseitiger Orientierung und Vorbereitung der Studioausstattung miteinander verflochten und führen so langsam zur Herstellung eines „Senderaums“. Auch wenn die Nutzung technischer Geräte (Mikro, Mischpult, Kopfhörer) einen wichtigen Bestandteil der Konstituierung verschiedener Räume darstellt, ziehen die Teilnehmer keine scharfen Grenzen zwischen deren Nutzung und Nicht-Nutzung, sondern vollziehen diese schrittweise. Auszug 5a (Noch 1: 50 Minuten bis zur nächsten Live-Moderation) 89 ● (0.8) isa ● ...positioniert sich neu vor Bildsch.3-> oli >>--Kopfhörer auf Kopf->> 90 ISA ä: hm/ ● isa --> ● 91 %(0.4) ● (0.3)#(0.3-----------) ● (0.5) kol %dreht sich zur Studiotür--> isa ● .dreht Kopf nach links• bild #b.29a/ b 29a 29b Im Radiostudio arbeiten 387 92 ISA #H: : \%+ wie mache mers/ isa >Blick Bildsch.3--> oli +...Blick ISA--> kol -->%öffnet Studiotür & geht hinaus--> bild #b.30 93 (0.4)+(0.9) oli -->+ 94 ISA #söll isöll i[ch*die: ] 95 OLI [i *mach e+n ii]stig\ isa --->*Blick OLI--> oli +...Blick ISA--> bild #b.31 30 31 96 (.) 97 ISA du machsch en iistig\ (.) und denn was mach- 98 de erschte %ton/ kol -->% 99 (0.35)+(0.55) oli "Blick auf Dokumente/ Laptop--> 100 OLI ja\ 101 ⊥*(0.2)⊥ ● (0.6) ● (1.6) *(1.1) oli ⊥nickt-⊥ isa *..Blick Bildsch.2/ Worddokument*Blick Papier links-> ● ..positioniert sich neu, Hände zur Tastatur-> ● Vorbereitung Schreiben, murmelt--> 102 ISA *queer officers heissts\ gäll/ isa *...Blick OLI--> 103 (0.5)⊥(0.6)⊥ oli ⊥nickt⊥ 104 OLI +* ● queer heisst schwul ● °uf *englisch° oli +..Blick ISA--> isa ● Texteingabe Dok. Bildsch.2 ● >*..Blick Bildsch.2, Blickwechsel Bldsch.2/ Papier—> *nickt--> Lorenza Mondada / Florence Oloff 388 105 (0.4)*+(2.7) oli " isa -->* 106 ISA *°mer wüsse nid *wie (ma queer schribt)\° isa *..Blick OLI---*Blick Bildsch.2/ Papier--> 107 (0.6) 108 ISA °von° queer officers: : \ °vom: : ° 109 ● (1.1) isa ● R Hand greift nach Maus Bildsch.2, bewegt Cursor-> ● 110 ISA °°vom ver•ein\°° Obwohl Isas ähm einen Redebeitrag projiziert, folgt eine Pause von 1.5 Sekunden, in der Isa ihren Kopf schnell nach links in Richtung des Kollegen dreht (Z. 91, Bild 29a/ b), als ob sie ein plötzliches Geräusch wahrgenommen hätte. Dadurch entsteht der Eindruck, dass Isa die Präsenz des Kollegen als potenzielle Störung behandelt bzw. darauf wartet, dass dieser das Studio verlässt, was durch die Abwesenheit eines verbalen Austausches zwischen den beiden noch verstärkt wird. So konfiguriert Isa das Studio als Raum der konzentrierten Arbeit, in dem für weitere Personen und Interaktionen im wahrsten Sinne des Wortes kein Platz ist. Als sie schließlich fragt, wie bei der weiteren Planung vorzugehen sei (Z. 92), schaut sie auf den Programmbildschirm und hebt dabei die linke Hand (Bild 30). Dieser „erhobene Zeigefinger“ unterstreicht einerseits die Dringlichkeit, andererseits den planerischen und konzentrierten Charakter der von ihr initiierten Sequenz - was möglicherweise auch mit der momentanen Präsenz des Kollegen im Studio in Verbindung steht. Der späte Blickkontakt (Z. 95) weist darauf hin, dass die Moderatoren hier nur eine minimale fokussierte Interaktion projizieren. Olis Vorschlag, die Anmoderation (iistig) zu übernehmen, wird von Isa wiederholt und dann mit der Frage weitergeführt, ob er sich ebenfalls um die Einführung des ersten Interviewausschnitts kümmern wird (Z. 97-98). Die von Isa initiierte Sequenz wird mit Olis minimaler Antwort und einem kurzen Nicken abgeschlossen (Z. 100- 101), zuvor hat er bereits wieder zu seinem Laptop bzw. den darauf befindlichen Papieren geschaut, was einen Rückzug in den privaten Arbeitsraum projiziert (Z. 99). Nach Olis Antwort wendet sich auch Isa wieder ihrem persönlichen „Schreibraum“ zu, bringt ihre Hände auf der Tastatur in Position, murmelt einige zukünftige Textelemente und schaut nochmals zum Papierdokument links von ihr (Z. 101). Die Moderatoren interagieren hier nur mit kurzem und minimalem Fokus und ziehen sich jeweils schnell wieder in ihren individuellen Arbeitsraum zurück. Auch auf die nächsten Redebeiträge antworten sie entweder nur minimal (durch Nicken, Z. 102-104) oder gar Im Radiostudio arbeiten 389 nicht (Z. 106-107). Die Fokussierung auf den Vorbereitungsprozess drücken beide also durch die Reduktion des Mündlichen und des Blickkontakts sowie durch die Fortführung der individuellen Arbeit aus (Z. 107-114). Auszug 5b (Noch 1: 27 Minuten bis zur nächsten Live-Moderation) 111 (1.6) ● (0.3) isa ● R.Hand greift nach Maus, beginnt zu schreiben-> 112 ISA queer o ffi cer+s: : / oli -->+ 113 (1.3) 114 ● (1.4)⊥(1.5----)#+(2.1) ● ⊥ isa ● tippt Text, murmelt Text beim Schreiben• oli ⊥..zieht Mikro zu sich⊥ +..Blick zu ISA--> bild #b.32 115 (4.2) 116 OLI (jo) ich mach *relativ vil gäll/ °worschis jä° isa -->*...Blick zu OLI--> 117 (0.5) 118 ISA was machsch du/ 119 (1.1) 120 ISA he/ 121 (0.3) 122 OLI mach relativ/ viel: °i verzell dr no 123 schnäll° aber\ 124 (0.3)* isa -->* 125 ISA *aber [i] aber ● i tue%dr *ton#= 126 OLI [easy\] isa *..Blick Bildsch.3-------*Blick zu OLI--> isa ● klickt Maus Bildsch.3, Pop-up %Musik im Studio auf stumm bild #b.33 127 OLI =jA[jA* 128 ISA [ i*füere= isa -->* 129 OLI =jaja/ 130 (.) 131 ISA ebbä\ Lorenza Mondada / Florence Oloff 390 32 33 Die Transformation eines Schreib- und Leseplatzes hin zu einem „Sendeplatz“ wird auch darin sichtbar, dass Oli nun das rechte Mikrofon zu sich zieht (Z. 114, Bild 32). Sie wird aber nicht schlagartig, sondern schrittweise vollzogen, da Oli seit Beginn des Auszuges den Kopfhörer auf dem Kopf positioniert hat (und nicht bereits auf den Ohren) sowie noch eine kurze Gesprächssequenz einleitet (Z. 116). Die anschließende Reparatur (Z. 118) zeigt, dass Isa sich eher auf ihre eigene Redaktionsarbeit zu konzentrieren scheint, auch wenn sie dabei ihren Blick zum Moderationspartner richtet (Z. 116-124). Sie geht auch nicht auf Olis inhaltlich vage Aussage ein, sondern vergewissert sich lediglich, dass sie den ersten Interviewausschnitt anmoderiert (Z. 125, 128). Hierbei klickt Isa auf den Programmbildschirm und stellt die Musik, die aktuell im Radio läuft und im Studio zu hören ist, auf stumm. Die Unterdrückung der Geräuschkulisse modifiziert den hörbaren Raum des Studios in zweierlei Hinsicht: Einerseits wird einer letzten verbalen Koordinierung der komplette Klangraum zugesprochen, andererseits stellt die Kontrolle des Mischpults einen weiteren Schritt hin zur Nutzung des Studios als Senderaum dar. Die Dringlichkeit der Planung mit Hinblick auf die nächste Sendephase zeigt sich auch in Isas „aber“ sowie in ihrer erhobenen, nach oben gedrehten Handfläche (Z. 125, Bild 33). Auszug 5c (Noch 1: 02 Minuten bis zur nächsten Live-Moderation) 132 ● (0.4) ● %(1.6) isa ● Mausklick Bildsch.3, schließt Pop-up >>mute%...Musik im Studio wieder hörbar-> ● .....setzt Kopfhörer auf--> 133 OLI +und*dr ● #zweiti au no\ ● # oli +..Blick ISA--> isa *..Blick OLI--> --> ● schiebt Kopfhörer zurück ● bild #b.34 #b.35 Im Radiostudio arbeiten 391 34 35 134 ● (0.2) isa ● setzt Kopfhörer wieder auf--> 135 ISA ● °jä° ● + isa ● nickt ● oli " 136 (0.6)* ● (0.1) isa -->*...Blick Bildsch.3-->> --> ● Kopfhörer auf Kopf, linkes Ohr frei-->> 137 OLI +und de gömmer eifach usen\ oder/ oli +.....Blick ISA--> 138 (0.3) 139 ISA ●°° mhm\°° ● + isa ● nickt-- ● oli -->+ 140 +(0.5) ● (1.3) oli +..blickt nach rechts->> isa ● Klick Pop-up Bildsch.3, arbeitet an Tracklist>> 141 OLI UH: : \# bild #b.36 36 Nach Abschluss der Reparatursequenz klickt Isa wieder auf den Programmbildschirm und schaltet den Ton der Radiosendung im Studio wieder ein (Z. 132). Sie greift dann zum Kopfhörer und verwandelt so ihren Schreibin einen Sendeplatz (Z. 132-133, Bild 34). Die Unterscheidung zwischen gemeinsamem Arbeitsraum und Senderaum wird hier besonders deutlich, als Isa nach Olis Redebeitrag (Z. 133) zu ihm aufschaut, gleichzeitig aber ihren Kopfhörer Lorenza Mondada / Florence Oloff 392 wieder nach hinten rückt (Bild 35). Dieser „Techno-Torque“ (Mondada/ Oloff i.Dr.) wird schnell aufgelöst. Bereits vor ihrer Antwort hat Isa den Kopfhörer wieder aufgesetzt und sich so sichtbar einem gemeinsamen Gesprächsraum entzogen (Z. 134-135) - zumindest teilweise, da der Kopfhörer zwar auf ihrem Kopf sitzt, ihre linke Ohrmuschel jedoch nicht bedeckt (Z. 136, siehe Bild 36). Somit zeigt sie, dass der Raum für Gespräche nur noch begrenzt offen ist, was sich auch in ihrem konstanten Blick zum Programmbildschirm sowie ihrer minimalen Antwort auf Olis Vorschlag widerspiegelt (Z. 137-139). Auch Oli kehrt zur konzentrierten Vorbereitung zurück (siehe sein hörbares „doing thinking“, Z. 141). Die Moderatoren befinden sich nun in einer klaren Vorstufe zum baldigen Sendungsbeginn, beide haben den Programmbildschirm im Blick und den Kopfhörer zumindest teilweise aufgesetzt (Bild 36). Hier wird der Studioraum Schritt für Schritt von einem halb-öffentlichen Arbeitsraum in einen geschlossenen Senderaum verwandelt. Zunächst schließen die Moderatoren weitere Teilnehmer aus, indem sie sich sicht- und hörbar ihrem Schreibtisch und der weiteren Planung zuwenden. Diese Planungsphase zeichnet sich durch eine gewisse Dringlichkeit aus: Kurzer Blickkontakt, der oft noch vor Sequenzende wieder abgebrochen wird, kurze Gesprächssequenzen mit minimalen, oft nur sichtbaren Antworten, schnelle Rückorientierung zum individuellen Arbeitsplatz. Diese abnehmende Durchlässigkeit für Interaktion zeigt sich auch in der hier beginnenden Verbindung der Teilnehmer mit den technischen Artefakten des Studios. So erschaffen Isa und Oli hier nicht nur räumlich, sondern bald auch phonisch getrennte Arbeitsplätze, die sie für die Live-Moderation benötigen. 3.6 Ein letzter Wortwechsel ohne gegenseitiges Hören: Wiederholte summons vor der Übertragung Beide Moderatoren haben nun Kopfhörer auf und sind auf ihre individuelle Vorbereitung fokussiert. Jetzt, da der Moment der nächsten Live-Übertragung weniger als eine Minute entfernt ist, wird die Klangarchitektur des Studios von ihnen genutzt, um sich ganz auf den Radioklang zu konzentrieren und sich vom akustischen Umfeld des Studios zu isolieren. Auszug 6a (Noch 0: 55 Minuten bis zur nächsten Live-Moderation) 142 (2.5------------------) ● (1.1----------------) ● isa >>fügt Track ein Bildsch.3 ● ● LHand setzt Kopfh. auf l.Ohr ● ● RHand stößt Mikro nach vorn ● Im Radiostudio arbeiten 393 143 +(0.4) (0.6) ● +(1.5------------)+(0.3)* ● oli +....blickt zu ISA--—> oli +zieht Mikro runter+ setzt Kopfh. auf--> isa ● zieht Mikro runter, stellt es ein ● isa *Blick Bsch.3-> 144 # (1.0) # (0.6) ⊥+ oli -->⊥ oli ----->+blickt auf seinen Bildsch.-> bild #b.37 #b.38 37 38 Isa fügt einen neuen Track auf dem Programmbildschirm ein, rückt den Kopfhörer zurecht, so dass das linke Ohr nun vollständig bedeckt ist, und positioniert das Mikro vor ihren Mund (Z. 142). Diese letzten Handgriffe bereiten die imminente Anmoderation vor und projizieren kein weiteres Sprechen im Studio. Sie erreichen auch eine beinah vollkommene Trennung von der Klangumgebung des Studios und verbinden Isa mit dem gesendeten Klang. Oli schaut zu Isa, er passt ebenfalls die Ausrichtung seines Mikrofons vor sich an und setzt sich den Kopfhörer richtig auf (Z. 143, Bild 37-38). Sie bereiten sich also zum gleichen Zeitpunkt auf die nächste Sendephase vor: Beide schauen nun auf den Bildschirm jeweils vor ihnen, auch auditiv sind sie nicht mehr mit dem Studio, sondern bereits mit dem Radio verbunden. Als Isa ein neues Fenster auf dem Programmbildschirm öffnet, dreht sie sich zu Oli, was zeigt, dass diese Handlung eine Entscheidung von beiden Teilnehmern erfordert. Die Aktivierung des Fensters projiziert noch ein Gespräch im Studio vor dem Gespräch auf Sendung. Isas wiederholte summons zeigen, wie schwierig weitere Gespräche einzufügen sind, wenn der nächste Sendeabschnitt definitiv projiziert wurde. Auszug 6b (Noch 0: 49 Minuten bis zur nächsten Live-Moderation) 145 (1) ● (3) *(0.2) Ø * ● (0.4) Ø (0.6) ● (0.8) ● isa ● Pop-up Bildsch.3 ● ØKopfhörer weg vom l. OhrØ --->*OLI---*Blick Bildsch.3--> ● hebt l.Hand ● Lorenza Mondada / Florence Oloff 394 146 ● #(0.2---) ● (2-------) ● (0.9-------) ● isa ● schnippt- ● LHand hoch ● senkt l.Hand ● bild #b.39 147 ISA oli/ 148 (0.8) ● (0.5---) ● *(0.5) ● (0.2)* (1.1) isa ● hebt l.H ● schnippt ● ------>*Blick OLI-----*beugt sich nach links-> 39 40 149 ISA #.TS #OLI\ bild #b.40 #b.41 150 (0.9)*(0.7) *(1.1) isa -->*Bsch.3*Beugung weiter n. links, schaut zu OLI-> 151 ISA O: : LI(h): / # bild #b.42 152 (0.9) ● (0.2) ● (0.4)*(0.6---------)*(0.2) isa ● schnippt ● -->*Blick Bildsch3*zu OLI--> 153 ISA O: LI: 154 (0.6)+(0.2) ● (0.6) ● #⊥(1.2)⊥*# oli +schaut zu Isa u. beugt sich zu ihr--------> ⊥nimmt Kopfhörer teilweise ab⊥ isa ● LHand winkt ● " bild #b.43 #b.44 41 44 43 42 Im Radiostudio arbeiten 395 Isa konzentriert sich auf das Mischpult und aktiviert ein Fenster (Z. 145), mit dessen Hilfe sie die Reihenfolge des zu sendenden Materials abändern kann. Während sie noch auf den Bildschirm schaut, befreit sie ihr linkes Ohr vom Kopfhörer und hebt ihre linke Hand (Bild 39). Diese beiden Gesten projizieren einen imminenten Austausch mit Oli. Da das Pop-up-Fenster geöffnet bleibt, kann angenommen werden, dass es für Isa eine Entscheidungsgrundlage ist, aufgrund derer sie sich mit Oli zu besprechen sucht. Oli jedoch schaut zu diesem Zeitpunkt nicht zu Isa, da er damit beschäftigt ist, sein Kopfhörerkabel zu entwirren (Bild 39). Isa eröffnet erneut die Interaktion mit Oli mit Hilfe eines ersten summons (Z. 147), gleichzeitig hebt sie ihre linke Hand, schnippt nochmal mit den Fingern (Z. 146, 148) und lehnt sich, Oli mit dem Blick fixierend, nach links (Bild 40). Sie reagiert auf Olis fehlende Antwort mit einem zweiten, lauteren summons (Z. 149, Bild 41). Oli antwortet immer noch nicht, was einen dritten summons, eine deutlichere Bewegung Isas nach links sowie weiteres Fingerschnippen zur Folge hat (Z. 151-152, Bild 42). Nach einem vierten summons (Z. 153) schaut Oli endlich auf, beugt sich zu ihr vor und nimmt nach ihrem Winken (Bild 43) den Kopfhörer teilweise ab (Bild 44). Dieser wiederholte summons ist interessant mit Hinblick auf die Einschränkungen einer nicht nur sichtbaren, sondern auch akustischen Architektur. Da beide Teilnehmer ihre Klangumgebung von der Geräuschkulisse des Studios „wegorganisiert“ haben sowie durch ihre auditive Nicht-Verfügbarkeit die nächste Aufgabe „auf Sendung“ projizieren, hat ein summons nur schwer Erfolg. Isa organisiert diesen sowohl verbal (ihren Moderationspartner beim Namen rufend) als auch sichtbar (durch Blickrichtung, zur Seite Lehnen, Schnipsen, Winken). Diese Organisation des summons berücksichtigt die Studioarchitektur, da Isa sich zwischen den Bildschirmen und Mikrofonarmen positioniert, um den besten visuellen Zugang zu Oli zu haben. Als Oli endlich als Rezipient zur Verfügung steht, teilt Isa ihm mit, dass sie etwas vom Interviewmaterial zu schneiden gedenkt, und bittet um seine Zustimmung (Z. 155). Auszug 6c (Noch 0: 25 Minuten bis zur nächsten Live-Moderation) 155 ISA ich nimm d- +(.) ich nimm dings use gäll/ oli ----->+Blick Bildsch.3-------> 156 ● (0.9) isa ● Rechte Hand zur Maus--> 157 OLI wi+so/ (0.2) lä[ngts nid/ ] 158 ISA [wills nid ] längt\+ oli ->+blickt zu ISA" Lorenza Mondada / Florence Oloff 396 159 *⊥# (1.8) ● # (0.3) ● (1.6) * oli ⊥lehnt sich zurück----> isa *dreht sich nach rechts, schaut auf Bildsch.3* ● klickt, schließt Pop-up ● ● setzt Kopfhörer wieder auf l. Ohr ● bild #b.45 #b.46 45 46 160 OLI *aber chasch ihn jo au ⊥vor- isa *Blick Bildsch.2-------> oli ⊥LHand formt Trichter->⊥Z.165 161 (0.25) 162 OLI I*SABE ● lle/ ● isa ->*Blick OLI--> isa ● hebt Kopfhörer vom linken Ohr ● isa ● steht auf, Neupositionierung auf Stuhl-> 163 (0.15) 164 OLI chasch ihn jo au# (.) abbreche (.) bild #b.47 165 chum\⊥ *(0.4) ● goht me ums isa ---> ● isa ->*schaut auf Bildsch.3-> 166 (2) ● (1.5----)⊥(1.1) ● ⊥(0.5) ⊥(0.5) isa ● Klickt: Pop-up & Track----- ● oli ⊥L. Hand auf Kopfh.⊥Kopfh. auf⊥ 167 ● (0.9---------------------) ● (0.4) isa ● setzt Kopfhörer auf l. Ohr ● 168 ⊥(1) ● (0.4) ● (2.4-------------)⊥ ● (0.3)⊥(2.2)# (1) oli ⊥setzt Kopfh. auf linkes Ohr-⊥rotes Licht, Musik aus⊥ isa ● schließt Pop-up ● dreht sich zu Dok. ● Dok.vor sich> bild #b.48 169 OLI jetz isches zit/ (0.3) nün minute vor de halber achti Im Radiostudio arbeiten 397 47 48 Sobald Oli sie anschaut, teilt Isa ihr Vorhaben mit, worauf er mit einem Blick zu ihr, dann auf den Programmbildschirm rechts von ihm antwortet (Z. 155). Er antwortet nach einer Verzögerung (während derer Isa ihre rechte Hand zur Maus führt, was eine Handlung auf dem Programmbildschirm projiziert, Z. 156-157). Isa behandelt Olis verkörperte Antwort (er lehnt sich zurück, weg vom Bildschirm, 159) als eine Zustimmung und schließt das Popup-Fenster, das seit dem ersten summons geöffnet war (siehe Z. 145). Olis Zurücklehnen sowie Isas Zurechtrücken des Kopfhörers zeigen den Sequenzabschluss an (Z. 159). Solange Isa zu Oli schaute, war ihr Ohr nicht vollständig vom Kopfhörer bedeckt (Bild 45), was ihre Verfügbarkeit für weiteres Sprechen aufgezeigt hat („Techno-Torque“, Mondada/ Oloff i.Dr.), nun hingegen ist ihr Blick auf den Programmbildschirm gerichtet (Bild 46). Beide Teilnehmer sind jetzt wieder auf ihre individuelle Arbeit und die Sendung (in jetzt noch 23 Sekunden) konzentriert, obschon Oli seinen Kopfhörer noch nicht wieder komplett aufgesetzt hat (sein linkes Ohr ist seit Z. 156 unbedeckt). Er greift mit einem aber die vorangegangene Verhandlung wieder auf (Z. 160). Da Isa keinen Blickkontakt herstellt, ruft er laut ihren Namen und formt mit seiner linken Hand einen Trichter vor dem Mund (Z. 161-162, siehe Bild 47). Isa antwortet sofort, indem sie zu Oli schaut, den Kopfhörer vom linken Ohr hebt und sich kurz von ihrem Stuhl erhebt (Z. 162). Da sie nunmehr als Rezipientin verfügbar ist, formuliert Oli seinen Gegenvorschlag, auf den Isa mit einem erneuten Blick zum und Klick auf dem Programmbildschirm antwortet (Z. 164-166). Beide behandeln die Sequenz als beendet und setzen ihre Kopfhörer wieder vollständig auf (Z. 166-168), Isa wendet sich den Dokumenten zu, die sie bereits zu Beginn der Episode genutzt hatte. Dann aktiviert Oli sein Mikro (Z. 168, 3.5 Sekunden vor der Live-Übertragung) und deaktiviert den Ton im Studio, so dass der Radiosound nur über die Kopfhörer übertragen wird. Schließlich sind beide Teilnehmer voll auf die beginnende Live-Übertragung konzentriert. Sobald das Lied zu Ende ist (siehe auch die dunkle Linie oben auf dem Programmbildschirm, Bild 48), beginnt Oli die Moderation mit der Zeitangabe (Z. 169). Lorenza Mondada / Florence Oloff 398 4. Fazit In der Einzelfallanalyse wurde beschrieben, wie die Radiomoderatoren innerhalb von dreieinhalb Minuten ihre nächste Live-Moderation vorbereiten. Wir haben gezeigt, dass sie in diesem Zeitraum unterschiedliche Aktivitäten durchführen, wie z.B. alleine arbeiten, scherzen, zusammenarbeiten, sich auf die unmittelbare Live-Übertragung konzentrieren, eine letzte Kontrolle des Tonmaterials machen usw. Diese Aktivitäten zeichnen sich durch eine jeweils spezifische Nutzung der Umgebung, der Architektur, des Raums, der technischen Geräte und anderer Artefakte aus. Diese spezifische Mobilisierung konfiguriert das Studio als einen individuellen oder gemeinsamen Arbeitsplatz, einen professionellen oder eher persönlichen und privaten Raum, als einen Arbeitsplatz, der auf Gespräch oder auf Klangmaterial fokussiert ist usw. Die Eigenheiten der Studioarchitektur werden also durch die Mobilisierung der räumlichen Merkmale innerhalb der situierten Handlung sowohl genutzt als auch reflexiv hergestellt. Auf dieser Grundlage können wir verschiedene Nutzungen des Umfelds, der Artefakte und Materialitäten unterscheiden, die unterschiedliche Potenziale des architekturierten und technologisierten Raumes offenbaren. Arbeitsräume: In der Vorbereitungsphase wird ersichtlich, wie der Tisch in eine Vielzahl von Arbeitsplätzen transformiert werden kann. Der „Schreibtisch“ zeichnet sich durch die Verwendung der Tastatur und der Maus, des mittleren Bildschirms (Isa) bzw. des Laptops (Oli) sowie eines Textdokumentes auf eben diesem aus. Der „Leseplatz“ hingegen ignoriert die informatischen Mittel weitestgehend bzw. zweckentfremdet diese: So wird die Tastatur oder der Laptopbildschirm zur Ablage von Papieren bzw. zum Lesepult (z.B. Auszug 1). Auch der virtuelle Raum (Internet) gehört in diesem Abschnitt zumindest für Isa zu den möglichen Arbeitsräumen - in diesem Fall wird der Schreibbildschirm benutzt, um verschiedene Webseiten aufzurufen und Informationen aus dem Internet zu erhalten (Auszug 4). Der „Programmarbeitsplatz“ hingegen zeichnet sich durch den Einbezug des Programmbildschirmes jeweils rechts von den Teilnehmern aus. Allgemein wird aus dem Tisch erst dann ein Arbeitsplatz, wenn die Teilnehmer an diesen heranrücken und sich mit einem der auf ihm befindlichen Elemente beschäftigen. Erwähnenswert ist auch die Möglichkeit, den jeweiligen Platz durch bestimmte Körperhaltungen noch deutlicher zu einem individuellen, isolierten Arbeitsplatz werden zu lassen. So schafft sich beispielsweise Isa durch Hinunterbeugen zum Bildschirm sowie Abstützen ihres Kopfes mit der linken Hand ihren persönlichen Arbeitsraum (Auszug 4). Interaktionsräume: Gemeinsame Interaktion zwischen den Moderatoren zeigt sich eher in der Nichtnutzung von Artefakten, es werden Kopfhörer und Pa- Im Radiostudio arbeiten 399 piere auf dem Schreibtisch abgelegt oder Mikrofone zur Seite geschoben, so dass ein freies Sichtfeld zwischen den sich gegenübersitzenden Personen entsteht. Auch wird die (zumeist relativ aufgerichtete) Körperhaltung von den Teilnehmern dazu genutzt, die architektonisch gegebene Interaktionsmöglichkeit (höhenversetzte, sich gegenüberstehende Schreibtische) zu aktivieren. Auch wenn das Studio an sich keinen Rückzugsort für eventuelle vertrauliche Gespräche bietet, so kann durch Vorbeugen und Hochhalten eines Papieres vor dem Gesicht erreicht werden, dass sich die Teilnehmer maximal von den technischen Elementen des Studios entfernen und so Platz für einen Scherz schaffen (Oli, Auszug 2). Je weiter die Planung voranschreitet, desto mehr wird der gemeinsame Interaktionsraum eingeschränkt - verbaler Austausch sowie Blickkontakt werden immer weiter reduziert, so dass die einzelnen Arbeitsräume wieder stärker relevant werden (Auszug 5). Der Besuch des Kollegen (Auszug 4) zeigt gut, dass, auch wenn das Studio an sich ein offener, betretbarer Raum ist, dieser von den Moderatoren erst als ein solch offener Raum konfiguriert werden muss. Nicht nur durch minimalen verbalen Austausch mit dem Kollegen, sondern auch durch wenig Blickkontakt sowie eine relativ stabile Orientierung zum Schreibtisch hin zeigen beide Moderatoren, dass sie nicht bereit sind, ihren Arbeitsraum in einen offenen Gesprächsraum zu transformieren. Dies spiegelt sich auch im Verhalten des Kollegen: Anstatt an den Arbeitstisch heranzutreten, bleibt er stets in der Nähe der Tür und geht schließlich wortlos wieder hinaus. Klangräume: Die grundlegende Unterscheidung zwischen „auf Sendung“ und „nicht auf Sendung“ ist zwar eine in der Architektur des Studios vorgesehene (siehe Lampen, Fenster usw.), jedoch keine ausreichende Unterscheidung der Klangräume, die von den Teilnehmern relevant gesetzt werden. Im Allgemeinen ist die laufende Sendung im Hintergrund zu hören (dieser Ton kann aber von Isa lauter oder ausgeschaltet werden), insofern besteht durch diesen hörbaren Hintergrund eine beständige Verbindung zum Senderaum bzw. öffentlichen Raum außerhalb des Studios. Auch in anderer Hinsicht kann sich Schall auf die lokale Konzeptualisierung des Raumes auswirken: Die hörbare Aktivierung von Interviewelementen (Auszug 2) beendet die Witzsequenz, schränkt somit auch den von Oli geschaffenen Raum zum Scherzen ein und führt beide Teilnehmer wieder zu ihrem individuellen Arbeitsplatz zurück. Die einzelnen Arbeitsräume werden nicht nur durch Körperhaltungen und Artefakte, sondern auch durch bestimmte hörbare Handlungen erst zu eben solchen. So begleitet Isa ihr Tippen mit dem Murmeln von Textelementen und erschafft sich so ihren persönlichen „Schreibraum“, der für Oli so trotz fehlender Sicht auf Isa auch hörbar entsteht (Auszug 3, 5). Nicht nur der fehlende Blickkontakt zum Kollegen, auch die knappe Verbalpräsenz und das dann folgende, hörbare Weiterarbeiten zwischen Isa und Oli grenzen ihre Arbeitsplätze gegenüber einem halb-öffentlichen Gesprächsraum mit anderen Teilnehmern Lorenza Mondada / Florence Oloff 400 ab (Auszug 4-5). Schnippen (Isa, Auszug 3) sowie diverse Ausrufe (uh, mhm, ähm) werden von den Moderatoren dazu genutzt, Phasen konzentrierter Arbeit einzuleiten oder zu begleiten und so auch auditiv einen individuellen Arbeitsraum zu schaffen. Das erste Aufsetzen der Kopfhörer (Auszug 5) symbolisiert den Übergang zu einem Raum, in dem Gespräche nur noch erschwert möglich sind - dies ist der erste Schritt, mit dem die Teilnehmer sichtbar die Transformation des Studios in einen „Senderaum“ angehen, indem sie ihren Körper mit der technischen Ausstattung verbinden (siehe auch die Ausrichtung des Mikros, Auszug 5-6). Das unvollständige Aufsetzen des Kopfhörers zeigt, dass die Moderatoren eine baldige phonische Isolierung („auf Sendung“) projizieren, jedoch für letzte Gesprächselemente noch „ein Ohr haben“. Da sich diese Doppelorientierung hier durch die Verwendung eines technischen Artefakts ausdrückt, haben wir diese in Anlehnung an Schegloff (1998) als Techno-Torque bezeichnet (Mondada/ Oloff i.Dr.). Sobald die Kopfhörer jedoch komplett aufgesetzt sind, bereiten sich beide Moderatoren individuell auf die nächste Moderation vor und transformieren den Raum nur noch mit erhöhtem sicht- und hörbarem Aufwand in einen möglichen Gesprächsraum (Auszug 6), hier wird der technischen Ausstattung also klar Platz eingeräumt. Die Sendung an sich geht dann mit einer individuellen Verschmelzung mit technischen Artefakten einher: Beide Teilnehmer positionieren das Mikro vor sich; nun sind das Mischpult, der Programmbildschirm sowie der getippte Text für sie relevant (Ende Auszug 6). Hier sind beide allerdings phonisch isoliert, sowohl voneinander als auch vom Raum außerhalb des Studios. Die Komplexität und Flexibilität der Radiostudioarchitektur, die auch durch die kreative Nutzung des materiellen Umfelds geformt wird, ist ein Habitat für eine Vielzahl von Handlungsweisen. Diese Praktiken können entweder die Architektur voll nutzen oder sich von architektonisch unterstützten Aktivitäten distanzieren. Das Potenzial der Studioarchitektur zeigt sich in seiner dynamischen und variablen Benutzung. Zu diesem Potenzial gehört daher auch die Möglichkeit, Architektur eben nicht zu nutzen, diese abzuwandeln oder zu unterlaufen. Unsere Analyse hat insbesondere auf diverse Herausforderungen bezüglich architekturierter Interaktionen aufmerksam gemacht: a) die vielfältigen Potenziale der Architektur und ihrer interaktionalen Nutzung, b) die Komplexität hochgradig spezialisierter Berufsräume (und nicht nur der in ihnen vorkommenden Technologien, so wie es von den workplace studies bereits gut beschrieben wurde), c) die Spezifizität von Klangarchitektur, in der sicht- und unsichtbare Aspekte von Klang, Zeit und Raum miteinander verflochten sind. Im Radiostudio arbeiten 401 5. Literatur Arnold, Jeanne E./ Graesch, Anthony P./ Ragazzini, Enzo/ Ochs, Elinor (2012): Life at home in the twenty-first century: 32 families open their doors. Albuquerque: University of New Mexico Press. Auer, Peter/ Schmidt, Jürgen Erich (Hg.) (2009): Language and space. Bd. 1. Theories and methods. Berlin/ New York: de Gruyter Mouton. Britain, David (2001): Space and spatial diffusion. In: Chambers, Jack K./ Trudgill, Peter/ Schilling-Estes, Natalie (Hg.): The handbook of language variation and change. Oxford: Blackwell, S. 603-637. Crang, Mike/ Thrift, Nigel (Hg.) (2000): Thinking space. London: Routledge. Drew, Paul/ Heritage, John (1992): Talk at work: interaction in institutional settings. In: Drew, Paul/ Heritage, John (Hg.): Talk at work. Cambridge: Cambridge University Press, S. 418-469. Garfinkel, Harold (1967): Studies in ethnomethodology. Englewood Cliffs, NJ: Prentice-Hall. Garfinkel, Harold/ Sacks, Harvey (1970): On formal structures of practical actions. In: McKinney, John C./ Tiryakian, Edward A. (Hg.): Theoretical sociology. New York: Appleton-Century-Crofts, S. 337-366. Göbel, Hanna Katharina (2015): The re-use of urban ruins. London/ New York: Routledge. Goffman, Erving (1963): Behavior in public places. Notes on the social organization of gathering. New York: Free Press. Goodwin, Charles (2000): Action and embodiment within situated human interaction. In: Journal of Pragmatics 32, S. 1489-1522. Goodwin, Charles (2007). Participation, stance, and affect in the organization of activities. In: Discourse and society 18, 1, S. 53-73. Goodwin, Charles/ Goodwin, Marjorie Harness (2004): Participation. In: Duranti, Alessandro (Hg.): A companion to linguistic anthropology. Oxford: Blackwell, S. 222-244. Goody, Jack (1977): The domestication of the savage mind. Cambridge: Cambridge University Press. Haddington, Pentti/ Mondada, Lorenza/ Nevile, Maurice (Hg.) (2013): Mobility and interaction. (= linguae & litterae 20). Berlin/ Boston: de Gruyter. Haddington, Pentti/ Keisanen, Tiina/ Mondada, Lorenza/ Nevile, Maurice (Hg.) (2014): Multiactivity in social interaction. Beyond multitasking. Amsterdam/ Philadelphia: Benjamins. Hausendorf, Heiko (2012): Der Hörsaal als Interaktionsraum. In: Bulletin VALS/ ASLA 96, S. 43-68. Hausendorf, Heiko/ Schmitt, Reinhold (2013): Interaktionsarchitektur und Sozialtopografie. Umrisse einer raumlinguistischen Programmatik. In: Arbeitspapiere des UFSP Sprache und Raum (SpuR) 1, S. 1-59. Hausendorf, Heiko/ Mondada, Lorenza/ Schmitt, Reinhold (Hg.) (2012): Raum als interaktive Ressource. (= Studien zur Deutschen Sprache 62). Tübingen: Narr. Lorenza Mondada / Florence Oloff 402 Heath, Christian/ Luff, Paul (1992): Collaboration and control: crisis management and multimedia technology in London Underground Line control rooms. In: CSCW Journal 1, 1/ 2, S. 69-94. Heath, Christian/ Luff, Paul (2000): Technology in action. Cambridge: Cambridge University Press. Heath, Christian/ Jirotka, Marina/ Luff, Paul/ Hindmarsh, John (1995): Unpacking collaboration: the interactional organisation of trading in a city dealing room. In: CSCW Journal 3, 2, S. 147-165. Heath, Christian/ Luff, Paul (1992): Media space and communicative asymmetries: Preliminary observations of video-mediated interaction. In: Human-Computer Interaction 7, 3, S. 315-334. Heritage, John (1984): Garfinkel and ethnomethodology. Cambridge: Polity Press. Kendon, Adam (1990): Conducting interaction: patterns of behavior in focused encounters. Cambridge: Cambridge University Press. Levinson, Stephen C. (1996): Language and space. In: Annual Review of Anthropology 25, S. 353-382. Licoppe, Christian/ Relieu, Marc (Hg.) (2007): De la rue au tribunal. Études sur la visiocommunication. Réseaux 2007/ 5, 144. www.cairn.info/ revue-reseaux1-2007-5.htm (Stand: Juni/ 2016). Linke, Angelika (2012): Körperkonfigurationen. Die Sitzgruppe. Zur Kulturgeschichte des Verhältnisses von Gespräch, Körpern und Raum vom 18. bis zum Ende des 20. Jahrhunderts. In: Ernst, Peter (Hg.): Historische Pragmatik. (= Jahrbuch für germanistische Sprachgeschichte 3). Berlin/ Boston: de Gruyter, S. 185-214. Luff, Paul/ Hindmarsh, John/ Heath, Christian (Hg.) (2000): Workplace studies. Recovering work practice and informing system design. Cambridge: Cambridge University Press. Luff, Paul/ Jirotka, Marina/ Yamashita, Naomi/ Kuzuoka, Hideaki/ Heath, Christian/ Eden, Grace (2013): Embedded interaction. The accomplishment of actions in everyday and video-mediated environments. In: Transactions on Computer-Human Interaction 20, S. 1-22. Mondada, Lorenza (2000): Décrire la ville. La construction des savoirs urbains dans l’interaction et dans le texte. Paris: Anthropos. Mondada, Lorenza (2005a): Espace, langage, interaction et cognition: Une introduction. In: Intellectica 41-42, 2/ 3, S. 7-24. Mondada, Lorenza (2005b). La constitution de l’origo déictique comme travail interactionnel des participants: Une approche praxéologique de la spatialité. In: Intellectica 41-42, 2/ 3, S. 75-100. Mondada, Lorenza (2007a): Interaktionsraum und Koordinierung. In: Deppermann, Arnulf/ Schmitt, Reinhold (Hg.): Koordination. Analysen zur multimodalen Interaktion. (= Studien zur Deuschen Sprache 38). Tübingen: Narr, S. 55-94. Mondada, Lorenza (2007b): Operating together through videoconference: members’ procedures accomplishing a common space of action. In: Hester, Stephen/ Francis, David (Hg.): Orders of ordinary action. Aldershot: Ashgate, S. 51-67. Im Radiostudio arbeiten 403 Mondada, Lorenza (2009): Emergent focused interactions in public places. A systematic analysis of the multimodal achievement of a common interactional space. In: Journal of Pragmatics 41, S. 1977-1997. Mondada, Lorenza (2011): The interactional production of multiple spatialities within a participatory democracy meeting. In: Social Semiotics 21, S. 283-308. Mondada, Lorenza (2014): Bodies in action: multimodal analysis of walking and talking. In: Language and Dialogue 4, 3, S. 357-403. Mondada, Lorenza (2015): Das Sprechen im Rundfunk als interaktive Montage verschiedener Ressourcen. In: Dausendschön-Gay, Ulrich/ Gülich, Elisabeth/ Krafft, Ulrich (Hg.): Ko-Konstruktionen als interaktive Verfahren. Bielefeld: transcript, S. 157-182. Mondada, Lorenza/ Oloff, Florence (2015): „Hetero oder homo? “. La performance d’un coming out hétérosexuel à la radio. In: Langage et Société 152, S. 17-40. Mondada, Lorenza/ Oloff, Florence (i.Dr.): Passer à l’antenne: Arrangements technologiques et interactionnels préparant la prise de parole en direct. In: Cahiers de Praxématique. Psathas, George (1979): Some organized features of direction maps. In: Psathas, George (Hg.): Everyday language. New York: Irvington, S. 203-226. Psathas, George (1990): Direction-giving in interaction. In: Conein, Bernard/ de Fornel, Michel/ Quéré, Louis (Hg.): Les formes de la conversation. Bd. 1. Paris: CNET, S. 183-200. Sacks, Harvey/ Schegloff, Emanuel A./ Jefferson, Gail (1974): A simplest systematics for the organization of turn-taking for conversation. In: Language 50, S. 696-735. Scheflen, Albert E. (1975): Micro-territories in human interaction. In: Kendon, Adam A./ Harris, Richard M./ Key, Mary Ritchie (Hg.): Organization of behaviour in faceto-face interaction. Den Haag: Mouton, S. 159-173. Schegloff, Emanuel A. (1998): Body torque. In: Social Research 65, S. 534-596. Schegloff, Emanuel. A. (1972): Notes on a conversational practice: formulating place. In: Sudnow, David (Hg.): Studies in social interaction. New York: Free Press, S. 75-119. Schittich, Christian (Hg.) (2003): Bauen im Bestand. Umnutzung, Ergänzung, Neuschöpfung. München: Institut für internationale Architektur-Dokumentation. Schmitt, Reinhold (2012): Körperlich-räumliche Grundlagen interaktiver Beteiligung am Filmset: Das Konzept ‘Interaktionsensemble’. In: Hausendorf/ Mondada/ Schmitt (Hg.), S. 37-87. Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. (= Studien zur Deutschen Sprache 64). Tübingen: Narr. Stivers, Tanya (2004): „No no no“ and other types of multiple sayings in social interaction. In: Human Communication Research 30, 2, S. 260-293. Suchman, Lucy (1996): Constituting shared workspaces. In: Engeström, Yrjö/ Middleton, David (Hg.): Cognition and communication at work. Cambridge: Cambridge University Press, S. 35-60. Lorenza Mondada / Florence Oloff 404 Gliederung 1. Einleitung ..............................................................................................................361 1.1 Der spatial turn in der interaktionalen Forschung ...........................................361 1.2 Datenbeschreibung: Interaktionen in einem Radiostudio .............................365 2. Interaktionen im Radiostudio: Ein flexibel architekturierter Raum für vielfältige Aktivitäten ........................................................................365 2.1 Architektur des Radiostudios.............................................................................366 2.2 Das Radiostudio als Interaktionsraum..............................................................369 3. Eine praxeologische und interaktionale Analyse der situierten Nutzung der Studioumgebung ..........................................................................372 3.1 Planung der nächsten Moderation durch Nutzung verschiedener Studioelemente und Materialien........................................................................372 3.2 Scherzen: Eine andere verkörperte Nutzung des Raumes.............................375 3.3 „Back to Business“: Konfigurierung verschiedener Arbeitsplätze ...............379 3.4 „Bitte nicht stören“: Das Studio als Arbeitsraum, nicht als Interaktionsraum ..................................................................................................382 3.5 Planung des Einstiegs: Verringerung des Gesprächsraums und Transformation in einen Senderaum.........................................................386 3.6 Ein letzter Wortwechsel ohne gegenseitiges Hören: Wiederholte summons vor der Übertragung ..........................................................................392 4. Fazit ........................................................................................................................398 5. Literatur .................................................................................................................401 IV. INTERDISZIPLINÄRE KOMMENTARE LARS FRERS ZWISCHEN NORMALITÄT UND DIFFERENZ - WAHRNEHMUNGSHANDELN IN DER STANDBILDANALYSE Was ist normal, was nicht und warum? Die Beiträge in diesem Band beschäftigen sich mit dieser grundlegenden Frage sozialwissenschaftlichen Forschens. Sie richten ihren forschenden Blick noch genauer aus und betrachten vor allem das Zusammenspiel zwischen räumlich-materieller Ordnung, hier gefasst als Architektur und Topografie, und menschlichem Handeln. Die Metapher des forschenden Blicks bezieht sich auf das für diesen Band zentrale Dokument: das Standbild. Dieser herausragenden Stellung will ich im Folgenden zuerst Rechnung tragen und den spezifischen Dokumentcharakter der hier verwendeten Aufnahmen diskutieren. Im Anschluss daran ist es für mich entscheidend, die über das eigentliche Dokument hinausgehenden Annahmen zum Zusammenhang von Wahrnehmen und Handeln in leiblichmateriellen Konstellationen zu explizieren und zu hinterfragen. Dabei tritt das Thema der Bewegung hervor, welches im Anschluss näher verfolgt wird. Der Begriff der Sequenzialität als ein Hauptmerkmal konversationsanalytischer Forschung ist dabei von besonderer Bedeutung. Er wird im Spannungsfeld zwischen leiblicher Bewegung und analysiertem turn-taking platziert, um mögliche Anschlusspunkte für weitere Untersuchungen aufzuzeigen. Zum Abschluss werde ich Bewegung, Wahrnehmungshandeln und Standbildanalyse gemeinsam in Bezug auf die übergeordnete Frage nach Normalität und Differenz diskutieren und so Stärken und Schwächen der in diesem Band präsentierten Perspektivierung herausarbeiten. 1. Standbilder So wie in der Konversationsanalyse das Transkript und nicht die Tonaufnahme als Grundlage für die eigentliche Analyse dient, so wird auch in diesem Band nicht die Videoaufnahme als solche, sondern es werden einzelne Standbilder einer detaillierten Analyse unterzogen. Die Entscheidung für das Standbild ist immer auch mit der gedruckten Form der Veröffentlichung verknüpft - eine wirkliche Orientierung der Analyse am Ton- oder Videomaterial erfordert andere Medien. Wie immer bringen solche Beschränkungen Risiken mit sich und führen zu Verlusten, bergen aber auch Möglichkeiten. Wo in diesem Bereich zwischen Verlust und Ermöglichung ist das vorliegende Material zu platzieren? Um diese Frage zu beantworten, müsste eigentlich jede einzelne Standbildanalyse genauer betrachtet und eingeordnet werden. Da dies im Rahmen dieses Kommentars nicht möglich ist, werden die Standbilder in ihrer Gesamtheit in zwei Spannungsfeldern platziert. Lars Frers 408 Das erste Spannungsfeld erstreckt sich von der Behandlung des jeweiligen Standbildes als eigentliches, für sich stehendes Dokument bis zur Behandlung als Teil einer Sequenz oder Bildabfolge. In mehreren Beiträgen wird das gezeigte Standbild einer Art der deskriptiven Inhaltsanalyse bezogen, in der Interaktionsarchitektur über das Abgebildete rekonstruiert wird. Es wird in gleichsam ikonografischer Weise besprochen, was im Bild zu sehen ist und wie die unterschiedlichen zu sehenden Gegenstände angeordnet sind. Diese Art der beschreibenden oder inventarisierenden Analyse findet zumeist für das erste gezeigte Bild Anwendung. Hier soll ein Überblick gegeben bzw. die später bespielte Szene als solche betrachtet werden. In einigen Fällen werden auch spätere Aufnahmen einer solchen genaueren Beschreibung unterzogen. So verändert sich der gezeigte Bildausschnitt im Verlauf der Analyse bei Putzier (i.d.Bd.) einmal (Bild 2). Bei Kesselheim liegt ein besonderer Fall vor, da die Kamera beschattend (Hognestad/ Bøe 2016) gebraucht wird und sich zusammen mit der beobachteten Kleingruppe durch einen Ort bewegt, so dass jedes Standbild eine neue Perspektive zeigt. Diese Mobilität in der Aufzeichnung findet sich in immer wieder vorgenommenen Kurzbeschreibungen des Bildinhalts wieder. Im Vordergrund der Beschreibung steht die räumlichmaterielle Ordnung: Was steht wo, wie sind die Abstände usw. Der Schwerpunkt liegt auf der immobilen Architektur und dem dazu gehörigen Mobiliar. Die statische Natur der mit Hilfe des Standbilds beschriebenen Interaktionsarchitektur spiegelt sich auch in der Wahl menschenleerer Bilder. Die zentrale Annahme, dass der Raum bzw. die Interaktionsarchitektur sich in einer Art reiner räumlich-materieller Ordnung zeigt, wird so in eröffnenden Standbildern wiedergegeben (mit Kesselheim als Ausnahme). Erst im weiteren Fortschreiten der Analyse werden die Standbilder zunehmend zu Elementen einer Sequenz. Sie werden bevölkert, Teile der räumlich-materiellen Anordnung verändern sich bzw. das Mobiliar tritt als solches hervor, die Sozialtopografie der betrachteten Orte entfaltet sich. Die Sequenzierung der Standbilder steht mit dem zeitlichen Fokus der Analyse in direktem Zusammenhang. Bei der besonders detailliert vorgehenden Analyse des Senderaums liegen zwischen einigen Standbildern im Extremfall nur Bruchteile von Sekunden (Mondada/ Orloff), während zwischen einigen Aufnahmen in anderen Beiträgen mehrere Minuten vergangen sind. Die Untersuchung des Standbildes konzentriert sich dann weniger auf den jeweiligen Bestand, sondern vor allem auf die Änderung im Verhältnis zum vorher gezeigten Bild. So rücken Prozesse in die Aufmerksamkeit der Analyse. Das Standbild steht dann nicht mehr für sich bzw. für den gezeigten Raum allein, sondern verweist auf Veränderungen über die Zeit und die damit einhergehenden räumlichen, körperlichen und sozialen Aushandlungen. Das zweite Feld ist ähnlich, aber nicht identisch gelagert. Auf der einen Seite befindet sich wieder das Standbild als für sich stehendes Dokument, aber auf Wahrnehmungshandeln in der Standbildanalyse 409 der anderen Seite steht nun der weitere Kontext, die Platzierung in einem über das im Bild bzw. die vorher behandelte Sequenz hinausgehenden Bereich. Der Umgang mit diesen über das vorliegende „Datum“ hinausgehenden Informationen bzw. dem dazugehörigen expliziten wie impliziten (emotionalen, verkörperlichten usw.) Wissen und den dazu gehörigen Institutionen bzw. Diskursen ist ein klassisches Minenfeld in der ethnomethodologisch oder konversationsanalytisch orientierten Forschung (Schegloff 1999; Have 2007, S. 57-63), die sich in ihrer orthodoxesten Form jedwede Nutzung von über die von den Mitgliedern einer bestimmten Interaktion hinausgehenden und explizit gemachten Relevanzsetzungen untersagt. Wo die Grenzen des gleichsam rein gezeigten Datums liegen, ist jedoch insbesondere bei der Verwendung von Bildern keinesfalls klar. In jedem Standbild liegt gleichzeitig ein Überschuss, ein Exzess an Information (Liggett 2007) und eine faktisch nicht zu begrenzende Reihe von Verweisen auf Praktiken und Wissensbestände, die nicht in reiner Gegenständlichkeit aufgehen. Das mag selbstverständlich erscheinen, stellt aber die Interaktionsraumanalyse als solche auf tönerne Füße. Hausendorf/ Schmitt zeichnen diese Voraussetzungabhängigkeit als Vertrautheitsabhängigkeit aus. Wie ein Kirchenraum (oder ein Museum oder ein Klassenzimmer) „gelesen“ werden kann, lässt sich nicht aus seiner bloßen räumlich-materiellen Anordnung erkennen. Aber: genau diese Annahme ist gleichzeitig Grundannahme der Interaktionsarchitekturanalyse. Man könnte natürlich behaupten, dass damit die Interaktionsarchitekturanalyse als solche fällt. Aber angesichts der Tatsache, dass alle sozialwissenschaftlichen Methoden mit ähnlichen Problemen konfrontiert sind, wäre dies ein Kurzschluss. Eine mögliche Art des Umgangs mit dieser nicht hintergehbaren Problematik liegt in einer ausgesprochen vorsichtigen Rekonstruktion der Interaktionsarchitektur. Diese erfordert große sprachliche Sorgfalt und ein frühzeitiges Explizieren von unterstellten Vorannahmen. Auf diese Schwierigkeiten werde ich im Folgenden wieder Bezug nehmen, hier will ich nur noch auf die Herstellung des Dokuments eingehen. Denn auch die Herstellung des Dokuments beeinflusst das Gezeigte. Dies wird in den vorliegenden Beiträgen in die Analyse einbezogen, wenn beispielsweise Kameraeinstellungen und die gewählte Perspektive im Text beschrieben werden. Aber auch hier gibt es Selbstverständlichkeiten, die eigentlich keine sind und die sich auf Perspektivnahmen z.B. in Abhängigkeit von Körpergröße oder Sehfähigkeit rückführen lassen. Die Einschränkung der Perspektive bringt immer auch den Vorteil mit sich, dass etwas in den Fokus rückt und also näher untersucht werden kann. Diese grundlegende Spannung erfordert besondere Aufmerksamkeit in der Analyse selbst und in der späteren Darstellung im Text. Was wird ausgeblendet und worauf konzentriert sich der Blick bzw. die Beschreibung? Eine Art und Wei- Lars Frers 410 se, diese Herausforderung anzunehmen, liegt wie bereits angeführt im besonders sorgfältigen Formulieren. In weiten Teilen der vorliegenden Texte ist der Wille zu dieser Vorsicht deutlich. Es findet sich aber trotzdem eine Vielzahl von Bruchstellen. Eine andere Möglichkeit läge in einer methodischen Reduktion, in der die Standbildanalyse wirklich als solche als auf das vorliegende Einzelbild fokussiert betrieben und erst später um weitergehende Sequenzialisierungen und Kontextualisierungen ergänzt würde. Ein solches kontrolliertes Schritt-für-Schritt Vorgehen wird hier jedoch nicht (mindestens nicht explizit) vorgenommen und es bleibt für die Lesenden unklar, ob und wann sich die Rekonstruktion der Interaktionsarchitektur eigentlich aus dem Standbild selbst erschließt bzw. wann diese eigentlich nur post facto vollzogen wird, also nachdem die Forschenden lange mit ihrem Material gearbeitet haben und dieses dann nur, dem Schema folgend, nachträglich aufschlüsseln. Das ist zwar genauso üblich, wie die Formulierung einer „Problemstellung“ für einen Forschungsartikel, nachdem die eigentliche Forschung abgeschlossen ist und nur noch publiziert werden soll (die Problemstellung in der präsentierten Form wäre also für den eigentlichen Forschungsprozess nicht ausschlaggebend gewesen). Aber das bedeutet trotzdem, dass ein Teil des methodischen Potenzials verloren geht, welches in der Kontrastierung einer vergleichsweise reduzierten und voraussetzungsarmen Standbildanalyse mit einer späteren auf gute Material- und Kontextkenntnis gestützten Analyse läge. 2. Wahrnehmung, Atmosphäre, Affekt Die Analyse der Standbilder dient dazu, den Interaktionsraum zu erschließen, ihn und die zu ihm gehörenden Handlungsmöglichkeiten bzw. die vorfindbaren Benutzbarkeitshinweise zu erfassen und zu beschreiben. In diesem Zusammenhang tritt die zentrale Rolle des Wahrnehmens hervor. Denn Interaktionsarchitektur wird als solche nur über das Wahrnehmen relevant. Das Wahrnehmen selbst aber spielt in den vorliegenden Beiträgen nur eine untergeordnete Rolle. Es wird zwar in mehr oder weniger technische Beschreibungen aufgelöst, die sich um die Verfasstheit des gebauten Raums, eben seine Architektur im weiteren Sinne drehen. Diese Beschreibungen umfassen von Zeit zu Zeit Fragen der Perspektive und Informationen zu Abständen und zur Mobilität und Handhabbarkeit einzelner Dinge und sind insofern mit wahrnehmungsrelevanten Aspekten befasst. Auf diese oben näher erläuterten Beschreibungen vor allem der ersten Standbilder folgt aber in der Regel im nächsten Schritt gleich die Analyse von konkreten, körperlich-sichtbaren Handlungen der Anwesenden in den untersuchten Räumen. Was fehlt? Überspitzt könnte man sagen, dass die gesamte Dimension des Ästhetischen, des eigentlich Sinnlichen zu kurz kommt. Zwischen technischer Detailbeschreibung, die auf Funktionalitäten fokussiert, und Interaktionsanalyse, die auf Wahrnehmungshandeln in der Standbildanalyse 411 Handlungen fokussiert, bleibt kaum Raum für die Sphäre des Wahrnehmens, die Welt der Stimmungen und Atmosphären. Diese Sphäre zeichnet sich dadurch aus, dass sie eben zwischen Subjekt und Objekt gelagert ist. In der Phänomenologie wird dieser Zwischencharakter in unterschiedlichen Begriffen aufgerufen. Der Begriff der ‘Atmosphäre’ verweist auf Gestimmtheiten von Räumen, die zugleich im Material und in den Akteuren liegen (Böhme 1995; Kazig 2007). Der Begriff des ‘Einhüllens’ verweist auf die dynamische Verwebung im Durchgang durch räumlich-materiell-soziale Konstellationen (Frers 2007). Der Begriff des ‘Affekts’ bezieht sich in Anschluss an Deleuze und Guattari auf die gefühlten und produzierten Intensitäten, die emotionale Dynamik des Werdens von Anordnungen (Anderson 2009; Deleuze/ Guattari 1992). Merleau-Ponty benutzt in seinem Spätwerk den Begriff des ‘Fleisches’ (chair), um der postulierte Trennung von Subjekt und Objekt, von Akteur und Gegenständen, von Wahrnehmenden und Wahrgenommenem, von Körper und Umwelt etwas gegenüber zu stellen (Merleau-Ponty/ Lefort 1994). Allen diesen Begriffen gemeinsam ist die Sorge, dass in der Konzentration auf entweder die äußere Welt der Dinge oder die innere Welt der Akteure etwas Entscheidendes verloren geht: die Trennung ist technische Illusion, und in unserem Erleben vor Ort berühren die eigenen Sinne genauso wie sie berührt werden (Serres 1998). Diese weichen Übergänge, dieses Ineinandergehen lässt sich schwer fassen. Aber auch wenn die Übergänge weich sind, so sind sie nicht weniger gewichtig. Es geht nicht nur darum, dass beispielsweise „die Kadrierung des [Stand]Bilds schärfere Grenzen hervorbringt als die natürlichen, unscharfen Ränder des menschlichen Gesichtsfelds“ (Kesselheim i.d.Bd.). Wichtig ist vielmehr zum einen, dass unterschiedliche Menschen ihre Umgebung zu unterschiedlichen Zeiten auf verschiedene Weise wahrnehmen. Das genauso individuell und leiblich wie sozial geprägte Wahrnehmen eines Kirchen-, Klassen- oder Museumsraums lässt begriffliche Gerüste wie Interaktionsarchitektur gleichsam in sich zusammenstürzen, wie im vorigen Abschnitt in Bezug auf die Vertrautheitsabhängigkeit bereits angedeutet. Die mögliche Rettung eines Begriffs wie den der ‘Interaktionsarchitektur’ liegt aber dessen ungeachtet in derselben geschmeidigen Übergangsnatur des Wahrnehmens: es ist eben nicht absolut different und individuell. Im Gegenteil, es ist immer auch auf entscheidende Weise sozial geprägt und lokal verhandelt. Hier kommt dann auch der andere Aspekt ins Spiel: das Wahrnehmen ist nicht nur in einer individuellen Leiblichkeit verankert, es ist immer auch ein Handeln. Wahrnehmen, etwas betrachten, sich etwas annähern, sich in eine kontemplative Haltung begeben, Abstand nehmen und sich auf anderes orientieren - all dieses Wahrnehmen ist notwendigerweise auch Handeln. Es gibt kein Handeln ohne Wahrnehmen und kein Wahrnehmen, das nicht auch Handeln ist (Frers 2007, S. 50-54). Solches Wahrnehmungshandeln zeigt sich leiblich als Orientierung, in Form praktischer Weltbezüge, und solches Wahrnehmungs- Lars Frers 412 handeln ist in seiner Orientiertheit immer auch in soziale Bezüge eingebunden. Gleichzeitig zeigt es seine wahrnehmende Orientierung eben auch im Handeln an. Das Wahrnehmen und die darin vorgenommenen Bezüge sind somit nicht rein innerweltliche oder kognitive Größen, sondern beobachtbar und werden von den Beteiligten als Wahrnehmungswahrnehmungen (Hausendorf) ausgehandelt. Die so verhandelten sozialen und praktischen Weltbezüge sind nicht beliebig. Sie kommen nicht einfach aus dem Individuum, genauso wenig wie sie einfach aus einem Raum und dessen Architektur kommen. Kesselheim bringt den hier sinnvollen Begriff der ‘Emergenz’ ins Spiel. Benutzbarkeitshinweise emergieren erst im praktischen Wahrnehmungshandeln - sie werden als solche vor Ort ins Spiel gebracht und erst indem sie ins Spiel gebracht werden, zeigen sie ihre Relevanz. Dieses Aufzeigen von lokalen Relevanzsetzungen im Wahrnehmungshandeln der Anwesenden liegt also der Realisierung von Interaktionsarchitekturen in konkret ausgehandelten Sozialtopografien zu Grunde. Damit, so könnte man sagen, wiederholt dieser Kommentar nur bereits in anderen Beiträgen Geschriebenes. Der entscheidende Unterschied ist, dass in diesem Wahrnehmungshandeln nicht bloß die Rolle einzelner Gegenstände und ihrer räumlichen Anordnung verhandelt wird, sondern eben auch deren affektive oder atmosphärische Aufladung. Dies ist eigentlich in allen Beiträgen der Fall - im Kirchenraum ist dies ein Thema, das sich durch die gesamte Präsentation des Alpha-Gottesdienstes zieht, in den Klassenzimmern gehören zum Lernen bzw. Warten unterschiedliche leibliche Präsenzformen und Stimmungen, genauso wie Pausen im Radiostudio genutzt werden, um sich zeitweilig von einer Orientierung auf die Manipulation technischer Artefakte zu lösen und zu erholen. Die Anlage ist also da, es fehlt vielleicht nur an dem Mut, sich den vermeintlich subjektiveren, weicheren und gefühlsbezogenen Qualitäten stärker zu widmen und diese explizit zum Gegenstand der Analyse zu machen. Dabei gäbe es zwei Vorteile einer solchen Einbeziehung. Erstens würde damit einer der gewichtigsten Aspekte menschlicher Raumbezogenheit einbezogen werden, nämlich dessen emotionale Qualität. Gerade diese macht den Unterschied zwischen verstörenden und produktiven, zwischen einengenden und befreiend wirkenden, zwischen eindeutigen und ambivalenten Raumerfahrungen aus. Zweitens hätte eine Beschäftigung mit affektiven Dimensionen auch das Pozential, das soziale wie leibliche Auflösungsvermögen der Analyse zu verbessern, indem Differenzierungen zwischen unterschiedlichen emotional-affektiven Raumbezügen klarer hervortreten würden - seien diese mit Distinktionspraktiken und Fragen des Geschmacks verbunden oder mit Fragen der Diversität von Erfahrungshintergründen und leiblich-sinnlichen Dispositionen. Wahrnehmungshandeln in der Standbildanalyse 413 Als letzter Punkt und bereits im Übergang zum folgenden Abschnitt harrt noch ein weiterer wichtiger Aspekt jedweden Wahrnehmungshandelns der Betrachtung. Wahrnehmungshandeln und die dazu gehörigen Sinneseindrücke wie Praktiken realisieren sich immer im zeitlichen Durchgang durch die Welt - sie realisieren sich in der Bewegung - ein kinästhetisches Element ist Teil allen Wahrnehmens (Merleau-Ponty 1974, S. 166-172). Das Betreten eines Ortes, das sich vor Ort mit Dingen und anderen Arrangieren, genauso wie das Warten, Beobachten und Betrachten ist ein dynamischer Prozess, in dem sich Raumerfahrung aus der Abfolge unterschiedlicher, divergierender wie konvergierender Wahrnehmungshandlungen ergibt. Auch dieser Aspekt taucht in den unterschiedlichen Beiträgen auf, wird aber nicht systematisch thematisiert - die in der Bewegung erfahrenen Räume treten in gewisser Weise hinter der Statik der Standbilder zurück. Die mobile Aufnahme des Museumsbesuchs zeigt hier am ehesten das Potenzial einer solchen Umfokussierung vom statischen Raum auf die Bewegung auf, da hier die Orientierung in dynamischer Umgebung als solche klarer hervortritt und in die Methode selbst eingeht. 3. Bewegung Im vorherigen Abschnitt wurde Bewegung als grundlegende Qualität des Wahrnehmungshandelns und damit der räumlichen Bezugnahme herausgestellt. Eine andere Art, Bewegung zu thematisieren, findet sich im Bezug auf die Sequenzhaftigkeit sozialen Handelns. Jede Interaktion, jedes Gespräch realisiert sich als Sequenz, sowohl gedacht als Bezugnahme auf Vorangegangenes, als gegenwärtige Positionierung und Projektion in die Zukunft, als auch im Sinne der Konversationsanalyse als Folge von Beiträgen oder turntaking im Gespräch. Welchen Sinn ein Raum oder ein Gegenstand oder eine Äußerung hat, erschließt sich erst aus der Sequenz, in der er oder sie eingebettet ist. Die Analyse von Sozialtopografien genau wie die Analyse von Interaktionen bzw. von Gesprächen versucht also eben nicht, das eigentliche Wesen eines Objekts an sich zu ergründen. An dieser Stelle tritt wieder die eigentümliche Spannung hervor, der sich die hier präsentierten Beiträge aussetzen: sie versuchen einerseits in der Analyse der Interaktionsarchitektur etwas Vorliegendes gleichsam als Statisches an sich aufzuschlüsseln. Hier ist die Form des Standbildes maßgeblich. Andererseits stehen in der Analyse der Sozialtopografie Praktiken und Prozesse im Vordergrund, und es wird gezeigt, wie der Charakter eines Raums oder einer räumlich-materiellen Anordnung in Interaktionssequenzen als bestimmter hervorgebracht wird. In diesem Abschnitt soll vor allem deutlich gemacht werden, dass bereits das Vorliegende als Bewegtes gedacht werden muss. Das gilt für Räume und Dinge genauso wie für ruhende oder sitzende Akteure - hier muss gewissermaßen die Symmetrieforderung der Science and Technology Studies (Law 2012) mitgedacht werden. Lars Frers 414 Denn selbst der gebaute Raum ist in ständiger Bewegung, es gibt ihn in Wirklichkeit nicht als abgeschlossenen, fertigen Raum. Auch gebauter Raum ist von vielfältigen Relationen durchdrungen und so in steter Veränderung. Genau wie auch für Menschen im Ruhen, im Sitzen oder Stehen oder Warten die Bewegung nicht aufhört - im Gegenteil, denn die Ruhe muss sich als solche im Fluss der Dinge behaupten, gegen die Schwerkraft, gegen Ermüdung, Abnutzung, Schmutz und Verwitterung. So lange wahrgenommen wird, wird auch gehandelt und sich so in Relation zu anderen Bewegungen gesetzt - entweder im Fluss mitgehend oder sich dagegen stemmend oder sich in anderer Weise zum Strom mit seinen Drücken und Turbulenzen (Bissell 2011; Serres 2010) positionierend. Diese vielfältigen Dynamiken drohen in der Standbildanalyse verloren zu gehen, jedenfalls solange der gebaute Raum als voriger, als dauerhaft präsenter vorgestellt wird. Im Fall des Kirchenraums im Alpha-Gottesdienst wird dies am deutlichsten hinterfragt, und es ist nicht zufällig, dass in diesem Fall sowohl die Bewegung durch den Raum als auch die spezifische Rolle des Mobiliars als Mobilem herausgestellt wird. Beides verändert den Raum, in dem unterschiedliche Nutzungen aufeinanderfolgen und mit- und gegeneinander kontrastiert werden. Hier ist aber auch die eigentliche Grenze der Bühnenmetapher aufzuzeigen. Denn die Unterstellung dieser Metapher ist, dass die Bühne zwar unterschiedlich bespielt werden kann, sie aber immer Bühne bleibt. Die Arbeit an dieser Grenze, an der Grenze einer vermeintlichen interaktionsarchitektonischen Stabilität, ist das eigentliche Potenzial einer solchen Analyse. Hier ließe sich der Aspekt der Macht einbringen; insbesondere verstanden als Macht im modalen Sinn, also als Ermöglichung genauso wie als Einschränkung. Ein möglicher Ansatz ließe sich, ganz im Sinne einer Orientierung an der Bewegung, mit Michel de Certeaus Begriffspaar ‘Taktik’ und ‘Strategie’ einbringen (de Certeau 1988, S. 23-25). Die stabilen und stabilisierenden Momente der Interaktionsarchitektur ließen sich in der Sphäre der Strategie platzieren, in der Herrschaft über den Raum ausgeübt wird - wichtige Stellungen werden besetzt, verschaffen Überblick und Vorteile, ordnen an und lenken Bewegungen bzw. Interaktionssequenzen in bestimmte Bahnen. Gleichzeitig verfügen die Akteure über ein taktisches Repertoire. Sie können innerhalb der strategisch gesetzten Grenzen ihren eigenen Körper und die ihnen verfügbare Zeit dazu nutzen, eigene, auch widerspenstige Praktiken einzubringen, sich in überraschende Positionen zu bringen und so die sozialräumliche Ordnung zu unterminieren. (Hier liegt eine gewisse Differenz zur Bestimmung des Positionsbegriffs bei Putzier (i.d.Bd.), der dort als Endpunkt einer Bewegung verstanden wird. In der Sphäre der Taktik wäre die Einnahme einer Position eine vorübergehende, zeitlich begrenzte.) Diese Überlegungen zur Fragen der Macht, zu Grenzen und Verschiebungen soll im folgenden und letzten Abschnitt weiter diskutiert werden. Wahrnehmungshandeln in der Standbildanalyse 415 4. Differenz/ Normalität - Körper/ Leib Ich habe diesen Kommentar mit der Frage nach der Normalität eröffnet und möchte diese Frage jetzt zum Abschluss wieder aufnehmen. Im Zusammenhang mit den vorherigen Abschnitten stehen dabei zwei miteinander verwandte Aspekte im Mittelpunkt. Zum einen die grundsätzliche Frage nach Differenz im Bezug auf körperlich-leiblich-sinnliche Bezugnahmen zum Raum und die dazugehörigen sozialen, ethnischen, altersusw. abhängigen Kriterien. Die Interaktionsraumanalyse ist unablösbar durchdrungen von Normalitätsvorstellungen, Vertrautheitsabhängigkeiten und Konventionen. Zum anderen die Frage nach Macht, Widerständigkeit und Veränderung. Auch wenn die Frage nach dem Normalen, nach dessen Etablierung und dessen Grenzen in den Beiträgen in diesem Band immer wieder gestellt wird, kann ich mich nicht eines Unbehagens entledigen. Dieses Unbehagen taucht ständig auf, meist an den Rändern der Beschreibungen, selten stärker im Zentrum der vorgestellten Analysen. Dieses Unbehagen wird geweckt von einer geringen Aufmerksamkeit für Randfälle, für alle Arten von Abweichungen von der jeweils geltenden Regel. Unterschiedliche Arten von Behinderungen und/ oder Einschränkungen werden fast ausnahmslos nicht thematisiert. Die Beschreibungen orientieren sich am Normalfall eines einwandfrei sehenden und hörenden, voll mobilen und kompetenten Interaktionsteilnehmers. Das Stichwort Behinderung oder die disability studies finden also solche keinen Einzug. Ähnliches gilt für die Kategorie des Alters. Mit der wichtigen Ausnahme des die Normalitätsunterstellungen des Museumsraumes untergrabenden Kindes bei Kesselheim wird auf Alter als eine relevante Größe nicht eingegangen - obwohl sich gerade im Fall des Kindes zeigt, wie grundsätzlich vermeintlich stabile und klare räumliche Strukturen sich in anderen Zugangsweisen wandeln. Die Frage kultureller Unterschiede oder von diversity wird ebenfalls nicht systematisch gestellt und taucht in den hier präsentierten Fällen nicht auf. Es gibt also eine Gleichzeitigkeit von einem Interesse an der materiell-räumlichen Herstellung von Normalität, das aber nicht von einem ähnlich ausgeprägten Interesse an der Aushandlung von Differenz begleitet wird. Das ist selbstverständlich nicht als solches falsch oder an sich problematisch. Es hat aber beim Lesen und Arbeiten mit den Beiträgen immer wieder ein Unbehagen in mir hervorgerufen. In Bezug auf die zweite Dimension, den direkten Bezug auf Fragen von Macht und Widerständigkeit, hat sich für mich ein ähnliches Bild ergeben. In den einzelnen Analysen taucht dieses Thema immer wieder auf, in einigen stärker und mehr explizit, in anderen weniger deutlich. Die Nutzung des Fensterraums als Freiraum, die Umnutzung und Infragestellung gebräuchlicher Muster des Gottesdienstes und die Nutzung des Ausstellungsraums als Spiel- Lars Frers 416 platz zeigen alle Beispiele auf, in denen Normalitätsunterstellungen gleichsam systematisch untergraben werden. Diese Beschreibungen gehen jedoch nicht einher mit einer begrifflichen Reflektion. Es wäre ja gerade interessant, das Potenzial des Spannungsverhältnisses zwischen Standbild und Sequenz, zwischen Interaktionsarchitektur und Sozialtopografie in die Diskussion von Begriffen wie ‘Macht’ und ‘Ermöglichung’, beispielsweise in Anschluss an den Begriff des ‘Dispositivs’ bei Foucault (1978) zu diskutieren oder in Bezug auf Widerständigkeit und die Aufteilung des Sinnlichen (Rancière/ Muhle 2006) oder, wie bereits angedeutet, in Bezug auf die Differenzierung zwischen Strategie und Taktik wie bei de Certeau (1988). Wichtiger als die rein begriffliche Dimension wäre dabei noch die Frage nach den Grenzen und Möglichkeiten von Praktiken, die Änderungen hervorrufen bzw. Stabilisierungen einfordern. Für mich ist dies die Frage nach der Beständigkeit sozialmateriell-räumlicher Konstellationen. Bis zu welcher Belastung ist eine Konstellation, also eine dynamische Bewegung von Körpern nach gewohnten Mustern und in einem bestimmten Feld von Kräften, noch stabil? Wie lange und wie heftig muss sie unterbrochen oder ausgesetzt werden, um als sich als solche aufzulösen und so die Bestandteile in eine oder mehrere neue Konstellationen zu überführen? 5. Literatur Anderson, Ben (2009): Affective atmospheres. In: Emotion, Space and Society 2, 2, S. 77-81. Bissell, David (2011): Thinking habits for uncertain subjects: movement, stillness, susceptibility. In: Environment and Planning A 43, 11, S. 2649-2665. Böhme, Gernot (1995): Atmosphäre: Essays zur Neuen Ästhetik. Frankfurt a.M.: Suhrkamp. de Certeau, Michel (1988): Kunst des Handelns. Übersetzt von Ronald Voullié. Berlin: Merve. Deleuze, Gilles/ Guattari, Félix (1992): Tausend Plateaus: Kapitalismus und Schizophrenie. Übersetzt von Gabriele Ricke und Ronald Voullié. Berlin: Merve. Foucault, Michel (1978): Dispositive der Macht: Über Sexualität, Wissen und Wahrheit. Berlin: Merve. Frers, Lars (2007): Einhüllende Materialitäten: Eine Phänomenologie des Wahrnehmens und Handelns an Bahnhöfen und Fährterminals. Bielefeld: transcript. Hognestad, Karin/ Bøe, Marit (2016): Studying practices of leading: qualitative shadowing in early childhood research. In: European Early Childhood Education Research Journal 24, 5 (online first). Wahrnehmungshandeln in der Standbildanalyse 417 Kazig, Rainer (2007): Atmosphären: Konzept für einen nicht repräsentationellen Zugang zum Raum. In: Berndt, Christian/ Pütz, Robert (Hg.) Kulturelle Geographien: Zur Beschäftigung mit Raum und Ort nach dem Cultural Turn. Bielefeld: transcript, S. 167-187. Law, John (2012): Notes on fish, ponds and theory. In: Norsk antropologisk tidsskrift 23, 3-4, S. 225-236. Liggett, Helen (2007): Urban aesthetics and the excess of fact. In: Frers, Lars/ Meier, Lars (Hg.): Encountering urban places: visual and material performances in the city. Aldershot: Ashgate, S. 9-23. Merleau-Ponty, Maurice (1974): Phänomenologie der Wahrnehmung. Übersetzt von Rudolf Boehm. Berlin: de Gruyter. Merleau-Ponty, Maurice/ Lefort, Claude (1994): Das Sichtbare und das Unsichtbare: Gefolgt von Arbeitsnotizen. Übersetzt von Regula Giuliani und Bernhard Waldenfels. 2. Aufl. München: Fink. Rancière, Jacques/ Muhle, Maria (2006): Die Aufteilung des Sinnlichen: Die Politik der Kunst und ihre Paradoxien. Übersetzt von Maria Muhle, Susanne Leeb und Jürgen Link. Berlin: b_books. Schegloff, Emanuel A. (1999): Naivete vs sophistication or discipline vs self-indulgence: a rejoinder to Billig. In: Discourse & Society 10, 4, S. 577-582. Serres, Michel (1998): Die fünf Sinne: Eine Philosophie der Gemenge und Gemische. Übersetzt von Michael Bischoff. Frankfurt a.M.: Suhrkamp. Serres, Michel (2010): Ströme und Turbulenzen: Die Geburt der Physik bei Lukrez. In: Ilinx 1, S. 289-305. ten Have, Paul (2007): Doing conversation analysis : A practical guide. 2. Aufl. Los Angeles: Sage. Gliederung 1. Standbilder ............................................................................................................407 2. Wahrnehmung, Atmosphäre, Affekt .................................................................410 3. Bewegung ..............................................................................................................413 4. Differenz/ Normalität - Körper/ Leib..................................................................415 5. Literatur .................................................................................................................416 MICHAEL GUGGENHEIM GEBÄUDE/ TECHNIK: ETHNOMETHODEN UND IMPLIZITE TYPOLOGIETHEORIEN 1. Ethnomethoden und implizite Architekturtheorie Der Sammelband vereinigt äusserst anregende Fallstudien zum Thema Interaktionsarchitektur, Sozialtopografie und Funktionsraum. Bei aller Verschiedenheit der Fälle werden sie zusammengehalten durch die gemeinsame Methodengrundlage konversationsanalytischer Standbildanalysen, sowie die theoretische Vorannahme, dass es sich dabei jeweils um Fälle von „Funktionsarchitektur“ handle. Im Zentrum meiner Überlegungen steht die Frage, was die Fallstudien (Kirche, Radiostudio, Chemieraum, Schulzimmer, Museum) zusammenhält und trennt und ob sich daraus etwas Allgemeineres über Interaktionsarchitektur, Sozialtopografie und Funktionsraum lernen lässt. Das wichtigste Desiderat der hier vorliegenden Studien ist wohl, dass von den Autoren kaum Bezüge hergestellt werden zwischen den Studien. Es ist unklar, warum die Autoren die je spezifischen Fälle ausgesucht haben und nicht andere und ob es irgendeine Leitidee gibt, wie sich die Fälle aufeinander beziehen oder sich voneinander abgrenzen. Im Folgenden versuche ich aus einer bestimmten Perspektive, die architekturtheoretische Studien zu Typologien mit Akteur-Netzwerktheoretischen Analysen von Gebäuden verbindet (siehe z.B. Guggenheim 2009), eine solche Einordnung vorzunehmen. Mich interessiert dabei primär die implizite Architekturtheorie der Autoren. Diese Behauptung, eine solche sei relevant, widerspricht erst einmal der methodischen Grundannahme der Autoren, bzw. der Form der Konversationsanalyse, die die Autorengruppe teilt. Grundsätzlich, und dies ist nicht spezifisch für diesen Band, ist die Konversationsanalyse, wie auch die Ethnomethodologie agnostisch gegenüber strukturellen, formalen, oder materiellen Kategorisierungen der Welt. Es ist gerade das herausragende methodische Merkmal der genannten Forschungsrichtungen, dass sie weniger eine Theorie über die Welt aufstellen, sondern eben einen Forschungsstil beschreiben, der solche Kategorisierungen als akademische fallacy begreift, die es verhindern, die Ethnomethoden des Untersuchungsgegenstandes zu verstehen. Michael Guggenheim 420 Wenn ich im Folgenden versuche, herauszuarbeiten, dass die Fallstudien, entgegen dieser methodologischen Enthaltsamkeit, notwendigerweise eine implizite Theorie von Gebäudetypen entwerfen, die anhand der Achse Gebäude - Technik analysiert werden kann, dann nicht, um die Autoren zu überführen und den Abfall von der reinen Lehre anzuprangern, sondern um mitzuhelfen, die hier angelegte Architekturtheorie reichhaltiger zu gestalten. Hausendorf und Schmitt brechen schon in der Einführung mit der theoretischen Abstinenz, indem sie die äusserst hilfreiche und fundamentale Unterscheidung von Funktionsraum, Interaktionsarchitektur und Sozialtopografie einführen. Zur Erinnerung: Interaktionsarchitektur definieren sie mit „wie die Architektur von Räumen Interaktion (wenn auch nicht determinieren und verhindern, so doch) ermöglichen und nahelegen kann“. Interaktionsarchitektur ist primär ein Angebot, ein Möglichkeitshorizont. Sozialtopografie hingegen wird „in konkreten Raumnutzungen Anwesender als kognitive Ressource (als sozialtopografisches Wissen) wie selbstverständlich ausgenutzt und in konkreten Raumnutzungen auch sichtbar (und für uns analysierbar) gemacht“. Sozialtopografie bezeichnet demnach Handlungen, Lektüren, Nutzungen: Alles was Menschen mit Räumen anfangen. 1 Unter Funktionsräumen verstehen die Autoren Räume, die in Bezug auf spezifische soziale Funktionen hergerichtet sind, also was in der Architekturtheorie normalerweise Typus heisst, wie im vorliegenden Band an den Beispielen Radiostudio, Museum, Kirche, Chemielabor und Klassenzimmer durchdekliniert wird. 2. Funktionsräume und Strukturierung Funktionsräume implizieren, dass sowohl Interaktionsarchitektur wie auch Sozialtopografie nicht etwa zufällig in der Welt verteilt sind: Der Begriff ‘Funktionsraum’ ist zu unspezifisch, als dass er wichtige Binnendifferenzen zwischen Objektkategorien oder zwischen den Fallstudien fassen könnte. Der Begriff des Funktionsraums, so wie er im Band verwendet wird, weist auf eine unspezifische Spezifizierung eines Raums hin, aber es bleibt durchgehend unklar, was damit gemeint ist. Um ein Beispiel heranzuziehen, schreibt Putzier etwa: „Beim Chemiesaal handelt es sich um einen hochgradig vorstrukturierten Funktionsraum, der in seiner Ausstattung auf ein „Vorne“ ausgerichtet ist.“ Was sollen wir nun darunter verstehen? Ohne Kenntnis architekturhistorischer und -theoretischer Analysen lässt sich aus einer unbelasteten Beobach- 1 Wobei man hier hinzufügen könnte: Tiere und Pflanzen. Zoos, veterinärmedizinische Kliniken, botanische Gärten oder Bauernhöfe sind Gebäude, die wesentlich für Mensch-Tier-Pflanzen-Interaktionen entworfen werden und in denen Tiere und Pflanzen nach den hier genannten Logiken interagieren (Hancocks 1971). Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 421 terperspektive sagen, dass jeder Raum, sofern es sich nicht um den abstrakten, leeren, physikalischen Raum handelt, „vorstrukturiert“ ist. Das ist der Ansatzpunkt jeglicher Raumanalyse: Auch ein Wald mit einem Teich in der Mitte ist vorstrukturiert. Der Wald lädt etwa zum Interaktionstypus ‘Versteckenspielen’ ein, der Teich zum Schwimmen oder Schlittschuhlaufen, oder allenfalls bei Nichtschwimmern oder dünner Eisschicht zu besonderen Vorsichtsmassnahmen. Um genauer zu fassen, was implizit in den Studien mit ‘Funktionsraum’ gemeint ist, schlage ich drei hilfreiche Unterscheidungen vor. Anhand dieser drei Unterscheidungen werde ich versuchen, einige Probleme des gewählten Ansatzes herauszuarbeiten, und einige Vorschläge für theoretische und empirische Erweiterungen unterbreiten. Diese Unterscheidungen sind ‘gestaltet/ ungestaltet’, ‘Typen/ nicht-Typen’ sowie ‘Gebäude als mutable immobile/ Technik’. Die Unterscheidung ‘gestaltet/ nicht-gestaltet’ erklärt den Unterschied zwischen Wald und Chemiesaal. Der Unterschied zwischen Wald und Chemiesaal oder Radiostudio besteht nicht darin, dass letztere Interaktionen strukturieren und ersterer nicht. Sondern dass erstere Interaktion strukturieren durch das Vorhandensein natürlicher Elemente, während letztere Interaktionen basierend auf Ideen strukturieren, die durch Gestalter, Erbauer, Designer, Techniker mithilfe von Standards, Technologien, Baumaterialien etc. in Räume implementiert werden. Hier geht es mir nicht darum, einen Unterschied zwischen Natur und Kultur aufzumachen oder den menschlichen Einfluss auf die Form der sogenannten Natur wegzudefinieren. Vielmehr geht es darum, dass im Falle des Waldes kein Design stattfindet, das qua einer Gestaltungsanalyse rekonstruiert werden kann, während dies üblicherweise im Falle von Räumen sehr wohl möglich ist. Man kann natürlich zu Recht einwenden, auch ein Wald sei ein gestalteter Raum, der von Förstern mit spezifischen Nutzungen im Auge gestaltet wird. Dies gilt sogar für extra „ungestaltete“ Wälder, wie etwa den Schweizerischen Nationalpark, siehe dazu Kupper (Kupper 2012). Die relevante Differenz liegt jedoch nicht an der vollkommenen Abwesenheit von Gestaltung, sondern ihrer Präzision und Eingriffstiefe. Dies ist deshalb entscheidend, weil die Differenz zwischen den beiden Optionen für einen uninformierten Beobachter nicht am Raum selbst oder an der Nutzung ablesbar ist. Ohne Vorwissen kann man nicht entscheiden, ob ein Wald gestaltet wurde oder nicht. Ohne Vorwissen lässt sich auch nicht entscheiden, ob ein bestimmtes Detail eines Gebäudes dafür gedacht ist, dass es ein bestimmtes Interaktionsangebot macht oder nicht. Hier zeigt sich das Problem der konversationsanalytischen und ethnomethodologischen theoretisch-historischen Abstinenz. Indem der Band sich nur auf Nutzung fokussiert, und die Analyse der Gebäudeproduktion durch Architekten, Designer, Michael Guggenheim 422 Ingenieure und Bauarbeiter ausblendet, spielt es letztlich keine Rolle, ob der Raum gestaltet ist oder nicht, denn es gibt keinen methodischen Zugriff auf die Differenz. Die zweite Unterscheidung zwischen Typen und Nicht-Typen wird relevant, wenn wir uns nur für gestaltete Räume interessieren. Auf einer basalen Ebene lässt sich dann von jedem Raum sagen, er sei ein Funktionsraum, und zwar in doppelter Hinsicht: Auf der Ebene der Interaktionsarchitektur legt jeder gestaltete Raum einige Nutzungen nahe und blendet andere aus, und jede Gestalterin wird sich überlegen, wozu der Raum, den sie gestaltet, benutzt werden soll. Auf der Ebene der Sozialtopografie wird jede Analyse für einen Raum zeigen, dass Nutzungen nicht beliebig darin stattfinden, sondern dass einige Nutzungen häufiger als andere sind. Der Begriff des Typus hingegen verweist darauf, dass die moderne Welt eine Clusterung von Interaktionsarchitekturen aufweist. Gebäude sind nicht einfach begehbare Kisten mit zufälliger Ausstattung (weil sie ein Dach über dem Kopf bieten und im Winter geheizt und im Sommer gekühlt sind), sondern sie sind funktional spezifiziert. Dies geschieht in einem langen historischen Prozess, in dem Gebäude in erkennbaren Kategorien oder eben Typologien im Sinne von Clustern mit sozialen Nutzungskategorien korrespondieren. Wenn Putzier schreibt, der Chemiesaal sei „auf ein Vorne ausgerichtet“, dann referenziert sie damit nicht einen zufälligen Einfall der Architektin, der für diesen Chemiesaal gilt, nicht jedoch für andere, sondern eine historische Tatsache, die für die meisten Chemiesäle auf der Welt gilt. Diese historische entstandene Typisierung gilt sowohl für ein Vokabular der Raumgestaltung und Ausstattung, als auch für ein auf die Ausstattung ausgelegtes Training der Interaktionen. Diese Paarung verhindert, dass im Normalbetrieb Akteure in Schulen beten oder in Radiostudios Chemieexperimente demonstrieren. Funktionsräume lassen sich nicht ohne Typen oder Kategorisierungen denken und ihre Benutzung geschieht immer aufgrund von historisch etablierten Kategorisierungen. Die Verschränkung von Interaktionsarchitektur und Sozialtopografie in Funktionsräumen ist immer schon gegeben. 3. Funktionsräume als Typen Eine Präzisierung in Bezug auf Typen würde es ermöglichen, die Beiträge des Bandes an die Erforschung der Geschichte von Typologien anschlussfähig zu machen (zum Einstieg siehe Franck/ Schneekloth 1994; Markus 1993). Der Band versammelt Analysen von Funktionsräumen: einem Museum, einer Kirche, einem Chemiezimmer, einem Schulzimmer und einem Radiostudio. Diese Analysen sind immer dann hyperpräzise, wenn es um spezifische Interak- Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 423 tionen von Nutzern in und mit diesen Räumen geht. In den Blick gerät immer ein spezifischer Nutzer mit einem spezifischen Ausschnitt der Realität des jeweiligen Raumes. Eine spezifische Besuchergruppe und eine spezifische Vitrine. Ein spezifischer Lehrer und ein spezifisches Chemieexperiment. Auffälligerweise springen die Autoren in ihrem jeweiligen Fazit zu allgemeinen Ausführungen über die Methode, über die beobachteten Interaktionstypen oder über das Zusammenspiel von Raum und Körper. Fast durchgehend lassen die Autoren jedoch Ausführungen zum jeweiligen Funktionsraum aus. Was hat der jeweilige Fall damit zu tun, dass es sich um ein Museum, Klassenzimmer oder Radiostudio handelt? Inwiefern ist die beobachtete Interaktion typisch oder untypisch für den Raumtyp? Könnte das, was hier für das Naturkundemuseum X beschrieben wird, auch für ein Naturkundemuseum Y gelten? Wie verhält sich dieses Museum zur Klasse aller Naturkundemuseen oder gar aller Museen? Wie unterscheiden sich Naturkundemuseen von Kunstmuseen, von kulturhistorischen Museen, von Technikmuseen? Am deutlichsten wird diese Problematik noch am Beispiel des Kirchenraums ausgearbeitet, weil es sich offensichtlich um einen nicht-typischen Funktionsraum handelt. Obwohl es sich um einen erkennbaren Kirchenraum handelt, dessen Raumlogik dem typischen zentraleuropäischen Nutzer und Konversationsanalytiker seit Schulausflügen der Primarschule vertraut ist, kommen irritierende Elemente wie Lautsprecher und Stehtische ins Bild, die erkennbar die erwartbare Sakralität durchbrechen. Bloss wird aus den Fallstudien insgesamt nicht deutlich, ob die Autoren überhaupt ihre Fälle in Hinblick auf Typizität gewählt haben oder nicht. Vielmehr erscheint es für die Autoren (mit Ausnahme des erwähnten Beispiels der Kirche) als relativ irrelevant, wie sich der jeweilige Fall zum Universum aller möglichen Fälle verhält. Das zeigt sich auch daran, dass der Leser kaum etwas über den jeweiligen Raum erfährt: Die Räume werden uns als Museen, Klassenzimmer etc. vorgestellt. In welcher Stadt und welchem Land befindet sich dieser Raum? In welchem Jahr und welcher Jahreszeit wurden die Daten aufgenommen? Wann wurde das Gebäude gebaut, wann wurde es renoviert bzw. mit der in den Daten sichtbaren Ausstattung versehen? Wer war die Architektin, die Innendesignerin, die ausführende Baufirma? Die Tatsache, dass wir darauf keine Antwort erhalten, lässt sich einerseits mit dem methodologischen Imperativ erklären, dass die Autoren Benutzerinteraktionsforschung und nicht Architekturgeschichte oder -soziologie schreiben wollen. Dennoch ist die Unspezifik problematisch, sowohl im Hinblick auf die Materialität der Gebäude, als auch auf die Spezifik der Nutzer. Im Bezug auf die Gebäude läuft es darauf hinaus, dass die Gebäude doch nicht ernstgenommen werden als eine spezifische materielle Konstellation. Michael Guggenheim 424 Wenn es nicht darauf ankommt, wie sich das Radiostudio X zur Klasse anderer Radiostudios verhält, dann vermindert sich dementsprechend das theoretische Gewicht des Gebäudes als Funktionsraum. Es ist hyperspezifisch und zugleich vage. In diesem Zwischenraum wird deshalb die Nutzerin sozusagen automatisch, methodenbedingt aufgewertet, denn sie wird zum Schlüssel dafür, warum in diesem Radiostudio geschieht, was geschieht. Dadurch, dass ich als Leser aber auch nicht erfahre, inwiefern die beschriebene Interaktionssequenz eine typische Interaktionssequenz in diesem Raum ist, kann ich auch nicht einschätzen, inwiefern die beschriebene Interaktion nicht durch den Raum, sondern durch die Nutzer geprägt ist. Letztlich muten die Autoren entgegen dem präsentistischen Imperativ dem Leser eine Einordnung zu. Das Kind tut etwas Ausserordentliches, im Radiostudio findet Übliches statt. Aber insofern der Leser diese Einordnung vornimmt, widerspricht sie der empirischen Logik der Aufsätze, denn genau diese Zuordnung sollten die Leser nicht aus ihrem Alltagswissen über Funktionsräume beziehen, sondern sie sollte in den Studien empirisch demonstriert werden. Sind die Hauptzuschauergruppen des Museums Kleinfamilien mit Kindern? Sind die Vitrinen deshalb speziell darauf ausgerichtet, dass Eltern ihre Kinder wiederfinden können? Oder handelt es sich hier um einen Ausnahmefall, und die meisten Benutzer sind Rentner, die sich darüber beschweren, dass es kaum Sitzgelegenheiten gibt? Sind die Teilnehmer des Gottesdienstes typische Gottesdienstteilnehmer? Was geschähe, wenn es sich um eine andere Gemeinde, mit einer anderen Mitgliederstruktur handelte? Werden Chemieexperimente immer auf diese Art und Weise demonstriert, oder ist das typisch für eine Demonstration vor 14-Jährigen, die erst ein Jahr Chemieunterricht haben, nicht jedoch vor denjenigen kurz vor dem Abitur? Handelt es sich hier um einen besonders versierten Lehrer, oder einen unsicheren Anfänger? Die Klasse scheint sehr konzentriert zu sein. Was geschieht im Unterricht mit einer Klasse, bei der es chronische Disziplinprobleme gibt? Was tut der Lehrer, wenn er von einem Papierflieger getroffen wird? Sind Grössenunterschiede relevant? Lässt sich im Radiostudio eines Piratensenders dieselbe Interaktion beobachten wie in einem Radiostudio eines Staatssenders? Inwiefern ist (medien-)technischer Wandel relevant für die Interaktionen, die sich beobachten lassen? Liessen sich dieselben Interaktionen in einem Radiostudio beobachten, in dem die Redakteure Tonbänder, analoge Mischpulte, Schallplattenspieler bedienen? Wie verhalten sich die Vitrinen im Naturkundemuseum zu Dioramen, oder zu Exponaten ohne Vitrinen? Wie verändert sich die Nutzerinteraktion, wenn statt der einohrigen „Telefonhörer“ iPods an Nutzer vergeben werden? Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 425 4. Um - und Gegennutzen An das Problem, wie sich der Fall zum Universum der möglichen Fälle verhält, schliesst sich ein weiteres Problem an: Ob eine konkrete Nutzung eine „korrekte“ Nutzung, oder eine Um- und Gegennutzung ist, lässt sich demnach nicht aus einer Videoanalyse erschliessen, sondern wiederum nur mit Referenz auf die im vorherigen Abschnitt diskutierte Funktionsräumigkeit. Ein Wald kann nicht um- oder gegengenutzt werden, weil im Wald kein Gestaltungsplan verwirklicht wurde. Die hier angesprochene Differenz zwischen gestalteten Räumen und nicht-gestalteten Räumen ist nicht eine zwischen Natur und Technik: ein Erdbeerplantage ist genauso ein gestalteter Raum wie ein Chemielabor. Wenn man im Falle von Wald von Um-oder Gegennutzung sprechen kann, dann nicht mit Referenz auf seine Materialität und Form, sondern in Bezug auf eine Nutzungsordnung, die sich abseits seiner Form konstitutiert. So mag es zum Beispiel ein Pilzsammelverbot geben, aber dieses ist der Materialität des Waldes external. Es hat noch niemand Pilze designt, die sich des Gesammeltwerdens erwehren. Die Verschränkung von Interaktionsarchitektur und Sozialtopgrafie lässt sich empirisch nur dann auseinanderdividieren, wenn sie auf einer der beiden Seiten eine Krise oder Kontroverse erfährt. Im Falle der Interaktionsarchitektur etwa dann, wenn die Form und Materialität von Gebäuden die etablierten Formen spezifischer Funktionsräume unerkennbar machen. Eine solche Krise kann durch verschiedene Strategien erfolgen, etwa durch besonders avantgardistische Architektur, die mit den bekannten Nutzungshinweisen eines bestimmten Typus bricht, durch die historische Verschiebung oder Updates der Logik typischer Funktionsräume (etwa wenn Bücher aus Bibliotheken verschwinden und daraus „idea stores“ werden (Kärrholm 2013)), oder durch Umnutzungen, wenn in Gebäude eines Typs andere Nutzungen eingebaut werden (Guggenheim 2013). Jede dieser Optionen lässt sich jedoch nicht aus dem Material einer Standbildanalyse herauslesen, sondern nur, indem spezifische Räume mit dem Arsenal anderer existierender Gebäude desselben Typs verglichen werden. Wer nicht weiss, wie eine Kirche eigentlich ausschaut, der versteht auch nicht, inwiefern der Gebetsraum der Fallstudie von der Raumlogik einer Kirche abweicht. Auf der Seite der Sozialtopografie kann ebenfalls eine Krise durch Umnutzung durch typusfremde Interaktionen erfolgen (wenn etwa in Universitäten gebetet wird), oder wenn Nutzungshinweise ignoriert werden (etwa wenn Paare in Bibliotheken lautstark streiten). Empirisch lässt sich dies mit den hier vorgenommen Mitteln dann rekonstruieren, wenn abweichende Nutzungen sanktioniert werden, etwa durch Überwachungspersonal oder durch Interventionen spezifischer Überwachungstechnik (piepsende Laserschranken vor Michael Guggenheim 426 Kunstwerken). Dies kann auch durch Funktionspersonal der Räume geschehen, wie sich am Beispiel der Schule zeigt, wenn der Lehrer zur Ordnung ruft und die Stunde beginnt. Oder es kann durch Verlängerungen der Ordnung geschehen, wie etwa am Beispiel der Mutter sichtbar wird, die ihr Kind zu disziplinieren versucht. 5. Technik und Typus Hier kommt nun die dritte Unterscheidung ins Spiel, nämlich diejenige zwischen Gebäuden als Technik und Gebäuden als mutable immobile (siehe dazu Guggenheim 2009). Wenn die Autoren davon reden, Funktionsräume seien „vorstrukturiert“, welche Kraft wird dann diesem Vorstrukturiertsein zugewiesen? Wann wird ein Raum zu einem Chemiesaal? Und unter welchen Umständen ist es möglich, einen Raum, der ein Chemiesaal ist, zu einem Gebet zu benutzen? Zu Recht betonen die Herausgeber und Autoren mehrerer Fallstudien den Angebotscharakter von Räumen, und Hausendorf und Schmitt sprechen in ihrem gemeinsamen Beitrag explizit davon, dass „konkrete Raumnutzung - auch im stabilen Rahmen institutioneller Ordnung ... nicht eindeutig prognostizierbar und auch im Rahmen usueller Orientierungen relativ variabel ist.“ Dies trifft sich mit meiner Idee von mutable immobile. Die Angebote, die Interaktionsarchitekturen machen, können unterdrückt, ausgeblendet und verändert werden, ohne dass sich die Funktionsräumigkeit ändert. Allerdings diskutieren die Herausgeber nicht in vergleichender Absicht, warum Räume eher Angebote machen als in einem harten Sinne strukturieren. Dies hat meines Erachtens auch damit zu tun, dass ein Vokabular fehlt, das Differenzen zwischen der Härte der Strukturierungen erläutern könnte. Der Begriff der ‘Technik’ könnte hier weiterhelfen. Der Aufsatz von Mondada und Oloff (i.d.Bd.) fällt aus dem Strauss der Fallstudien heraus, insofern sie als einzige explizit ‘Technik’ thematisieren. Allerdings führen sie einfach Technik ein, wenn sie schreiben: „Wie bereits erwähnt, richten Studien zum Interaktionsraum ihr Augenmerk insbesondere auf Körperbewegungen, Arbeiten zur Interaktionsarchitektur verstärkt auf einschränkende materielle Umgebungen, jedoch hat keine dieser Ausrichtungen sich primär damit befasst, dass Technologie stark zur Komplexität der Umgebung beiträgt.“ Sie theoretisieren jedoch diese Differenz zwischen Technik und Architektur nicht. Aus dem ersten Zitat würde ich folgern, dass es sich hierbei bloss um eine Aufmerksamkeitsverlagerung handelt: Einige Autoren „fokussieren“ auf Körper und Bewegung, andere auf einschränkende materielle Umwelten und wiederum andere auf Technik. Je nachdem, wohin man schaut, sieht man dann andere Dinge. Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 427 Ich möchte dagegen zeigen, dass hier eine wichtige Unterscheidung zwischen Gebäuden als mutable immobiles und Technik oder eben immutable (im-)mobiles angelegt ist (Guggenheim 2009). Diese Unterscheidung, so will ich zeigen, ist weniger eine Unterscheidung eines Beobachters, die wahlweise als Brille in der Raumforschung gewechselt werden kann, sondern es ist eine Unterscheidung, zwischen verschiedenen Dingkategorien. Diese Unterscheidung, so meine These, „wabert im Hintergrund der Studien herum“, und die Studien könnten erheblich an Präzision gewinnen, wenn wir sie in den Vordergrund schieben. Denn diese Unterscheidung erklärt sowohl, was wir als Kultur-und Sozialwissenschafter sehen, als auch, was die Benutzer in den jeweiligen Fallstudien tun. Es ist im Wesentlichen eine Unterscheidung von Freiheitsgraden. So weisen Mondada und Oloff darauf hin, dass „Arbeitsplätze nicht immer sofort für eine visuelle Analyse verfügbar“ sind. Der Grund dafür liegt nicht darin, dass ein Laie professionelles Handeln entschlüsseln kann, sondern darin, dass ein Grossteil des Handelns technisch hart vorstrukturiert ist. Die technische Strukturierung wiederum ist nicht sichtbar, da sie in Geräte eingelagert ist. Wer nicht weiss, welcher Knopf im Radiostudio welchen Effekt zeitigt, der versteht fundamental nicht, was die Moderatoren tun. Ein Moderator muss einen bestimmten Knopf drücken, um auf Sendung zu gehen, und die Situation im Studio ist vollkommen davon bestimmt, ob gerade Sendung ist oder nicht, aber die Unterscheidung zwischen Sendung und Nicht-Sendung kann nicht am Raum abgelesen werden. Die Unterscheidung Technik/ mutable immobile lässt sich auch entlang der Unterscheidung „kommt mit Gebrauchsanweisung“ und „kommt ohne Gebrauchsanweisung“ fassen. Darin ist nicht nur ein sozusagen ontologischer Unterschied gefasst, sondern auch ein Unterschied hinsichtlich der Entzifferbarkeit der Nutzung. Auf ontologischer Ebene impliziert Technik erst einmal ein Objekt, das bei gleicher Nutzung stabile Outputs liefert. Wer das Mischpult im Radiostudio einschaltet, kann durch das Mikrofon sprechen und auf Sendung gehen. Ohne Mikrofon und Mischpult kein Radio. Für die „Gebetbarkeit“ der Kirche lässt sich dies nicht sagen. Eine Kirche enthält keine Technologien, die das Gebet überhaupt erst ermöglichen und stabilisieren. Die Kirchgemeinde kann auch ohne Altar und Bänke einen Gottesdienst durchführen, wenn es denn sein muss. Diese ontologische Unterscheidung korrespondiert auf mehreren Ebenen mit einem zentralen Unterschied in der Beschreibbarkeit. Es beginnt beim Designer, Architekt oder Konstrukteur: Technik als blackbox ist abgeschlossen und nicht zugänglich für Benutzer. Sie ist opak. Ein ungelernter Benutzer - jemand, der dieses oder ein hinreichend ähnliches Gerät noch nie benutzt hat - kann es nicht in Betrieb setzen. Eine Gebrauchsanweisung erklärt, welche Michael Guggenheim 428 Handgriffe zu welchen Resultaten führen. Die Gebrauchsanweisung funktioniert genau deswegen, weil die beschriebenen Handgriffe zu den spezifischen Resultaten führen. Umgekehrt folgt daraus, dass, wenn ein beschriebener Handgriff nicht zum beschriebenen Resultat führt, das Gerät kaputt ist. (Dieser Bruch ist natürlich nur auf dem Papier so klar, in der Praxis jedoch nicht, wie wir aus Beschreibungen von Reparaturarbeit wissen (Orr 1998)). Die Unterscheidung kann auch positiv formuliert werden: Als Nicht-Technik sind Gebäude offen für Benutzer. Sie laden zum Gebrauch ein. Die Einladung ist im besten Fall eine Aufforderung an die Benutzerin, etwas zu tun und dieses etwas ist nicht etwa durch das Gebäude festgeschrieben. Viel eher, und das sehen wir sehr schön am Beispiel des Schulzimmers oder des Museums, können Nutzer punktuell an den Materialitäten und intendierten Benutzungen von Architekten ansetzen, aber sie können auch vollkommen an ihnen vorbeigehen, etwa wenn ein Kind sich auf den Boden setzt. Wenn das Kind sich auf den Boden setzt oder wenn die Schüler sich ans Fenster stellen und hinausschauen, dann lässt sich dies nicht im Verhältnis zu einer Gebrauchsanleitung, auch nicht einer imaginären, lesen. Egal was wir Foucauldianisch über die Geschichte des Schulzimmers als Raum der Herrichtung von Schülern wissen (Hnilica 2003), wenn die Schüler aus dem Fenster schauen, dann sabotieren sie weder diese Geschichte, noch verhalten sie sich überhaupt irgendwie dazu. Lars Frers weist in seinem Kommentar in eine ähnliche Richtung, bloss setzt er Hoffnungen gerade in eine Foucauldianische Machtanalyse. Aber eine solche verpasst dann sowohl den interaktionistischen Fokus auf das Überraschende, das nicht in den Gebäuden angelegte, das ja gerade so schön in den Beispielen des Schulzimmers und Museums zum Ausdruck kommt, und die hier vorgeschlagene relevante ontologische Differenz zwischen Techniken und Gebäuden. Die interaktionistische Nicht-Vorhersehbarkeit des Kindes im Museum ist keine Unterwanderung der Macht, gerade deswegen weil die „Lesbarkeit“ und Benutzbarkeit der Vitrine und des Museums insgesamt als materielles Objekt (sozusagen vor oder abseits der disziplinären Überformung als Museumsvitrine) gerade ein auf den Boden setzen vorschlägt. Die Einladung des Museums ist nicht nur eine Einladung ans Kind, es ist genauso eine Einladung an Techniker, die zur Steckdose müssen, ans Putzpersonal, das hinter, vor und zwischen und auf den Vitrinen putzen muss, an Eltern, die sich vor ihren Kindern verstecken, oder ihre Kinder suchen, und an Hunde oder Katzen, wenn sie denn ins Museum dürften. Die Disziplinierung des Benutzers, etwa in der Vorgabe, eine Vitrine sei bloss von vorne zu beschauen, und nicht von hinten, ist, insofern sie eine Diszipli- Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 429 nierung ist, nicht im Raum selbst angelegt, sondern gleichermassen in der Benutzerin sedimentiert. Dies ist genau die Differenz, die das Kind als Benutzer aufmacht. Nicht weil es nicht lesen oder hören kann, sondern weil, auch wenn es lesen kann, sein Körper die disziplinierenden Eindrücke noch nicht eingelagert hat. 6. Mutable immobiles, Benutzer, Interpreten Dieser Befund weist auch darauf hin, dass in den diesem Band vorausgegangenen Autorenworkshops, bzw. in den Interpretationen der Autoren in den Analysen der leeren, (noch) unbenutzten Räume, nicht die Benutzungseinladungen der Räume rekonstruiert werden, sondern die Benutzungseinladungen, wie sie die je spezifischen Betrachter rekonstruieren. Hausendorf und Schmitt schreiben dazu in ihrem Beitrag: „Verfügen wir nicht über die gleiche raumnutzungsbezogene Kompetenz wie die dokumentierten Raumnutzer, sind unsere Erkenntnismöglichkeiten ausgesprochen beschränkt.“ Damit implizieren sie richtigerweise, dass die Interpreten verstehen müssen, was die Nutzer tun. Aber damit machen sie sich zu Gefangenen der dokumentierten Nutzer, beziehungsweise genauer, der Selektion des jeweiligen Datenmaterials und der dort vorkommenden Nutzer. Die Interpretin muss soviel verstehen wie die Nutzerin, aber sie darf nicht mehr sehen. Das Spektrum der dokumentierten Nutzer wiederum ist sehr schmal, was der extrem hohen Auflösung der Fallstudien geschuldet ist. Zudem ist die Interpretenschaft der Workshops und Autoren der Sache nach extrem homogen: Akademiker. Die Konvergenz der Interpretationen in den Workshops ist deshalb weniger der Eindeutigkeit der Benutzungseinladung zu attribuieren, sondern der Homogenität der Interpreten. Wenn alle etwas Ähnliches sehen, dann nur deshalb, weil alle etwas Ähnliches zu sehen gelernt haben. Das Kind unter der Vitrine fungiert hier als Korrektiv, aber leider als einziges Korrektiv. Alle anderen imaginierbaren Korrektive fehlen in den Daten und in der Interpretengruppe: Gehbehinderte, Ingenieure, Architekten, Inkontinente, Blinde, Teenager, Terroristen, Diebe, Materialwissenschaftler, Putzmänner, Köche, Marketingexperten, Katzen, Restauratoren, Denkmalschützer etc. Wir können uns leicht für jede dieser Figuren eine Fülle von Interaktionen und Interpretationen denken, die nicht in den hier vertretenen Texten vorkommen. Für einige der Figuren lassen sich leicht Gründe finden, warum sie sich höchstwahrscheinlich kaum je in den jeweiligen Räumen aufhalten würden: etwa Terroristen in Naturkundemuseen oder Köche in Schulzimmern. Aber für viele Figuren gilt dies nicht, und es ist bloss der zufälligen, nicht auf ethnografische Dauer angelegten Methoden der Autoren zuzuschreiben, dass sie nicht vorkommen. Michael Guggenheim 430 Die Vielzahl der genannten Figuren in ihren je spezifischen Interaktionen deutet auch darauf hin, dass die Technizität der Gebäude gerade gering ist. Ein Dieb etwa handelt nicht für oder gegen intendierte Nutzungen, wenn er eine Tasche im Schulzimmer oder im Museum mitgehen lässt, aber seine Tätigkeit ist sehr wohl bedingt durch Wände, Türen und Winkel. Diebigkeit verläuft auch deshalb schräg zu Normalnutzungen, weil es sich nicht um ein Gegenprogramm zur pädagogischen Funktion des Schulzimmers handelt, genauso wenig wie es Blindheit oder Putzen ist. Putzen etwa ist eine charakteristische Tätigkeit für jeden Raum und gerade in „Funktionsräumen“ ist Putzen zumeist eine der professionalisierten Tätigkeiten, die den Raum auf sehr intensive und regelmässige Art und Weise in Beschlag nehmen. Wenn die Autoren (und die Teilnehmer an den Workshops, die diesem Band vorangingen, inklusive der Autor dieses Textes) alle oben genannten Nutzungsangebote verpassen, dann weist das einerseits auf unsere kulturelle Homogenität als Interpretengruppe hin. Aber es weist auch auf die Unabgeschlossenheit von Räumen hinsichtlich ihrer Benutzungsangebote hin, die ein Effekt ihrer Untertechnisierung sind. Hier ist wieder der Vergleich mit dem Radiostudio als hochtechnisiertem Raum instruktiv. Insofern es sich um Technik handelt, sind alle obengenannten Benutzungen eben nicht eingeladene Benutzungen, die gerade die Technizität der Geräte ignorieren. Das Mischpult muss zwar auch gereinigt werden, genauso wie der Tisch im Schulzimmer, aber dabei wird das Mischpult als Mischpult aussen vor gelassen (manchmal wird tatsächlich auch das Mischpult als technisches Gerät gereinigt, aber dann ist es ausser Betrieb und muss auseinander geschraubt werden etc.). Dieses Nicht-Verhalten zu realen oder imaginierten Gebrauchsanweisungen widerlegt nicht die Möglichkeit Foucauldianischer Geschichtsschreibung. Aber es zeigt ihre interaktionistischen Grenzen auf. Und diese Grenzen sind nicht solche, die aus der Widerständigkeit der Subjekte herrühren, sondern aus der Indeterminiertheit von Gebäuden, die nicht technisiert sind. Gebäude/ Technik: Ethnomethoden und implizite Typologietheorien 431 7. Literatur Franck, Karen A./ Schneekloth, Lynda H. (Hg.) (1994): Ordering space. Types in architecture and design. New York: Van Nostrand Reinhold. Guggenheim, Michael (2009): Mutable immobiles. Change of use of buildings as a problem of quasi-technologies. In: Farias, Ignacio/ Bender, Thomas: Urban assemblages. How actor network theory transforms urban studies. London: Routledge, S. 161-178. Guggenheim, Michael (2013): Unifying and decomposing building types: how to analyze the change of use of sacred buildings. In: Qualitative Sociology 36, 4, S. 445-464. Hancocks, David (1971): Animals and architecture. New York: Praeger. Hnilica, Sonja (2003): Disziplinierte Körper: Die Schulbank als Erziehungsapparat. Wien: Edition Selene. Kärrholm, Mattias (2013): Building type production and everyday life: Rethinking building types through actor-network theory and object-oriented philosophy. In: Environment and planning D: Society and Space 31, 6, S. 1109-1124. Kupper, Patrick (2012): Wildnis schaffen: Eine transnationale Geschichte des Schweizerischen Nationalparks. Bern: Haupt. Markus, Thomas A. (1993): Buildings & power. Freedom and control in the origin of modern building types. London: Routledge. Orr, Julian E. (1998): Images of work. In: Science, Technology & Human Values 23, 4, S. 439-455. Gliederung 1. Ethnomethoden und implizite Architekturtheorie .........................................419 2. Funktionsräume und Strukturierung................................................................420 3. Funktionsräume als Typen .................................................................................422 4. Um- und Gegennutzen ........................................................................................425 5. Technik und Typus...............................................................................................426 6. Mutable immobiles, Benutzer, Interpreten.......................................................429 7. Literatur .................................................................................................................431 ACHIM HAHN INTERAKTIONSARCHITEKTUR AUS DER PERSPEKTIVE DER PHÄNOMENOLOGISCH - HERMENEUTISCHEN ARCHITEKTURTHEORIE 1. Das Anliegen der Interaktionsarchitekturforschung Das Konzept der Interaktionsarchitektur geht davon aus, dass Menschen stets mit ihrer Umwelt kommunizieren. Zu dieser Umwelt gehören feste oder bewegliche Dinge, natürliche wie künstliche, aber auch andere Menschen, die ich in meiner Umgebung wahrnehmen kann. Ich sitze gerade an einem Küchentisch. Vor mir der PC, links von mir auf dem Tisch ein geschlossenes Buch. Ich bin alleine. Wenn ich aus dem Fenster hinter mir schauen würde, sähe ich eine Dorfstraße und möglicherweise ein Fahrrad oder Auto und vielleicht mal einen Spaziergänger vorübergehen. Stellen wir uns vor, dass in einer oberen Ecke dieser Küche eine Kamera angebracht wäre, die mich bei meinem Aufenthalt filmte. Man würde dann aus einer Sequenz von vielleicht fünf Minuten vier Standbilder auswählen, die meine Position und mein Handeln im Umgang mit den Dingen auf dem Tisch in einer Folge festhielten. Die Perspektive der Kamera hält alles für einen späteren Betrachter der Aufnahme Sichtbare fest. Aus dieser Perspektive erscheint alles Belichtete als gleich scharf und gewichtig. Die fest in einer Ecke im Raum fixierte Kameraperspektive ist diejenige, der die Interaktionsarchitekturforschung als einzige vertraut. Sie ist die einzige Verbindung mit der Wirklichkeit. Was die Kamera einfängt, bildet das Geschehen ab, das interpretiert werden soll. Meine Perspektive als Akteur, der sich leiblich entspannt oder gereizt fühlt in dieser Umgebung, da sie ihn so oder so anmutet, bleibt unergründlich. Die Perspektive der Kamera soll Objektivität gegenüber einem Wahrnehmungsgeschehen verbürgen, das sich in der Linse des Aufnahmegerätes spiegelt. Aber schon mein Beispiel des Küchenarbeiters war schief gewählt, da die Forschung in diesem Band sich mit Institutionen beschäftigt, in deren Räumen Interaktionen stattfinden und untersucht werden. Architektur gilt dieser Forschung als etwas zu bestimmten Zwecken Hergestelltes. Sie wird allein unter funktionalen Gesichtspunkten betrachtet. In allen Texten dieses Bandes, so darf ich wohl zusammenfassen, soll dem „Zusammenspiel von gebautem Raum und Interaktion“ nachgegangen werden, wobei vorausgesetzt wird, dass „Interaktion [...] an den gebauten Raum gebunden ist, in dem sie stattfindet“ (Kesselheim i.d.Bd., S. 335). In den untersuchten Fällen geht es um archi- Achim Hahn 434 tektonisch gestaltete Innenräume, in denen geplante Aktivitäten in einer möblierten Umgebung stattfinden. Es sind also geschlossene Räume, nicht etwa Straßen-, Grün- oder Landschaftsräume, in denen Menschen sich aufhalten und bewegen. Es geht in den Beispielen um Schul-, Kirchen- und Museumsarchitektur, also um öffentliche und nicht um private Räume. „Hinter“ den öffentlichen Räumen stehen Institutionen (und eine „institutionelle Praxis“), die für die Veranstaltungen, die in ihren Architekturen stattfinden, verantwortlich sind. Wer sich mit solchen Institutionen ein wenig auskennt und es gelernt hat, sich in ihnen entsprechend zu verhalten, von dem darf dann auch eine bestimmte Interaktion mit anderen Menschen in diesen Umgebungen erwartet werden. Kinder allerdings müssen erst dieses Verhalten lernen. Aber nicht nur die Spontaneität von Kindern fordert angepasstes interaktives Verhalten von Erwachsenen heraus. Auch ungeplante Lagen, in die man kommen kann, stören den ansonsten routinierten Handlungsablauf. Die Forschung geht davon aus, dass wir Menschen immer irgendetwas vorhaben und die Architektur unserem Vorhaben den Raum gewährt, dass wir es durchführen können. Dabei kann es auch vorkommen, dass wir Räume erst für unser Anliegen umgestalten müssen, z.B. durch das Umstellen und Herrichten der Möbel, so dass eine geplante Interaktion überhaupt stattfinden kann. So kann in einem Fall der Kirchenraum erst dadurch Interaktionsprobleme lösen, die eine spielerische Darstellung mit sich bringt, nachdem vier Stühle vor einem Altar platziert wurden. Oder auch Freiflächen vor Fenstern können in bestimmten Situationen temporär zu Warteplätzen umgenutzt werden. Ein Beitrag fragt auch danach, wie die an einer Interaktion Beteiligten diese erst herstellen und aushandeln. 1 Der Zusammenhang von Interaktionsarchitektur und Sozialtopografie interessiert alle Beiträge des Bandes. Dieser Zusammenhang wird an Hand von Fallanalysen aufgezeigt und untersucht. Es sind alltägliche Situationen, die dafür ausgewählt werden, indem das Verhalten der Menschen daraufhin interpretiert wird, dass eine gewisse Benutzung von Innenräumen in Abhängigkeit der zugewiesenen Aufgaben der Interagierenden durch die Anordnung architektonischer Elemente (fester wie Wände, Decken, Säulen, Fenster, Vitrinen als auch beweglicher wie Tische, Stühle, Bänke, leichtes Arbeitsgerät usw.) den zu beobachtenden Menschen nahegelegt wurden. Die Räume selber also zeigen sich auf eine Weise, aus der sich schließen lässt, wo vorne und hinten ist und wie man in ihnen agieren soll. „Die Raumnutzerinnen und -nutzer werten den Raum und die in ihm wahrnehmbaren Dinge nun als Hinweise darauf aus, welche Form der Nutzung der Raum ihnen nahelegt, was also mögliche, angemessene, vom Raum suggerierte oder gar geforderte Formen der Raumnutzung sein können“ (Kesselheim i.d.Bd., S. 336). Aber nicht 1 Vgl. den Beitrag von Putzier (i.d.Bd.). Interaktionsarchitektur aus der Perspektive der Architekturtheorie 435 nur das, die Anordnung der Ausstattungsgegenstände unterstellt eine gewisse Rollenverteilung (Lehrer-Schüler; Darsteller-Zuschauer usw.) der potenziellen Raumnutzer. Von diesem Verhalten erfährt der Forscher über Videomitschnitte und Standbilder, die zum Teil mit Originalton unterlegt sind. Wir haben es also nicht mit teilnehmender Beobachtung, auch nicht mit verdeckter Beobachtung zu tun, sondern mit der Betrachtung und Auswertung einer oder mehrerer Kameraperspektiven. Diese „technischen“ Perspektiven haben den Vorteil, „objektiv“ zu sein, da jeder Betrachter der Standbilder einen identischen Bildausschnitt zu Gesicht bekommt. Die Fallanalysen sollen aufweisen, wie Menschen den architektonischen Raum so „bespielen“ und/ oder herrichten, dass gewünschte Handlungen, die immer zugleich Nutzungen sind, tatsächlich vollzogen werden können. Ebenfalls soll herausgearbeitet werden, dass eine vorgefundene und nicht ad hoc umbaubare Architektur ein entsprechendes Verhalten nahelegt, beeinflusst und lenkt. Insofern unterstellt das Konzept der Interaktionsarchitektur eine notwendige und nicht hintergehbare Auseinandersetzung des Menschen mit dem ihn umgebenden architektonischen, gebauten Raum. Allerdings ändert sich für den nicht teilnehmenden Betrachter das Vorne und Hinten, das Nahe und Ferne nicht. Für die Akteure, die sich in den Architekturen bewegen und verhalten, gestaltet es sich potenziell laufend um. Mit jeder Körper-Bewegung nehmen sie ein anderes Hier ein. Möglicherweise fühlt es sich an diesem Hier auch anders an. Die Menschen nehmen immer schon „mehr“ oder auch „weniger“ wahr als der Betrachter im Off des Forschungslabors. Es hängt dann aber auch von den intendierten Handlungen der Menschen ab, ob die vorgefundenen Räume eher unterstützend oder eher hemmend ihr interaktives Tun begleiten. Was diesen Ansatz allerdings nicht interessiert, sind die Stimmungen, die natürlich und selbstverständlich jede Begegnung von Menschen mit anderen Menschen und Dingen begleiten, denn man fühlt sich immer irgendwie, wenn man, in Situationen verstrickt, etwas lösen und erreichen will. 2 2. Methodologie und Methoden In die Methodologie der Interaktionsarchitekturforschung gehen unterschiedliche Theorien ein, die auf eine interessante und wie mir scheint neue Weise kombiniert werden. Kesselheim nennt die Konversationsanalyse, Sozialpsychologie, Architektursemiotik. Aber auch Raum- und Wahrnehmungstheorien und Theorien sozialen Verhaltens (Goffman) kommen zum Einsatz. Zum anderen haben die beteiligten Forscher selbst schon viele Bücher und Artikel publiziert, die ihren Ansatz beschreiben und vorstellen. Die Frage nach der wissenschaftstheoretischen Verankerung der Interaktionsraumforschung kann ich im Rahmen meiner Einlassung nur so stellen, dass ich nach der vorgängi- 2 Vgl. den Beitrag von Kesselheim (i.d.Bd.), sowie Anm. 3. Achim Hahn 436 gen Theorie frage, unter die die bearbeiteten Fälle subsumiert werden, so wie sie mir in den vier Artikeln sichtbar wird. Im Gegensatz zu Verfahren der empirischen Sozialforschung wie die Grounded Theory (Glaser/ Strauss 1998), die ihrem Selbstverständnis nach ein Entdeckungsverfahren ist, wird in unseren Fällen ein Zusammenhang von Architektur, Sozialtopografie und Raumverhalten unterstellt. Dieser Zusammenhang soll sich in den Videoausschnitten, deren „Perspektive“ auf das Material wiederum einer Maschine (Kamera) überlassen wird, abgebildet werden. Die Kamera soll, so weit es technisch möglich ist, den Raum in seiner physischen Vollständigkeit abbilden. „Wir beginnen unsere Analyse mit der Rekonstruktion der interaktionsarchitektonischen Implikationen des Kirchraums auf der Grundlage eines Standbildes“ (Hausendorf/ Schmitt i.d.Bd., S. 228). Bei Putzier heißt es: „Die methodische Vorgehensweise folgt der sogenannten Gesamtbildanalyse: Bei der Analyse lasse ich mich von der Struktur des Standbildes selbst leiten, durch das einzelne Raumaspekte relativ zur Erkenntnisperspektive stärker hervorgehoben werden als andere. [...] Die Auswahl und Ordnung der Standbilder folgt dem Prinzip der Sichtbarmachung und Vollständigkeit interaktionsarchitektonischer Relevanzen“ (Putzier i.d.Bd., S. 304f.). Die Interaktionsforschung, die, in Amerika angeregt durch Mead und Schütz, unter anderem von der Ethnomethodologie (Cicourel) begründet wurde, versteht sich als ein Rekonstruktionsverfahren. Es werden soziologisch vorausgesetzte Konstruktionen des institutionellen Rollenverständnisses als räumliches Verhalten re-konstruiert. So soll es sich um ein „objektives Datenmaterial“ handeln. Es wird dabei zwar von einer „situativen Nutzung“ von Raum gesprochen (Dausendschön-Gay/ Schmitt i.d.Bd., S. 263), aber die Autoren scheinen darunter eher so etwas wie eine „objektive Lage“ in einem sozial determinierten Raum zu verstehen. Man könnte den Ansatz der Interaktionsarchitekturforschung deshalb als einen wichtigen Beitrag zur empirischen Raumsoziologie und Institutionenforschung ansehen. Von den untersuchten Fällen wird behauptet, sie seien solche alltäglicher „institutioneller [...] Praxis“ (ebd). Allerdings wird, soweit ich es beurteilen kann, kein methodisch gesicherter Zugang zum Alltagswissen angestrebt. Obwohl die Menschen, deren Bewegungen im Raum abgebildet werden, auch mit einem Namen benannt werden, spielen nicht als Individuen mit ihren eigenen Geschichten, Empfindungen und Erfahrungen eine Rolle, sondern sie sind Rollenträger: Sie sind Lehrer oder Schüler, Laienschauspieler, Musiker oder Pfarrer, Schwiegermutter oder Schwiegertochter oder Kind, - und nur als Inhaber einer sozialen Rolle interessieren sie die Forschung. Und auch der konkrete Umweltraum wird zu einem „sozialen“ Raum in dem Sinne, dass er dafür gebaut und hergerichtet wurde, dass Menschen in ihm ihre Rollen angepasst einnehmen können. Der soziologische Raum ist ein Container-Raum, in dem Menschen sich wie in einem „natürlichen“ Labor in ihren gesellschaftlich zugerichteten Aufgaben einrichten. Raum-Nutzen und Interaktionsarchitektur aus der Perspektive der Architekturtheorie 437 Rolle-Ausfüllen sind hier ein identischer Vorgang sozialen Verhaltens. Raumfunktion und soziale Rolle entsprechen sich. In Abwandlung der Devise der Architekten der Chicagoer Schule „form follows function“ heißt es nun: „function follows role“. Von Interesse kann dabei natürlich auch sein, dass „der Raum auf eine spezielle, nicht mit den Zielen der Institution zu vereinbarende Weise genutzt“ werden muss (Kesselheim i.d.Bd., S. 335). Dabei ist die Aufmerksamkeit der Forscher darauf gerichtet, zu beobachten, wie die Rollenträger auf eine Architektureinrichtung eingehen, die für abweichende Rollenspiele nicht vorgesehen ist, oder wie eine Rollenträgerin in einer räumlichen Lage mit zwei Rollen (Mutter und Museumsbesucher) zugleich zurechtkommt. 3. Architekturtheorie und Interaktionsarchitektur Im folgen Abschnitt versuche ich die Interaktionsforschung mit der phänomenologisch-hermeneutischen Architekturwissenschaft, wie wir sie in Dresden betreiben, in Beziehung zu setzen. Die Architekturtheorie wird seit ihren Anfängen von Architekten ausgeführt. Seit dem 19. Jahrhundert haben sich vermehrt Kunsthistoriker und Kunstwissenschaftler mit Architektur und vor allem mit ihren Ausdrucksformen beschäftigt. Aber erst in jüngster Zeit hat sich das Interesse gebildet und formuliert, Architektur mit sozialwissenschaftlichen empirischen Methoden zu untersuchen. Diese in den letzten 20 Jahren aufkommenden Forschungsaktivitäten sind ganz gut in den Architekturtheoriezeitschriften Wolkenkuckucksheim und Ausdruck und Gebrauch dokumentiert. Nicht mehr die Architektur als Kunstwerk und sein ästhetischer Genuss stehen im Mittelpunkt des Forschungsinteresses, sondern der Mensch in seinem Verhalten zur gebautem Umwelt - im Wohnen, Entwerfen und Bauen (Hahn 2008). Beide wissenschaftlichen Zeitschriften sehen sich in der Tradition der phänomenologischen Hermeneutik und veröffentlichen Artikel, die das Phänomen des architektonischen Verhaltens in der Lebenswelt der Menschen zum Ausgang nimmt. Wir können nur nach soziologischen Rollen und Topografien suchen, weil wir davon vorwissenschaftlich-lebensweltlich bereits wissen. Deshalb sprechen wir auch vom lebensweltlichen Apriori (Mittelstraß 1991). Das wissenschaftliche Denken hat das vorwissenschaftliche zu seiner Grundlage. Paul Lorenzen hat „(d)ie Frage nach der Methode unseres Denkens“ untersucht. Da das Denken eine menschliche Leistung ist, muss sich eine entsprechende Reflexion statt an den Naturwissenschaften an den Geisteswissenschaften orientieren. 3 Damit stehen sich Denken und Verstehen bzw. Logik und Hermeneutik gegenüber. Vor allem 3 Vgl. Lorenzen (1968): Die Erkenntnistheorie hat es mit den Bedingungen, Möglichkeiten und Grenzen menschlicher Erkenntnis zu tun. Deshalb kann sie nicht als eine empirische (Natur-) Wissenschaft angelegt werden. Achim Hahn 438 Dilthey habe das Leben des Menschen in den Mittelpunkt gerückt, dahinter keine Erkenntnis zurückgehen kann. Innerhalb dieser hermeneutischen Tradition ist es evident, dass das Denken von der praktischen Lebenssituation auszugehen habe, denn „(a)lles Denken ist eine Hochstilisierung dessen, was man im praktischen Leben immer schon tut“ (Lorenzen 1968, S. 26). 4 Wenn allerdings nicht schon bei einer Wissenschaft, etwa der Hermeneutik oder beim Interaktionismus, sondern bei praktischen Lebenssituationen angesetzt werden soll, dann bleibt nur die Sprache, in der wir vorwissenschaftlich unser Tun und Lassen schon verstehen, der Ausgangspunkt. Aber gerade die Sprachpraxis der Protagonisten der vorgeführten Fälle bleibt erstaunlicherweise ungewürdigt. Für alle Wissenschaft gilt: Ihre Interpretationen und Sinnauslegungen müssen sich immer rückbeziehen lassen auf die primäre Welt, in der die Menschen ihr Leben führen, und das ist die Welt in „natürlicher“ Einstellung. Alle Menschen haben in ihrem Leben Erfahrungen mit Architektur gemacht, zunächst im Wohnen, und wissen damit implizit schon etwas „Allgemeines“ über Gebautes. Aus diesem Grunde ist für uns der Erfahrungsbegriff im Sinne von ‘Erfahrenheit im Umgang mit’ von entscheidender methodologischer Bedeutung. 5 Erfahrungen, insbesondere Erfahrungen mit der eigenen Leiblichkeit, 6 gehen jeder sozialen Rollenkonstruktion immer schon voraus. Deshalb untersucht die phänomenologisch-hermeneutische Architekturwissenschaft Wahrnehmungen oder besser Empfindungen - da „ich“ es bin, der sie leibhaftig spürt, und auch „ich“ es bin, der „weiß“, wie sich z.B. Holz im Unterschied zu Stahl oder Glas anfühlt - stets aus der Perspektive der Praxis der Menschen selbst mit ihrem Umgangswissen. Praxis hat die Struktur der Situation. Sie ist je meine Situation und zugleich „problematische“ Situation. Als solche macht sie sich bemerkbar. Die Situation stellt sich mir als eine Aufgabe, die von mir bewältigt und gelöst werden muss. Sie enthält nicht nur eine sozusagen theoretische Aufforderung an mich, sondern ich erlebe einen Handlungsdruck. Im Tun kläre und verändere ich die Situation. Durch die Tat schaffe ich einen neuen Sinn, indem ich auf situativ adäquate Weise eine praktische Erkenntnis vollzogen habe. Der Handelnde steht nicht einer Situation gegenüber. Vielmehr agiert er, insofern er die Situation zu seiner macht, sie als diese besondere und einmalige Situation begreift. Die Situation in ihrer einzigartigen Problematik geht den Handelnden etwas an. Sie betrifft ihn. Der Handelnde identifiziert sich mit ihrer Bewältigung. Das Erfassen von Situationen lässt sich deuten als eine Erkenntnis, 4 Der philosophische Konstruktivismus hat diese Position Lorenzens unter dem Stichwort „Lebensweltliches Apriori“ weiter verfolgt, vgl. Mittelstraß (1991). 5 Vgl. Kambartel (1973, 1974). 6 Vgl. Schmitz (2007, S. 115ff.). Interaktionsarchitektur aus der Perspektive der Architekturtheorie 439 die als solche zugleich ihre praktische Lösung ist. Ein entsprechendes Wissen, das bereithält, was in einer Situation am besten zu tun ist, ist eine praktische Erkenntnis der Besonderheit von einmaligen Sachverhalten. Es ist kein theoretisches Wissen, das hier zur Anwendung kommt, sondern Erfahrungs-, Umgangs- oder Gebrauchswissen. Das „Lesen“ von räumlich-architektonischen Situationen heißt dann: das Besondere der Situation als etwas Bekanntes und Vertrautes zu identifizieren und damit zugleich die Möglichkeiten einzusehen, sie daraufhin zu verändern. Während die Interaktionsforschung sich in eine Zuschauerposition hinein begibt und sich auf Objekte, insofern sie als Fälle vorausgesetzter Theorie genommen werden können, ausrichtet, versucht die phänomenologisch-hermeneutische Architekturforschung die Menschen in ihrer Welt zu erreichen und vor dem Hintergrund ihrer Lebenserfahrungen ihr Können vom Umgang mit Architektur zu verstehen. 3.1 Raum und Architektur (Container - Raum) Jedermann ist die Vorstellung geläufig, alles in der Welt Vorhandene sei so im Raum anwesend, daß man es stets an einem bestimmten Ort oder Platz innerhalb eines vorgegebenen, hohlraumartigen Weltbehälters antreffe. An seiner jeweiligen Stelle würde außerdem alles Vorhandene den seiner meßbaren Ausdehnung und seinem berechenbaren Volumen entsprechenden Raumausschnitt einnehmen und ihn ausfüllen. [...] Zu allem, was in der Welt anwesend ist, gehört auch der Mensch. Darum wird sein ‘Im Raume-sein’ üblicherweise ebenfalls auf solche Weise vorgestellt. (Boss 1999, S. 239) Medard Boss, ein Schweizer Psychiater, hat diesem von ihm skizzierten naiven Raumverständnis ein anderes, lebensweltliches zur Seite gestellt. Der Mensch in seiner Um-Welt bewegt sich stets in einem Raum, der sein ureigenes Milieu ist. Der Mensch „hat“ seine Welt, in der er räumlich anwesend ist. Er befindet sich „in“ dieser Lebenswelt nicht wie Dinge, die in einer Schachtel beieinander liegen. Vielmehr verhält sich der Mensch zur Räumlichkeit seines Daseins. Der „Raum“, in dem wir unser Leben in der Welt führen und agieren, ist unsere Alltagslandschaft (Hahn 2007). Der Mensch selbst ist die Mitte dieser alltäglich gelebten oder lebensweltlichen Umwelt. Oben und unten, vorne und hinten, links und rechts sind Koordinaten, die auf ein „Hier“ und eine Mitte, die wir jeweils selbst sind, ausgerichtet sind. Wenn in einem Text von den „räumlichen Bedingungen“ (Putzier i.d.Bd., S. 303) die Rede ist, dann meint die Autorin eigentlich die technische Ausstattung eines Klassenzimmers als Chemiesaal. Unter den räumlichen Bedingungen kann aber auch das Wirken von räumlicher Anmutung als Bedingung für das leibliche Sich-Befinden der Menschen verstanden werden. Achim Hahn 440 Auch die Interaktionsarchitekturforschung unterstellt einen Raum, in dem Menschen sich befinden, als diesen hohlen Behälter- oder Containerraum. Welt und Raum sind identisch: Wie wenn wir uns vor ein Aquarium stellten und die Fische in ihrem Treiben durch die Glaswand beobachteten, so nimmt auch die Kamera eine Perspektive ein, die auf einen vollständigen Überblick des Hohlraums innerhalb seiner physischen Begrenzungen ausgerichtet ist. Der Forscher sitzt ebenfalls vor „seiner“ Scheibe (Leinwand) und betrachtet, was dahinter bzw. auf ihr passiert. Diese Haltung wird besonders dadurch deutlich, dass man sich zunächst das Kamerabild aussucht, auf dem noch keine Menschen zu sehen sind. Warum? Weil man zunächst einmal sich der Vollständigkeit der Dinge und dessen versichern will, was diese „an sich“ sind. Alltagsweltlich ist eine solche Perspektive völlig irrelevant, weil man nie auf Vollständigkeit der Dinge in einem Containerraum aus sein kann, sondern immer nur auf etwas Bestimmtes im Umweltraum orientiert ist. Man ist „bei“ den Dingen, die zur Hand sind, in einer gemeinsamen Welt. 7 Die Perspektive auf eine vollständige Anwesenheit von Dingen im Behälterraum kann kein Mensch handelnd einnehmen. Die Menschen und Dinge nehmen eine Stelle in diesem Raum ein, und man beobachtet, wie sie neue Stellen besetzen. Für den Beobachter sind die Dinge vorhanden, für die Handenden im Umweltraum ist Zeug zuhanden. Für ihn ist die Welt nicht „im“ Raum. Umgekehrt: er hat „in“ seiner Welt auch Räumliches erschlossen. Er führt sein Leben „immer schon“ räumlich. 8 Das Raumverständnis unserer Architekturtheorie ist ein anderes. Wir haben nicht auf der einen Seite den Menschen und ihm gegenüber einen Raum, den er betritt und wieder verlässt. Die Räumlichkeit des Menschen ist unhintergehbar. Hermann Schmitz spricht auch von der „Räumlichkeit des Leibes“. 9 Raum oder Räumlichkeit ist das erlebte Hier unseres Daseins. Wir unterscheiden zwischen einem abstrakten, mathematischen Raum, wie er z.B. in der Geometrie theoretisch konstruiert werden kann, und dem „erlebten“ Raum. 10 Jener mathematische Raum ist eine Abstraktion von diesem „erlebten“ oder „Empfindungsraum“, wie u.a. Ernst Cassirer und Erwin Straus unterschieden haben. Wir sind mit Wilhelm Schapp 11 davon überzeugt, dass man Raum 7 Dieses In-der-Welt- und Bei-den-Dingen-sein hat Martin Heidegger ausführlich in der „Zeuganalyse“ von Sein und Zeit herausgearbeitet. Vgl. Heidegger (1984, § 15.). 8 Heidegger (1984, § 24. Die Räumlichkeit des Daseins und der Raum). 9 Vgl. Schmitz (2007). Der Leib ist kein Wahrnehmungsorgan wie Auge, Hand und Gehör, die man willkürlich einsetzen kann, um einen sinnlichen Eindruck zu erhalten. Es geht um ein affektives Betroffensein in seiner Ganzheitlichkeit. Schmitz nennt das, was man von sich („eigenleiblich“) spürt, wie Schmerz, Hunger, Behagen, „leibliche Regung“. 10 „Wir sprechen [...] von einem erlebten Raum und meinen damit, den Raum, wie er sich dem konkreten menschlichen Leben erschließt.“ (Bollnow 1963, S. 18). 11 Vgl. seine Beiträge zur Phänomenologie der Wahrnehmung (Schapp 1976). Interaktionsarchitektur aus der Perspektive der Architekturtheorie 441 nicht wahrnehmen kann. Wahrnehmen, z.B. sehen, können wir nur Dinge im Raum: Stühle, Tische, Menschen, Wände aus Stein, Decken aus Holz, Fußböden aus Kunststoff usw. Raum können wir nur spüren: z.B. in der Enge oder Weite, Behaglichkeit oder Kälte, in der Gemütlichkeit und Geborgenheit einer Umwelt. Architektur ist nicht identisch mit Raum. Architektur schafft Grenzen, nach innen wie nach außen. Innerhalb ihrer Grenzen versammelt sie Dinge und Menschen. Sie ist ein Artefakt, ein tektonisches Gestell, ein Gefüge aus Materialien. Architektur lässt sich fotografieren, Dinge bilden sich darauf ab, Räume lassen sich nur erleben. Wir nutzen auch nicht Raum, sondern Dinge im Raum, und die Leere zwischen ihnen und uns dient unserer Bewegung. Wir gehen dabei mit der Leere, die z.B. zwischen mir und einer Tafel gelassen wurde, klug um. Dennoch hat es zweifelsfrei Sinn, wenn man einmal bewusst das „Leibapriori“ (Thomas Rentsch) im erlebten Raum „einklammert“. Dann lösen wir allerdings den Raum in Flächen auf, die wir aufeinander beziehen können, dass z.B. ein Würfel entsteht, dessen Volumen sich bestimmen lässt. Alle Maße und Dimensionen können dabei numerisch festlegt werden. Deshalb kann auch vom Stand-Bild, das selbst flächig ist, als einem objektiven Datum, wie es der mit einer Legende versehene und genordete Plan ebenfalls ist, ausgegangen werden. Den erlebten Raum erleben wir in seinem so-Wirken sowie in seiner Bedeutsamkeit und Relevanz für unser Befinden und unsere Vorhaben. Bedeutsamkeit ist ein wesentlicher Begriff der hermeneutischen Philosophie bei Dilthey und später auch bei Georg Misch. Bedeutsamkeit nennt Misch die „natürliche vorwissenschaftliche Stellung unseres Wissens zu den Dingen“ (Misch 1994, S. 515) und grenzt diese ab von deren (purer) Wahrnehmung. Das „Zeigen“ ihrer Bedeutsamkeit lässt sich nur von dieser natürlichen (erlebnismäßigen) Stellung des Lebens zu den Dingen her begreifen. Eine wissenschaftliche Logik mit ihrer Gebundenheit an sachliche Richtigkeit und der ihr eigenen auffassenden Stimmung könnte hier nichts ausrichten. Die Auslegung dessen, wie uns etwas anmutet und was es bedeutet, ist nicht bloß eine Vorstellung von einem Ding, sondern gestaltet dieses erst in der auslegenden Darstellung. 3.2 Wahrnehmung und Erfahrung Von zentraler Bedeutung ist für die Interaktionsarchitekturforschung die Wahrnehmung. Doch was ist Wahrnehmung? „Wir haben einen gebauten und gestalteten Raum [Kircheninnenraum, A.H.] vor uns, der über seine mehr oder weniger voraussetzungsarm wahrnehmbare Interaktionsarchitektur hinaus gleich schon sozialtopografisch hoch vertrautheitsabhängig aufgeladen ist. Die Wahrnehmung des Raumes wird damit, Vertrautheit vorausgesetzt, zu einem Wiedererkennen“ (Hausendorf/ Schmitt i.d.Bd., S. 231). Ein Kircheninnenraum in unserem Kulturkreis zeigt eine typische und erwartbare architektoni- Achim Hahn 442 sche Gestalt und ist mit uns bekannten Ausstattungselementen angefüllt. Unsere Aufmerksamkeit richtet sich deshalb auf das Überraschende („Drei Stühle“), und wir fragen uns, was es damit wohl auf sich hat. Diese Frage gilt dann als beantwortet, wenn Menschen mit dem Unvertrauten umgehen und sich darin wiederum ein bekanntes Muster zeigt, das intersubjektiv verständlich ist. Ich habe jedoch nicht verstanden, was die Autoren unter einer „Wahrnehmungswahrnehmung“ verstehen. Mir scheint es allerdings plausibel, dass Menschen wahrnehmen, nicht um wahrzunehmen, sondern stets etwas als etwas wahrnehmen. Die Phänomenologie hat deshalb auf die Intentionalität als zentrales Moment unserer Wahrnehmung hingewiesen. Wahrnehmung ist niemals Selbstzweck, sondern dient unserer Orientierung in der Welt. Der Forscher unterstellt eine identische Wahrnehmungshaltung bei den Akteuren, die ja auch nicht in ihrer leiblichen Betroffenheit interessieren, sondern als Vertreter bestimmter sozialer Rollen. Das ist die Haltung des Ethnologen, der vor dem Hintergrund seiner Kulturwelt (sein Vorwissen) das deutend einschätzt, was ihm „im Feld“ an bekannten Bildern dargeboten wird. Das ihm Unbekannte wird er entweder als Irrtum der Menschen auffassen oder als ein abweichender Fall, der aber ins überkommene Schema integriert werden kann (vgl. Wittgenstein 1991, S. 29ff.). Der Ethnologe hat vermutlich kein Interesse an der Eigenwelt, den Orientierungen und dem Selbstverständnis der Menschen, die in ihrem Tun und Lassen an ihren eigenen Lebenserfahrungen anknüpfen. „Wahrnehmen“ ist an ein Vorwissen („Vor-Urteil“) gebunden, das selbst nicht explizit sein muss. Oder ein anderer Fall: „Fast alles, was am Experimentiertisch stattfindet, fällt unter Beobachtungsverdacht. [...] So kann er [der Lehrer, A.H.] gezielt spezifische Positionierungen vornehmen, weil sie an dem Ort realisiert werden, der für Wahrnehmung und Beobachtung hergerichtet ist.“ (Putzier i.d.Bd., S. 304). Hier interessiert nur der spezielle Fall der Wahrnehmung als Beobachtung. Was sind aber in dieser konkreten Situation Anlass, Gegenstand und Ziel der Wahrnehmung? Und was soll „fast alles“ hier bedeuten? Ist es quantitativ oder qualitativ gemeint? 12 Etwas sehen kann nur der, der schon etwas verstanden hat. Und verstehen können wir nur, insofern wir schon in der (je meiner) Welt orientiert sind. Was wurde als „tatsächlich“ vor dem Hintergrund von Erfahrungen wahrgenommen? Nimmt der Schüler A Identisches wie der Schüler B wahr? Nehmen beide Identisches wie der Lehrer wahr? Dann müssten alle auch dieselben Vorkenntnisse und Ambitionen in die Situation einbringen. Aber die Schüler ebenso wie der Lehrer spüren sich auch in dieser Situation. Und was nimmt der Forscher vor dem Hintergrund seines Vorwissens wahr, wenn er alle Personen auf seinem Monitor „beim Wahrnehmen“ beobachtet? Schon die Antworten der Schüler zeigen, dass sie mit un- 12 Vgl. John Deweys Aufsatz Qualitatives Denken (1930), in: Dewey (2003, S. 94ff.). Interaktionsarchitektur aus der Perspektive der Architekturtheorie 443 terschiedlichen Erwartungen und Betroffenheiten in die Wahrnehmungssituation hineingeraten sind. Und haben alle Beteiligten denn zuvor nicht schon etwas als etwas wahrgenommen, als sie noch gar nicht wussten, was der Lehrer ihnen vorführen würde? Jede Wahrnehmung ist primär reaktiv. Nur insofern sich etwas zeigt, darauf ich mich auch intentional richten kann, wird aktiv gesehen, gehört, ertastet usw. In diesen Zusammenhang gehört auch die Unterscheidung zwischen aisthetischer und ästhetischer sinnlicher Wahrnehmung und Erfahrung. Die Wahrnehmung ist rezeptiv und aktiv. Der Wahrnehmende muss „aufgeschlossen“ sein für das, was „wahr“ genommen wird. Die „Sachen selbst“ lassen sich also niemals in einem „reinen Selbstsein“ entdecken, vielmehr sind sie schon immer Sachen (z.B. Chemieunterricht-Sachen) für uns Menschen in unserer Welt. Ihr „Selbst-sein“ zeigt sich in ihrer Bezogenheit auf die menschliche Welt, nur innerhalb dieser Welt sind sie überhaupt zugänglich. In der Wahrnehmung widerfährt uns etwas, das uns „betrifft“. „Wahrnehmend“ erfahren wir etwas, was uns angeht. Dieser „Angang“ z.B. einer räumlichen Situation kann freudig, ängstlich, interessiert oder gelangweilt hingenommen werden. Auf dieses Phänomen geht auch die Wirkbeschreibung von Interaktionsarchitektur zurück, wenn etwas den Eindruck macht, „besonders markant und salient“ zu sein (Hausendorf/ Schmitt i.d.Bd., S. 231). Auch die Wahrnehmung, besser: Anmutung von „Spannung“ benennt keine Eigenschaft von Dingen, sondern ein räumlich-atmosphärisches Wirken, ebenso wenn der Eindruck benannt wird, dass etwas „in den Hintergrund tritt“, etwas „unmittelbar anschaulich [wird]“ (ebd., S. 233). An diesen Beispielen wird deutlich, dass der Forscher sich der Wirkung von Bildern gar nicht ganz entziehen und den vermeintlich „objektiven“ Standpunkt des neutralen Beobachters nicht durchstehen kann. 3.3 Nutzung (Funktion) und Gebrauch (Widerfahrnis und Angemessenheit) Vitruv hat bekanntlich das „Wesen“ der Architektur in ihren drei Eigenschaften gesehen: Firmitas (Standfestigkeit), Utilitas (Nützlichkeit) und Venustas (Schönheit). Und er hat diese Eigenschaften aus der Perspektive des ingeniösen Architekten formuliert. Dieser ist dafür verantwortlich. Vitruv entnahm das „Maß“ für Schönheit der Architektur dem Durchmesser einer Säule. Die Perspektive, die er nicht eingenommen hat, ist die des Umgangs, des Gebrauchs. Aber schon Platon hatte eine „Wissenschaft des Gebrauchs“ nicht nur angemahnt, sondern diese noch vor das Herstellen gesetzt. 13 Aus dieser Perspektive, dass dem Gebrauch das Primat gegenüber dem Herstellen gebührt, hat er allen Hervorbringungen folgende drei Tugenden anheimgestellt: 13 Platon: Politeia, 601 B-601 C. Achim Hahn 444 Tüchtigkeit, Schönheit, Richtigkeit (Arete, Kallos, Orthotes). Der Architekt kann immer nur für einen allgemeinen Nutzen entwerfen, Architektur in Gebrauch nehmen wir stets in konkreten Situationen. Im Gebrauch widerfahren uns die Dinge hinsichtlich ihrer Angemessenheit einem drängenden Begehren gegenüber. Zwar bildet das Material der Interaktionsarchitekturforschung konkrete Gebrauchssituationen ab, aber sie wertet das Abbild aus, nicht die Situation selbst. Sie richtet ihr Interesse an einem allgemeinen Nutzen aus. Aus der erlebten Situation von Lehrern und Schülern in ihren konkreten Lebenswelten werden verallgemeinerte topografische Lagen von Rollenträgern. Freilich, vorwissenschaftlich kennen wir die Dinge aus unmittelbaren Erfahrungen. Situationen widerfahren uns leibhaftig, sie widerfahren uns bezogen auf unsere Bedürftigkeit, wie Wilhelm Kamlah es genannt hat (Kamlah 1972). In generelle Lagen können Menschen kommen. Die Interaktionsarchitekturforschung nimmt auch hier eine methodische Reduktion vor, als sie den Menschen nicht mit seinen unmittelbaren und durchaus individuellen (Gebrauchs-)Erfahrungen sich begegnen lässt, sondern als „Homo sociologicus“ (Ralf Dahrendorf). 4. Fazit: Produktive Ergänzungsstrategien einer empirischen Architekturwissenschaft Ich habe die vier Forschungsberichte mit großem Interesse gelesen. Sie zeigen ein hohes Niveau der Interaktionsarchitekturforschung und machen auf eindrückliche Weise bewusst, dass und wie architektonisches Verhalten sozialwissenschaftlich erforscht und analysiert werden kann. Im Grunde ist jedem Architekten die Haltung eines Forschers zu wünschen, der eine architektonische Bauaufgabe auch aus Nutzungs- und Funktionszusammenhängen begreifen muss. Die Videos und Standbilder zeigen Architekten eindrucksvoll, wie Menschen sich in Institutionen bewegen und wie sie durch die Architektur in ihrem Verhalten geführt und vielleicht auch verführt werden können. Architektur und Städtebau, das hat schon Hans Paul Bahrdt (Die moderne Großstadt, Bahrdt 1961) vor vielen Jahren festgestellt, manipulieren unser sozialräumliches Verhalten. Der (symbolische) Interaktionismus, der vor allem in der Auslegung von Harold Blumer anregend für eine phänomenologisch-hermeneutische Architekturtheorie gewesen ist (Blumer 1973), hat in dem Buch Das Unfertige bauen des schwedisch-amerikanischen Architekten und Architekturtheoretikers Lars Lerup (Lerup 1986) einen intelligenten Vertreter gefunden. Gegen den Behaviorismus gerichtet, behauptet Lerup, Architektur und ihre Elemente erhielten ihre Bedeutung erst im Umgang der Menschen mit ihnen. Einen vergleichbaren Zugang auf städtischer Ebene hat schon früh die Wilhelm Stern-Schülerin und Pädagogin Martha Muchow vorgelegt (Der Lebensraum des Großstadtkindes, Muchow 1935). Darin zeigt sie ein- Interaktionsarchitektur aus der Perspektive der Architekturtheorie 445 drucksvoll, wie Plätze, die Erwachsene längst „links liegen“ gelassen haben, von Kindern stimmungsmäßig angeeignet werden und deren Welt bereichern. Gerade letzteres Beispiel zeigt, dass Handeln immer auch eine Naturseite (z.B. Affekte, Motivation) hat und nicht ausschließlich gesellschaftskritisch interpretiert werden kann. Beide Arbeiten thematisieren die Vorherbestimmbarkeit menschlichen Verhalten durch sozialräumliche und institutionelle Umwelten. Lerup hat den Architekten als einen Sozialforscher bezeichnet, der sich in dem Zusammenhang von menschlichem Verhalten und physischer Umwelt auskennen muss. Die Architektur sei schließlich die „Bühne des Lebens“. Die spannendste Frage stellt Lerup hinsichtlich der Bedeutungen der Dinge unserer Umwelt? Weiß der Architekt etwa nicht, was ein Fenster, eine Treppe, was Türen sind? Ja und Nein, ist seine Antwort. Wenn es eindeutig sei, was jene architektonischen Elemente im Leben der Menschen bedeuteten, dann müssten sich entsprechend eindeutige Entwurfskriterien entwickeln lassen, die eine auf den Menschen maßgeschneiderte gebaute Umwelt gewährleisten könnten. In diesem Zusammenhang kritisiert Lerup die These des Behaviorismus, es gäbe eine entwurfsrelevante deterministische Beziehung zwischen dem menschlichen Verhalten und der physischen Umwelt. Angeregt von Erkenntnissen des Symbolischen Interaktionismus plädiert Lars Lerup dafür, das Verhalten des Menschen zu seiner Umwelt als eine Interaktion zu verstehen und in architektonischen Entwürfen „Platz“ zu lassen für die Aneignungen der Menschen. Er ist der Auffassung, dass Architektur das menschliche Verhalten nicht manipulieren kann, da man nicht voraussehen kann, wie sich Menschen tatsächlich in Situationen verhalten werden. Die Bedeutung von Situationen wird in jedem einzelnen Fall neu ausgehandelt. Ähnlich sind auch die Erfahrungen, die Martha Muchow in Hamburg gemacht hat. Spielend und daher völlig unerwartet eignen sich Kinder Plätze, Mauern, Treppen an. Interessanterweise unterscheidet Lerup zwischen Verhalten und Handeln. So begreife der Behaviorismus Verhalten als vorherbestimmbare Reaktionen auf äußere Reize und Impulse. Stattdessen liege aber z.B. im Gebrauch von Architektur ein echtes Handeln vor: „Die Bewohner sind keine respondierenden Organismen, sondern aktive Individuen, die durch ihre Aneignung den Dingen eine Bedeutung geben.“ (Lerup 1986, S. 20). Der Interaktionismus, so wie ihn Lerup auslegt, weist jede einseitige Prägung des Menschen durch seine Umwelt zurück. Lerup denkt das Verhältnis von Mensch und Umwelt als Wechselwirkung, so dass der Mensch immer Spielräume hat, eine gegebene Umwelt auch gegen Üblichkeiten anders zu verstehen und zu nutzen. „Menschen handeln, behandeln ihre Umwelt; sie definieren und interpretieren diese und beschäftigen sich damit, wie die vorgegebene Situation zu bewältigen ist.“ (ebd., S. 20f.). Lerup arbeitet gerade das hohe Maß an Unvorhersehbarkeit, Unfertigkeit und Offenheit heraus, das der Entwerfer sich zu nutzen machen soll, damit Achim Hahn 446 er den unterschiedlichen Persönlichkeiten (und nicht allein den sozialen Rollenmustern) gerecht werden kann. „Menschliches Verhalten ist, aus der Sicht des Interaktionismus, eine komplizierte Matrix mit unbekannten Verknüpfungsmöglichkeiten - die Folge ist ein hohes Maß an Unwägbarkeiten, eine wundervolle Unfertigkeit und Offenheit.“ (ebd., S. 21). Das Unfertige bauen heißt eben nicht allein aus dem Geist einer Institution entwerfen, sondern „Raum“ für Spontanes und Überraschendes lassen. Aus dieser lebenspraktischen Perspektive erscheinen erst einmal auch die architektonischen Elemente, wie Tische, Stühle, Fenster, Türen usw., in einem neuen Licht. Denn wenn wir sie mit den Augen derjenigen betrachten, die tatsächlich in Situationen z.B. des Wartens unerwartet verstrickt werden, dann können sie eine neue Bedeutung bekommen, die möglicherweise institutionell nicht vorgesehen ist. Denn solche plötzlichen Umbrüche werden auch emotional erlebt und können die Stimmung unter den Menschen in einem Klassenzimmer beeinflussen: diese kann mit einem Mal kippen. Der Architekt Lars Lerup entdeckt eine in der Architektur absolut vernachlässigte Bedeutungsebene der architektonischen Elemente: Die Menschen „sind mit den Dingen durch ihre Handlungsweisen verbunden, durch die Art und Weise, wie sie mit den Dingen umgehen. Einige dieser Handlungsweisen lassen sich in unserer Umwelt beobachten, andere verschließen sich dem bloßen Auge“ (ebd., S. 23). Neben der Geschichte der jeweiligen Institution und dem dieser zugewachsenen Architekturtypus sollten ebenso die (Lebens-)Geschichten der beteiligten Menschen als Kontext eines situativen Verständnisses dessen berücksichtigt werden, was es heißt, hier und jetzt zu interagieren und Dinge in Gebrauch zu nehmen. Die intensive Standbildanalyse kann in der sozialwissenschaftliche Ausbildung von Architekten gut eingesetzt werden und ergänzt phänomenologischhermeneutische Methoden. Sie leitet den Entwerfer an, genau hinzuschauen, wie Architektur genutzt wird, welche Erwartungen, aber auch Überraschungen dabei denkbar sind. Architekten lernen den Zusammenhang von Gesellschaft, ihren Institutionen sowie den baulichen Artefakten auf eindringliche Weise kennen. Architektur ist immer auch Produkt der Gesellschaft, in die Architekten „hineinsozialisiert“ werden. Aber Architekten sollten ebenso darauf hingewiesen werden, dass sich bestimmte Verhaltensweisen nicht steuern lassen, insofern Architekturnutzer immer noch etwas anderes sind als Träger von Rollen. Unser Alltagswissen schöpft primär aus unseren Erfahrungen, und Erfahrungen machen wir nicht als „Homo sociologicus“, sondern leibhaftig verstrickt in die situativ-kommunikative Praxis unserer Welt. So wäre es sicher einseitig und verkürzt, Menschen, die wir in ihrem Lebensalltag beobachten, auf ihre Rollenzugehörigkeit, d.h. auf eine soziologische Theorie, zu reduzieren. Interaktionsarchitektur aus der Perspektive der Architekturtheorie 447 5. Literatur Bahrdt, Hans Paul (1961): Die moderne Großstadt. Soziologische Überlegungen zum Städtebau. Reinbek: Rowohlt. Blumer, Harold (1973): Der methodologische Standort des symbolischen Interaktionismus. In: Arbeitsgruppe Bielefelder Soziologen (Hg.): Alltagswissen, Interaktion und gesellschaftliche Wirklichkeit. Bd. I. Reinbek: Rowohlt, S. 80-101. Bollnow, Otto F. (1963): Mensch und Raum. Stuttgart: Kohlhammer. Boss, Medard (1999): Grundriss der Medizin und Psychologie: Ansätze zu einer phänomenologischen Physiologie, Psychologie, Pathologie und Therapie und zu einer daseinsgemässen Präventiv-Medizin. 3. Aufl. Bern u.a.: Huber. Dewey, John (2003): Philosophie und Zivilisation. Frankfurt a.M.: Suhrkamp. Glaser, Barney G./ Strauss, Anselm L. (1998): Grounded Theory. Strategien qualitativer Forschung. Bern: Huber. [Zuerst engl. 1967]. Hahn, Achim (2007): Alltagslandschaft als Wohn- und Aufenthaltsort. In: Ausdruck und Gebrauch - Dresdner wissenschaftliche Halbjahreshefte für Architektur Wohnen Umwelt 8, II, S. 29-44. Hahn, Achim (2008): Architekturtheorie. Wohnen, Entwerfen, Bauen. Wien: UTB. Heidegger, Martin (1984): Sein und Zeit. 15. Aufl. Tübingen: Niemeyer. Kambartel, Friedrich (1973): Wie abhängig ist Physik von Erfahrung und Geschichte? - Zur methodischen Ordnung apriorischer und empirischer Elemente in der Naturwissenschaft. In: Hübner, Kurt/ Menne, Albert (Hg.): Natur und Geschichte. X. Deutscher Kongreß für Philosophie, Kiel, 8.-12. Oktober 1972. Hamburg: Meiner, S. 154-169 Kambartel, Friedrich (1974): Zum Fundierungszusammenhang apriorischer und empirischer Elemente der Wissenschaft. In: Vente, Rolf E. (Hg.): Erfahrung und Erfahrungswissenschaft. Stuttgart/ Berlin/ Köln/ Mainz: Kohlhammer, S. 154-167; Kamlah, Wilhelm (1972): Philosophische Anthropologie. Sprachkritische Grundlegung und Ethik. Mannheim/ Wien/ Zürich: Bibliographisches Institut. Lerup, Lars (1986): Das Unfertige bauen. Architektur und menschliches Handeln. Gütersloh: Vieweg und Teubner. Lorenzen, Paul (1968): Methodisches Denken. Frankfurt a.M.: Suhrkamp. Misch, Georg (1994): Der Aufbau der Logik auf dem Boden der Philosophie des Lebens: Göttinger Vorlesungen über Logik und Einleitung in die Theorie des Wissens. Freiburg i.Br./ München: Alber. Mittelstraß, Jürgen (1991): Das lebensweltliche Apriori: Paul Lorenzen zum 70. Geburtstag. In: Gethmann, Carl Friedrich (Hg.): Studien zum Verhältnis von Phänomenologie und Wissenschaftstheorie. (= Neuzeit und Gegenwart 1). Bonn: Bouvier, S. 114-142. Muchow, Martha (1935): Der Lebensraum des Großstadtkindes. Hamburg: Riegel. Schapp, Wilhelm (1976): Beiträge zur Phänomenologie der Wahrnehmung. Mit e. Vorw. zur Neuaufl. von Carl Friedrich Graumann. Wiesbaden: Heymann. Achim Hahn 448 Schmitz, Hermann (2007): Der unerschöpfliche Gegenstand. Grundzüge der Philosophie. Bonn: Bouvier. Wittgenstein, Ludwig (1991): Vortrag über Ethik und andere kleine Schriften. 2. Aufl. Frankfurt a.M.: Suhrkamp. Gliederung 1. Das Anliegen der Interaktionsarchitekturforschung ......................................433 2. Methodologie und Methoden.............................................................................435 3. Architekturtheorie und Interaktionsarchitektur..............................................437 3.1 Raum und Architektur (Container-Raum) .......................................................439 3.2 Wahrnehmung und Erfahrung...........................................................................441 3.3 Nutzung (Funktion) und Gebrauch (Widerfahrnis und Angemessenheit) ..................................................................................................443 4. Fazit: Produktive Ergänzungsstrategien einer empirischen Architekturwissenschaft......................................................................................444 5. Literatur .................................................................................................................447 Studien zur Deutschen Sprache Forschungen des Instituts für Deutsche Sprache herausgegeben von Arnulf Deppermann, Stefan Engelberg und Angelika Wöllstein Aktuelle Bände: Frühere Bände finden Sie unter: http: / / www.narr-shop.de/ reihen/ s/ studien-zurdeutschen-sprache.html 43 Manfred W. Hellmann Das einigende Band? Beiträge zum sprachlichen Ost-West-Problem im geteilten und im wiedervereinigten Deutschland. Herausgegeben von Dieter Herberg 2008, 563 Seiten €[D] 98, - ISBN 978-3-8233-6385-9 44 Ludwig M. Eichinger / Meike Meliss / Maria José Dominguez Vázquez (Hrsg.) Wortbildung heute Tendenzen und Kontraste in der deutschen Gegenwartssprache 2008, 356 Seiten €[D] 72, - ISBN 978-3-8233-6386-6 45 Heidrun Kämper / Annette Klosa / Oda Vietze (Hrsg.) Aufklärer, Sprachgelehrter, Didaktiker Johann Christoph Adelung (1732-1806) 2008, 293 Seiten €[D] 72, - ISBN 978-3-8233-6401-6 46 Ludwig M. Eichinger / Albrecht Plewnia (Hrsg.) Das Deutsche und seine Nachbarn Über Identitäten und Mehrsprachigkeit 2008, 184 Seiten €[D] 72, - ISBN 978-3-8233-6437-5 47 Lorenza Mondada / Reinhold Schmitt (Hrsg.) Situationseröffnungen Zur multimodalen Herstellung fokussierter Interaktion 2010, 386 Seiten €[D] 78, - ISBN 978-3-8233-6438-2 48 Hardarik Blühdorn Negation im Deutschen Syntax, Informationsstruktur, Semantik 2012, 482 Seiten €[D] 98, - ISBN 978-3-8233-6444-3 49 Wolf-Andreas Liebert / Horst Schwinn (Hrsg.) Mit Bezug auf Sprache Festschrift für Rainer Wimmer 2009, 584 Seiten €[D] 98, - ISBN 978-3-8233-6470-2 50 Daniela Heidtmann Multimodalität der Kooperation im Lehr-Lern-Diskurs Wie Ideen für Filme entstehen 2009, 340 Seiten €[D] 78, - ISBN 978-3-8233-6471-9 51 Ibrahim Cindark Migration, Sprache und Rassismus Der kommunikative Sozialstil der Mannheimer „Unmündigen“ als Fallstudie für die „emanzipatorischen Migranten“ 2010, 283 Seiten €[D] 72, - ISBN 978-3-8233-6518-1 52 Arnulf Deppermann / Ulrich Reitemeier / Reinhold Schmitt / Thomas Spranz-Fogasy Verstehen in professionellen Handlungsfeldern 2010, 392 Seiten €[D] 88, - ISBN 978-3-8233-6519-8 53 Gisella Ferraresi Konnektoren im Deutschen und im Sprachvergleich Beschreibung und grammatische Analyse 2011, 350 Seiten €[D] 78, - ISBN 978-3-8233-6558-7 54 Anna Volodina Konditionalität und Kausalität im Deutschen Eine korpuslinguistische Studie zum Einfluss von Syntax und Prosodie auf die Interpretation komplexer Äußerungen 2011, 288 Seiten €[D] 78, - ISBN 978-3-8233-6559-4 55 Annette Klosa (Hrsg.) elexiko Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs 2011, 211 Seiten €[D] 72, - ISBN 978-3-8233-6599-0 56 Antje Töpel Der Definitionswortschatz im einsprachigen Lernerwörterbuch des Deutschen Anspruch und Wirklichkeit 2011, 432 Seiten €[D] 98, - ISBN 978-3-8233-6631-7 57 Ludwig M. Eichinger / Albrecht Plewnia / Melanie Steinle (Hrsg.) Sprache und Integration Über Mehrsprachigkeit und Migration 2011, 253 Seiten €[D] 72, - ISBN 978-3-8233-6632-4 58 Inken Keim / Necmiye Ceylan / Sibel Ocak / Emran Sirim Heirat und Migration aus der Türkei Biografische Erzählungen junger Frauen 2012, 343 Seiten €[D] 49, - ISBN 978-3-8233-6633-1 59 Magdalena Witwicka-Iwanowska Artikelgebrauch im Deutschen Eine Analyse aus der Perspektive des Polnischen 2012, 230 Seiten 72, - ISBN 978-3-8233-6703-1 60 Kathrin Steyer (Hrsg.) Sprichwörter multilingual Theoretische, empirische und angewandte Aspekte der modernen Parömiologie 2012, 470 Seiten €[D] 98, - ISBN 978-3-8233-6704-8 61 Ludwig M. Eichinger / Albrecht Plewnia / Christiane Schoel / Dagmar Stahlberg (Hrsg.) Sprache und Einstellungen Spracheinstellungen aus sprachwissenschaftlicher und sozialpsychologischer Perspektive. Mit einer Sprachstandserhebung zum Deutschen von Gerhard Stickel 2012, 370 Seiten €[D] 88, - ISBN 978-3-8233-6705-5 62 Heiko Hausendorf / Lorenza Mondada / Reinhold Schmitt (Hrsg.) Raum als interaktive Ressource 2012, 400 Seiten €[D] 88, - ISBN 978-3-8233-6706-2 63 Annette Klosa (Hrsg.) Wortbildung im elektronischen Wörterbuch 2013, 279 Seiten €[D] 78, - ISBN 978-3-8233-6737-6 64 Reinhold Schmitt Körperlich-räumliche Aspekte der Interaktion 2013, II, 334 Seiten €[D] 88, - ISBN 978-3-8233-6738-3 65 Kathrin Steyer Usuelle Wortverbindungen Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht 2014, II, 390 Seiten €[D] 88, - ISBN 978-3-8233-6806-9 66 Iva Kratochvílová / Norbert Richard Wolf (Hrsg.) Grundlagen einer sprachwissenschaftlichen Quellenkunde 2013, 384 Seiten €[D] 88, - ISBN 978-3-8233-6836-6 67 Katrin Hein Phrasenkomposita im Deutschen Empirische Untersuchung und konstruktionsgrammatische Modellierung 2015, 510 Seiten €[D] 98, - ISBN 978-3-8233-6921-9 68 Stefan Engelberg / Meike Meliss / Kristel Proost / Edeltraud Winkler (Hrsg.) Argumentstruktur zwischen Valenz und Konstruktion 2015, 497 Seiten €[D] 128, - ISBN 978-3-8233-6960-8 69 Nofiza Vohidova Lexikalisch-semantische Graduonymie Eine empirisch basierte Arbeit zur lexikalischen Semantik 2016, ca. 340 Seiten €[D] ca. 88, - ISBN 978-3-8233-6959-2 70 Marek Konopka / Eric Fuß Genitiv im Korpus Untersuchungen zur starken Flexion des Nomens im Deutschen 2016, 283 Seiten €[D] 108, - ISBN 978-3-8233-8024-5 71 Eva-Maria Putzier Wissen - Sprache - Raum Zur Multimodalität der Interaktion im Chemieunterricht 2016, 282 Seiten €[D] 108, - ISBN 978-3-8233-8032-0 72 Heiko Hausendorf / Reinhold Schmitt / Wolfgang Kesselheim Interaktionsarchitektur, Sozialtopographie und Interaktionsraum 2016, 452 Seiten €[D] 138, - ISBN 978-3-8233-8070-2 Interaktion ist ohne konkreten Raum- und Ortsbezug kaum denkbar. In der institutionellen Kommunikation kommt diese Raumbindung besonders prägnant zum Ausdruck, weil sich hier charakteristische Räume ausdifferenziert haben, in denen die Kommunikation ihr soziales Zuhause gefunden hat: Gottesdienst im Kirchenraum, Unterricht im Klassenzimmer, Ausstellungen im Museum oder die Produktion von Radiosendungen im Aufnahmestudio. Dieser Zusammenhang von Interaktion und gebautem Raum steht im Zentrum des Sammelbandes: Wie wird durch und mit Architektur Interaktion möglich und erwartbar gemacht (Interaktionsarchitektur)? Wie bringen die Beteiligten in ihrer Nutzung der Architektur ihr Alltagswissen über soziale Räume zum Ausdruck (Sozialtopographie)? Wie fließen diese Ressourcen in die Herstellung eines je konkreten Interaktionsraumes ein? Mit diesen Fragen ist ein vielversprechendes interdisziplinäres Forschungsfeld aufgespannt, das in empirischer, theoretischer und methodologischer Hinsicht erschlossen wird: mit Fallanalysen zu den genannten Räumen, mit Beiträgen zur Theorie und Methodologie und mit interdisziplinären Experten-Kommentaren.