Kodikas/Code
kod
0171-0834
2941-0835
Narr Verlag Tübingen
Es handelt sich um einen Open-Access-Artikel, der unter den Bedingungen der Lizenz CC by 4.0 veröffentlicht wurde.http://creativecommons.org/licenses/by/4.0/121
2017
403-4
Gemeinsame Aufmerksamkeit
121
2017
Rafael Mollenhauer
kod403-40303
K O D I K A S / C O D E Volume 40 (2017) · No. 3 - 4 Gunter Narr Verlag Tübingen Gemeinsame Aufmerksamkeit Der Schlüssel zur symbolischen Praxis? Rafael Mollenhauer (Duisburg-Essen) Regarding the emergence of the specific semanticity of human communication and language, joint attention is generally seen as the crucial ontogenetic development. At the same time, it is considered an important evolutionary turning point which marks the differences between subhuman and specific human forms of interaction. While taking into account and integrating the findings of a mainly psychologically shaped joint attention research, this article aims to provide an interactional framework of triadic engagement, instead of focusing on preconditional individual competencies of learning and cognition. This framework allows to adress not only different evolutionary scenarios of triadic engagement, but also considers the semiotic quality of communication means used within these forms of interaction, thus leading to further evidence of the emergence of joint attention and its role for the development of symbolic communication. 1 Einleitung Unter dem Dach der Joint-Attention-Forschung treffen von jeher konkurrierende Paradigmen aufeinander, deren unterschiedliche Vorannahmen und Erkenntnisinteressen zu verschiedenartigen Individuierungen des Bezugsgegenstandes ‘ Gemeinsame Aufmerksamkeit ’ führen und damit kaum überraschend ein gewisses Spektrum unterschiedlicher Auffassungen gemeinsamer Aufmerksamkeit generieren (cf. Moore und Dunham 1995/ 2009; Eilan et al. 2005; Seemann 2011; Metcalfe und Terrace 2013). Demgemäß ist das jüngste Forschungsinteresse innerhalb der Joint-Attention-Forschung in erheblichem Maße auch definitorischen Aspekten gewidmet (cf. Seemann 2011 a: 4). Gemein ist den konkurrierenden Ansätzen die Betrachtung eines bestimmten mikroanalytischen Phänomens, das mit Butterworth (1995/ 2009: 29) als “ looking where someone else is looking ” beschrieben werden kann und je nach methodologischem Standpunkt in unterschiedlicher Ausprägung mit mentalistischen Prämissen unterfüttert wird. Im Fokus steht die kindliche Fähigkeit, dem Blick bzw. der Blickrichtung eines Erwachsenen zu folgen und seine Aufmerksamkeit auf die auch vom Erwachsenen betrachtete Entität zu richten (cf. Kathage 2008: 46), oder ganz einfach, und weniger auf das Visuelle fixiert, die Orientierung an der Orientierung anderer (cf. Knobloch 1997) mitsamt den dafür notwendigen kognitiven Ressourcen. Ontogenetisch gilt ein Zeitfenster um den ersten Geburtstag des Kindes herum als entscheidend für die Herausbildung gemeinsamer Aufmerksamkeit, die - wie gemeinhin angenommen wird - den kurz darauf einsetzenden Spracherwerb begründet. Eng verknüpft werden die frühesten Aktivitäten gemeinsamer Aufmerksamkeit in der Regel mit der ebenfalls ab einem Alter von etwa einem Jahr vermehrt eingesetzten Zeigegeste und mit einer triadischen Beziehung zwischen Kind, Betreuungsperson und der jeweils betrachteten Entität, die eine zuvor vorherrschende Dyade zwischen Kind und Betreuungsperson ablöst (cf. Bruner 1995/ 2009; Tomasello 1995/ 2009, 2002). Ausgehend von diesen Annahmen zur Ontogenese wird gemeinsamer Aufmerksamkeit (und zum Teil auch der Zeigegeste) auch auf phylogenetischer Ebene, z. B. mit Blick auf die Jagd in frühmenschlichen Jäger- und Sammlergemeinschaften, höchste Bedeutung bei der Rekonstruktion der Genese der spezifisch sprachlichen Semantizität zugesprochen. In den nachfolgenden Abschnitten werden zunächst die Probleme und Folgen der den lerntheoretischen und den mentalistischen Ansätzen der Joint-Attention-Forschung jeweils zugrundeliegenden Vorverständnisse dargelegt, um demgegenüber die Notwendigkeit herauszustellen, gemeinsame Aufmerksamkeit (und schließlich die Sprache) nicht aus weitgehend voraussetzungslosen Vermögen (des Lernens oder der Kognition), sondern aus Prozessen wechselseitiger Verhaltensabstimmung abzuleiten (2). Im Anschluss soll ein (mangels entsprechend ausgerichteter empirischer Forschung lückenhafter) eigener Erklärungsansatz bereitgestellt werden, der ausgehend von einer dyadische Steuerungsprozesse bereits übertreffenden funktionalen Triadizität (3) über eine funktional-kognitive Triadizität zum synsemantischen Potential der Sprache hinführt (4). Abschließend wird zu überlegen sein, wie ein - die wegweisenden Befunde der bis dato geleisteten Forschung integrierender - empirischer Ansatz zur näheren Erforschung gemeinsamer Aufmerksamkeit und ihrer Rolle beim Übergang zur symbolischen Kommunikation weiter ausgearbeitet werden kann (5). 2 Die soziale Ausgangskonstellation Ihren Ausgang nimmt die Joint-Attention-Forschung nach gängiger Einschätzung bei den Arbeiten Jerome Bruners und seiner Schüler (cf. insbesondere Scaife und Bruner 1975), wenngleich Bruner (1995/ 2009: 1) selbst ein frühes Interesse an diesem Forschungsfeld bereits bei einem Londoner Symposium in den späten 1950er Jahren sowie daraus entstandenen Arbeiten (cf. David und Appell 1961) als gegeben sieht. Etabliert ist das Forschungsfeld spätestens mit dem Sammelband von Chris Moore und Philip Dunham (1995), in dem sich drei konkurrierende Paradigmen identifizieren lassen. 1 Die lerntheoretische Strömung (cf. Corkum und Moore 1995/ 2009; Moore 1996; Barresi und Moore 1996; Dymond und McHugh 2005) bezweifelt, dass gemeinsame Aufmerksamkeit ein Verstehen der Tätigkeiten des anderen bedingt. Wie im conditioned head turn 1 Schon damals werden auch alternative Klassifizierungen vorgenommen. So unterscheidet Tomasello (1999 a: 304 ff.) zwischen Ansätzen des prepared learning (cf. Muir und Hains 1999; Rochat und Striano 1999) und Simulationserklärungen (cf. Tomasello 1999 a; Barresi und Moore 1996; Meltzoff und Gopnik 1993; Gergely und Watson 1999), wobei Letztere unabhängig vom Ausmaß der angenommenen biologischen Prädispositionen die Auffassung anderer Akteure in Analogie zum Selbst in den Vordergrund stellten. 304 Rafael Mollenhauer (Duisburg-Essen) paradigm von Corkum und Moore (1995/ 2009) könnten die Merkmale gemeinsamer Aufmerksamkeit auch einfach erlernt beziehungsweise konditioniert sein: Das Kind nutze die Kopfbewegung der Betreuungsperson also als Stimulus für die Bewegung seines eigenen Kopfes in dieselbe Richtung (cf. Kathage 2008: 50). Lerntheorien stehen in dieser Hinsicht in der Tradition des Behaviorismus (cf. Tomasello 1995/ 2009: 112), veranschlagen aber dennoch auch gewisse biologische Prädispositionen (cf. Tomasello 1999: 305 f.). Nichtsdestotrotz haben die verschiedenen Verhaltensweisen gemeinsamer Aufmerksamkeit für Lerntheoretiker ihre je eigene Lerngeschichte und ihre eigenen Auslösereize, die nicht von ausgefeilten sozio-kognitiven Fertigkeiten abhängen (cf. Tomasello 2002: 84). Demgegenüber fußt das nativistische Paradigma auf einer universalistischen biologischen Begründung, die kindliche Interaktionen mit der Betreuungsperson weitgehend unberücksichtigt lässt (cf. Kathage 2008: 50). So gleicht die Sozialkognition des Kindes nach Trevarthen (1979) von Geburt an der des Erwachsenen und ein angeborener Sinn für den virtuellen anderen warte lediglich darauf, über die Entwicklung so genannter behavioral performance skills in sichtbares Verhalten transformiert zu werden. Baron-Cohen (1995/ 2009) veranschlagt gar je eigene Module für das Folgen der Blickrichtung (eye direction detector), gemeinsame Aufmerksamkeit (shared attention mechanism) und eine theory of mind (theory of mind mechanism). Vergleichbar den von Lerntheoretikern zumindest angesprochenen biologischen Veranlagungen verweist er umgekehrt aber immerhin auf die Notwendigkeit eines sozialen Umfelds. Im Spannungsfeld von Lerntheorien und nativistischen Ansätzen etabliert Michael Tomasello Mitte der 1990er Jahre das sozial-kognitive Paradigma der Joint-Attention- Forschung. Tomasello, der Aufmerksamkeit in Anlehnung an Gibson und Rader (1979) als intentionale Wahrnehmung definiert (cf. Tomasello 1995/ 2009: 104), kritisiert die Ansätze lerntheoretischer und nativistischer Prägung dafür, keine angemessene Erklärung für das synchrone Auftreten der unterschiedlichen Verhaltensweisen gemeinsamer Aufmerksamkeit zu liefern. Zwar bemühe der lerntheoretisch eingestellte Moore (1996) eine im entsprechenden Zeitfenster neu auftauchende Fähigkeit zur Informationsverarbeitung, auf deren Basis Kinder ihre Aufmerksamkeit auf zwei Dinge gleichzeitig richten könnten, diese habe man aber niemals identifizieren oder gar mit der frühen Sozialkognition in Verbindung bringen können (cf. Tomasello 2002: 84 f.). Ebenso liefere die von Nativisten (cf. Trevarthen 1979) vorgebrachte motorische Reifezeit keine angemessene Begründung, da nur minimale motorische Fertigkeiten für Verhaltensweisen gemeinsamer Aufmerksamkeit überhaupt notwendig seien (cf. Tomasello 1999 a: 65). Tomasello selbst veranschlagt daher das sozial-kognitive Vermögen, andere als intentionale Akteure zu verstehen. 2 Seiner Simulationserklärung zufolge schreiben Kinder anderen Akteuren von Geburt an diejenigen mentalen Kapazitäten zu, die sie an sich selbst ausmachen (Analogie mit dem Selbst, Identifikation mit anderen). Sobald sie mit einem Alter von 8 - 9 Monaten begönnen, ihre eigene Intentionalität (im Sinne einer Unterscheidung von Mitteln und Zielen; cf. Piaget 1974, 1992) zu verstehen, verstünden sie mithin auch andere als intentionale Akteure. Dieses 2 Seither hat Tomasello (2009, 2010, 2014) seine Ansicht jedoch mehrfach revidiert und geht mittlerweile davon aus, dass auch nichtmenschliche Primaten die Intentionen und Wahrnehmungen (und deren Verbindung) anderer Akteure verstehen, während sie Beschränkungen hinsichtlich geteilter Intentionalität (der dann auch das Konzept gemeinsamer Aufmerksamkeit subsumiert ist) zeigten. Gemeinsame Aufmerksamkeit 305 neue Verstehen intentionaler Tätigkeiten entfalte sich dann in unterschiedlichen Tätigkeitsbereichen und manifestiere sich in gemeinsamer Aufmerksamkeit wie auch in der damit verbundenen Verwendung deiktischer Gesten und dem Imitationslernen. Die paradigmatische Dreiteilung der Joint-Attention-Forschung in lernorientierte, nativistische und sozial-kognitive Ansätze hat in ihrer klassischen Form nicht bis heute überdauert. Zu stark waren wohl die Einflüsse, die philosophische (cf. z. B. Fletcher und Carruthers 2013) und vor allem neurowissenschaftliche Strömungen (cf. z. B. Gallese und Sinigaglia 2013; Steele und Lau 2013) auf die im Kern aber weiter entwicklungspsychologisch geprägte Joint-Attention-Forschung ausgeübt haben. Geblieben ist indes eine ihrerseits kontrovers diskutierte Dichotomie behavioristisch-lerntheoretischer Ansätze einerseits und mentalistischer Ansätze andererseits (cf. hierzu Racine 2011; Penn und Povinelli 2013; Fletcher und Carruthers 2013). Ob nun neurowissenschaftliche Konzeptionen den nativistischen Ansätzen subsumiert und/ oder diese ihrerseits den kognitionstheoretischen oder den mentalistischen Ansätzen zugerechnet werden, spielt hier jedoch nur eine untergeordnete Rolle. Es soll vielmehr eine Gemeinsamkeit aller Forschungen zur gemeinsamen Aufmerksamkeit im Vordergrund der Kritik stehen und zugleich als Ausgangspunkt zur Etablierung eines Kontrastprogramms dienen: die individualistische Ausgangskonstellation. Der Nativist betrachtet Module, die im einzelnen Individuum schlicht heranreifen müssen; der Lerntheoretiker verweist auf individuelle Lernprozesse, die das einzelne Kind in einem sozial strukturierten Umfeld durchläuft; der Kognitionswissenschaftler stützt sich auf sozial-kognitive Komponenten, die zwar auf das soziale Umfeld zielen mögen, die aber stets nur dem einzelnen Kind zugerechnet werden können; und der Neurowissenschaftler geht gar so weit, die infrage stehenden Kompetenzen auf Hirnareale und -strömungen zu reduzieren. Eine wirklich soziale Ausgangskonstellation, wie sie von Mead (1973) oder Bühler (2000) veranschlagt wird, sucht man in der Joint- Attention-Forschung vergeblich. Die Probleme, die ein individualistisch aufgestelltes Fundament zur Herleitung gemeinsamer Aufmerksamkeit und schließlich der Sprache mit sich bringt, wurden an anderer Stelle bereits ausführlich besprochen (cf. Mollenhauer 2015). Es soll hier genügen, den Kern des Problems herauszuarbeiten. Wird nämlich die soziale Praxis der gegenseitigen Verhaltensabstimmung und Handlungskoordination nicht in den Blick genommen, ist die spezifisch sprachliche Semantizität unvermeidlich zu einem Ausdruck individueller Ressourcen herabgestuft. Mit Bühler (2000) ließe sich feststellen, dass sowohl die behavioristisch geprägten Lerntheorien als auch die mentalistisch argumentierenden Ansätze der Joint-Attention-Forschung einen unzulässigen Sprung von der Ebene des Ausdrucks zur Ebene der Darstellung vollziehen. Letztere bleibt in ihrer besonderen Qualität aber verborgen, wenn der Ausdruck nicht schon in fundamentalen Prozessen gegenseitiger Steuerung fest verknüpft ist mit einem Appell, wenn also unberücksichtigt bleibt, dass jedwedes kundgegebene Signal erst einmal kundgenommen werden muss, um seine Wirkung zu entfalten. Die von der Joint-Attention-Forschung fokussierten individuellen Vermögen (des Lernens und der Kognition) haben zweifellos ihre Rolle zu spielen beim Übergang von auch im Tierreich üblichen Kontakten zu Formen humanspezifischer Interaktion, ihre Genese kann sich aber nur vollziehen im Rahmen bereits etablierter signalartiger Prozesse gegenseitiger Steuerung, von denen in Forschungen zur gemein- 306 Rafael Mollenhauer (Duisburg-Essen) samen Aufmerksamkeit zwar durchaus hier und da die Rede ist (Bruners Formate, Tomasellos Szenen gemeinsamer Aufmerksamkeit), die dort aber nie näher aufgeschlüsselt werden. Vor allem aber müssen auch unter Zuhilfenahme kognitiv-motivationaler Faktoren Prozesse gemeinsamer Aufmerksamkeit in wechselseitiger wahrnehmungsmäßiger Abstimmung der beteiligten Individuen erst einmal konstituiert werden, bevor durch eine regelmäßige signalartige und wechselseitig abgestimmte Bezugnahme auf bestimmte Entitäten kontinuierlich eine die Sprache kennzeichnende Konventionalität geschaffen werden kann und schließlich die Ebene synsemantischer Kontakte (cf. Bühler 1999) erreicht ist. Dass die überindividuelle Ebene der Sprache (und anderer Symbole) qualitativ gerade dadurch bestimmt ist, dass sie hinsichtlich ihrer Formate nicht mit denen der Kognition übereinstimmt, bleibt der Joint-Attention-Forschung weitgehend verborgen, wie auch letztlich über individuelle Motive bestimmte Grammatiken des Aufforderns, Informierens und Teilens in dem mit kommunikationstheoretischen Grundannahmen wohl noch am ehesten harmonierenden sozial-kognitiven Ansatz Tomasellos (2009) belegen. Der hier vertretene und nachfolgend dargelegte Ansatz unterscheidet sich von den psychologischen Paradigmen gemeinsamer Aufmerksamkeit ebenso wie von den Ansätzen innerhalb der Neurowissenschaften und der philosophy of mind also durch seine soziale Ausgangskonstellation im Sinne Bühlers oder Meads. Bühler bestimmt in methodologischer Offenheit den Sozialverbund zum Ausgangspunkt seiner Überlegungen und vermeidet eine unnötige Belastung der Hypothesen durch mentalistische Vorannahmen, indem er mit behavioristischen und kybernetischen Mitteln beginnt (ohne in einen ‘ Individualbehaviorismus ’ nach Art moderner Lerntheorien zu verfallen), und auch Meads Sozialbehaviorismus kommt ohne mentalistische Vorentscheidungen aus. Nach diesen Vorbildern soll nachstehend eine funktionale Betrachtung verschiedener Konstellationen der Verhaltensabstimmung erfolgen. Orientiert an dem in der Joint-Attention-Forschung viel diskutierten Phänomen der Triadizität, die teilweise als Merkmal gemeinsamer Aufmerksamkeit gilt (cf. Bakeman und Adamson 1984), zum Teil aber auch als nicht hinreichend für Joint Attention angesehen wird (cf. Carpenter und Call 2013), werden sodann kognitive Ressourcen in die Betrachtung von (bereits etablierten) Steuerungsprozessen aufgenommen, wodurch nähere Aussagen zur (a) Entstehung gemeinsamer Aufmerksamkeit und zu (b) ihrer Rolle beim Übergang zur symbolischen Kommunikation ermöglicht werden sollen. 3 Funktionale Triadizität Joint Attention wird in der Regel in Abgrenzung von einem rein dyadischen Steuerungsprozess als Triade von Kind, Betreuungsperson und betrachteter Entität definiert. Ein einfacher, rein dyadischer Steuerungsprozess liegt beispielweise im Falle der von Mead (1973) angeführten, sich gegenseitig drohenden Hunde vor. Hier sind auch die Anforderungen Bühlers (2000) an eine soziale Ausgangskonstellation als Grundlage der Herleitung der spezifisch sprachlichen Semantizität bereits erfüllt. Gegeben ist eine Situation gemeinsamer Wahrnehmung mit einer Einstellung der Individuen aufeinander sowie einem gegenseitigen Verstehen der Tätigkeiten des anderen (cf. Bühler 2000; Ungeheuer 2004). Derartig strukturierte Koordinationsprozesse sind im Tierreich üblich, und sie durchziehen auch die zwischenmenschliche Kommunikation unter kompetenten Gemeinsame Aufmerksamkeit 307 Sprechern in erheblichem Maße. Dennoch sind triadisch organisierte Kontakte in verschiedenartigen Ausformungen auch im subhumanen Bereich bereits anzutreffen. Beispielhaft sollen hier drei solcher Szenarien besprochen werden: Beispiel 1: Der Tanz der Honigbienen Bienen, die nach erfolgreicher Nahrungssuche von einer Blüte zurückkehren, führen bei Ankunft im Bienenstock einen Tanz auf, um ihren Artgenossen damit Richtung und Entfernung der besuchten Nahrungsquelle anzuzeigen. Zudem offerieren sie den anderen Mitgliedern des Stocks eine stoffliche Probe der aufgesuchten Blüte. Bühler (2000: 72 ff.) erläutert an diesem Beispiel den symphysischen Einsatz der Steuerungsmittel. Angesprochen sind damit, wie andernorts bereits beschrieben (cf. Mollenhauer 2010, 2015, 2016), soziale Konstellationen, die über die gegenseitige Steuerung der beteiligten Individuen hinaus auf einen weiteren, außerhalb gemeinsamer Wahrnehmung befindlichen Steuerungsrichtpunkt (hier die Blüte) zielen, die aber dennoch der spezifisch sprachlichen Semantizität entbehren. Sie sind gebunden an das physische Umfeld, im Gegensatz zur symbolischen Praxis also nicht entstofflicht und ablösbar von den Bezugsentitäten. Durch den zusätzlichen Steuerungsrichtpunkt, der sich gar außerhalb gemeinsamer Wahrnehmung befindet, entsteht aber eine triadische Beziehung aus Biene 1, Biene 2 und der betroffenen Blüte. Man muss (und soll) hier selbstverständlich nicht annehmen, die Bienen würden gemeinsam wissen, dass ihre Aufmerksamkeit auf dasselbe Objekt gerichtet ist (cf. Carpenter und Call 2013), ja man muss nicht einmal glauben, dass ihre Aufmerksamkeit überhaupt parallel auf dieselbe Entität zielt. Mit behavioristischen Mitteln kann - ohne Belastung der Hypothesen - ein einfaches Reiz-Reaktions-Schema zugrunde gelegt werden, demzufolge die Blüte als Reiz auf Biene 1 wirkt, die in Reaktion darauf zum Stock zurückkehrt und einen entsprechenden Tanz aufführt (und eine Stoffprobe offeriert), der dann (zusammen mit der Stoffprobe) seinerseits Biene 2 als Reiz gilt und als Reaktion ihren Aufbruch zur Blütenquelle hervorruft. Eine einfache Reiz-Reaktions-Kette ist zur Beschreibung dieser Aktivitäten aber nicht hinreichend. Es liegt stattdessen ein Reiz-Reaktions-Dreieck vor, das als einseitig verlaufende triadische Beziehung beschrieben werden kann, insofern der neben den sich steuernden Individuen selbst vorhandene Steuerungsrichtpunkt den Auslösereiz für Biene 1 stellt, während ihm auch die Reaktion von Biene 2 gilt (wenn Biene 2 erst einmal in Sichtweite der Blüte ist, kann diese dann auch für sich als Reiz fungieren, der ein weiteres Reiz- Reaktions-Dreieck in Gang bringt). Triadizität bedeutet hier auch, dass das Reiz-Reaktions- Dreieck nicht reduzierbar ist auf voneinander unabhängige Reiz-Reaktions-Abläufe. Wenn nämlich nicht genau Blüte X in einer spezifischen Richtung Y und einer spezifischen Entfernung Z den Reiz für Biene A stellen würde, könnte B nicht erfolgreich die entsprechende Blüte X anfliegen. Reaktion 2 (das Aufsuchen der Blüte) ist also abhängig von Reiz 1 (der Reiz 2 herbeiführt), und zwar nach einem artspezifisch festgelegten Schema und mit Hilfe eines artspezifischen Spektrums von Signalen, die von anderen Artgenossen reproduzierbar sind. Es geht folglich nicht um eine bloße Kausalkette, bei der ein Ereignis A zu einem Ereignis B führt, das seinerseits zu einem Ereignis C führt, welches ohne B und damit ohne A nicht stattgefunden hätte. Vielmehr liegt im Falle der gegenseitigen Steuerungsaktivitäten der Honigbienen eine, allerdings nur in eine Richtung verlaufende und zeitlich gestaffelte, triadische Beziehung vor. 308 Rafael Mollenhauer (Duisburg-Essen) Beispiel 2: Die Warnrufe Grüner Meerkatzen Die Warnrufe, die Grüne Meerkatzen in Reaktion auf einen Beutegreifer von sich geben, werden von anderen Individuen der Gruppe zum Anlass genommen, die Flucht zu ergreifen. Nach Tomasello (2009: 28 f.) stellen diese Vokalisierungen einen schlichten Ausdruck von Emotion dar, da sie nicht intentional hervorgebracht würden und nicht willentlich an andere Individuen gerichtet seien. Da sie außerdem kein geeignetes Mittel für die referentielle Intention darstellten, hält er sie nicht für den entscheidenden Umschlagpunkt auf dem Weg zur humanspezifischen Interaktion. Beruft man sich demgegenüber auf die aus einer methodologischen Offenheit resultierende und eine soziale Ausgangskonstellation veranschlagende Axiomatik, die Karl Bühler in seiner Krise der Psychologie darlegt, erfüllen die Warnrufe Grüner Meerkatzen zweifellos die Bedingungen des ersten und des zweiten Axioms: Sie werden innerhalb eines Sozialverbundes hervorgebracht, sie bringen das innere Befinden zum Ausdruck und sie dienen der Steuerung anderer Individuen. Eine intentionale Warnung der Artgenossen muss nicht vorausgesetzt werden, um die von Bühler angesprochene Einstellung der Individuen aufeinander und eine gegenseitige Steuerung des sinnvollen Verhaltens anzunehmen. Es genügt hier eine bloße Zweckgerichtetheit, die, wie Bühler (2000: 66 f.) bemerkt, auch der Behaviorist stillschweigend voraussetzen muss, wenn er aus allen Verhaltensweisen das einer Untersuchung würdige sinnvolle Benehmen auswählt, um es erst dann behavioristisch betrachten zu können. Die Ausprägung intentionaler Vermögen spielt hier zunächst nicht die entscheidende Rolle, wenn die den semiotischen Mitteln eigene Qualität beleuchtet wird. Natürlich kann Intentionalität im Kontext signalartiger Steuerungsprozesse von schlichter Zweckgerichtetheit bis hin zur bewussten Absicht mit Erwartungserwartungen reichen, allein hierdurch ist die Funktion und Qualität der Zeichen aber keineswegs bestimmt. Abgestritten ist damit weder das bloße Vorhandensein noch die graduelle Abstufung intentionaler Phänomene. Ein zunächst auf die Funktionen der semiotischen Ressourcen im Zuge gegenseitiger Verhaltensabstimmung gestützter Start belastet die Hypothesen aber nicht vorab in der Art mentalistischer Vorannahmen, sodass nicht von vornherein bedeutende Aspekte des Interaktionsprozesses aus dem Blick geraten und schließlich eine Betrachtung der Genese kognitiver Ressourcen im Steuerungsprozess möglich wird. Zudem kann den Warnrufen Grüner Meerkatzen auf der Grundlage einer derartigen Betrachtungsweise durchaus das von Tomasello geforderte referentielle Potential zugschrieben werden. Wie Tomasello (2009: 26 f.) selbst bemerkt, beziehen sich die Warnrufe der Meerkatzen nämlich stets auf ganz bestimmte Feinde (Schlange, Adler), wobei die Adressaten die entsprechenden Informationen aus den Warnrufen extrahierten. Das innerhalb der Art verbreitete grundlegende Repertoire an Rufen zeigt eine spezifische (artspezifische) Appellfunktion an, die von mentalistischen Ansätzen kaum berücksichtigt wird. Auch im Falle der Grünen Meerkatzen kann von einer triadischen Relation die Rede sein, da neben den Individuen selbst ein weiterer (wie im Bienenbeispiel zunächst nur von einem Individuum wahrgenommener) Steuerungsrichtpunkt im Spiel ist. Die Form der triadischen Beziehung ist indes ungleich schwerer beschreibbar als im Bienenbeispiel. Ohne die Kognition betreffende Vorentscheidungen ist nämlich nicht erkennbar, ob die Reaktion des Adressaten tatsächlich dem Beutegreifer gilt. So könnte man dem Plädoyer für eine triadische Konstellation entgegenhalten, dass Individuum 1 eine schlichte Reaktion auf den Gemeinsame Aufmerksamkeit 309 Auslösereiz des Beutegreifers zeigt, die dann wiederum zum Reiz für die Fluchtreaktion von Individuum 2 wird. Man müsste demnach von einer Reiz-Reaktions-Kette statt von einem Reiz-Reaktions-Dreieck ausgehen. Die Argumentation weiter erschwerend ließe sich hinzufügen, dass die Warnrufe unterschiedslos an alles und jeden in der Umgebung ausgesandt werden (cf. Tomasello 2009: 29). Zu bedenken ist hier aber das (auch dem Tanz der Bienen zugrundeliegende) artspezifische Signalrepertoire. Alle Individuen der Gruppe sind in der Lage, beim Vernehmen eines Adlerwarnrufs eine spezifische Reaktion (z. B. die Flucht in den Schutz der Bäume) zu zeigen, die sich von der Reaktion auf den Schlangenwarnruf (z. B. Flucht auf eine Lichtung) unterscheidet. Zudem produzieren alle Individuen der Gruppe entsprechende Warnrufe bei Begegnung mit einem jeweiligen Beutegreifer. Alle Artgenossen sind demnach zur Kundgabe und Kundnahme in Bezug auf ein bestimmtes Signalrepertoire befähigt. Ob sie den Warnruf in der einen oder anderen Rolle bewusst mit dem angezeigten Beutegreifer assoziieren, ist hier vorerst nicht entscheidend. Ist kein Artgenosse anwesend, liegt auch keine triadische Beziehung vor; werden dieWarnrufe aber kundgenommen und von einer entsprechenden Reaktion gefolgt, erlangen sie ganz unabhängig von der zugrundeliegenden Intention Steuerungsrelevanz. Die triadische Beziehung scheint weniger eindeutig als im Beispiel der Bienen, da Reaktion 2 nicht direkt zu derjenigen Entität zurückführt, die auch als Auslösereiz fungiert (die Meerkatzen laufen nicht zur Schlange, sondern fliehen vor ihr, ohne dass ganz eindeutig festgestellt werden könnte, dass sie nicht nur mit einem bestimmten Verhaltensmuster auf den Warnruf reagieren). In einem evolutionären Szenario wird das Überleben der Art aber gerade dadurch gesichert, dass alle Individuen über einen spezifischen Signalvorrat verfügen, wobei den einzelnen Signalen jeweils ein Auslösereiz zugeordnet ist, der zur Produktion des Signals führt, und zudem eine Reaktion, die bei Wahrnehmung des Signals gezeigt wird. Ein diakritisches (oder referentielles) Potential wie es die Unterscheidung von Schlangen- und Adlerwarnruf nahelegt, wohnt auch schon den Kontakten der Honigbienen inne, denn immerhin können mit Hilfe des Tanzes gänzlich verschiedene Richtungen und Entfernungen angegeben werden. Das Beispiel der Grünen Meerkatzen zeigt darüber hinaus das Potential, das Vokalisierungen zukommt, wenn der Übergang von subhumanen zu humanspezifischen Interaktionsformen infrage steht. Zugleich verdeutlicht eine an der Funktionalität der semiotischen Ressourcen orientierte Betrachtung, dass die so oft - auch im Zusammenhang mit Joint Attention - gefeierte Zeigegeste trotz gewisser Unterschiede zu Vokalsierungen (größeres referentielles Potential in gemeinsamer Wahrnehmung) nur dann einen qualitativen Quantensprung bedeutet, wenn man sie an bestimmte kognitive oder motivationale Komponenten bindet (cf. Mollenhauer 2016). Beispiel 3: Die gemeinsame Jagd Gemeinsame Jagdaktivitäten sind im Tierreich vielerorts anzutreffen, so z. B. bei Löwen oder Wölfen. Besonders interessant erscheint die gemeinsame Jagd der Schimpansen, denn gerade hier werden immer wieder kognitive Kompetenzen unterstellt, die andernorts im Tierreich nicht anzutreffen sind. So glauben einige Forscher, an der in manchen Populationen von Schimpansen gängigen Jagd auf Stummelaffen offenbarten sich gemeinsame Intentionen und Aufmerksamkeit (cf. Boesch und Boesch 1989; Boesch 2005). Andere 310 Rafael Mollenhauer (Duisburg-Essen) hingegen sind der Ansicht, jedes Tier nehme stets die für sich im jeweiligen Augenblick günstigste Position ein, sodass keine gemeinsamen Interessen und Ziele, sondern eine Summe einzelner Interessen und Ziele im Spiel sei (cf. Tomasello 2009: 188). Im Gegensatz zu den bisherigen Beispielen befinden sich bei der Gruppenjagd der Schimpansen weder die involvierten Individuen noch die zusätzliche Bezugsentität (der Stummelaffe) außerhalb der (funktional) gemeinsamen Wahrnehmung der Jäger. Die Aktivitäten laufen schneller ab und können daher kaum in eine sinnvolle Abfolge gebracht werden. Ob die Schimpansen nun ein gemeinsames Ziel oder individuelle Ziele verfolgen, sie reagieren stets auf den/ die anderen Schimpansen und auf das Beutetier. Würde ein Schimpanse zunächst nur auf die Position des Beutetiers reagieren, ohne die Position der anderen Schimpansen zu berücksichtigen, um erst im Anschluss mit der Einnahme einer neuen Position zu reagieren, wo er erneut die Position des Beutetiers zu sichten hätte usw., würde er dem Geschehen hinterherlaufen als wäre er der Hase in der Geschichte von Hase und Igel. Er muss also in situ unter ständiger Berücksichtigung der Position aller Beteiligten agieren. Hier liegt nicht notwendigerweise Joint Attention in der kognitiv reichhaltigsten Form vor, es könnte sich aber um ein entscheidendes Szenario für die Herausbildung entsprechender kognitiver Ressourcen handeln, insofern eine verhaltens- und wahrnehmungsmäßige Feinabstimmung einer erfolgreichen Jagd zuträglich sein dürfte: Die Jagd gestaltet sich koordinierter, wenn A weiß, was B vorhat, und weiß, dass B weiß, was er (A) vorhat - und umgekehrt. Es scheint also durchaus möglich, dass derartige triadische Interaktionen in gemeinsamer Wahrnehmung eine besondere Rolle bei der evolutionären Entstehung gemeinsamer Aufmerksamkeit (und der beteiligten kognitiven Ressourcen) gespielt haben, obwohl auch triadische Interaktionen nachweisbar sind, die mit ziemlicher Sicherheit nicht kognitiv reichhaltig interpretierbar sind, dennoch aber über die gemeinsame Wahrnehmungssituation hinausgehen, insoweit einer der Steuerungsrichtpunkte nicht im gemeinsamen Wahrnehmungsrahmen enthalten ist. Auch für die Ontogenese ließe sich demnach ein Szenario veranschlagen, in dem funktional triadische Interaktionen in gemeinsamer Wahrnehmung die Grundlage für die Herausbildung gemeinsamer Aufmerksamkeit im engeren Sinne (mitsamt den kognitiv-motivationalen Faktoren) bilden (s. Bruners Formate). Die Erkenntnis, dass bloße Triadizität ( Joint Attention aus lerntheoretischer Perspektive) einer gemeinsamen Aufmerksamkeit im engeren (mentalistischen) Sinne vorausgeht, ist sicher nicht neu. Sie ist allein schon daraus abzuleiten, dass Lerntheoretiker die Entstehung gemeinsamer Aufmerksamkeit früher ansetzen als mentalistische Programme. Die hier betrachteten Beispiele zeigen aber auf, dass (funktionale) Triadizität auch im Tierreich weit verbreitet ist und gar als (rein verweisartige) Bezugnahme auf Abwesendes in Erscheinung tritt. Gerade eine solche - oft fälschlicherweise schon mit einer symbolischen Versetzung in Raum und Zeit gleichgesetzte - Möglichkeit der Bezugnahme auf Abwesendes wird häufig auch der Zeigegeste zugesprochen, die so zum entscheidenden Spiegelbild gemeinsamer Aufmerksamkeit und zur Grundlage humanspezifischer Kommunikation erhoben wird. Nun stellt sich die Zeigegeste im Hinblick auf ihre Funktion jedoch als bloßer Verweis dar, der schon im Tierreich seinesgleichen findet; zudem lässt sich vermuten, dass die Genese gemeinsamer Aufmerksamkeit nicht entscheidend mit einer solchen Bezugnahme auf Entitäten außerhalb gemeinsamer Wahrnehmung verknüpft ist, da zunächst gerade Gemeinsame Aufmerksamkeit 311 wechselseitige, triadisch strukturierte Steuerungsaktivitäten in gemeinsamer Wahrnehmung von der Genese der entsprechenden sozio-kognitiven Vermögen profitiert haben dürften und der bloße Verweis auf einen Richtpunkt außerhalb gemeinsamer Wahrnehmung ohnehin schon vorab möglich war (Bienen). Auch die Annahme einer besonderen Bedeutung der Zeigegeste bei der Entstehung gemeinsamer Aufmerksamkeit und der Sprache scheint so längst nicht gesichert. 4 Funktional-kognitive Triadizität und Sprache Eine funktionale Betrachtungsweise führt uns Szenarien vor Augen, in denen der Übergang zu humanspezifischen Kommunikationsformen sich vollzogen haben könnte, allerdings erst - und diese Erkenntnis ist das Verdienst vor allem sozial-kognitiver Forschungsansätze zur gemeinsamen Aufmerksamkeit - , wenn bestimmte kognitive Vermögen hinzutreten. Die kindliche Ontogenese und darauf bezogene Experimente entwicklungspsychologischer Prägung zeigen, dass Kinder um ihren ersten Geburtstag herum neue kognitive Fertigkeiten entwickeln, die mit gemeinsamer Aufmerksamkeit im engeren Sinne beschrieben werden können und deren Auftreten dem Spracherwerb unmittelbar vorausgeht. Es ist also zu vermuten, dass ab einem gewissen Punkt in der Ontogenese gewisse heraufdämmernde kognitive Vermögen in den Interaktionsprozess eingebracht werden, die für den Spracherwerb notwendig sind. Wahrscheinlich ist, dass funktional bereits triadisch organisierte Prozesse hier von besonderer Bedeutung sind. Entscheidend ist aber vor allem, dass die in solchen Prozessen neu zum Vorschein gelangenden kognitiven Ressourcen allein längst noch nicht ausreichen, den Übergang zur Sprache zu begründen. Nur weil unsere Vorfahren im Rahmen einer der Jagd der Schimpansen vergleichbaren Interaktion neue sozialkognitive Fertigkeiten entwickelt haben mögen, wird sich ihnen nicht wie von selbst das symbolische Potential der Sprache eröffnet haben. Demgemäß stellt Jürgen Habermas (2012: 61 ff.) in kritischer Auseinandersetzung mit mentalistischen Konzeptionen gemeinsamer Aufmerksamkeit (und bezugnehmend auf den Ansatz Tomasellos) die Notwendigkeit des ‘ Dazwischentretens von Gesten ’ heraus. Er adressiert die angesprochene triadische Beziehung, die durch Verknüpfung horizontaler Beziehungen zwischen den Interaktanten mit dem vertikalen Weltbezug entstehe und zunächst durch den Einsatz von Gesten gekennzeichnet sei. Die Verschränkung von Wahrnehmungen und Blickrichtungen führe dann zu einem objektivierenden Weltbezug und der sich in diesem Kontext vollziehende Abgleich reziprok übernommener Perspektiven löse die noch bei nichtmenschlichen Primaten gegebene egozentrische Wahrnehmung der Umgebung ab. Im nächsten Schritt müsse der Fähigkeit zur gestenvermittelten Bezugnahme auf objektive Gegebenheiten, bei der die Interaktanten dieselben Ziele verfolgen, aber noch eine Konventionalisierung des Zeichengebrauchs folgen, denn erst auf diese Weise werde das Zeichensubstrat zum Träger von Bedeutung erhoben. Demnach können symbolische Gehalte erst entstanden sein, nachdem geteiltes Wissen regelmäßig mit solchen Lauten und Bewegungen assoziiert wurde, die der bloßen Herstellung gemeinsamer Aufmerksamkeit als Antrieb dienten. Da erst über das Dazwischentreten von Gesten die für die Genese symbolischer Kommunikation notwendige Verschränkung der interpersonalen Beziehung mit einer objektivierenden Einstellung zur Welt erklärbar 312 Rafael Mollenhauer (Duisburg-Essen) wird, dürfe in keinem Fall ein Vorrang mentaler Phänomene vor der Kommunikation angenommen werden (cf. Habermas 2012: 63). Hier wird abermals deutlich, dass nur im Prozess der Handlungskoordination gemeinsame Aufmerksamkeit (einhergehend mit entsprechenden kognitiven Schlüsselkomponenten) zuerst signalartig konstituiert werden kann, um als Steuerungsprozess sodann der Genese symbolischer Akte als Fundament zu dienen. Joint Attention als entscheidenden (womöglich schon humanspezifischen) Zwischenschritt auf dem Weg von einer bloßen (funktionalen) Triadizität zur spezifisch sprachlichen Semantizität auszuweisen, erscheint durchaus sinnvoll. Entwicklungspsychologische Forschungen zeigen (trotz gewisser selbstauferlegter Beschränkungen), dass sich um den ersten Geburtstag des Kindes herum entscheidende (sozial-)kognitive Entwicklungen einstellen, denen der Spracherwerb unmittelbar folgt und die zur Aufstellung von Hypothesen zu einem dementsprechenden evolutionären Szenario zumindest verleiten. Da kognitive (und/ oder motivationale) Komponenten folglich über bloße Triadizität hinaus zu entscheidenden Charakteristika des Steuerungsprozesses avancieren, soll hier im Zusammenhang mit Joint Attention im engeren Sinne von einer funktional-kognitiven Triadizität die Rede sein. Herausgestellt sein soll damit der fundamentale Charakter funktional triadischer Steuerungsprozesse, die der Genese entsprechender kognitiver Faktoren und der durch sie gekennzeichneten Interaktionen als soziales Substrat dienen. Wie von sozial-kognitiven Ansätzen angenommen sind die involvierten Individuen nun zu einem rekursiven Erkennen von Intentionalität in der Lage - und bringen dieses in die Interaktion ein. Sie richten ihre Aufmerksamkeit jeweils auf eine gewisse Entität und wissen dies wechselseitig voneinander. Die Genese solcher Kompetenzen kann sich aber nur im Rahmen bereits funktional triadisch organisierter Interaktionen wie der gemeinsamen Jagd vollzogen haben (warum Schimpansen entsprechende Kompetenzen vermutlich dennoch nie entwickelt haben, wäre eine andere Frage, die es in zukünftiger Forschung zu klären gilt). Was hier zunächst wie ein beiläufiger Befund daherkommen mag, ist der springende Punkt für eine nähere Erforschung sowohl der phylogenetischen Wurzeln humaner Kommunikation als auch des ontogenetischen Übergangs zur symbolischen Praxis. Die individualistisch argumentierenden Ansätze der Joint-Attention-Forschung schließen die Genese kognitiver Faktoren als Produkt von Verhaltensabstimmung und Handlungskoordination nämlich von vornherein aus, wenn sie in schlichter Veranschlagung angeborener Module (Nativisten), bestimmter Lernvermögen (Lerntheoretiker) oder über entsprechend ausgelegte Experimentaldesigns, die allein auf den Nachweis einer bestimmten Kompetenz zielen, den Joint-Attention-Prozess (wie im Übrigen auch die symbolische Praxis) zum Ausdruck individueller Ressourcen herabstufen und von einer Beschreibung der sozialen Praxis weitgehend absehen. Resultat sind ausdruckstheoretische Erklärungsmodelle, die sprachliche und kulturelle Errungenschaften direkt aus dem Individuum ableiten. Die Darstellungsebene der Sprache wird als schlichtes Produkt eines individuellen Ausdrucks jedoch nicht in ihrer besonderen überindividuellen Qualität erfasst. Es bleibt aber festzuhalten, dass in triadischen Prozessen der Handlungskoordination, die der kindlichen Einbringung in symbolisch strukturierte Steuerungen unmittelbar vorausgehen, dem Anschein nach bestimmte kognitive Vermögen in der Koordination von Wahrnehmungs- Gemeinsame Aufmerksamkeit 313 aktivitäten verhaltensmäßig zum Ausdruck kommen, die dem Tierreich (vermutlich) verborgen bleiben und die somit einen bedeutenden Anteil am (auch phylogenetischen) Übergang zu humanspezifischer Kommunikation haben könnten. Ist gemeinsame Aufmerksamkeit im Sinne einer funktional-kognitiven Triadizität erst hergestellt, kann, wie von Habermas beschrieben, eine Konventionalisierung des Zeichengebrauchs einsetzen. Hier ist allerdings zu betonen, dass das einzelne Wort noch nicht die Ebene spezifisch sprachlicher Semantizität betrifft. Vielmehr kann es nur symphysisch oder empraktisch wirken; es ist also entweder an das physische Umfeld geknüpft (wie ein Produktname auf Konsumgütern) oder an den Handlungszusammenhang gebunden (wie im Falle eines Passagiers, der am Schalter schlicht das angestrebte Ziel benennt). Demgegenüber ist der synsemantische Einsatz der Kontaktmittel gekennzeichnet durch die Entstofflichung und die Ablösbarkeit von den Dingen. Die Bedeutung eines Wortes wird hier erst über die das Wort umgebende Rede bestimmt. Das kraft Konvention eine bestimmte Bedeutung vermittelnde Symbol erfüllt seine Funktion folglich nur innerhalb eines Symbolfeldes. Auch als Spiegel gemeinsamerAufmerksamkeit taugt das einzelneWort nur bedingt, denn auch von verschiedenen Tieren, denen gemeinsame Aufmerksamkeit im engeren Sinne gemeinhin abgesprochen wird, werden Worte gelernt und situationsspezifisch eingesetzt. Kaum anders verhält es sich mit der Zeigegeste, die teilweise in Form einer ein-eindeutigen Zuordnung mit gemeinsamer Aufmerksamkeit verknüpft wird (cf. Tomasello 2009), obwohl ihr Einsatz mindestens auch bei Affen und - rein motorisch - bei Kindern ab einem Alter von drei Monaten beobachtet wurde. Das Zeigen bleibt letztlich ein bloßer Verweis, das einzelne Wort eine schlichte Benennung. Etwas anders scheinen die Dinge zu liegen, wenn ein Kind in Gegenwart eines Erwachsenen selbst einen Namen für eine von beiden betrachtete Entität einführt und beide diesen Namen fortan für jene Entität gebrauchen. Hier hat der von Habermas angeführte und das wechselseitige Wissen um die gemeinsame Bezugnahme auf etwas voraussetzende Konventionalisierungsprozess eingesetzt. Derartige Fälle werden aber auch für akkulturierte Affen, deren Leistungen ohnehin schwierig in eine Erklärung der evolutionären Genese humaner Kommunikation einzubinden sind (cf. Mollenhauer 2010; Tomasello 2002), beschrieben, sodass die Humanspezifität gemeinsamer Aufmerksamkeit doch erneut infrage gestellt werden könnte. Vorerst ist aber von einer spezifisch menschlichen Qualität synsemantischer Zeichenverwendungen auszugehen, die aus auch im Tierreich anzutreffenden signalartig strukturierten, funktional-triadischen Steuerungen hervorgeht, (vermutlich) wenn bestimmte zumindest in ihrer vollen Entfaltung wohl auf den Menschen beschränkte kognitive Vermögen hinzutreten, welche eine funktional-kognitive Triadizität generieren, die ihrerseits das Substrat einer Konventionalisierung des Zeichengebrauchs darstellt. Doch all dies ist wohl allein auf der Grundlage einer empirischen Forschung näher zu klären, die die bisherigen (vornehmlich experimentalpsychologischen) Studien transzendiert. 314 Rafael Mollenhauer (Duisburg-Essen) 5 Zur empirischen Erforschung gemeinsamer Aufmerksamkeit Eine nähere Entschlüsselung der Genese humanspezifischer Kommunikation sowie der Genese der beteiligten kognitiven Ressourcen verlangt nach einer empirischen Forschung, die sich eben nicht auf den Nachweis kognitiver Kompetenzen beschränkt, deren Kern vielmehr eine Beschreibung des Prozesses der Handlungskoordination darstellt. Nur über eine Beschreibung der Koordinationsaktivitäten können auch die Differenzen zwischen (funktional) triadischen Steuerungsaktivitäten im Tierreich und Aktivitäten gemeinsamer Aufmerksamkeit beim Menschen weiter herausgearbeitet werden, während Befunde ausschließlich zu kognitiven Aspekten oder der Verwendung bestimmter Steuerungsmittel kaum aussagekräftig sind im Hinblick auf den Steuerungsprozess und die dort auch tatsächlich abgerufenen kognitiven Ressourcen. Gegenüber der weithin psychologisch geprägten Spracherwerbsforschung hätte eine (a) Forschung zur kommunikativen Entwicklung des Kindes (cf. Kathage 2008) einen ganzheitlichen Ansatz zu verfolgen, der nicht das einzelne Kind und dessen Erwerb sprachlicher Strukturen, sondern die Entwicklung des Kindes im Rahmen eines nicht weiter zerlegbaren multimodalen Interaktionsgeschehens in den Vordergrund stellt, denn auch die (sozial-)kognitive Entwicklung des Kindes kann sich allein in sozialer Praxis vollziehen. Folglich kommt auch der im Wesentlichen an der kognitiven Entwicklung interessierte Psychologe um eine Betrachtung natürlicher Prozesse der Verhaltensabstimmung und Handlungskoordination nicht herum. Vergleichende Studien mit nichtmenschlichen Primaten im Rahmen einer Art (b) ‘ Vergleichenden Interaktionsforschung ’ könnten darüber hinaus aufzeigen, inwiefern sich die Koordinationsaktivitäten von Mensch und Menschenaffe ähneln, was womöglich nähere Aufschlüsse zum Übergang von subhumanen zu humanspezifischen Interaktionsformen herbeiführen könnte. Anbieten würde sich in beiden Forschungsbereichen eine Kombination natürlicher Settings und experimenteller Methoden. Experimentalpsychologische Studien liegen bereits in großer Fülle vor, sodass man sich hier - mit angemessener Vorsicht - auf bereits generierte Ergebnisse stützen könnte, die man mit einer Beschreibung sozialer Praxis zu verbinden hätte. Es wäre zu untersuchen, wie Kinder und nichtmenschliche Primaten die (gemäß den experimentellen Befunden) augenscheinlich in einem bestimmten Zeitfenster heraufdämmernden (Kinder) oder grundsätzlich vorhandenen (Schimpansen) kognitiv-motivationalen Ressourcen in den Interaktionsprozess einbringen, wie sie in Letzterem vielleicht erst generiert werden und in welcher Weise sie auch zum Objekt der Verhaltensabstimmung bzw. Handlungskoordination werden. Noch besser wäre es, bereits durchgeführte experimentelle Studien (möglicherweise mit gewissen Anpassungen) zu reproduzieren und die dort getesteten Individuen zudem in (möglichst) natürlicher sozialer Praxis zu beobachten. So entstünde im Hinblick auf die kindliche Entwicklung auch die Möglichkeit, im Kontext einer Längsschnittuntersuchung veränderte Koordinationsmuster mit sich einstellenden kognitiven Entwicklungen in Relation zu setzen (ohne daraus einseitige Bedingungsverhältnisse ableiten zu wollen und so womöglich wieder in eine mentalistisch fundierte Zirkularität zu verfallen). Während zahllose Experimentaldesigns, die dem hier vorgestellten Vorhaben gerecht werden, bereits vorliegen und in Abhängigkeit vom jeweiligen Erkenntnisinteresse Gemeinsame Aufmerksamkeit 315 problemlos angepasst werden können, müssten für die angemessene Erfassung der Ganzheitlichkeit und Multimodalität entsprechende Methoden erst noch bereitgestellt werden oder zumindest Anpassungen bestehender Methoden vorgenommen werden. Zwar wird der Multimodalitätsbegriff in Soziologie und Linguistik in den letzten 10 - 15 Jahren verstärkt propagiert, die zugrunde gelegten Verständnisse von Multimodalität sind aber höchst heterogener Art (cf. Loenhoff und Schmitz 2015: 11 ff.). Nicht selten werden die verschiedenen Modi als jeweils eigenständige Ausdrucksmittel charakterisiert, denen sogleich eigene, nebeneinander bestehende Kanäle zugeordnet werden, die unabhängig voneinander geöffnet oder geschlossen werden können (cf. Loenhoff 2003: 181). Zur Orientierung für die Erfassung von Ganzheitlichkeit und Multimodalität kann Bühlers Modell zum seelischen Kontakt (s. Abb. 1) dienen, das die Gleichzeitigkeit der Steuerungsaktivitäten von Sprecher (der zugleich Hörer ist) und Hörer (der zugleich Sprecher ist) aufzeigt und auch auf nichtsprachliche (signalartige) Steuerungsaktivitäten anwendbar bleibt. Abb. 1: Modell zum seelischen Kontakt (nach Bühler 2000: 117) Bühler veranschlagt in den sich gegenseitig steuernden Individuen je einen Sender und einen Empfänger (wohlgemerkt, ohne mit dieser Metaphorik informationstheoretisches Gedankengut in seinen Ansatz aufzunehmen), wobei der Sender A nicht nur auf Empfänger B und der Sender B auf Empfänger A wirkt. Vielmehr nehmen die Ausdrucksbewegungen von A unmittelbar auch Einfluss auf A selbst, sodass das vom Sender A Kundgegebene vom Empfänger A und das vom Sender B Kundgegebene vom Empfänger B kundgenommen wird, was auf sprachlicher Ebene auch als das Verfertigen der Gedanken beim Reden bezeichnet werden darf (cf. Kleist 1984), insoweit das gerade Gesagte den Sprecher selbst in seinem Denken und seinen weiteren Äußerungsanstrengungen steuert. Auch Mead (1973) schlägt in diese Kerbe, wenn er der vokalen Geste aufgrund ihrer Zugänglichkeit für den Zeichenverwender besondere Bedeutung für den Übergang zum signifikanten Symbol zuspricht, doch soll hier auf grundlegender Ebene (und nicht allein vokale Äußerungen betreffend) zuerst einmal nur gesagt sein, dass man sich selbst im Zuge der Interaktion wahrnimmt. Dabei kann eine gefühlte Anspannung der Gesichtsmuskeln ebenso mit 316 Rafael Mollenhauer (Duisburg-Essen) gleichzeitig stattfindenden Ausdrucksbewegungen des Gegenübers gekoppelt werden wie die visuelle Wahrnehmung der eigenen Handbewegungen. Die vom Modell herausgestellte Ganzheitlichkeit des Interaktionsprozesses betrifft aber keineswegs nur die gleichzeitige Bezugnahme der Interaktionsteilnehmer aufeinander, sondern auch das Zusammenwirken unterschiedlicher Modalitäten, die in der Art von Gesamtgestalten zusammenkommen und daher auch analytisch nicht sinnvoll zu trennen sind. Die Ausdrucksbewegungen von A wirken in ihrer Gesamtheit auf B und umgekehrt, womit nicht geleugnet ist, dass jeweils nur bestimmte Aspekte des Sich-Äußerns steuerungsrelevant sein können. In einem nächsten Schritt müssten also geeignete Methoden für eine nähere Erforschung gegenseitiger Verhaltensabstimmung und Handlungskoordination erarbeitet werden, welche die Ganzheitlichkeit und die Multimodalität des Interaktionsprozesses angemessen erfassen. Sequenzanalysen konversationsanalytischer Prägung, die mehr und mehr eine multimodale Ausrichtung für sich in Anspruch nehmen, sind in der Regel weiterhin primär am sprachlichen Material, dem dann weitere Modi (Kanäle) addiert werden, orientiert. Obschon vergleichbare Methoden durchaus schon auf die naturgemäß nichtsprachlichen Interaktionen nichtmenschlicher Primaten Anwendung gefunden haben (cf. Rossano 2012), bleibt dennoch der sequenzielle Charakter (und eine Addition verschiedener Kanäle), sodass der Eindruck eines Nacheinanders von Aktivitäten erweckt wird. Es sind in zukünftiger Forschung demnach mindestens entscheidende Anpassungen bestehender Methoden vorzunehmen, um die ontogenetischen und die phylogenetischen Pfade zur symbolischen Praxis weiter zu entschlüsseln. Literatur Bakeman, Roger und Lauren B. Adamson 1984: “ Coordinating Attention to People and Objects in Mother-Infant and Peer-Infant Interactions ” , in: Child Development 55 (1984): 1278 - 1289 Baron-Cohen, Simon 1995/ 2009: “ The Eye Direction Detector (EDD) and the Shared Attention Mechanism (SAM): Two Cases for Evolutionary Psychology ” , in: Moore und Dunham (eds.) 3 1995/ 2009: 41 - 59 Barresi, John und Chris Moore 1996: “ Intentional Relations and Social Understanding ” , in: Behavioral and Brain Sciences 19 (1996): 107 - 154 Boesch, Christophe 2005: “ Joint Cooperative Hunting among Wild Chimpanzees: Taking Natural Observations Seriously ” , in: Behavioral and Brain Sciences 28 (2005): 692 - 693 Boesch, Christophe und Hedwige Boesch 1989: “ Hunting Behavior of Wild Chimpanzees in the Tai Forest National Park ” , in: American Journal of Physical Anthropology 78.4 (1989): 547 - 573 Bruner, Jerome S. 1995/ 2009: “ From Attention to the Meeting of Minds: An Introduction ” , in: Moore und Dunham (eds.) 3 1995/ 2009: 1 - 14 Bühler, Karl 1999: Sprachtheorie. Die Darstellungsfunktion der Sprache, Stuttgart: Lucius & Lucius [Zuerst erschienen 1934] Bühler, Karl 2000: Die Krise der Psychologie, Karl Bühler Werke 4, Weilerswist: Velbrück Wissenschaft [zuerst erschienen 1927] Carpenter, Malinda und Josep Call 2013: “ How Joint Is the Joint Attention of Apes and Human Infants? ” , in: Metcalfe und Terrace (eds.) 4 2013: 49 - 61 Corkum, Valerie und Chris Moore 1995/ 2009: “ Development of Joint Visual Attention in Infants ” , in: Moore und Dunham (eds.) 3 1995/ 2009: 61 - 83 Gemeinsame Aufmerksamkeit 317 David, Myriam und Geneviève Appell 1961: “ A Study of Nursing Care and Nurse-Infant Interaction ” , in: Brian M. Foss (ed.) 1961: Determinants of Infant Behavior: I, London: Methuen, 121 - 136 Dymond, Simon und Louise McHugh 2005: “ Symbolic Behaviour and Perspective-Taking Are Forms of Derived Relational Responding and Can Be Learned ” , in: Behavioral and Brain Sciences 5 (2005): 697 Eilan, Naomi et al. (eds.) 2005: Joint Attention: Communication and Other Minds, Oxford: Clarendon Press Fletcher, Logan und Peter Carruthers 2013: “ Behavior-Reading versus Mentalizing in Animals ” , in: Metcalfe und Terrace (eds.) 4 2013: 82 - 99 Gallese, Vittorio und Corrado Sinigaglia 2013: “ Cognition in Action: A New Look at the Cortical Motor System ” , in: Metcalfe und Terrace (eds.) 4 2013: 178 - 195 Gergely, György und John S. Watson 1999: “ Early Socio-Emotional Development: Contingency Perception and the Social-Biofeedback Model ” , in: Philippe Rochat (ed.) 1999: Early Social Cognition: Understanding Others in the First Months of Life, Mahwah, NJ: Lawrence Erlbaum Associates, 101 - 136 Gibson, Eleanor und Nancy Rader 1979: “ Attention: The Perceiver as Performer ” , in: Gordon A. Hale und Michael Lewis (eds.) 1979: Attention and Cognitive Development, New York: Plenum Press, 6 - 36 Habermas, Jürgen 2012: “ Die Lebenswelt als Raum symbolisch verkörperter Gründe ” , in: ders. 2012: Nachmetaphysisches Denken II. Aufsätze und Repliken, Frankfurt am Main: Suhrkamp, 54 - 76 Kathage, Andrea 2008: Zur kommunikativen Entwicklung des Kindes. Grundlagenstudie zur Entwicklung eines kommunikationswissenschaftlichen Ansatzes (= Essener Studien zur Semiotik und Kommunikationsforschung 25), Aachen: Shaker Kleist, Heinrich von 1984: “ Über die allmähliche Verfertigung der Gedanken beim Reden ” , in: ders. 1984: Sämtliche Erzählungen und andere Prosa, Stuttgart: Reclam, 340 - 346 Knobloch, Clemens 1997: “ Rezension von Boris M. Velichkovsky & Duane M. Rumbaugh (eds.): Communicating Meaning: The Evolution and Development of Language ” , in: Sprache und Kognition 16.2 (1997): 127 - 132 Loenhoff, Jens 2003: “ Kommunikationstheorie und Fundierungsrelationen im interpersonellen Kommunikationsprozeß ” , in: Helmut Richter und H. Walter Schmitz (eds.): Kommunikation - ein Schlüsselbegriff der Humanwissenschaften, Münster: Nodus, 179 - 191 Loenhoff, Jens und H. Walter Schmitz 2015: “ Einleitung ” , in: dies. (eds.) 2015: Telekommunikation gegen Isolation. Kommunikationswissenschaftliche Studien aus einem Modellprojekt in einer Klinik, Wiesbaden: Springer, 1 - 30 Mead, George Herbert 1973: Geist, Identität und Gesellschaft aus der Sicht des Sozialbehaviorismus, Frankfurt am Main: Suhrkamp Meltzoff, Andrew und Alison Gopnik 1993: “ The Role of Imitation in Understanding Persons and Developing a Theory of Mind ” , in: Simon Baron-Cohen, Helen Tager-Flusberg und Donald J. Cohen (eds.) 1993: Understanding Other Minds: Perspectives from Autism, Oxford, UK: Oxford University Press, 335 - 366 Metcalfe, Janet und Herbert Terrace (eds.) 4 2013: Agency and Joint Attention, Oxford u. a.: Oxford University Press Mollenhauer, Rafael 2010: Symbolverwendung bei Primaten? Eine Analyse der Ansätze von David Premack und Susan Savage-Rumbaugh (= Essener Studien zur Semiotik und Kommunikationsforschung 33), Aachen: Shaker Mollenhauer, Rafael 2015: Tomasellos Kooperationsmodell. Michael Tomasellos Forschung im Kontext kommunikationstheoretischer Fragestellungen, Konstanz und München: UVK Mollenhauer, Rafael 2016: “ Von subhumaner zu humanspezifischer Interaktion. Tomasello und die Qualität des Zeigens ” , in: Zeitschrift für Semiotik 38.3/ 4 (2016): 39 - 58 318 Rafael Mollenhauer (Duisburg-Essen) Moore, Chris 1996: “ Theories of Mind in Infancy ” , in: British Journal of Developmental Psychology 14 (1996): 19 - 40 Moore, Chris und Philip J. Dunham (eds.) 3 1995/ 2009: Joint Attention. Its Origins and Role in Development, New York und London: Psychology Press Muir, Darwin und Sylvia Hains 1999: “ Young Infant ʼ s Perception of Adult Intentionality: Adult Contingency and Eye Direction ” , in: Philippe Rochat (ed.) 1999: Early Social Cognition: Understanding Others in the First Months of Life, Mahwah, NJ: Lawrence Erlbaum Associates, 155 - 188 Penn, Derek C. und Daniel J. Povinelli 2013: “ The Comparative Delusion: The ‘ Behavioristic/ Mentalistic ’ Dichotomy in Comparative Theory of Mind Research ” , in: Metcalfe und Terrace (eds.) 4 2013: 62 - 81 Piaget, Jean 1974: Der Aufbau der Wirklichkeit beim Kinde, Stuttgart: Klett-Cotta Piaget, Jean 1992: Das Erwachen der Intelligenz beim Kinde, München: Deutscher Taschenbuch-Verlag Racine, Timothy P. 2011: “ Getting Beyond Rich and Lean Views of Joint Attention ” , in: Seemann (ed.) 5 2011: 21 - 42 Rochat, Philippe und Tricia Striano 1999: “ Social-Cognitive Development in the First Year ” , in: Philippe Rochat (ed.) 1999: Early Social Cognition: Understanding Others in the First Months of Life, Mahwah, NJ: Lawrence Erlbaum Associates, 3 - 34 Rossano, Federico 2013: “ Sequence Organization and Timing of Bonobo Mother-Infant Interactions ” , in: Interaction Studies 14.2 (2013): 160 - 189 Scaife, Michael und Jerome S. Bruner 1975: “ The Capacity for Joint Visual Attention in the Infant ” , in: Nature 253 (1975): 265 - 266 Seemann, Axel (ed.) 5 2011: Joint Attention. New Developments in Psychology, Philosophy of Mind, and Social Neuroscience, Cambridge/ MA und London: The MIT Press Seemann, Axel 2011 a: “ Introduction ” , in: ders. (ed.) 5 2011: 1 - 17 Steele, Sara und Hakwan Lau 2013: “ The Function of Consciousness in Controlling Behavior ” , in: Metcalfe und Terrace (eds.) 4 2013: 304 - 320 Tomasello, Michael 1995/ 2009: “ Joint Attention as Social Cognition ” , in: Moore und Dunham (eds.) 3 1995/ 2009: 103 - 130 Tomasello, Michael 1999: “ Social Cognition Before the Revolution ” , in: Philippe Rochat (ed.) 1999: Early Social Cognition: Understanding Others in the First Months of Life, Mahwah, NJ: Lawrence Erlbaum Associates, 301 - 314 Tomasello, Michael 1999 a: “ Having Intentions, Understanding Intentions, and Understanding Communicative Intentions ” , in: Philip D. Zelazo, Janet W. Astington und David R. Olson (eds.) 1999: Developing Theories of Intention: Social Understanding and Self-Control, Mahwah, NJ: Lawrence Erlbaum Associates, 63 - 75 Tomasello, Michael 2002: Die kulturelle Entwicklung des menschlichen Denkens. Zur Evolution der Kognition. Aus dem Englischen von Jürgen Schröder, Frankfurt am Main: Suhrkamp Tomasello, Michael 2009: Die Ursprünge der menschlichen Kommunikation. Aus dem Amerikanischen von Jürgen Schröder, Frankfurt am Main: Suhrkamp Tomasello, Michael 2010: Warum wir kooperieren, Berlin: Suhrkamp Tomasello, Michael 2014: Eine Naturgeschichte des menschlichen Denkens. Aus dem Amerikanischen von Jürgen Schröder, Berlin: Suhrkamp Trevarthen, Colwyn 1979: “ Instincts for Human Understanding and for Cultural Cooperation: Their Development in Infancy ” , in: Mario von Cranch et al. (eds.) 1979: Human Ethology: Claims and Limits of a New Discipline, Cambridge, MA: Cambridge University Press, 530 - 571 Ungeheuer, Gerold 2004: “ Die kybernetische Grundlage der Sprachtheorie von Karl Bühler ” , in: ders.: Sprache und Kommunikation. 3., erweiterte und völlig neu eingerichtete Auflage. Herausgegeben und eingeleitet von Karin Kolb und H. Walter Schmitz, Münster: Nodus Publikationen, 128 - 146 Gemeinsame Aufmerksamkeit 319
