Der Fragebogen in der Sozialforschung
0301
2014
978-3-8385-4129-7
UTB
Thomas Petersen
Mit der Qualität des Fragebogens steht und fällt der Erkenntniswert jeder Befragung. Dennoch wird diesem Instrument oft wenig Aufmerksamkeit entgegengebracht. Der vorliegende Band beschreibt, welche Funktionen ein Fragebogen in der Sozialforschung erfüllen muss, welche methodischen Probleme bei der Umsetzung einer Forschungsidee in die Fragebogenform auftreten können und wie man sie lösen kann.
Anhand von zahlreichen Beispielen zeigt der Autor, wie man Kompliziertes einfach macht und Informationen ermittelt, ohne zu fragen. Er beschreibt auch, wie man die Befragten bei Laune hält, sie mit notwendigen Informationen versorgt und wie man mit simplen Fragen bis in ihr Unbewusstes vordringen kann.
<?page no="1"?> Eine Arbeitsgemeinschaft der Verlage Böhlau Verlag · Wien · Köln · Weimar Verlag Barbara Budrich · Opladen · Toronto facultas.wuv · Wien Wilhelm Fink · Paderborn A. Francke Verlag · Tübingen Haupt Verlag · Bern Verlag Julius Klinkhardt · Bad Heilbrunn Mohr Siebeck · Tübingen Nomos Verlagsgesellschaft · Baden-Baden Ernst Reinhardt Verlag · München · Basel Ferdinand Schöningh · Paderborn Eugen Ulmer Verlag · Stuttgart UVK Verlagsgesellschaft · Konstanz, mit UVK / Lucius · München Vandenhoeck & Ruprecht · Göttingen · Bristol vdf Hochschulverlag AG an der ETH Zürich <?page no="2"?> Thomas Petersen Der Fragebogen in der Sozialforschung UVK Verlagsgesellschaft mbH · Konstanz mit UVK Lucius · München <?page no="3"?> Dr. Thomas Petersen ist seit vielen Jahren Projektleiter am Institut für Demoskopie Allensbach und Lehrbeauftragter an den Universitäten Dresden und Krems (Donau). Er war Präsident der World Association for Public Opinion Research (WAPOR). Online-Angebote oder elektronische Ausgaben sind erhältlich unter www.utb-shop.de. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.d-nb.de> abrufbar. Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. © UVK Verlagsgesellschaft mbH, Konstanz und München 2014 Einbandgestaltung: Atelier Reichert, Stuttgart Lektorat: Monika Pfaff, Langenfeld Druck und Bindung: fgb · freiburger graphische betriebe, Freiburg UVK Verlagsgesellschaft mbH Schützenstr. 24 · 78462 Konstanz Tel. 07531-9053-21 · Fax 07531-9053-98 www.uvk.de UTB-Nr. 4129 ISBN 978-3-8252-4129-2 <?page no="4"?> 5 Den Kollegen der Allensbacher Fragebogenkonferenz In den Gründerjahren u. a.: Herta Ludwig, Erp Ring, Hans Schneller, vor 20 Jahren, als ich in Allensbach anfing: Anne Niedermann, Karsten Pöhl, Ulrich Völker, Iron Werther, seitdem u. a.: Oliver Bruttel, Andrea Cermak, Andreas Fischer, Freya Frank, Wilhelm Haumann, Hartwig Köser, Maria Lauber, Julia Maushardt, Marion Lühe, Frank Plamboeck, Cathrin Schiemenz, Michael Sommer, Christian Statz, Eva-Maria Tschurenev, Peter Voss, Alexander Wagner, Julian Wangler, Matthias Wiepen. Ihnen das Buch nur zu widmen, wäre eine Anmaßung. Es ist ihr Buch, denn es dokumentiert ihre Arbeit, ihre Kreativität und Professionalität. <?page no="5"?> 6 Inhalt Einleitung ....................................................................................................... 9 1 Die Funktion des Fragebogens ................................................ 15 1.1 Das Prinzip des Messens................................................................ 18 1.2 „Ganzheitliche“ und analytische Betrachtungsweise ................. 22 1.3 Vom Leitfaden zur Strukturierung ................................................ 26 2 Das sozialwissenschaftliche Interview als soziale Interaktion ....................................................................... 31 2.1 Die schwächsten Glieder in der Kette ......................................... 31 2.2 Die Position der Befragten ............................................................ 37 2.3 Das Interview als Reaktions-Experiment..................................... 48 2.4 Die Sprache des Fragebogens....................................................... 53 3 Konstruktionsprinzipien des Fragebogens ......................... 63 3.1 Dramaturgie des Fragebogens ...................................................... 63 3.2 Das Problem der Monotonie ......................................................... 72 3.3 Der „taube Interviewer“ ................................................................. 75 3.4 Subjektive und objektive Fragebogenlänge ................................ 81 4 Formenlehre .................................................................................. 87 4.1 Fünf inhaltliche Ausrichtungen und zwei Fragezwecke ........... 87 4.2 Fragen zur Steuerung des Interviews........................................... 91 4.3 Verwendungszwecke offener Fragen......................................... 100 4.4 Über zwei einfache Regeln und die Schwierigkeiten, sie einzuhalten............................................................................... 110 4.5 Die Strukturierung von Antwortmöglichkeiten - Von der Ja-Nein-Frage zur Cafeteria .......................................... 124 4.6 Möglichkeiten und Probleme von Skalen ................................. 133 4.7 Umgang mit der Kategorie „Unentschieden“ ............................ 153 4.8 Interviewer-Beobachtungen ........................................................ 162 <?page no="6"?> Inhalt 7 5 Fragestrategien ........................................................................... 171 5.1 Grundsatzentscheidung: Abstrakt oder konkret? ...................... 171 5.2 Die Präsentation komplexer Sachverhalte ................................ 178 5.3 Erinnerungs- und sonstige Stützen............................................. 195 5.4 Die Überwindung von Aussagebarrieren .................................. 209 5.5 Die Kunst der indirekten Frage .................................................. 218 5.6 Projektive Verfahren ..................................................................... 236 5.7 Feldexperimentelle Methoden .................................................... 242 6 Der Fragebogen entsteht ......................................................... 265 6.1 Fragebogenkonferenz................................................................... 265 6.2 Hundert Stolperfallen und der Pretest ....................................... 269 6.3 Aspekte der formalen Fragebogengestaltung ........................... 281 Nachwort .................................................................................................... 289 Anhang Literatur....................................................................................................... 293 Verzeichnis der Abbildungen.................................................................. 310 Verzeichnis der Fragebeispiele ............................................................... 312 Index........................................................................................................... 315 <?page no="8"?> 9 Einleitung Dieses Buch hat eine ungewöhnlich lange Vorgeschichte. Sein Konzept stammt von der Pionierin der deutschen Umfrageforschung Elisabeth Noelle-Neumann (1916-2010), mit der ich fast zwanzig Jahre lang zusammenarbeiten durfte. In gewisser Hinsicht ist dieser Band ihr letztes Buch. Ich habe sogar kurz überlegt, ob ich sie als Autorin aufführen sollte, doch der Text ist vermutlich doch anders geworden, als sie ihn sich vorgestellt hatte, und sie kann sich ja nicht mehr wehren. Kennengelernt habe ich Elisabeth Noelle-Neumann Ende der 1980er- Jahre, als ich Student an dem von ihr gegründeten Institut für Publizistik der Universität Mainz war. Seit dieser Zeit sprach sie immer wieder von ihrem Fragebogenbuch, dass sie demnächst gedächte zu schreiben. Beschäftigt hatte sie die Frage, wie man gute Fragen für strukturierte Fragebogen entwickelt, spätestens seitdem sie 1947 das Institut für Demoskopie Allensbach gegründet hatte. Sie und ihre Mitarbeiter hatten in den darauf folgenden Jahrzehnten unzählige Fragemodelle entwickelt, und es muss sie geärgert haben, dass sich in der Fachwelt außerhalb des eigenen Instituts nur selten jemand für das Thema interessierte. Sie klagte darüber, dass die große Tradition der Fragebogenexperimente, mit denen George Gallup in den 30er-Jahren begonnen hatte, und die zu so großartigen Büchern wie Hadley Cantrils „Gauging Public Opinion“ (1944) oder Stanley Paynes „The Art of Asking Questions“ (1951) geführt hatte, in den 50er-Jahren abgerissen war. In den Jahren danach füllten sich die Fachbibliotheken mit unzähligen Lehrbüchern über Stichprobenstatistik und Analyseverfahren, doch das Thema Fragebogen spielte in der Methodenliteratur kaum eine Rolle. 1970 unternahm Elisabeth Noelle-Neumann den Versuch, mit einem Artikel in der Fachzeitschrift „Public Opinion Quarterly“ auf dieses Defizit aufmerksam zu machen (Noelle-Neumann 1970), doch nur wenige Forscher griffen ihre Hinweise auf. So leuchtete es mir ein, dass sie sich, wie es schien, nun, Ende der 80er-Jahre, vorgenommen hatte, ein Lehrbuch über die vielen in den <?page no="9"?> Einleitung 10 vorangegangenen Jahrzehnten entwickelten Fragebogenmethoden zu schreiben. Doch das Buch wurde nie geschrieben. Immer waren andere Projekte eiliger: Die Neuauflage ihrer „Einführungen in die Methoden der Demoskopie“, die immerhin ein großes Kapitel über Fragebogen enthielt, Neuausgaben ihres Hauptwerks „Die Schweigespirale“, dieser Aufsatz, jene Studie, die nächste Bundestagswahl. Und immer wieder erzählte sie mir und anderen: „Als Nächstes müssen wir aber das Fragebogenbuch schreiben.“ So wurde das Fragebogenbuch zu einer Art „Running Gag“ unter ihren Mitarbeitern. 1998 unternahm Elisabeth Noelle-Neumann einen letzten Versuch, das Projekt doch noch zu verwirklichen. Auf einer Fachtagung zur Qualität in der Umfrageforschung präsentierte sie das Inhaltsverzeichnis zum geplanten Buch, das sie sich inzwischen als riesiges Gemeinschaftsprojekt mit einer Vielzahl von Autoren vorstellte. Doch sie war mittlerweile fast 82 Jahre alt, und wie viele Menschen in diesem Alter hatte sie Formschwankungen. An guten Tagen konnte sie mitreißend und überzeugend sein wie in jungen Jahren, an schlechten Tagen gelang es ihr nicht mehr. Der Tag, an dem sie ihr Konzept auf der Tagung vorstellte, war ein schlechter Tag. Ihre Präsentation wirkte konfus und ziellos. Das Publikum verstand kaum, was sie mit dem Vortrag bewirken wollte. Schließlich verteilte sie Kopien des Inhaltsverzeichnisses, doch es war kaum mehr als eine weitgehend ungeordnete Sammlung von Stichwörtern. Niemand ging ernsthaft auf die Pläne ein, und so verpuffte auch dieser Versuch. Im Jahr 2009 dann, Elisabeth Noelle-Neumann hatte sich inzwischen aus der aktiven Forschung zurückgezogen, geschahen drei Dinge fast gleichzeitig: Erstens stellte ich bei einer Recherche im Allensbacher Archiv zufällig fest, dass es für den Vortrag aus dem Jahr 1998 nicht nur, wie ich geglaubt hatte, eine grobe Stichwortliste gab, sondern einen sauber ausgearbeiteten, gut durchdachten Vortragstext, der keineswegs so konfus und ziellos war wie die tatsächliche Präsentation und der nur aus irgendeinem Grund nicht zum Einsatz gekommen war. Klar und mit großer Detailtreue hatte Elisabeth Noelle-Neumann darin festgehalten, wie sie sich das Fragebogenbuch vorstellte. Es sollte 14 Hauptkapitel geben. „Das erste Kapitel“, heißt es in dem Manuskript, „beschreibt den Weg von der Forschungsaufgabe über daraus abgeleitete Programmfragen zu der Auswahl der Untersu- <?page no="10"?> Einleitung 11 chungsmodelle, der Übersetzung der Programmfragen in Testfragen und zugleich mit Blick auf die Rückübersetzung zur Beantwortung der Forschungsaufgabe am Ende der Untersuchung. Es muss das zweite Hauptkapitel folgen mit der Abhandlung der formalen Fragen, wie sie schon im Referat von 1974 dargestellt wurden und wie sie von der kognitiven Schule seit damals mit guten Fachpublikationen weiter entwickelt wurden. Hier wären auch Skalentechniken vorzustellen. Ebenfalls wäre hier abzuhandeln, mit welcher Art von Fragen die Zielpersonen für das Interview zu bestimmen sind. Das dritte Hauptkapitel behandelt den Übergang vom individuellen Gespräch zu der strukturierten Befragung von Personengruppen, wie sie in strikter Einheitlichkeit für statistische Zwecke erforderlich ist. Aus dem individuellen Gespräch wird ein Reaktionstest. Das vierte Hauptkapitel behandelt die Übersetzung von direkt nicht abfragbaren Sachverhalten, Einstellungen, was man seit Emile Durkheims Buch über die ‚Regeln der soziologischen Methode’ von 1898 empirische Äquivalente oder Indikatoren nennt (...). Das fünfte Hauptkapitel muss zeigen, wie die Instrumente der Individualdiagnostik der Psychologie in die Umfrageforschung eingeführt werden können. Das geht bekanntlich bis zum Assoziationstest (TAT), dazu Projektionstests (auch Rohrschach), Zeichentest. Das semantische Assoziationsprofil und Polaritätsprofil gehören zu den frühesten Instrumenten, die in der Umfrageforschung Eingang gefunden haben.“ Und so ging es weiter: Es waren präzise Beschreibungen aller 14 geplanten Hauptkapitel, eine Art Gebrauchsanweisung für die Planung eines Fragebogenbuchs, das über die sonst üblichen wenigen allgemeinen Hinweise in den Methodenbüchern weit hinausging und die ganze Bandbreite der Formen und Funktionen von Fragebogen und die Probleme bei ihrer Entwicklung präsentierte. Das zweite, was im Jahr 2009 geschah, war, dass ich auf einen alten Zeitungsausschnitt stieß. Es handelte sich um ein Interview mit Elisabeth Noelle-Neumann aus der Mitte der 70er-Jahre. Dort erzählte sie dem Reporter das, was sie auch mir 20 Jahre lang erzählt hatte, nämlich dass sie demnächst ein Fragebogenbuch schreiben werde. Es las sich, als sei sie fest entschlossen, am nächsten Morgen damit anzufangen. Der Plan zu dem Buch war also noch viel älter, als ich gedacht hatte. <?page no="11"?> Einleitung 12 Nach meiner Erinnerung am selben Tag, zumindest nicht mehr als ein paar Tage später, meldete sich schließlich bei mir Rüdiger Steiner von der UVK Verlagsgesellschaft in Konstanz mit der Frage, ob ich bereit wäre, ein Lehrbuch zum Thema öffentliche Meinung zu verfassen. Dies war das dritte der Ereignisse, die sich nun wie von selbst zusammenfügten. Spontan schlug ich vor, anstelle des Buches über öffentliche Meinung auf der Grundlage des wiederentdeckten Leitfadens nun doch noch das seit Jahrzehnten phantomhaft als Plan herumgeisternde Fragebogenbuch zu schreiben, denn fast 40 Jahre der Ankündigung seien eigentlich genug. Zu meiner Überraschung willigte der Verlag wenige Wochen später ein. Fast wäre auch dieser Anlauf wieder im Sande verlaufen, denn auch bei mir erwiesen sich immer wieder andere Dinge als eiliger. Aber schließlich begann ich doch zu schreiben, mühsam, in kleinen Häppchen und mit langen Pausen. Als roter Faden diente der Vortragstext aus dem Jahr 1998. Zwar wurden aus den geplanten 14 Hauptkapiteln schließlich sechs, und nicht alle in dem Text angesprochenen Aspekte konnten berücksichtigt werden, aber im Kern ist das Konzept erhalten geblieben. Dabei wurde gar nicht erst versucht, jenes bahnbrechende Standardwerk vorzulegen, das Elisabeth Noelle-Neumann vorschwebte. Diese Vorstellung war in meinen Augen immer übertrieben. Wahrscheinlich ist aus den Plänen auch deswegen 40 Jahre lang nichts geworden, weil sie überambitioniert waren. Doch ich glaube, dass dieses Buch immerhin helfen kann, eine schmerzhafte Lücke in der Methodenliteratur wenigstens ein wenig zu verkleinern. Dass es eine solche Lücke gibt, ist meiner Meinung nach nicht zu bestreiten. Die Situation ist eigentlich grotesk: Der Fragebogen ist das zentrale Instrument in der Umfrageforschung. Mit ihm steht und fällt der Erkenntniswert einer Untersuchung, und doch wird kein Element des Forschungsprozesses in der Methodenliteratur liebloser behandelt. Es gibt abseits vergleichsweise kleiner Zirkel von Spezialisten, beispielsweise in der kognitiven Psychologie, keine ausgeprägte Kultur der Auseinandersetzung mit Fragebogenmethoden, und dies merkt man vielen Untersuchungen auch deutlich an, sowohl in der akademischen als auch in der privatwirtschaftlichen Umfrageforschung. Während viele Forscher regelrechte Glaubenskriege um Stichprobenmethoden aus- <?page no="12"?> Einleitung 13 fechten und immer größere und komplexere Modelle zur Datenanalyse entwickeln, akzeptieren sie klaglos, ja ohne Problembewusstsein, Fragebogen, die den Wert ihrer so liebevoll und aufwendig angelegten Analysen von vornherein zunichtemachen. Immer die gleichen wenigen Fragemodelle, zusammengeführt in überlangen, monotonen Fragebogen, die allein nach den Maßgaben der Analysewünsche konzipiert, nicht aber an der Psychologie der Befragten ausgerichtet sind, führen immer wieder zu wirklichkeitsfremden Ergebnissen, ohne dass es der meist von der konkreten Feldarbeit abgeschnittene Forscher überhaupt merkt. Dieses Buch soll aus dieser Situation herausführen. Es versucht, die ganze Bandbreite der Fragetechniken und ihrer Einsatzmöglichkeiten wenigstens ansatzweise vor Augen zu führen, illustriert am praktischen Beispiel, wo immer dies möglich ist. Es zeigt, wie man die Befragten bei Laune hält, sie mit notwendigen Informationen versorgt und dazu verleitet, Dinge zu sagen, die sie eigentlich lieber verschweigen würden. Es beschreibt, wie man Kompliziertes einfach macht, Informationen ermittelt, ohne zu fragen, wie man mit simplen Fragen bis ins Unbewusste der Befragten vordringen kann und vieles mehr. Kurz: Es ist eine Einladung, die große, auch für viele Fachleute überraschend bunte und vielfältige Welt der Fragebogenmethoden kennenzulernen. Sie ist viel komplizierter, vor allem aber viel interessanter, als die meisten Menschen glauben. Herzlich bedanken möchte ich mich bei Martin Degen, Wolfgang Donsbach, Wilhelm Haumann, Tobias Langner, Sven Reinecke, Isabel Römer und Anette Weiberg. Sie haben mir in verschiedenen Phasen der Erstellung des Manuskripts sehr geholfen. Mein besonderer Dank gilt Rüdiger Steiner für seine große Geduld. Ihm und Monika Paff danke ich außerdem für die außerordentlich gründliche und gleichzeitig behutsame Korrektur des Manuskripts. <?page no="14"?> 15 1 Die Funktion des Fragebogens In den Gründerjahren der Umfrageforschung war das Institut für Demoskopie Allensbach sehr bemüht, der Öffentlichkeit die Prinzipien der strukturierten Repräsentativbefragung nahezubringen. Als Mitbegründer der Umfrageforschung in Deutschland - es war das erste deutsche Institut, das 1947 begann, Repräsentativumfragen durchzuführen (vgl. Noelle-Neumann 2006, S. 150-169) - fühlte man sich für die öffentliche Aufklärung zu diesem Thema in besonderer Weise verantwortlich. Dieses Bestreben führte zur Produktion einer ganzen Reihe von aus heutiger Sicht teilweise etwas eigenartig erscheinenden Werbeprodukten, darunter Notizblöcken, auf deren Deckblatt unter der Überschrift „Ablauf einer demoskopischen Untersuchung“ die Schritte des Forschungsprozesses sehr detailliert aufgelistet waren. Die Liste enthielt 41 Punkte, darunter „Abgrenzung des Personenkreises, dessen Verhalten, Meinung usw. zu erforschen ist“, „Leitstudie auf statistischer Basis von 100 bis 300 Fällen“, „Einsatzpläne und Stichprobenanweisungen für die Interviewer“ oder „Interpretation und theoretische Verarbeitung der Befunde bei statistischer Beweisführung“. Viele der Punkte müssen für Außenstehende, die mit den Prinzipien der Umfrageforschung nicht vertraut waren, sehr eindrucksvoll gewirkt haben. Man kann durchaus Zweifel anmelden, ob die Liste tatsächlich dazu geeignet war, den Menschen die Methoden der Demoskopie nahezubringen, oder ob sie, wenn sie überhaupt gelesen wurde, nicht eher abschreckte. Doch die Listenpunkte, die das Thema Fragebogen betrafen, wirkten keineswegs besonders eindrucksvoll. Es sind insgesamt sechs, und sie lesen sich teilweise wie unnötige Wiederholungen: „Erster Fragebogenentwurf“, dann „Probe-Interviews“, danach „Zweiter Fragebogenentwurf“. „Statistische Beweisführung“, das klingt anspruchsvoll, „Erster Fragebogenentwurf“ banal. Dass beides untrennbar miteinander zusammenhängt, wird nur dem Experten deutlich. Das Beispiel dieser kleinen Liste zeigt die Schwierigkeit, die sich bei dem Versuch ergibt, die Bedeutung des Fragebogens in der empirischen Sozialforschung zu erläutern. Auf einer ganz allgemeinen Ver- <?page no="15"?> Die Funktion des Fragebogens 16 ständnisebene wird den meisten Menschen, Experten wie Laien, durchaus einleuchten, dass der Fragebogen ein zentrales Element der Umfrageforschung ist, denn ohne Fragen erhält man keine Antworten. Doch es ist oft schwer zu vermitteln, dass die Fragebogenentwicklung ein außerordentlich anspruchsvolles Unterfangen ist, der intellektuell am meisten herausfordernde Schritt des Forschungsprozesses. In der Praxis der Umfrageforschung erlebt man häufig, dass die Auftraggeber einer Studie mit großem Respekt auf die technischen Schritte des Forschungsprozesses blicken: die Stichprobenbildung, die Details der Feldarbeit und vor allem die mathematisch-statistische Auswertung. Überzeugt, dass diese Schritte den Fachleuten vorbehalten sein müssen, halten sie respektvoll Abstand. Bei der Fragebogenentwicklung dagegen besteht diese Überzeugung nicht. Fragen stellen, so wird oft angenommen, kann schließlich jeder. Und wer, wenn nicht der Auftraggeber selbst, kann am besten sagen, welche Fragen er beantwortet haben möchte? Manche pfiffigen Geschäftsleute in der privatwirtschaftlichen Umfrageforschung machen sich diese verbreitete Meinung sogar zunutze und bieten ihren Auftraggebern an, ihre Fragen selbst zu formulieren. Hinter einer solchen Haltung steckt nicht nur eine Unterschätzung der Komplexität der Fragebogenentwicklung und der bei ihr zu beachtenden Faktoren, und auch der Hinweis darauf, dass tatsächlich eben nicht jeder Mensch gleich gut Fragen für die Sozialforschung stellen kann, sondern dass dafür spezielle Fachkenntnisse nötig sind, trifft nicht den Kern der Sache. Die Unterschätzung der Probleme bei der Fragebogenentwicklung geht letztlich zurück auf ein verbreitetes grundsätzliches Missverständnis der Bedeutung des Fragebogens im Forschungsprozess. Der Fragebogen ist nicht, wie angenommen wird, ein einzelner, zwar notwendiger, aber vergleichsweise kleiner Schritt im Ablauf einer Untersuchung, wie dies auch ungewollt durch die eingangs erwähnte Auflistung des Allensbacher Instituts auf dem Deckblatt des Notizblocks suggeriert wird, sondern er ist das zentrale Steuerungselement des gesamten Forschungsprozesses. Der Fragebogen muss viel mehr leisten, als nur unmissverständlich die Themen auflisten, zu denen die Befragten Antworten geben sollen, und er bewirkt viel mehr als den Transfer von Frageinhalten: <?page no="16"?> Die Funktion des Fragebogens 17 - Er macht den Befragten das oft abstrakte Untersuchungsthema erst zugänglich, indem die komplexe Fragestellung des Forschers in eine Mehrzahl leicht verständlicher Teilfragen „übersetzt“ wird. - Er strukturiert die Fragen und Antwortmöglichkeiten und gibt damit den Befragten einen festen Rahmen für ihre Reaktionen vor. - Er muss eine Brücke schlagen zwischen der Gedankenwelt der Befragten und den analytischen Bedürfnissen des Forschers. Beide unterscheiden sich in ihren Strukturen oft beträchtlich. Der Fragebogen muss einen Kompromiss darstellen, der den Bedürfnissen beider Seiten gerecht wird. - Er steuert das Verhalten der Interviewer und sorgt für den reibungslosen Ablauf des Interviews. Damit sorgt er auch für die Standardisierung des Interviewvorgangs, der die Voraussetzung für die Vergleichbarkeit der Antworten ist. - Er vermittelt den Befragten Informationen und strukturiert diese. Diese Informationen wiederum beeinflussen das Antwortverhalten der Befragten. In manchen Fällen sind diese Informationen notwendig zur Beantwortung der Fragen, in manchen Fällen aber auch ungewollt, jedoch unvermeidlich. Sie bilden damit potenzielle Störfaktoren im Interview. - Er bestimmt die Dramaturgie des Interviews mit einem Wechsel von einfachen, leicht zu beantwortenden Fragen und unvermeidlich komplexen Fragestellungen, die den Befragten Konzentration abverlangen. Er steuert damit die Aufmerksamkeit der Befragten, hält ihr Interesse am Interview wach. - Er schult die Befragten im Frage- und Antwortspiel, nimmt ihnen die Scheu vor dem Interview, bevor die für die Untersuchung entscheidenden Fragen gestellt werden. - Er nimmt Einfluss auf die Stimmung der Befragten - gewollt, um etwa Aussagehemmungen zu überwinden und die Antwortbereit- <?page no="17"?> Die Funktion des Fragebogens 18 schaft auch über längere Passagen hinweg zu erhalten, oder ungewollt, wenn auch unvermeidlich, indem er auf die Befragten psychologischen Druck ausübt, vermeintliche Normen vorgibt oder durch Fragen, die als Prüfung empfunden werden, verunsichert. - Er muss - in aller Regel - den Befragten zu einer Reaktion veranlassen, die seinem alltäglichen Verhalten entspricht und nicht überwiegend eine Reaktion auf den Interviewprozess selbst ist. Das heißt auch, dass er Selbsttäuschungen und Rationalisierungen verhindern helfen muss. Mit dieser Liste sind die komplexen Aufgaben des Fragebogens in der Sozialforschung wahrscheinlich noch nicht vollständig beschrieben. Doch man erkennt bereits die Komplexität der Aufgaben, die das Instrument erfüllen muss. Die Kernfunktion ist - neben der Übermittlung und Strukturierung der Frageninhalte - die Vermittlung zwischen den Bedürfnissen der Forscher und der Befragten, die sich nicht selten in einem Konflikt befinden, denn in der empirischen Sozialforschung treffen zwei grundsätzlich unterschiedliche Denkweisen aufeinander: die von statistischen Prinzipien und daraus resultierenden abstrakten Strukturen geprägte Vorstellung der Wissenschaft und das meist eher vage, intuitive, wenig systematische Denken und Fühlen im Alltagsleben. Man muss sich mit beiden beschäftigen, beide verstehen, um auch die Vermittlungsaufgabe des Fragebogens vollständig zu erfassen. Im Folgenden sollen deswegen zunächst die Prinzipien des Messens in der Sozialwissenschaft und die damit verbundenen Zwänge zur Strukturierung und Standardisierung erläutert werden, dann, im nächsten Hauptkapitel, einige Elemente der Psychologie des Interviews und die sich daraus ergebenden Anforderungen für die Fragebogenentwicklung. 1.1 Das Prinzip des Messens Die Methode der Repräsentativumfrage hat sich im Verlauf der letzten Jahrzehnte zum wichtigsten Instrument einer ganzen Reihe von Sozialwissenschaften entwickelt. Sie ist das zentrale Erkenntnisinstrument in der Soziologie und der empirisch ausgerichteten Politikwissenschaft <?page no="18"?> Das Prinzip des Messens 19 (vgl. Petersen 2002, S. 48). In der Kommunikationswissenschaft steht sie gleichrangig neben der Medieninhaltsanalyse (vgl. Noelle-Neumann/ Petersen 2009, S. 292; Löblich/ Pfaff-Rüdiger 2008; Klammer 2005, S. 219-220; Schulz 2009, S. 47). Auch in Teilen der Psychologie hat sie eine gewisse Bedeutung, wenn sie auch hier meist im Schatten des Laborexperiments steht (vgl. Herkner 1991, S. 18). Dennoch stößt die Methode nach wie vor auf viele Missverständnisse, gelegentlich sogar Misstrauen, auch bei vielen Wissenschaftlern. Die westliche, christliche Kulturtradition ist von dem Gedanken geprägt, Menschen als Individuen zu betrachten, als unverwechselbare, einzigartige Geschöpfe Gottes. Der Gedanke, dass man diese Menschen unter Vernachlässigung ihrer Individualität alle „über einen Kamm scheren“ kann, sie alle, Universitätsprofessoren wie Hilfsarbeiter, mit demselben Fragebogen ausfragen kann, ohne auf ihre spezifischen Lebenslagen und Motive einzugehen, löst bei vielen Menschen Unbehagen aus. Der Vorwurf, die Umfragemethode sei mindestens oberflächlich, liegt nahe. Die Umfrageforschung verlangt vom Forscher wie vom Nutzer, sich von eben dieser Betrachtungsweise, die die Einzigartigkeit eines jeden Menschen in den Mittelpunkt stellt, zu lösen und stattdessen die spezifischen Eigenschaften zu betrachten, die große Gruppen von Menschen über die einzelnen Individuen hinaus aufweisen. Dieser Schritt fällt auch Wissenschaftlern schwer. Bezeichnend hierfür ist eine Begebenheit, die sich einmal bei einer wissenschaftlichen Tagung zum Thema Glück und subjektives Wohlbefinden in Koblenz ereignete. Dort wurde das Ergebnis einer Umfrage präsentiert, bei der eine Vielzahl von Fragen mithilfe des Verfahrens der Faktorenanalyse (hierzu Noelle- Neumann/ Petersen 2005, S. 558-561; Hofstätter 1962) ausgewertet worden war. Dabei wurden sehr aufschlussreiche Strukturen sichtbar, die es wiederum ermöglichten, die Befragten nach ihren - ihnen selbst unbewussten - Persönlichkeitseigenschaften in Gruppen zu sortieren. Der Charme der Methode bestand darin, dass es das Antwortverhalten der Befragten selbst war, das der Zuordnung in Gruppen zugrunde lag, nicht die theoretischen Überlegungen der Forscher. Die Befragten sortierten sich gleichsam selbst. Die Ergebnisse waren eindeutig und praktisch unumstößlich. Doch ein Teilnehmer der Diskussion wischte sie kurzerhand vom Tisch mit der entwaffnenden Bemerkung: „An Faktorenanalysen glaube ich nicht“ (Noelle-Neumann/ Petersen 2005, S. 561). <?page no="19"?> Die Funktion des Fragebogens 20 Wenn also die Betrachtung von Menschen in Gruppen unter Vernachlässigung ihrer Individualität so befremdlich ist, warum gibt man sich denn dann mit ihr ab? Warum ist es notwendig, die Befragten so rüde in das starre Schema eines Fragebogens zu pressen? Um dies zu verstehen, hilft es, sich die Bedeutung der Begriffe „qualitative“ und „quantitative Forschung“ zu verdeutlichen, die in der Sozialforschung oft irreführend verwendet werden und damit unnötigerweise eher zur Verwirrung als zum Verständnis beitragen (vgl. Noelle-Neumamn/ Petersen 2005, S. 499; Lasswell 1965, S. 464). Ursprünglich wurde die Unterscheidung zwischen „qualitativ“ und „quantitativ“ in den Naturwissenschaften entwickelt. Sie spielt vor allem in der Chemie eine wesentliche Rolle. Das „Römpp Chemie-Lexikon“ beschreibt eindeutig, worum es dabei geht: Die „qualitative Analyse“ ist demnach die „Bezeichnung für dasjenige Teilgebiet der chemischen Analyse, das die Feststellung der chemischen Art der Bestandteile (...) einer unbekannten Substanz (...) zum Ziele hat, ohne deren Mengenanteile zu berücksichtigen“. Die „quantitative Analyse“ ist dagegen „die Bezeichnung für dasjenige Teilgebiet der chemischen Analyse, das die Feststellung der Mengenanteile der bekannten - evtl. durch eine vorausgegangene qualitative Analyse ermittelten - Bestandteile (...) zum Ziele hat“ (Falbe/ Regnitz 1989-1993, Bd. 5, S. 3732). In diesem Sinne sind Repräsentativbefragungen quantitative Untersuchungen, nicht weil ihre Ergebnisse mit der Methode des Zählens ausgewertet werden - das geschieht gelegentlich auch bei qualitativen Untersuchungen -, sondern weil das Zählen zum Zweck der Verallgemeinerung stattfindet. Die in der Umfrage erhobenen Zahlen sollen Aufschluss darüber geben, welche - um in der Sprache des Chemie- Lexikons zu bleiben - Mengenanteile in der Gesellschaft (oder einer gesellschaftlichen Gruppe, über die die Umfrage Auskunft geben soll) vorhanden sind. Es geht nicht darum festzustellen, dass bestimmte Meinungen oder Verhaltensweisen in der Gesellschaft existieren, sondern bei einem wie großen Anteil der Gesellschaft sie existieren. Um dies zu ermöglichen, muss eine Umfrage zwei Bedingungen erfüllen. Erstens muss die Stichprobe, also die Auswahl der Befragten, für die Gesamtgruppe derjenigen, über die eine Aussage gemacht werden soll, repräsentativ sein. Die Basis hierfür bietet die Logik der Wahrscheinlichkeitsrechnung, die die Auswahl der Befragten bestimmen muss. Da dieser <?page no="20"?> Das Prinzip des Messens 21 Aspekt der Umfragemethode mit dem Thema Fragebogen nicht unmittelbar verknüpft ist, wird er hier nicht weiter behandelt. Er wird ausführlich in zahlreichen Handbüchern besprochen (z. B. Noelle- Neumann/ Petersen 2005; Kromrey 2000; Friedrichs 1985; Klammer 2005). Die zweite Voraussetzung für quantitative Verallgemeinerbarkeit von Umfrageergebnissen ist, dass die Antworten der Befragten so weit wie irgend möglich miteinander vergleichbar gemacht werden. Das wiederum setzt eine strenge Standardisierung des Interviews voraus. Das betrifft die Fragen selbst wie auch den Interviewverlauf. Alle Befragten müssen mit exakt den gleichen Fragen im gleichen Wortlaut in der gleichen Reihenfolge konfrontiert werden, und auch ihre Antworten müssen nach einem Schema ermittelt werden, das bei allen Befragten so weit wie irgend möglich gleich ist. Nur dann kann man die Antworten sinnvoll zählen und - sofern die statistischen Bedingungen einer Repräsentativstichprobe erfüllt sind - auf die Grundgesamtheit derer, aus denen die Befragten ausgewählt wurden, verallgemeinern. Der Umfrageforscher Wilhelm Schwarzenauer hat einmal in einem Rundbrief an die Interviewer des Instituts für Demoskopie Allensbach dieses Prinzip sehr anschaulich beschrieben und den Mitarbeitern damit erklärt, warum sie sich bei ihren Interviews immer streng an den Wortlaut des Fragebogens halten müssen: „Wenn Frau Peter ihrer Kollegin im Büro erzählt, dass ihr Sohn ihr schon bald über den Kopf wachse, so hat die Kollegin eine recht gute Vorstellung, wie groß der Sohn von Frau Peter ist. Sie hat ja diese anschaulich vor sich. Wenn wir aber wissen wollen, wie groß heute im allgemeinen 15jährige Jungen in Deutschland sind, oder ob die Kinder in Großstädten allgemein größer sind als Landkinder, würde eine solche Beschreibung nicht genügen. Wir müssen darum einen einheitlichen Maßstab nehmen. Man wird die Jungen einfach mit einem Metermaß messen. Bei der Erforschung der Meinungen und Gewohnheiten der Bevölkerung ist dieser Maßstab das Interview, noch besser gesagt, jede einzelne Frage. Wir setzen diesen Maßstab an 2000 Personen in ganz Deutschland an und können dann die Verschiedenheiten ihrer Meinungen, Ansichten und Gewohnheiten erkennen. Es leuchtet ein, warum ein solcher Maßstab immer der gleiche sein muss. <?page no="21"?> Die Funktion des Fragebogens 22 Würden wir in unserem Beispiel die 15jährigen Jungen mit verschiedenen Maßstäben messen, so wäre uns wenig damit gedient. Sie brauchen sich nur vorzustellen, jeder ‚Interviewer’ würde sich einen beliebig langen Stock abschneiden, die Jungen messen und dann nach Allensbach berichten: Drei Jungen sind zweieinhalbmal so groß wie meine Stocklänge, zwei nur zweieindrittel. Sie lachen, aber das ist gar nicht lächerlich. Wenn ein Interviewer die Fragen im Fragebogen nicht wörtlich vorliest, weil er meint, in diesem besonderen Fall wäre eine andere Fragestellung viel günstiger, macht er damit nichts anderes als jener ‚Interviewer’ mit seinem willkürlich abgeschnittenen Stock: Er misst mit einem willkürlichen Maßstab“ (Schwarzenauer o. J., S. 3-4). 1.2 „Ganzheitliche“ und analytische Betrachtungsweise Bereits die Notwendigkeit, einheitliche Maßstäbe an alle Befragten anzuwenden, zwingt den Forscher bei der Konstruktion des Fragebogens in ein enges Korsett - und damit auch die Befragten. Der Forscher muss versuchen, diesen möglichst keinen Ausweg aus dem vorgegebenen Schema zu bieten. Damit das überhaupt funktioniert, muss das Schema so konstruiert sein, dass sich alle Befragten darin wiederfinden, dass die Antworten, die sie geben möchten, in der festgefügten Struktur vorgesehen sind. Dies allein bereitet bereits genug Probleme bei der Fragebogenkonstruktion, doch der Forscher muss in seinem Erkenntnisstreben noch einen Schritt weiter gehen. Er untersucht nicht, wie oben bereits erwähnt, einzelne Menschen, sondern Gruppen von Menschen und ihr kollektives Verhalten. Die ebenfalls bereits erwähnte Notwendigkeit, sich von dem Versuch zu verabschieden, jedem einzelnen Befragten individuell gerecht zu werden, ist nicht nur der Tatsache geschuldet, dass das Ergebnis der Befragung gezählt und verallgemeinert werden soll, sondern dieser Schritt ist auch notwendig, um dem Untersuchungsgegenstand gerecht zu werden. Gesellschaften als Ganzes oder größere gesellschaftliche Gruppen folgen in ihrer Meinungsbildung und in ihrem Verhalten eigenen Regeln. Sie entwickeln spezifische Eigenschaften, gleichsam eine „überindividuelle Persönlichkeit“, die nicht <?page no="22"?> Ganzheitliche und analytische Betrachtungsweise 23 weniger komplex und nicht weniger einzigartig ist als die individuellen Persönlichkeiten ihrer einzelnen Mitglieder. Wenn man diese „Gruppenpersönlichkeit“ erfassen will, muss man von den Einzelpersönlichkeiten abstrahieren. Das bedeutet, dass man nicht versucht, beim einzelnen Menschen alles zu erfassen, sondern bei allen Personen einzelne Merkmale. Das Messen im „Merkmalsbereich“ verlangt damit auch, dass der Untersuchungsgegenstand nicht nur systematisch erfragt wird, sondern in kleine, handhabbare Teile zerlegt werden muss. Das kann vor allem bei den komplexen Forschungsfragen in der akademischen Sozialforschung, aber durchaus auch bei der Marktforschung ein äußerst komplizierter Vorgang sein, denn Zerlegung bedeutet letztlich auch Konkretisierung. Sie verlangt damit eine gedankliche Klarheit, der man bei einer „ganzheitlichen“ Betrachtung vielleicht noch ausweichen kann. Beispielhaft ist dies an der Sprache vieler geisteswissenschaftlicher Abhandlungen zu beobachten. Dort kommt es häufig vor, dass die Behauptung aufgestellt wird, irgendein Sachverhalt sei im Kontext mit etwas anderem zu betrachten. Als Bestandteil einer umfangreicheren theoretischen Argumentation mag eine solche Bemerkung ausreichend, vielleicht sogar befriedigend sein. Will man die Wahrheit der betreffenden Aussage aber mit einer Umfrage prüfen, steht man vor dem Problem, dass der Begriff „Kontext“ äußerst unpräzise ist. Er bedeutet eigentlich nur, dass zwei oder mehrere Dinge irgendwie miteinander zusammenhängen. In der Umfrageforschung kommt man mit einer solchen „Irgendwie“-Feststellung nicht weit. Um konkrete Fragen zu formulieren, muss man sich darüber klar werden, wie genau die beiden Dinge miteinander in Beziehung stehen oder stehen könnten. Der intellektuellen Mühe der Klärung solcher gedanklichen Unschärfen muss man sich unvermeidlich unterziehen. Sie ist das Grundprinzip des analytischen Denkens, das der Umfrageforschung zugrunde liegt. Nicht zufällig bedeutet der altgriechische Begriff „analysein“, aus dem sich das heutige Wort „Analyse“ entwickelt hat, ursprünglich „auflösen“. Der zu untersuchende Gegenstand wird in seine Bestandteile zerlegt, diese werden sortiert und auf diese Weise dem Verständnis zugänglich gemacht. Danach schließlich werden dann die Bestandteile wieder zusammengefügt, das Gelernte also in seinen ursprünglichen Zusammenhang eingeordnet („Synthese“). <?page no="23"?> Die Funktion des Fragebogens 24 Die zentrale Bedeutung des Zerlegens eines Forschungsgegenstandes zum Zweck seiner Untersuchung wird oft unterschätzt. Dabei ist ein erschwerender Umstand, dass die meisten Sozialwissenschaften geisteswissenschaftliche Wurzeln haben und allenfalls am Rande auch vom Denken der Naturwissenschaften beeinflusst sind. Für Naturwissenschaftler ist dieser Denkschritt seit dem Durchbruch der experimentellen Physik im frühen 17. Jahrhundert (vgl. Petersen 2002, S. 20-24) selbstverständlich. Weil er es für viele Sozialwissenschaftler nicht ist, stehen viele Forscher zunächst ratlos vor der Komplexität ihrer Untersuchungsaufgabe. Nicht selten wird gar die Behauptung aufgestellt, sozialwissenschaftliche Untersuchungsgegenstände seien viel komplexer als naturwissenschaftliche, und deswegen sei es schlicht unmöglich, sie mit empirischen und experimentellen Mitteln zu erfassen. So zitiert in diesem Zusammenhang der Graphologe Remo Buser den Mathematiker Warren Weaver mit der Aussage: „Eine einzige und einfache Gleichung beschreibt das Temperatur-Volumen-Druck-Verhalten aller Edelgase (...), aber wie vieler Variablen bedarf es, um eine Blume, ein Insekt, einen Menschen zu beschreiben? “ Buser folgert daraus, dass eine „ganzheitlich intuitive Schau (...) „wohl unumgänglich“ sei (Buser 1973, S. 11-12). Doch dieses Argument verkennt sowohl die Intentionen der Physiker als auch die Möglichkeiten der empirischen Sozialwissenschaft. Wollte man Menschen (oder menschliche Gesellschaften) in all ihren Facetten auf einen Schlag vollständig beschreiben, würde man in der Tat scheitern. Doch den Anspruch erhebt auch kein einigermaßen verständiger Sozialwissenschaftler - ebenso wie kein seriöser Physiker auf den Gedanken käme, kurzerhand alle naturwissenschaftlichen Rätsel auf einmal lösen zu wollen. Der Physiker untersucht das Temperatur-Volumen-Druck-Verhalten von Edelgasen letztlich auch nicht um seiner selbst willen, sondern weil es ein winziger Baustein zum Verständnis der Naturgesetze auf der Erde und im Universum ist. Der komplexe Gegenstand, der sich nicht auf einen Schlag erfassen lässt, wird in tausende leichter zu handhabende Einzelfragen zerlegt. Eben dieses geschieht auch in den empirischen Sozialwissenschaften - im Großen wie im Kleinen. Die große Grundfrage nach den Funktionsmechanismen menschlicher Gesellschaften wird in viele einzelne Teilthemen zerlegt, die in Umfragen untersucht werden können. Diese <?page no="24"?> Ganzheitliche und analytische Betrachtungsweise 25 Teilthemen wiederum werden in der konkreten Fragebogenentwicklung in Einzelfragen aufgespalten, die den Befragten zur Beantwortung vorgelegt werden. Natürlich hat der Forscher nicht bei jeder sozialwissenschaftlichen Untersuchung den Gedanken im Hinterkopf, dass er mit seiner Studie einen kleinen Teil zum Verständnis der großen Grundfrage beisteuert, doch solche Gedanken hat der Physiker, der sich mit dem Temperatur-Volumen-Druck-Verhalten von Edelgasen beschäftigt, wahrscheinlich meistens auch nicht. Und dennoch ist seine Studie letztlich nur als ein Resultat des Zerlegens des großen Untersuchungsgegenstandes der Naturgesetze zu verstehen. In der Umfragepraxis bedeutet dieses Prinzip, dass die jeweilige Forschungsfrage im Fragebogen in einer Weise zergliedert wird, dass Aussenstehende die ursprüngliche Intention der Studie oft nicht wiedererkennen. Eine scheinbar einfache Frage wie die nach den Motiven der Lektüre einer bestimmten Zeitung oder für ein bestimmtes Wahlverhalten wird, wenn sie wirklich gründlich untersucht werden soll, leicht in mehrere Dutzend Fragen überführt, darunter Fragen nach den Lebensgewohnheiten, dem sozialen Status, Interessen, familiären Verhältnissen, Kaufwünschen, politischen Prioritäten, tagespolitischen Kenntnissen, dem Bildungsstand usw. Erst wenn nach Ende der Datenerhebung die Antworten zu allen diesen Fragen vorliegen, können sie schließlich im Zusammenspiel die Ausgangsfrage beantworten helfen. Damit spiegelt sich im Verlauf einer strukturierten Repräsentativumfrage das Wechselspiel zwischen Analyse und Synthese, wie es vielfach in der Philosophie beschrieben wurde (vgl. z. B. Kant 1867, S. 91; Russell 1984, S. 119; Poincaré 1958, S. 23). Besonders lebhaft hat Friedrich Schiller diesen gedanklichen Schritt beschrieben, der in der Umfrageforschung eine forschungspraktische Notwendigkeit ist: „Leider muss der Verstand das Objekt des innern Sinns erst zerstören, wenn er es sich zu eigen machen will. Wie der Scheidekünstler, so findet auch der Philosoph nur durch Auflösung die Verbindung und nur durch die Marter der Kunst das Werk der freiwilligen Natur. Um die flüchtige Erscheinung zu haschen, muss er sie in die Fesseln der Regel schlagen (...)“ (Schiller 1904, S. 4). Was Schiller über die Philosophie sagt, gilt ebenso für die empirische Sozialwissenschaft. Die Strukturierung und Zerlegung des Untersuchungsthemas im Fragebogen folgt den Kategorien, die der Forscher für seine spätere Aus- <?page no="25"?> Die Funktion des Fragebogens 26 wertung benötigt. Er ist es schließlich auch, der die Bestandteile nach einem vorher erdachten Schema wieder zusammenführen muss. Also bildet er Kategorien, die sich leicht mathematisch verarbeiten lassen, Skalen, die eine bestimmte Art der Auswertung ermöglichen, Einzelfragen, die das Thema inhaltlich so gliedern, wie es den Vorstellungen des Forschers entspricht. Doch hierbei kommt es nicht selten zu erheblichen Konflikten mit den Vorstellungen und den Interessen der Befragten. 1.3 Vom Leitfaden zur Strukturierung Bevor die Perspektive gewechselt und die Interviewsituation aus Sicht der Befragten beleuchtet wird, soll noch ein wenig beim Thema der Zergliederung und Strukturierung des Untersuchungsgegenstandes verweilt werden. Die Notwendigkeit, die oft zunächst abstrakt und nicht selten auch gedanklich unscharfe Forschungsfrage in klar gegliederte und durchstrukturierte Einzelfragen zu zerlegen, verlangt mehrere Gedankenschritte. Oft ist es nicht ratsam, sich nach Klärung der groben inhaltlichen Linien der geplanten Untersuchung sofort an die Formulierung der Fragen zu machen. Sinnvoller ist es, als Zwischenschritt zunächst die Programmfragen zu notieren, also mehr oder weniger stichwortartig formulierte Fragen, die alle Aspekte abdecken, die in der Studie berücksichtigt werden sollen, ohne dabei schon bis ins Letzte ausformuliert oder durchstrukturiert zu sein. Übergeht man diesen Schritt und springt sofort zur Formulierung der endgültigen Fragen, läuft man Gefahr, sich rasch an einem Detail der Frageformulierung festzubeißen, bevor man überhaupt einen Überblick über die Grobstruktur des geplanten Fragebogens gewonnen hat. Dadurch wächst die Gefahr, wichtige Aspekte zu übersehen. Erfahrungsgemäß neigt man nämlich dazu, dem Thema, bei dem man auf die ersten Formulierungsprobleme stößt, ein besonders großes Gewicht beizumessen, nicht selten sogar ein unverhältnismäßig großes, weil man sich mit ihm sehr intensiv beschäftigt, bevor man überhaupt angefangen hat, sich über andere Themen des Fragebogens Gedanken zu machen. Erstellt man dagegen zunächst eine Liste mit Programmfragen, ohne sich dabei mit Detailproblemen der Frageformulierung aufzuhalten, bekommt man <?page no="26"?> Vom Leitfaden zur Strukturierung 27 zunächst einen Überblick über die im Fragebogen abzuhandelnden Aspekte und damit auch über das Gewicht, das ihnen innerhalb des Fragebogens zukommen sollte. Erst dann kann man sich an die Übersetzung der Programmfragen in Testfragen machen, also die konkreten Formulierungen, die schließlich im Fragebogen stehen werden. Die Unterscheidung von Programm- und Testfragen ist auch für das Verständnis der Möglichkeiten und Grenzen der Fragebogenmethode von großer Bedeutung. Deswegen werden diese Stichworte unten noch einmal aufgegriffen werden. Die Liste der Programmfragen ähnelt den Gesprächsleitfäden von Intensiv-Interviews, einer Methode der qualitativen Sozialforschung (vgl. hierzu z. B. Flick 1995; Lamnek 2010), die als Vorstufe einer strukturierten Befragung von großer Bedeutung sein kann. Dies ist besonders bei sehr komplexen oder abstrakten Untersuchungsthemen der Fall, oder immer dann, wenn man sich mit einer geplanten Studie gänzlich auf Neuland begibt, sodass keine Erfahrungen aus früheren Untersuchungen vorliegen, aus denen man die mögliche Bandbreite der Antworten der Befragten erkennen könnte. Hier können Intensiv- Interviews den Nachteil der Repräsentativbefragung ausgleichen, der darin besteht, dass nicht individuell auf die Befragten eingegangen werden kann. Der Zwang zur Standardisierung macht es unmöglich, das Instrument noch zu ändern, wenn nach den ersten Interviews ein unerwarteter Themenaspekt auftaucht, der im Fragebogen nicht berücksichtigt wurde. Hat die Feldarbeit erst einmal begonnen, muss sie mit demselben Instrument auch zu Ende geführt werden. Qualitative Untersuchungen erheben dagegen nicht den Anspruch der Verallgemeinerbarkeit. Stattdessen können sie so angelegt werden, dass sie möglichst alle Aspekte eines Themas zutage fördern, selbst solche, die den Forschern nicht in den Sinn gekommen wären. Eine qualitative Untersuchung als Vorstufe zu einer Repräsentativbefragung stellt damit das Idealmodell einer guten empirischen Untersuchung dar, auch wenn sich dieses Ideal aus Kostengründen in der Realität nur selten verwirklichen lässt. Die Vorstudie stellt sicher, dass der Fragebogen zur quantitativen Befragung dem Thema auch wirklich gerecht wird, weil er alle wichtigen Aspekte berücksichtigt und nicht an der Hauptsache „vorbeifragt.“ <?page no="27"?> Die Funktion des Fragebogens 28 Gesprächsleitfäden für Intensiv-Interviews können auf den ersten Blick durchaus konkret wirken, als handele es sich bereits um vollständige, strukturierte Fragebogen, die auch bei einer Repräsentativumfrage einsetzbar wären. Doch der Eindruck täuscht. Abbildung 1 zeigt einen Ausschnitt aus dem Gesprächsleitfaden zu einer qualitativen Studie über die Lesegewohnheiten der Abonnenten der religiösen Zeitschrift „Herder Korrespondenz“. Die Fragen erscheinen klar und eindeutig, doch den Anforderungen an eine strukturierte Repräsentativbefragung genügen sie nicht. So gibt es keine eindeutigen Antwortvorgaben. Manchmal, wie bei Punkt d), sind auch zwei Fragen zu einer zusammengefasst worden, sodass man unter Umständen nicht wissen kann, auf welchen Fragebestandteil der Befragte antwortet. Antwortet der Befragte beispielsweise „bei der Arbeit“, kann das bedeuten, dass er Pfarrer ist und das Heft zu Hause liest, oder aber, dass er Bankangestellter ist und sich die freien Minuten mit der Lektüre der „Herder Korrespondenz“ vertreibt. Auch die Frage g) wäre bei einer Repräsentativumfrage nicht brauchbar, denn bevor man fragt, was das Besondere an der „Herder Korrespondenz“ ist, müsste man zunächst einmal ermitteln, ob der Befragte überhaupt der Ansicht ist, dass sich die „Herder Korrespondenz“ von anderen religiösen Zeitschriften unterscheidet. Und Frage h) schließlich könnte in einem strukturierten Interview nur mit einem dürren „Ja“ oder „Nein“ beantwortet werden und hätte damit für sich genommen keinen großen Erkenntniswert, denn natürlich möchte man in erster Linie wissen, welche Zeitschriften denn mit der „Herder Korrespondenz“ vergleichbar sind. Die dafür notwendige Nachfrage fehlt hier aber. Doch alle diese Punkte, die bei einer Repräsentativumfrage als Fehler gewertet werden müssten, spielen beim Intensiv-Interview keine Rolle. Der Zweck des Fragenkatalogs besteht darin, die Befragten zum Reden zu bringen. Die für solche Studien meist speziell geschulten Interviewer sind nicht gehalten, sich an den Wortlaut der Fragen zu halten. Sie können nachfragen, Fragen überspringen und abschweifen. Wenn der Befragte im Fragebogen aufgeführte Themen von sich aus zur Sprache bringt, ist das gut, dann muss man sie nicht später noch einmal ansprechen. Wenn er Aspekte zur Sprache bringt, die im Gesprächsleitfaden nicht berücksichtigt sind, umso besser. Die Interviews werden meist aufgezeichnet, sodass keine Reaktion verloren geht. Und <?page no="28"?> Vom Leitfaden zur Strukturierung 29 wenn der Befragte auf die Frage „Gibt es etwas, worauf Sie bei der Herder Korrespondenz auf keinen Fall verzichten möchten? “ tatsächlich mit einem trockenen „Ja“ antwortet, was allerdings kaum zu erwarten ist, kann der Interviewer selbstverständlich nachhaken: „Worauf möchten Sie nicht verzichten? “ Abbildung 1 Auszug aus einem Gesprächsleitfaden GESPRÄCHSERÖFFNUNG: „Ich möchte mich heute mit Ihnen über die Herder Korrespondenz unterhalten. Zunächst einmal ein paar ganz allgemeine Fragen zur Herder Korrespondenz.“ a) Wie lange haben Sie schon die Herder Korrespondenz abonniert? b) Wie oft lesen Sie die Herder Korrespondenz? c) Haben Sie genug Zeit für die Lektüre der Herder Korrespondenz? d) Wo lesen Sie die Herder Korrespondenz im Allgemeinen? Lesen Sie die Herder Korrespondenz eher beruflich oder privat? e) Was gefällt Ihnen an der Herder Korrespondenz gut, was weniger gut? f) Gibt es etwas, worauf Sie bei der Herder Korrespondenz auf keinen Fall verzichten möchten? g) Was ist das Besondere an der Herder Korrespondenz, was unterscheidet sie von anderen Zeitschriften oder Publikationen zu religiösen Themen? h) Gibt es eine andere Zeitschrift mit religiösem Inhalt, die ähnlich ist wie die Herder Korrespondenz? (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2469) <?page no="29"?> Die Funktion des Fragebogens 30 Soll also eine qualitative Untersuchung verwirklicht werden, kann eine solche Liste mit halb strukturierten Fragen und Stichworten bereits eine gute Basis für die Studie sein. Ist dagegen eine Repräsentativbefragung geplant, ist ein solcher Fragenkatalog ein Zwischenschritt. Im zweiten Schritt muss nun jede einzelne Frage in eine feste Form gebracht werden, die den Befragten und - sofern welche zum Einsatz kommen - den Interviewern keine Spielräume zur individuellen Interpretation oder zur „kreativen Gesprächsführung“ lässt und die es ermöglicht, die Antworten möglichst leicht und detailliert mathematischstatistisch auszuwerten. Die eben beschriebenen Unschärfen der Frageformulierungen müssen dann beseitigt werden, die Fragen in eine größere Zahl wirklich eindeutiger und nur jeweils einen Aspekt ansprechender Fragen aufgegliedert werden. Mögliche Antwortkategorien müssen fest vorgegeben und der Fragebogen mit unmissverständlichen Regieanweisungen an die Interviewer oder die Befragten ergänzt werden. Wie eine solche Umsetzung konkret aussehen kann, wird in den folgenden Kapiteln dieses Buches beschrieben. Der Forscher muss dabei stets das Ziel der quantitativen Auswertung seiner Daten im Blick haben. Doch er darf darüber nicht vergessen, dass das Interview selbst, nicht die Analyse der Ergebnisse den Kern des Forschungsprozesses bildet. Denkt der Forscher ausschließlich an seine Analyse, nicht aber an die Motivationen und Bedürfnisse der Befragten im Interview, gefährdet er das ganze Forschungsprojekt. Es ist deswegen notwendig, sich etwas gründlicher mit der Psychologie des Interviews und den Verhaltensmustern der Befragten auseinanderzusetzen. <?page no="30"?> 31 2 Das sozialwissenschaftliche Interview als soziale Interaktion 2.1 Die schwächsten Glieder in der Kette Im letzten Kapitel wurde die Behauptung aufgestellt, dass das Interview und nicht die Analyse den Kern des Forschungsprozesses in der empirischen Sozialforschung ausmacht. Diese Feststellung ist einerseits banal, denn ohne Interview gibt es keine Daten, die man analysieren könnte, andererseits mag sie den Leser dennoch etwas überraschen, denn diese Sichtweise ist vor allem in der akademisch verfassten Sozialforschung, aber auch in der Marktforschung wenig verbreitet. Betrachtet man die gängigen Methodenlehrbücher, kann man den Eindruck gewinnen, lediglich bei der Stichprobenstatistik und Skalenlogik sowie den multivariaten Analyseverfahren handele es sich um wissenschaftliche Methoden. Kapitel, die sich mit der Psychologie des Interviews befassen, fehlen entweder vollständig (z. B. Kromrey 2000; Klammer 2005) oder beschränken sich auf wenige Seiten (z. B. Friedrichs 1985, S. 215-220; Atteslander 1984, S. 88-103). Selbst in den wenigen Büchern, deren Fokus auf der Fragebogenerstellung liegt, wird der Frage, wie sich denn der Fragenkatalog und die Testsituation aus Sicht der Befragten darstellen, kaum Aufmerksamkeit gewidmet (vgl. z. B. Kallus 2010). Die Neigung, diesen Aspekt einer Befragung gedanklich auszublenden, ist verständlich, aber gefährlich. Sie entspringt der verbreiteten Neigung vieler Menschen anzunehmen, dass die eigenen Gedanken, Kategorien, Ziele und Werte mit denen der meisten anderen Menschen übereinstimmen. In der Kommunikationsforschung ist das Phänomen unter dem Stichwort „Looking-glass Perception“, also „Spiegel-Wahrnehmung“, bekannt und beispielsweise bei der politischen Meinungsbildung immer wieder zu beobachten (vgl. z. B. Fields/ Schuman 1976; Shamir 1993, S. 30-32). Forscher sind für diesen Trugschluss vermutlich <?page no="31"?> Das sozialwissenschaftliche Interview als soziale Interaktion 32 nicht mehr und nicht weniger anfällig als andere Menschen, doch bei ihnen ist er besonders problematisch, nicht nur, weil man annehmen kann, dass die Ziele und Vorstellungen von Wissenschaftlern besonders stark von denen der meisten Bürger abweichen, sondern vor allem, weil die „Looking-glass Perception“ zur Blindheit gegenüber wesentlichen Teilen des Forschungsprozesses führen kann, was wiederum den Erfolg des gesamten Forschungsprojekts gefährden kann. Ein Sozialwissenschaftler, der eine empirische Untersuchung plant, hat sich meistens mit dem Gegenstand seiner Untersuchung im Vorfeld sehr intensiv befasst (zumindest sollte es in der Regel so sein). Er kennt viele Aspekte des Themas, auch feine Unterscheidungen von Teilaspekten sind ihm bewusst. Er entwickelt Vorstellungen von den Strukturen, die er untersuchen will, und damit auch von den geplanten Analyseschritten. Der Forscher macht sich bewusst, welche Daten er benötigt, und weil sein Thema umfangreich und kompliziert ist - und immer komplizierter wird, je tiefer er in die Materie eindringt -, glaubt er auch, sehr viele und komplizierte Daten zu benötigen, die selbst feinste Unterscheidungen zwischen den für ihn so wichtigen Teilaspekten ermöglichen. Außerdem braucht er Daten, die eine bestimmte mathematische Struktur haben - Skalen, Rangfolgen, Polaritätenprofile, davon wird unten noch die Rede sein -, die vielleicht ein theoretisch entwickeltes abstraktes Modell nachzeichnen. Der Gedanke an das theoretische Modell und an die Art der benötigten Daten bestimmt dann meist das gesamte Denken: „Das alles müssen wir wissen, um unsere Analyse durchführen zu können.“ Der Forscher kommt oft gar nicht auf den Gedanken, dass den meisten Menschen und damit auch seinen Befragten das Thema weit weniger wichtig ist als ihm selbst, dass ihnen die komplexen und abstrakten theoretischen Modelle, die er im Kopf hat, fremd sind und dass sie weder Zeit noch Lust noch die Möglichkeit haben, sich auf seine Konzepte einzulassen, wenn sie nicht mit den Kategorien ihrer Lebenswirklichkeit übereinstimmen. Und vor allem neigt er erfahrungsgemäß dazu zu vergessen, dass die Befragten nicht etwa verpflichtet sind, ihm all die vielen Daten zu liefern, die er für seine Analyse braucht, nur weil diese Analyse doch so wichtig ist, sondern dass sie ihm einen Gefallen tun, wenn sie sich zur Auskunft bereit erklären, dass sie ihm aber nur dann verlässliche Daten liefern, wenn er sie nicht überfordert oder gar verärgert, wenn er sich also auf ihre <?page no="32"?> Die schwächsten Glieder in der Kette 33 Denkwelt einlässt und nicht versucht, ihnen Kategorien aufzuzwingen, mit denen sie nicht umgehen können und wollen. Auch die Interviewer, sei es im Telefonstudio, sei es im Feld, sind in aller Regel nicht mit den theoretischen Konzepten der betreffenden Studie vertraut. Sie haben, wie die Befragten, kein eigenes Interesse daran, dass die Untersuchung, für die sie arbeiten, ein Erfolg wird, sondern sie haben das verständliche Bestreben, sich mit einem erträglichen Aufwand ihr Honorar zu verdienen. Elisabeth Noelle-Neumann hat deswegen die Interviewer und die Befragten einer Untersuchung die „schwächsten Glieder in der Kette“ des Forschungsprozesses genannt. Sie müssen deswegen so weit wie irgend möglich von organisatorischen Aufgaben und kognitiven Belastungen jeder Art entlastet werden. Der Interviewprozess ist für sie ohnehin eine beträchtliche Belastung. Interviewen ist eine außerordentlich langwierige, anstrengende und auch emotional belastende Tätigkeit. Befragt zu werden für die meisten Menschen mindestens ebenso sehr. „Man muss sich vergegenwärtigen“, schrieb Noelle-Neumann in ihrem Methodenbuch „Alle, nicht jeder“, „wie viel von dem unscheinbaren Vorgang der Unterhaltung zweier Personen abhängt (...). In der Kette der Mitwirkenden an einer solchen Studie fällt das Einbringen des ‚Rohmaterials’ gerade denjenigen Personen zu, die als einzige keine Spezialisten des Fachs sind (...). Wir werden viele Beispiele finden, wie bei der Planung von Untersuchungen (...) die Fragebogen-Konstrukteure und Spezialisten der Verschlüsselung und Datenverarbeitung sich selbst Mühe aufladen, oder wie sie die Mühe auf Interviewer und Befragte abwälzen können - und immer muss die Entscheidung zu Lasten der (...) Fragebogen-Konstrukteure, der Verschlüsselungsgruppe, der Techniker der Datenverarbeitung ausfallen. Sich diesen Grundsatz einzuprägen ist umso notwendiger, als bei der Planung einer Erhebung (...) die Befragten und die Interviewer abwesend sind“ (Noelle-Neumann/ Petersen 2005, S. 63-64). Diese Regel ist auch dann zu beherzigen, wenn, wie bei schriftlichen und Online-Umfragen, keine Interviewer im Spiel sind. Es wird dann zwar nicht deren moralische Widerstandskraft mit der Versuchung auf die Probe gestellt, das lästige und umständliche Interview abzukürzen, indem man Antworten ergänzt oder den Bogen kurzerhand gleich selbst am Küchentisch ausfüllt, doch dafür strapaziert man leicht die Geduld der Befragten, die sich dadurch rächen, dass sie einem nicht <?page no="33"?> Das sozialwissenschaftliche Interview als soziale Interaktion 34 die Antworten geben, die man von ihnen erwartet, meist ohne dass dies vom Forscher überhaupt bemerkt wird. Bei Umfragen sehen falsche Antworten oft auf den ersten Blick nicht anders aus als richtige. Auf die Folgen übermäßiger Monotonie in den Fragebogen - eines der häufigsten Probleme - wird unten noch ausführlicher eingegangen. Ein besonderes Problem ist in diesem Zusammenhang, dass in vielen Fällen, besonders in der betrieblichen Marktforschung und der akademischen Sozialforschung, die Kommunikation zwischen der Projektleitung und der Feldorganisation abgebrochen ist. Der Fragebogen wird in diesen Fällen meist auf der Grundlage der gängigen Methodenliteratur und streng an den späteren Analysebedürfnissen orientiert entwickelt, die als wissenschaftlich unattraktiv empfundene Feldarbeit dann aber an Dritte delegiert. Meist wird in einem Ausschreibungsverfahren ein privates Institut ausgesucht, das verspricht, die Feldarbeit möglichst schell und preisgünstig zu erledigen. Eine Überarbeitung des Fragebogens ist nicht erwünscht, der Gedanke, dass das Feldinstitut auf diesem Gebiet kompetenter sein könnte als die Projektleitung, kommt gar nicht erst auf. Hinweise selbst auf offensichtliche Mängel im Fragebogen werden mit dem Argument abgetan, die betreffende Fragetechnik sei in der Fachliteratur anerkannt und könne aus übergeordneten wissenschaftlichen Gründen nicht verändert werden. Wenn dann das durchführende Institut in der Feldarbeit auf die folgerichtig eintretenden massiven Probleme stößt, gerät es in eine Zwickmühle: Teilt es dem Auftraggeber mit, dass der Fragebogen den Bedingungen der Realität nicht standhält, kann es nicht auf Verständnis hoffen und muss um künftige Anschlussaufträge fürchten. So werden Schwierigkeiten bei der Durchführung der Umfragen oft verschwiegen, die Daten stattdessen so aufbereitet, dass man ihnen allenfalls mit großer Erfahrung noch ansehen kann, dass sie nicht unter regulären Bedingungen zustande gekommen sind. Der Auftraggeber erfährt gar nicht, dass sein Fragebogen im Feld versagt hat, sondern fühlt sich in seinen Auffassungen über die vermeintlich richtigen Methoden sogar noch bestätigt. So finden Methoden, die nicht funktionieren, Eingang in die Methodenliteratur, die dann wiederum von anderen Forschern zur Planung ihrer Untersuchungen herangezogen wird. Diese Darstellung mag auf den ersten Blick vielleicht übertrieben erscheinen, doch solche Vorgänge sind häufig zu beobachten. Ein be- <?page no="34"?> Die schwächsten Glieder in der Kette 35 sonders eindrucksvolles Beispiel ist der Fall des Schweizer Umfrageinstituts DemoSCOPE, das zu den seriösesten und mit Recht angesehensten Instituten des Landes gehört. DemoSCOPE sah sich im Mai des Jahres 2008 gezwungen, sein Telefonlabor in Winterthur zu schließen, weil die dort angestellten Interviewer von ihren direkten Vorgesetzten am Ort und ohne Kenntnis der Institutsleitung gezwungen worden waren, fortwährend Interviews in großer Zahl zu fälschen. Der Grund für die Fälschungen war, dass es schlichtweg unmöglich gewesen wäre, mit seriösen Mitteln die wirklichkeitsfremden und mit großem Druck von Institutsleitung und Auftraggebern eingeforderten Interviewzahlen pro Tag zu erreichen (vgl. Meier 2008). Offensichtlich hatten sich die Mitarbeiter des Telefonlabors nicht anders zu helfen gewusst. Ergänzt wird das Beispiel durch eine vom Autor persönlich erlebte Anekdote an einer führenden deutschen Universität. Bei der Vorbereitung einer geplanten gemeinsamen Untersuchung präsentierte ein Soziologieprofessor einen Fragebogen mit einer dreistelligen Zahl von großenteils abstrakten und in komplizierten Skalen organisierten Fragen. Die Interviewdauer musste auf weit über eine Stunde geschätzt werden. Der Soziologe erklärte, dieser Fragebogen sei bereits getestet und bei Telefonumfragen - durchgeführt von DemoSCOPE - in der Schweiz erfolgreich zum Einsatz gekommen. Ein einziger Versuch, selbst einen fremden Menschen per Telefon zu kontaktieren und mit dem Fragebogen zu interviewen, hätte zu der Erkenntnis führen müssen, dass es schlechterdings unmöglich war, mit diesem Erhebungsinstrument eine Telefonumfrage durchzuführen. Doch auf den Gedanken war der Professor nicht gekommen. Ein weiteres, sehr aufschlussreiches Beispiel aus der Praxis bietet der Kündigungsbrief einer Interviewerin des Instituts für Demoskopie Allensbach. In diesem Brief heißt es: „Ich möchte Ihnen mitteilen, dass dieses Interview meine letzte Aktion bei Ihnen war und ich somit zukünftig nicht mehr für Sie tätig sein werde. Zur Begründung möchte ich angeben, dass ich schon mehrfach darauf hingewiesen habe, dass die Interviews von der Zeitdauer her einfach zu lang sind. Bei uns im Dorf finde ich kaum noch Leute, die bereit sind, sich interviewen zu lassen, die älteren Leute sind teilweise überfordert, sich über einen längeren Zeitraum zu konzentrieren, die Berufstätigen und Selbständigen haben wenig Zeit. Die jüngeren haben sowieso keine Lust, sie haben einfach <?page no="35"?> Das sozialwissenschaftliche Interview als soziale Interaktion 36 andere Interessen. Selbst dass ich einen Teil meines Honorars anbiete, lockt sie nicht. Immer mehr Menschen gehen mir aus dem Wege oder verdrehen nur noch die Augen, wenn ich sie anspreche (...). Meine Meinung zu den Interviewthemen ist: Sie gehen vielfach an den Interessen der Menschen vorbei. Sie sind zu speziell und für manche Menschen gar nicht erklärbar (...).“ Als die Interviewer-Abteilung des Allensbacher Instituts diesen Brief erhielt, ließ sie allen Projektleitern eine Kopie zukommen. Und in der Tat hätte es dieser Brief verdient, an jedem sozialwissenschaftlichen Forschungsinstitut an auffälliger Stelle an der Wand angebracht zu werden. Die Lehren, die aus solchen Anekdoten zu ziehen sind, sind die folgenden: Erstens muss man sich über die Hierarchie der Forschungsziele im Klaren sein: Die wichtigste Frage lautet nicht: „Welche Analyse will ich machen? “, sondern: „Was will ich von den Befragten wissen und wie kann ich sie dazu verleiten, mir freiwillig die gewünschte Information zu geben? “ Das Interview ist der Kern des Forschungsprozesses, nicht die Analyse. Ihm muss die größte Aufmerksamkeit bei der Planung der Untersuchung gelten, gerade weil der Interviewvorgang so fehleranfällig, so empfindlich ist. Das schwächste Glied der Kette ist das erste, das reißt und damit die ganze Kette zerstört. Wer mit guten Daten schlechte Analysen macht, kann seinen Fehler später wieder korrigieren. Wer aber schlechte, nicht valide Daten hat, also solche Daten, die nicht das messen, was gemessen werden sollte, weil die Anforderungen des Interviews nicht beachtet wurden, kann diesen Fehler später nicht wieder gutmachen. Die aufwendigste Analyse ist sinnlos, wenn die Ausgangsdaten falsch sind. Zweitens ist es wichtig, den eigenen Datenhunger zu zügeln. Man kann nicht alles erfragen, was einem irgendwie interessant erscheint, denn die Belastbarkeit der Befragten und gegebenenfalls der Interviewer ist eng begrenzt. Auf die Frage „Was will ich von den Befragten wissen? “ sollte deswegen die Frage folgen: „Warum? “ Es ist erstaunlich, wie oft man sich selbst diese Frage nicht klar beantworten kann. Kann man sie nicht beantworten, muss die Frage folgen: „Muss ich das wirklich von den Befragten wissen? “ Die wichtigste Lehre ist aber, dass jeder Forschungsleiter zumindest gelegentlich selbst sein eigenes Instrument anwenden muss, selbst als <?page no="36"?> Die schwächsten Glieder in der Kette 37 Interviewer arbeiten muss, beispielsweise in der Testphase bei der Entwicklung des Fragebogens. Nur dann wird er die Möglichkeiten und Grenzen des Instruments kennenlernen und sich in die Situation der Befragten hineinversetzen können. Die Feldarbeit ist kein technischer Vorgang, von dem sich der Forscher zurückziehen kann, sondern integraler Bestandteil des kreativen Forschungsprozesses. Nur wer die Befragten versteht, kann gute Fragebogen entwickeln. Es soll deswegen im folgenden Abschnitt noch ein wenig auf den Blickwinkel der Befragten eingegangen werden. 2.2 Die Position der Befragten Der Kündigungsbrief der Interviewerin veranschaulicht, wie komplex die soziale Interaktion zwischen Interviewern und Befragten ist. Mit gewisser Abschwächung gilt dies auch für die Interaktion zwischen einem einen Fragebogen gestaltenden Forschungsinstitut und dem Befragten, der den Bogen schriftlich oder am Bildschirm ausfüllt. Stets schwingt mehr mit als nur das, was schwarz auf weiß im Fragebogen steht, und das doch eigentlich das einzige Signal sein sollte, auf das die Befragten reagieren. Die „Meta-Konversation“ setzt bereits vor dem Beginn des eigentlichen Interviews ein. Die Interviewerin beschreibt es mit eindrücklichen Worten: „Immer mehr Menschen gehen mir aus dem Wege oder verdrehen nur noch die Augen, wenn ich sie anspreche.“ Und es sind keineswegs nicht nur solche Abwehrreaktionen der potenziellen Befragten, die ein Interview massiv beeinflussen können. Viel von den unterschwelligen Reaktionen der Befragten im Interview ist seit den 1970er-Jahren von Experten der kognitiven Psychologie erforscht und beschrieben worden. Hier sind besonders die Arbeiten der Forscher Norman Bradburn, Seymour Sudman und Norbert S chwarz hervorzuheben (für eine Übersicht siehe S udman/ Bradburn/ Schwarz 1996). Doch bereits in den Gründerjahren der Umfrageforschung haben Pioniere wie zum Beispiel Donald Rugg (1941) und Hadley Cantril (1940, 1944) mit zahlreichen Fragebogenexperimenten den Grundstein für die psychologische Erforschung von Fragebogeneffekten gelegt. In der Soziologie seit Langem bekannt ist das Phänomen der „sozialen Erwünschtheit,“ also die Neigung mancher <?page no="37"?> Das sozialwissenschaftliche Interview als soziale Interaktion 38 Befragter, nicht unbedingt ehrliche Antworten zu geben, sondern solche, von denen sie meinen, dass sie sie Dritten gegenüber in einem besseren Licht dastehen lassen. Man kennt solche Verhaltensmuster aus dem Alltag. Vielleicht am treffendsten hat dies die Anthropologin Mary Douglas beschrieben mit ihrem berühmt gewordenen Bonmot: „Fragen Sie jemanden, was er isst, und er wird Ihnen so antworten, wie er denkt, dass Sie denken, was er essen sollte.“ Und als Illustration fügte sie gleich das Beispiel amerikanischer Ernährungsexperten hinzu, die das Essverhalten der Bevölkerung mit Fragebogen und parallel dazu dadurch untersuchten, dass sie den Hausmüll ihrer Versuchspersonen durchwühlten. Das Fazit: „Die Nahrungsabfälle sagten mehr über die Essgewohnheiten aus als die Antworten auf irgendwelche Fragebogen“ (Douglas 1991, S. 124). So eindrucksvoll das Beispiel auch ist, in den meisten Fällen wird man Befragungen nicht dadurch ersetzen können, dass man Hausmüll durchsucht, und so muss man lernen, mit dem Phänomen der sozial erwünschten Antworten umzugehen. Es werden weiter unten in diesem Band Techniken präsentiert, mit denen man Aussagebarrieren der Befragten überwinden und die Neigung vieler Menschen umgehen kann, die Aussagen zu ihrem Verhalten ihrer Idealvorstellung anzupassen, wenn man damit auch nicht in jedem Fall den Effekt sozialer Erwünschtheit gänzlich wird ausgleichen können. Der schwedische Sozialforscher Hans Zetterberg sagt mit Recht, dass es wahrscheinlich keine wirklich brauchbare Methode gibt, die Angaben der Bevölkerung über ihren Alkoholkonsum mit den Absatzzahlen der Brauereien in Einklang zu bringen (vgl. Kühlhorn u. a. 2000). Effekte sozialer Erwünschtheit werden unter anderem in Verbindung gebracht mit der Anwesenheit Dritter im Interview (Kiesler/ Sproull 1986, S. 497; Bradburn/ Sudman 1979, S. 134-146), folgerichtig treten sie tendenziell bei persönlichen Befragungen stärker auf als bei Telefon- oder Online-Umfragen (vgl. Taddicken 2009), doch das Phänomen taucht in allen Befragungsformen auf. Oft wird angenommen, dass die Befragten im Interview aus Prestigegründen bewusst die Unwahrheit sagen (z. B. bei Wagner/ Motel 1997, S. 497), doch wahrscheinlicher ist, dass es sich in den meisten Fällen um komplexere psychologische Vorgänge handelt, bei denen die Befragten versuchen, in der Öffentlichkeit - und damit auch gegenüber einem Interviewer oder Umfrageinstitut - ein Bild ab- <?page no="38"?> Die Position der Befragten 39 zugeben, das ihnen selbst akzeptabel erscheint (vgl. Schuman/ Presser 1981, S. 110), ein Konzept, das sich sowohl mit dem von George Herbert Mead beschriebenen „symbolischen Interaktionismus“ in Beziehung bringen lässt (vgl. Hallemann 1990, S. 39-47) als auch mit der Theorie der Vermeidung kognitiver Dissonanz (Festinger 1957), die sich übrigens sehr oft nutzbringend zur Interpretation von Umfrageergebnissen heranziehen lässt. Obwohl das Phänomen der sozialen Erwünschtheit mit Recht in vielen Lehrbüchern und Abhandlungen über die Umfrageforschung behandelt wird und allein schon deswegen Aufmerksamkeit verdient, weil es viel über menschliche Reaktionsmuster unter dem Druck sozialer Kontrolle verrät, soll es hier dennoch nicht weiter vertieft werden. In der Praxis der Umfrageforschung spielt die soziale Erwünschtheit eine geringere Rolle, als man auf den ersten Blick vermuten könnte. Die Zahl der Fälle, in denen diese Reaktionsmechanismen Umfrageergebnisse so sehr verzerren, dass ihre Aussagekraft erheblich beeinträchtigt ist, ist überschaubar. Meist sind solche Fälle bereits bei der Planung einer Untersuchung leicht zu identifizieren. An dieser Stelle dient das Beispiel der sozialen Erwünschtheit in erster Linie als Illustration dafür, dass die Befragten im Interview auf Signale reagieren, die im Fragebogen enthalten sind, obwohl dies vom Forscher nicht beabsichtigt wird. In diesem Fall geht vom Fragebogen ein Druck, eine implizite Drohung aus. Der Befragte empfindet die Interviewsituation ohnehin nicht selten als Prüfung. Fürchtet er nun darüber hinaus, sich mit einer offenen und ehrlichen Antwort sozial zu isolieren, weicht er einer solchen Antwort aus, sei es durch Interviewverweigerung (vgl. Kühlhorn u. a. 2000) oder durch eine Notlüge. Für die Praxis der Fragebogenentwicklung wichtiger sind zwei andere Reaktionsmuster, die nicht auf bestimmte Themen und Fragetypen beschränkt sind, sondern von denen man annehmen muss, dass sie stets im Interview eine gewisse Rolle spielen und damit zumindest potenziell die Validität sehr vieler Umfrageergebnisse beeinträchtigen können. Es handelt sich um die ergänzende Interpretation von Frageinhalten und gedankliche Abkürzungsstrategien bei der Entscheidungsfindung. Beide Reaktionen treten oft miteinander verbunden auf und führen zu charakteristischen Verzerrungen der Umfrageergebnisse. <?page no="39"?> Das sozialwissenschaftliche Interview als soziale Interaktion 40 Die Tatsache, dass Menschen nicht allein auf den objektiv vorhandenen Inhalt von Sprache reagieren, ist von Linguisten und Kognitionspsychologen oft und anschaulich beschrieben worden. Bei nahezu jedem täglichen Gespräch nehmen die Beteiligten unbewusst Ergänzungen vor. Selbst solche Sätze werden noch als eindeutig verständlich wahrgenommen, denen rein logisch die entscheidende Information fehlt (M. Schwarz 1992, S. 87-90; Krosnick/ Li/ Lehman1990). George A. Miller stellte bereits 1951 fest, dass die englische Sprache zu drei Vierteln redundant ist. Dass heißt, drei Viertel des Textes sind durch das restliche Viertel vorbestimmt, sodass sie eigentlich gar nicht mehr ausgesprochen werden müssten. Der Text würde auch ohne sie richtig verstanden werden (Miller 1951). Man kann annehmen, dass für die deutsche Sprache Ähnliches gilt. Weil weite Teile der Sprache streng genommen überflüssige Informationen enthalten, haben sich es anscheinend viele Menschen auch angewöhnt, diesen Fragebestandteilen gar nicht erst ihre volle Aufmerksamkeit zu schenken. Werden sie im Text tatsächlich einmal weggelassen, wird dies oft gar nicht (...). Das fehlende Element wird unbewusst hinzugefügt. Die Aufmerksamkeit konzentriert sich ganz auf die Schlüsselbegriffe, aus denen dann das übrige gefolgert wird. Der Psychologe Norbert Schwarz hat das Phänomen einmal auf einer Fachtagung mit einem einfachen fiktiven Dialog illustriert. Person 1 sagt: „Wo steckt eigentlich Claudia? “ Person 2 antwortet: „Bei Harald steht ein blauer Opel vor der Tür.“ Beide Sätze haben logisch nichts miteinander zu tun. Doch als Gespräch sind sie durchaus „alltagstauglich“: Der Zuhörer ergänzt einfach die fehlenden Elemente, und so wird aus der eigentlich unsinnigen Aneinanderreihung zweier unverbundener Sätze eine ganze kleine Geschichte. Für die Umfrageforschung bedeutet das, dass nicht entscheidend ist, welche Information objektiv in einer Frage enthalten ist, sondern was die Befragten glauben, was mit einer Frage gemeint ist. Beides ist keinesfalls immer das Gleiche. Illustrieren lässt sich dies mit dem Ergebnis eines Feldexperiments aus den frühen Jahren des deutschen Fernsehens. Für solche Feldexperimente, deren Einsatzmöglichkeiten in den folgenden Kapiteln noch ausführlich beschrieben werden, wird die Gesamtstichprobe einer Repräsentativumfrage in zwei (oder mehr) jeweils ihrerseits repräsentative Teilstichproben untergliedert. Die Personen jeder Teilgruppe werden gleichzeitig und unter gleichen Be- <?page no="40"?> Die Position der Befragten 41 dingungen befragt, und zwar mit einem Fragebogen, der sich von Gruppe zu Gruppe nur in Details unterscheidet, wie zum Beispiel der Formulierung einer bestimmten Frage oder der Variation der Reihenfolge zweier Fragen. Diese Variationen des Fragebogens bilden den experimentellen Stimulus, dem die Hälfte der Befragten ausgesetzt wird. Unterscheidet sich nun daraufhin das Antwortverhalten der beiden (oder mehreren) experimentellen Teilgruppen bei der betreffenden variierten Frage signifikant, also so stark, dass man dies nicht allein mit dem Zufall erklären kann, lässt sich dieser Unterschied auf den einzigen Punkt zurückführen, in dem sich die Teilgruppen mehr als zufällig voneinander unterscheiden, und das ist allein die Variation im Fragebogen. Solche Feldexperimente - man spricht auch von „gegabelten Befragungen“ oder englisch von „Split-Ballot-Experimenten“ - erfüllen, obwohl ihr Grundprinzip einfach ist, alle logischen Anforderungen an ein beweiskräftiges sozialwissenschaftliches Experiment (Petersen 2002, S. 81-85; Noelle-Neumann 1965; vgl. auch Schulz 1970). Ein solches Feldexperiment fand nun im Jahr 1975 im Rahmen einer Untersuchung statt, in der die Zuschauerzahlen des Werbefernsehens ermittelt werden sollten, das es damals auf nur zwei Kanälen, der ARD und dem ZDF gab, die allgemein als „erstes Programm“ und „zweites Programm“ bezeichnet wurden. In der einen Halbgruppe wurde zunächst die Frage gestellt: „Wann haben Sie - abgesehen von heute - zum letzten Mal das Werbefernsehen im ersten Programm gesehen? “ Danach wurde gefragt: „Wann haben Sie - abgesehen von heute - zum letzten Mal das Werbefernsehen im zweiten Programm gesehen? “ In der Parallelgruppe wurde die Reihenfolge der Fragen vertauscht. Hier wurde also zuerst nach dem zweiten, dann erst nach dem ersten Programm gefragt. Das Ergebnis des Experiments ist in Abbildung 2 wiedergegeben: Deutlich mehr Befragte gaben an, sie hätten das Werbefernsehen im ersten Programm gesehen, wenn dieses zuerst abgefragt wurde. Der gleiche Effekt, auch in der gleichen Stärke, zeigte sich beim zweiten Programm. Offensichtlich gaben die Befragten bei der jeweils ersten Frage Auskunft darüber, wann überhaupt sie zum letzten Mal Werbefernsehen angeschaut hatten, unabhängig davon, in welchem Programm. Sie hatten auf das Stichwort „Werbefernsehen“ reagiert und daraus auf die vermeintliche Absicht des Forschers geschlossen, ohne die im Fragetext enthaltene Einschränkung, die Angabe des Programms, <?page no="41"?> Das sozialwissenschaftliche Interview als soziale Interaktion 42 zu berücksichtigten. Erst bei der zweiten Frage dürfte den meisten aufgefallen sein, dass es nicht um Werbefernsehen allgemein, sondern um die Nutzung eines bestimmten Programms ging. Abbildung 2 Die Wahrnehmung verschiedener Fragebestandteile Fragen an Halbgruppe A: „Wann haben Sie - abgesehen von heute - zum letzten Mal das Werbefernsehen im ersten Programm gesehen? “ „Wann haben Sie - abgesehen von heute - zum letzten Mal das Werbefernsehen im zweiten Programm gesehen? “ Halbgruppe B: Zuerst wurde nach dem zweiten, dann nach dem ersten Programm gefragt. Dezember 1975 Bundesrepublik Deutschland Bevölkerung ab 16 Jahre Halbgruppe A (1. Programm zuerst genannt) Halbgruppe B (2. Programm zuerst genannt) % % Es sagten, sie hätten „gestern“ das Werbefernsehen ... ... im 1. Programm gesehen 26 18 ... im 2. Programm gesehen 18 27 n (Zahl der Befragten) = 983 1024 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 3022) Die Neigung, den Fragetext auf der Grundlage bestimmter Schlüsselbegriffe zu interpretieren, verbindet sich in der Praxis mit einem weiteren häufigen Reaktionsmuster der Befragten, der Tendenz zur Nutzung gedanklicher Abkürzungsstrategien. Psychologen sprechen von „heuristischer Urteilsbildung.“ Das bedeutet, dass die Befragten ihre Antwort nicht auf der Grundlage mehrmaligen Abwägens aller denkbaren As- <?page no="42"?> Die Position der Befragten 43 pekte des betreffenden Fragethemas geben, sondern sie wählen die Antwort aus, die für sie unter allen einigermaßen akzeptablen Antworten am leichtesten gedanklich erreichbar ist (vgl. Tversky/ Kahnemann 1973; Holbrook/ Krosnick 1999). Dieser Punkt wird bei der Fragebogenentwicklung gerade bei im akademischen Bereich konzipierten Studien oft übersehen, weil viele Wissenschaftler an Universitäten zwar über eigene Erfahrungen mit Laborexperimenten, nicht aber mit Repräsentativumfragen verfügen und die bei Laborstudien gewonnenen Erkenntnisse auf die Feldstudien übertragen. Man muss sich darüber im Klaren sein, dass sich das Verhalten der Versuchspersonen im Labor fundamental von dem der bei Repräsentativumfragen befragten Personen unterscheidet. Im Labor ist die Aufmerksamkeit der Versuchspersonen geschärft: Sie wissen in der Regel, dass sie an einem Experiment teilnehmen, und sie sind ein sogenanntes „captive audience“, ein „gefangenes Publikum,“ das, herausgerissen aus seinen normalen Lebensumständen, unter der Kontrolle der Forscher genau das tut, was man von ihm erwartet, das sieht, hört, liest, erlebt, was man ihm vorsetzt, egal ob es daran interessiert ist oder nicht. Die künstliche Testsituation schärft die Sinne. Nicht selten versuchen die Versuchspersonen zu überlegen, was wohl der Zweck des Tests sein mag, dem sie ausgesetzt sind, und wie sie sich am besten verhalten, um diesem Test gerecht zu werden. Die Forscher haben alle Mühe, die Testpersonen vom eigentlichen Ziel der Untersuchung abzulenken, um möglichst unverfälschte Ergebnisse zu erhalten. Bei Repräsentativumfragen befinden sich die Befragten dagegen in ihrem gewohnten Umfeld. Sie werden von einem Interviewer im Wohnzimmer, am eigenen Telefon oder vor dem eigenen Computer befragt. Sie haben sich nicht extra auf den Weg gemacht, um an der Studie teilzunehmen, sondern der Interviewer bzw. die durchführende Institution dringt in ihre Lebenswelt ein. Das Interview ist damit kein ungewöhnliches, größeres Ereignis, das einen für einen halben Tag aus dem Alltagsleben herausreißt und besondere Vorkehrungen verlangt, sondern eher eine kurzfristige Unterbrechung des sonst wenig veränderten Tagesablaufes. Für die Qualität der Daten ist das günstig, denn die Befragten antworten in ihrem gewohnten Umfeld viel realitätsnäher als in der Ausnahmesituation des Laborexperiments. Die mangelnde Verallgemeinerbarkeit von Laborergebnissen aufgrund der künstlichen <?page no="43"?> Das sozialwissenschaftliche Interview als soziale Interaktion 44 Testsituation gehört deswegen auch zu den größten methodischen Problemen dieser Forschungsrichtung (vgl. Schulz 1970, S. 133; Stroebe 1980, S. 28; Belson 1960, Petersen 2006). Doch es bedeutet auch, dass die Befragten von Repräsentativumfragen gegenüber dem durchführenden Institut und den Interviewern in einer psychologisch stärkeren Situation sind als die Versuchspersonen im Labor gegenüber dem Studienleiter. Sie sind weniger verunsichert, weniger auf die Untersuchung fokussiert und dementsprechend leichter abgelenkt und weniger aufmerksam. Gerade bei umfangreicheren Fragebogen konzentrieren sich viele Befragte vor allem darauf, die Prozedur möglichst rasch und mit möglichst geringem geistigem Aufwand hinter sich zu bringen, ohne allzu unhöflich zu werden. Nur sehr wenige gehen so weit, dass sie die Interviewer dabei direkt belügen (zum Glück für die Forscher wäre das in der Regel viel zu anstrengend; vgl. Noelle-Neumann/ Petersen 2005, S. 86-91). Doch viele Befragte lernen im Interview sehr rasch, wie sie unnötige gedankliche Anstrengungen vermeiden können. So erkennen sie beispielsweise schnell, wenn sie sich mit bestimmten Antworten anstrengende Nachfragen einhandeln. Wenn eine zur Auswahl stehende Antwort die Nachfrage „Und warum denken Sie so? “ nach sich zieht, wird diese Antwortmöglichkeit deutlich weniger häufig ausgewählt, als wenn auf die Nachfrage verzichtet wird (Petersen 2002, S. 193-201). Und die in Umfragen ermittelten Leserzahlen von Zeitungen und Zeitschriften sinken umso mehr, je mehr Titel abgefragt werden und je detaillierter bei jedem Titel, den der Befragte einmal als „gelesen“ angegeben hat, die Nachfragen zur Häufigkeit der Lektüre sind (Tennstädt 1984). Die meisten Befragten wollen zwar also durchaus „gute Befragte“ sein, sie haben aber keinen Grund, sich gedanklich im Interview besonders intensiv anzustrengen. Also wägen sie die ihnen präsentierten Fragen nicht mehrmals und bedenken mühsam alle Aspekte des Themas, sondern sie wählen unter den zur Verfügung stehenden Antwortmöglichkeiten die am einfachsten erreichbare einigermaßen befriedigende Variante aus. Es ist ja auch nicht so wichtig und vor allem für den Befragten folgenlos, wenn sich die eine oder andere Antwort bei näherem Nachdenken als falsch erweisen sollte. In Kombination mit der beschriebenen Neigung, auf Schlüsselbegriffe zu reagieren und auf dieser Grundlage den vermeintlichen Sinn <?page no="44"?> Die Position der Befragten 45 in eine Frage hineinzuinterpretieren, führen diese heuristischen Antwortstrategien unter Umständen zu Kurzschlüssen, die, wenn sie gehäuft auftreten, durchaus irreführende Daten zur Folge haben können. Ein Beispiel hierfür ist in Abbildung 3 dargestellt. Es stammt aus einer Repräsentativumfrage, mit der der Fragebogenentwurf zu einer amtlichen statistischen Erhebung getestet wurde. Nach dem eben beschriebenen Prinzip der gegabelten Befragung wurden zwei inhaltlich gleichbedeutende Versionen einer Frage in Teilgruppen verwendet. Die eine Variante lautete: „Sind Sie zusätzlich in einer privaten Krankenversicherung, ich meine selbst- oder auch mitversichert? “ Die andere Version lautete: „Haben Sie eine Krankenhaustagegeldversicherung oder eine sonstige Zusatzversicherung bei einer privaten Krankenkasse abgeschlossen, egal ob Sie selbst- oder auch mitversichert sind? “ Auch wenn es auf den ersten Blick nicht so erscheinen mag, waren beide Fragen inhaltliche Äquivalente. Die Krankenhaustagegeldversicherung war zumindest zum Zeitpunkt der Erhebung der häufigste Fall einer solchen Zusatzversicherung. Das Beispiel illustriert nebenbei die häufig in der Praxis angewandte Fragetechnik, einen etwas abstrakten Befragungsgegenstand durch die Einführung eines konkreten Beispiels anschaulicher zu machen. Wie in Abbildung 3 deutlich wird, führte die erste Frageversion, inhaltlich korrekt, aber in einer eher abstrakten „Amtssprache“ verfasst, dazu, dass 18 Prozent der Befragten angaben, sie hätten eine Zusatzversicherung bei einer privaten Krankenkasse abgeschlossen. Bei der zweiten, in anschaulicher Alltagssprache verfassten Fragevariante waren es dagegen doppelt so viele. Mit Sicherheit muss der höhere Wert von 36 Prozent als der validere angesehen werden, also als der, welcher der tatsächlichen Situation näher kommt. Denn es ist nicht anzunehmen, dass sich bei diesem Fragethema fast jeder fünfte Befragte so unter Druck gesetzt fühlte, dass er vorgibt, eine Versicherung zu besitzen, die er tatsächlich nicht hat. Weder eine Neigung zu Prestige-Antworten noch eine subjektiv empfundene Gefahr der sozialen Isolation dürften hier eine Rolle gespielt haben. Stattdessen muss man annehmen, dass in der ersten Gruppe die beschriebene Kombination aus der Konzentration auf Schlüsselbegriffe, Interpretation des vermutlich mit der Frage Gemeinten und heuristischer Antwortfindung bei einem großen Teil der Befragten zu Fehlinterpretationen und damit auch zu falschen Antworten geführt hat. <?page no="45"?> Das sozialwissenschaftliche Interview als soziale Interaktion 46 Abbildung 3 Der Unterschied zwischen „sachlich richtigen“ und „gefühlt richtigen“ Fragetexten Frage Gruppe A: „Sind Sie zusätzlich in einer privaten Krankenversicherung, ich meine selbst - oder auch mitversichert? “ Frage Gruppe B: „Haben Sie eine Krankenhaustagegeldversicherung oder eine sonstige Zusatzversicherung bei einer privaten Krankenkasse abgeschlossen, egal ob Sie selbst- oder auch mitversichert sind? “ Gruppe A (Amtssprache) % Gruppe B (ausführlicher Text) % Ja 18 36 Nein 82 61 Keine Angabe x 3 ___ 100 ___ 100 n = 543 556 x = weniger als 0,5 Prozent, wird auf 0 abgerundet (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2296, Februar 1990) Was also geht vermutlich im Kopf eines Befragten herum, der die Frage „Sind Sie zusätzlich in einer privaten Krankenversicherung, ich meine selbst - oder auch mitversichert? “ gestellt bekommt? Der erste und damit dominante Schlüsselbegriff der Frage ist der der „privaten Krankenversicherung“. Das inhaltlich entscheidende, aber am Anfang des Fragetextes unauffällig eingeschobene Wort „zusätzlich“ wird ebenso überhört wie in der in Abbhildung 2 dargestellten Frage der Verweis auf das Fernsehprogramm. Und der erläuternde Text nach dem Stichwort „private Krankenversicherung“ dürfte in vielen Fällen ebenso ungehört bleiben. Bei vielen Befragten bleibt von der Frage also übrig: „Sind Sie in einer privaten Krankenversicherung? “ Und wenn sie bei der <?page no="46"?> Die Position der Befragten 47 AOK versichert sind, antworten sie mit „Nein“, ohne sich noch einmal nähere Gedanken darüber zu machen, ob mit der Frage nicht doch etwas anderes gemeint sein könnte als die reguläre Krankenversicherung. Die in Amtssprache formulierte Frage setzt also, wie es ein Psychologe ausdrücken würde, den falschen „Frame,“ den falschen gedanklichen Bezugsrahmen, in den der Befragte die vermutete Absicht der Frage einordnet (zum Thema Frames und der ihnen übergeordneten Schema-Theorie siehe Tversky/ Kahnemann 1986; Kepplinger 2009, S. 687-688; Brosius 1995, S. 214-238). Die auf den ersten Blick etwas umständlicher erscheinende zweite Frage vermeidet dagegen diesen Effekt. Das erste Schlüsselwort lautet „Krankenhaustagegeldversicherung“. Dem Befragten wird damit gleich verdeutlicht, dass es nicht um die normale Krankenversicherung, sondern um einen Sonderfall geht. Es folgt das Wort „Zusatzversicherung“. Damit ist der Bezugsrahmen gesetzt, der es ermöglicht, nun das sonst möglicherweise in die Irre führende Stichwort der privaten Krankenversicherung einzuführen. An dieser Stelle jedoch steht weniger die fragebogentechnische Vermeidung des Missverständnisses im Vordergrund der Betrachtung als das Missverständnis selbst. Es illustriert, dass die geringe Aufmerksamkeit von Befragten und ihre Neigung zu einer wenig überlegten und allzu raschen Antwortfindung die Aussagekraft von Umfrageergebnissen erheblich beeinträchtigen können. Außerdem illustriert das Beispiel erneut, dass ein Fragebogen wesentlich mehr transportiert als den manifesten Frageinhalt. Fragebogen können verwirren, bedrohlich wirken, vermeintliche Normen vorgeben (vgl. hierzu Petersen 2002, S. 201-223). Nur wer sich dieser Fehlerquellen bewusst ist, sich in die Befragten hineinversetzen kann und die Entscheidungsprozesse durch unmissverständliche Setzung der richtigen Frames erleichtert, wird Fragebogen entwickeln können, deren Ergebnisse nicht in die Irre führen. Erneut zeigt sich die Bedeutung der Regel, dass die Befragten als „schwächste Glieder in der Kette“ von unnötigen kognitiven Belastungen jedweder Art befreit werden müssen, denn sonst werden die Befragten von sich aus für die Entlastung sorgen, auf Kosten der Validität der Ergebnisse. Eine Frage wird entweder auf Anhieb richtig oder gar nicht verstanden. Eine zweite Chance gibt es nicht. <?page no="47"?> Das sozialwissenschaftliche Interview als soziale Interaktion 48 2.3 Das Interview als Reaktions-Experiment Die im vorigen Kapitel beschriebenen Reaktionsmechanismen auf Seiten der Befragten zeigen nicht nur, dass bei der Fragebogenkonstruktion mehr auf die Psychologie der Versuchspersonen eingegangen werden muss, als es in der Praxis der Umfrageforschung oft geschieht, sondern sie lehren einen darüber hinaus einiges über den grundsätzlichen Charakter und damit über die Möglichkeiten und Grenzen des Interviewvorgangs. Das Interview ist nicht einfach ein Prozess, in dem die Befragten die Informationen zur Verfügung stellen, die der Forscher benötigt. Sie nehmen dem Forscher nicht die Aufgabe ab, seine Forschungsfrage zu beantworten, sondern sie reagieren auf die Fragen des Forschers. Diese Reaktionen helfen dem Forscher, seine Frage zu beantworten, sie sind aber nicht bereits die Antwort. Es ist vielleicht wirklich sinnvoll, sich diesen Reaktionsprozess analog zur Chemie vorzustellen: Man nimmt an einer Substanz ein Experiment vor: Man fügt beispielsweise zu einer Flüssigkeit eine weitere Flüssigkeit hinzu. Daraufhin verändert sich die erste Flüssigkeit: Eine klare Flüssigkeit wird trüb. Doch die Feststellung „trüb“ erklärt nicht den chemischen Prozess. Sie hilft lediglich, Rückschlüsse auf die Beschaffenheit des Ausgangsmaterials zu ziehen. Man sollte es mit solchen Analogien nicht übertreiben. Menschliches Verhalten ist natürlich nur äußerst begrenzt mit den Reaktionen chemischer Substanzen vergleichbar, doch der Forschungsprozess ist im Prinzip der gleiche. Das Ausgangsmaterial ist die Frage, mit der der Befragte konfrontiert wird. Dieser reagiert, und aus der Reaktion muss man - oft indirekt - auf die Eigenschaften des mit der Frage verbundenen Gegenstandes schließen. Ein Fragebogen, der ja aus mehreren, meist Dutzenden Fragen besteht, ist, in diesem Sinne verstanden, eine Testreihe: Was passiert, wenn man diese Frage einsetzt, was passiert, wenn man jene verwendet? Erst in der gemeinsamen Analyse der verschiedenen Tests ergibt sich das Gesamtbild, das Aufschluss über den Untersuchungsgegenstand bildet. Hier spiegelt sich die eingangs beschriebene Logik des Zerlegens und späteren Zusammensetzens in der Logik der Fragenentwicklung. <?page no="48"?> Das Interview als Reaktions-Experiment 49 So kommt es, dass viele Fragebogen - und oft sind es die besten - für den Außenstehenden kaum erkennen lassen, worin der Zweck der Ermittlung besteht. Da werden scheinbar unzusammenhängende Aspekte abgefragt, Fragen über das Alltagsverhalten wechseln sich ab mit Meinungsfragen. Immer dann, wenn man glaubt, eine Logik der Frageserie zu erkennen, wird abrupt das Thema gewechselt. Vor allem befasst sich der Fragebogen nicht selten mit Dingen, die nebensächlich erscheinen. In solchen Fällen beschleicht den Auftraggeber, wenn er den ersten Fragebogenentwurf sieht, der Verdacht, die Forscher hätten nicht verstanden, worum es bei der geplanten Studie gehen soll. Stattdessen findet er viele Fragen, die ihn gar nicht interessieren. Manch einer reagiert gar empört: „Und das alles von meinem Geld! “ Doch nicht die für den Außenstehenden erkennbare Logik ist das Kennzeichen der Qualität einer Frage, sondern allein ihre Eignung für das geplante Reaktions-Experiment. An dieser Stelle muss noch einmal auf die bereits an anderer Stelle kurz eingeführte Unterscheidung zwischen Programmfrage und Testfrage eingegangen werden, denn hierbei geht es um den wichtigsten gedanklichen Schritt, der bei der Fragebogenentwicklung vollzogen werden muss: Die Programmfrage bezeichnet das, was man mit einer Untersuchung erfahren möchte. Doch sie ist nur in den seltensten Fällen das, was am Ende auch im Fragebogen steht. Stattdessen muss die Programmfrage regelrecht übersetzt werden in meist eine größere Zahl von Testfragen. Bei den Programmfragen, mit denen die Untersuchungsziele beschrieben werden, und den Testfragen, die schließlich in den Fragebogen aufgenommen werden, handelt es sich um vollkommen unterschiedliche sprachliche und logische Konstrukte. Warum müssen Programmfragen in Testfragen übersetzt werden? Es gibt eine ganze Reihe von Gründen (siehe Noelle-Neumann/ Petersen 2005, S. 95-97). Der wichtigste ist aber, dass die Befragten in aller Regel nicht in der Lage wären, die Programmfragen zu beantworten. Programmfragen sind oft abstrakt und komplex. Typische Untersuchungsaufgaben in der Umfrageforschung und damit typische Programmfragen sind „Warum-“ und „Würden-Sie-Wenn-“ oder „Was-Wäre-Wenn“-Fragen. Typische Programmfragen sind beispielsweise: „Warum gehen so wenig junge Frauen zur Wahl? “ „Würde ein bestimmtes Produkt genug Kunden finden, wenn es eingeführt würde? “ „Wie würde eine be- <?page no="49"?> Das sozialwissenschaftliche Interview als soziale Interaktion 50 stimmte Plakatkampagne wirken? “ „Wird der Minister nach der neuesten Enthüllung zurücktreten müssen? “ Schlechte Fragebogen erkennt man leicht daran, dass sie diese Programmfragen ohne Übersetzung an die Befragten weiterreichen, als wären diese Experten für die Frage, die der Forscher, obwohl er sich doch meist wesentlich intensiver mit dem Untersuchungsgegenstand beschäftigt hat als die Befragten, selbst nicht beantworten kann. Wenn aber nun schon der Forscher eine Umfrage braucht, um die Antwort auf die Programmfrage zu finden, wie kann er erwarten, dass die Befragten die Antwort wissen? Als Beispiel mag die Programmfrage „Muss der Minister zurücktreten? “ dienen. Es wäre sinnlos, den Befragten diese Frage zu unterbreiten. Sie würden mit ihren Antworten bestenfalls das Echo dessen zu Protokoll geben, was sie am Vorabend in der Tagesschau gesehen haben. Die Befragten wissen nicht, ob der Minister zurücktreten muss. Sie wissen, ob sie ihn mögen oder nicht, ob sie seine Politik befürworten oder nicht, ob sie seine Verfehlungen als schlimm empfinden oder nicht, ob sie ihm vertrauen oder nicht. Doch die Schlussfolgerung, ob der Minister zurücktreten muss, muss der Forscher aus den Antworten auf diese und weitere Testfragen ziehen. Diesen Schluss können ihm die Befragten nicht abnehmen. Ein anderes Beispiel ist die erwähnte Programmfrage nach den Ursachen der geringen Wahlbeteiligung unter jungen Frauen. Man würde mit der Beantwortung dieser Frage nicht weit kommen, wenn man sich darauf beschränken würde, junge Frauen direkt zu fragen: „Warum sind Sie nicht zur Wahl gegangen? “ Viele Befragte würden auf diese Frage keine ehrliche Antwort geben können oder wollen: Oft spielen unbewusste Motive eine Rolle, oft fehlt es an der Möglichkeit, die komplexe Motivlage zu formulieren. Hinzu kommen in diesem Fall Selbsttäuschungen und Rationalisierungen, mögliche Effekte sozialer Erwünschtheit, das Bestreben nach der Verringerung kognitiver Dissonanz (vgl. Festinger 1957), also das Bemühen, eigenes Verhalten und eigene Motive mit dem „Ich-Ideal,“ der Vorstellung vom „eigentlich richtigen“ Verhalten und den „eigentlich richtigen“ Motiven in Einklang zu bringen. Kurz: Man erhielte viele Antworten, nur wahrscheinlich nicht diejenigen, die einem Aufschluss über die tatsächlichen Motive der Wahlenthaltung geben würden. Stattdessen täte man besser daran, nach Dingen zu fragen, die mit der Wahlenthaltung scheinbar direkt gar <?page no="50"?> Das Interview als Reaktions-Experiment 51 nichts zu tun haben: Die Testfragen würden beispielsweise - neben der Frage, ob man bei der letzten Wahl gewählt hat - das allgemeine politische Interesse betreffen. Man würde außerdem nach den Freizeitinteressen fragen, nach der Zeitungslektüre im Elternhaus, den Fernseh- und Internetnutzungsgewohnheiten, der bevorzugten Buchlektüre. Hinzu kämen einige nicht allzu aufdringliche politische Wissensfragen, Fragen zur Schulbildung und zu den persönlichen Zukunftsplänen. Erst die gemeinsame Auswertung dieser und anderer Testfragen würde eine einigermaßen verlässliche Antwort auf die Programmfrage ermöglichen. Natürlich gibt es auch Programmfragen, bei denen keine Übersetzung nötig ist. Wer wissen will, wie viele Menschen täglich mit der Straßenbahn fahren, wird keinen großen Fehler begehen, wenn er die Bürger kurzerhand direkt danach fragt. Doch meist will man nicht einfach wissen, wie viele Menschen mit der Straßenbahn fahren, sondern warum sie die Straßenbahn benutzen, warum sie sich manchmal stattdessen ins Auto setzen und unter welchen Bedingungen sie vielleicht mehr Straßenbahn fahren würden, als sie es derzeit tun - und schon hat das auf den ersten Blick scheinbar einfache Thema eine Komplexität gewonnen, die eine Übersetzung der Programmin Testfragen unumgänglich macht. Die Geschichte der Umfrageforschung ist gepflastert mit Niederlagen, die darauf zurückzuführen sind, dass die Übersetzung von Programmin Testfragen unterblieb. Besonders problematisch sind dabei neben Fragen nach den Motiven eines Handelns solche Fragen, bei denen das Handeln der Befragten in einer hypothetischen Situation erfragt werden soll. Die meisten Menschen sind nicht besonders geschickt darin, ihr eigenes Verhalten in einer nur theoretisch vorgestellten Situation zu erfassen. Sie können Auskunft über ihr tatsächliches Verhalten in der Gegenwart geben, darüber, was ihnen gefallt und was nicht, und darüber - wenn auch bereits mit erheblichen Abstrichen (Donsbach/ Jandura/ Petersen 2005, S. 227-228) -, was sie in der Vergangenheit getan haben. Doch Angaben über das mögliche zukünftige Verhalten unter einer nur angenommenen Bedingung sind erfahrungsgemäß sehr unzuverlässig. Ein Musterbeispiel dafür befindet sich im Archiv des Instituts für Demoskopie Allensbach: Im Jahr 1954 wurden Verbraucherinnen gefragt, ob sie sich vorstellen könnten, eine elektrisch beheizte Wolldecke zu kaufen. Rund ein Drittel der Befragten <?page no="51"?> Das sozialwissenschaftliche Interview als soziale Interaktion 52 zeigte sich interessiert (Allensbacher Archiv, IfD-Umfrage Nr. 652). Ein Jahrzehnt später hatte noch nicht ein Prozent der Bevölkerung eine Heizdecke angeschafft. Für die Konstruktion von Testfragen, mit denen Anhaltspunkte über mögliches künftiges Verhalten gewonnen werden sollen, leitet sich aus solchen Erfahrungen eine auf den ersten Blick etwas kurios erscheinende Regel ab: Fragt man die Bevölkerung nach der Zukunft, lernt man aus den Antworten vor allem etwas über die Gegenwart. Will man dagegen etwas über die Zukunft lernen, fragt man am besten nach der Gegenwart. Im Jahr 2005 stellte das Allensbacher Institut in einer repräsentativen Bevölkerungsumfrage die Frage „Wie wird es wohl in 10, 15 Jahren sein? “ Dazu wurde eine Liste überreicht, auf denen 20 verschiedene Zukunftsszenarien zur Auswahl gestellt wurden. Unter den am häufigsten ausgewählten Antworten waren „Es wird bei uns noch mehr Arbeitslose geben,“ genannt von 55 Prozent, und „Viele deutsche Unternehmen werden ins Ausland abwandern“ (65 Prozent). Bereits heute, im Jahr 2013, scheint es wahrscheinlich, dass diese Voraussagen in den verbleibenden zwei bis sieben Jahren der damals genannten Zeitspanne nicht eintreffen werden. Am ehesten erhält man noch verlässliche Aussagen über die Zukunft, wenn man gegenwärtiges und vergangenes Verhalten erfragt: Die wahrscheinlichsten Käufer eines neuen Produkts findet man meist unter denen, die bereits ähnliche Produkte besitzen, die neuen Wähler unter denen, die der betreffenden Partei früher schon einmal ihre Stimme gegeben haben. Man erkennt erneut, dass das, was man wissen möchte, nicht selten am ehesten aus den Antworten auf Fragen zu schließen ist, denen man ihren eigentlichen Zweck nicht ansieht. Das Prinzip der Übersetzung von Programmin Testfragen leuchtet vielen Menschen, die mit den Methoden der Umfrageforschung wenig vertraut sind, nicht ein. Doch nicht nur bei Auftraggebern aus Wirtschaft und Politik, auch innerhalb der Sozialwissenschaften wird deswegen immer wieder nach anderen Wegen gesucht, auf eine auf den ersten Blick überzeugender wirkende Art und Weise verborgene Motive oder unbewusste Einstellungen der Befragten zu erkennen. Oft wird dabei auf Methoden der qualitativen Forschung zurückgegriffen, die ihren Ursprung in der Individualpsychologie haben - mit eher bescheidenen Erfolgen. In den 1990er-Jahren gab es beispielsweise eine <?page no="52"?> Das Interview als Reaktions-Experiment 53 Phase, in der in der Forschung große Hoffnungen auf die „Think- Aloud-Technik“ gesetzt wurden. Dabei werden Versuchspersonen aufgefordert, möglichst jeden ihrer Gedankengänge, die zu einer Entscheidung führten, laut auszusprechen (vgl. Sudman/ Bradburn/ Schwarz 1996). Eine Kollegin am Allensbacher Institut sagte damals etwas höhnisch, das sei so, wie wenn man die Befragten unentwegt schütteln und anschreien würde: „Nun sag mir doch endlich, was Du wirklich denkst! “ Damit tut man dieser in der Psychologie und der qualitativen Sozialforschung oft sehr nützlichen Methode sicherlich unrecht. Doch das Prinzip der Übersetzung von Programmin Testfragen können solche Verfahren nicht ersetzen, denn bei aller systematischen Intensität bleiben sie doch stets auf der Ebene des rationalen Bewusstseins. Aus Sicht der quantitativen Sozialforschung missverstehen sie die Rolle der Befragten zumindest zum Teil, indem sie diese ausschließlich als Auskunftgeber ansehen. Doch die Umfrageforschung sammelt nicht nur Auskünfte, sondern sie registriert vor allem Reaktionen. 2.4 Die Sprache des Fragebogens Erkennt und akzeptiert man die Notwendigkeit, sich bei der Planung einer Untersuchung gedanklich intensiv in die Position der Befragten zu versetzen, stellt man folglich das Interview, nicht die Datenanalyse in den Mittelpunkt der methodischen Überlegungen, dann fällt es auch leicht, den Sinn einiger sprachlicher Grundregeln der Fragebogenkonstruktion nachzuvollziehen. Damit sind nicht Detailtechniken der Fragestellung gemeint. Ihnen werden sich die Kapitel im übernächsten Hauptteil dieses Bandes widmen, sondern das grundlegende Sprachverständnis, das die Frageformulierung leiten sollte. In den vorherigen Abschnitten ist ausführlich auf das Verhältnis zwischen Forscher und Befragten eingegangen worden. Die Ausführungen lassen sich grob vereinfacht in drei Aussagen zusammenfassen, die einem bei der Planung einer Untersuchung stets vor Augen stehen sollten: 1. Der Forscher will etwas vom Befragten, nicht umgekehrt. <?page no="53"?> Das sozialwissenschaftliche Interview als soziale Interaktion 54 2. Der Forscher will die Lebenswirklichkeit der Befragten erforschen, nicht nur ein Spiegelbild seiner eigenen Gedanken und Konzepte erzeugen. 3. Der Forscher hat sich intensiv mit dem Untersuchungsgegenstand beschäftigt, der Befragte in aller Regel nicht. Die Schlussfolgerung, die aus der ersten Aussage zu ziehen ist, ist, dass ein Fragebogen „gute Manieren“ (vgl. Noelle-Neumann/ Petersen 2005, S. 122-123) haben muss. Diese Feststellung klingt banaler, als sie ist, denn sehr oft sieht man Fragebogen, die sich über diese Regel hinwegsetzen. Zu den guten Manieren gehört neben einer grundlegenden Höflichkeit im Umgangston, dass man thematisch nicht mit der Tür ins Haus fällt, sondern mit Höflichkeitsfloskeln arbeitet und daran denkt, wie auch bei einem normalen persönlichen Gespräch, den Befragten bei Laune zu halten. Dieses Thema wird in den Abschnitten über die Vermeidung von Monotonie noch eine Rolle spielen. Wichtig ist es, in die Frageformulierungen Zeichen des Verständnisses der oft etwas schwierigen Situation des Befragten einzustreuen. Viele Menschen erleben das Interview als eine Prüfungssituation. Wahrscheinlich macht jeder Interviewer früher oder später die Erfahrung, dass ein potenzieller Befragter das Interview mit dem Argument abzulehnen versucht, von dem Thema verstehe er nichts. Auch dann, wenn der Interviewer die Zielperson doch noch davon überzeugt, sich befragen zu lassen, bleibt das latente Missverständnis, man werde ungerechtfertigterweise als Experte befragt, in vielen Fällen bestehen. Wenn nun ohne sprachliche Abmilderung die Aufforderung folgt, man solle doch einmal sagen, wie die nächste Bundestagswahl ausgeht, kann das zu erheblicher Verunsicherung führen. Eine Einleitungsfloskel wie „Wissen kann das natürlich niemand, aber was würden Sie persönlich sagen ...“ kann in solchen Situationen den Druck erheblich vermindern. Aus Sicht der Forscher erscheinen solche sprachlichen Bemühungen oft als etwas lächerlich wirkende Schnörkel, die den Fragebogen nur unnötig verlängern. Auf einem Sommerfest des Instituts für Publizistik der Universität Mainz wurden diese Formulierungen einmal stundenlang zum großen Vergnügen aller Beteiligten in immer neuen Varianten karikiert: „Wissen will das natürlich niemand, aber was meinen Sie <?page no="54"?> Die Sprache des Fragebogens 55 dennoch ...“ Tatsächlich wirkt diese Sprache manchmal etwas betulich und umständlich, doch sie ist keinesfalls überflüssig. Auch im täglichen Gespräch bedient man sich meist unbewusst solcher Floskeln. Wer sie für unnötig hält, möge einmal versuchen, einen Tag lang bewusst darauf zu verzichten und stets ohne Umschweife zur Sache zu kommen. Er wird rasch merken, dass er in erheblichem Maße den Unwillen seines persönlichen Umfeldes auf sich zieht. Das Gleiche vollzieht sich auch im Interview, wenn der Fragebogen keine Manieren besitzt. Das letzte aber, was ein Sozialforscher brauchen kann, sind verärgerte und damit unwillige Befragte. Besonders problematisch ist es, wenn sich ein Fragebogen wie ein amtliches Verhör liest. Gelegentlich findet sich in der Methodenliteratur der Hinweis, es sei sinnvoll, die statistischen Angaben zur Person (Alter, Geschlecht, Bildungsabschluss usw.) an den Anfang eines Interviews zu stellen, um damit, wie es in einem (abgesehen davon sehr lesenswerten) Aufsatz heißt, „die auch positive Anmutung einer (beinahe) amtlichen Erhebung zu verstärken“ (Scheuch 1996, S. 21). Die Erfahrung in der Praxis bestätigt diese Behauptung nicht. Das Abfragen der statistischen Daten am Anfang ist eine grobe Unhöflichkeit und auch forschungsstrategisch ungeschickt, denn einige statistische Angaben gehören aus Befragtensicht zu den heikelsten überhaupt, allen voran Fragen nach dem Einkommen. Mit solchen Fragen zu beginnen, ist der sicherste Weg, das Misstrauen der Befragten zu erwecken und vorzeitige Interviewabbrüche zu provozieren. Auf die praktischen Konsequenzen der zweiten oben aufgeführten Regel, wonach der Forscher die Lebenswirklichkeit der Befragten abbilden und kein Echo der eigenen Gedanken produzieren sollte, ist zum Teil bereits an anderer Stelle eingegangen worden, als beschrieben wurde, dass bei der Konzeption der Untersuchung die Alltagskategorien der Befragten und nicht die Konstrukte des Forschers den Maßstab bilden müssen. Doch der Fragebogen muss nicht nur die gedanklichen Kategorien der Befragten widerspiegeln, er muss auch ihre Sprache sprechen. Diese Forderung stellt den Forscher vor außerordentlich große Probleme, vor allem dann, wenn er eine bevölkerungsrepräsentative Umfrage plant, die ja alle sozialen Schichten, Altersgruppen und Bewohner aller Regionen gleichermaßen ansprechen soll. Die Feststel- <?page no="55"?> Das sozialwissenschaftliche Interview als soziale Interaktion 56 lung, dass bei der Fragebogenentwicklung auf größtmögliche Einfachheit und Verständlichkeit der Sprache geachtet werden muss, ist deswegen zwar richtig und auch wichtig, aber an dieser Stelle noch nicht ausreichend. Neben Fremdwörtern und Fachbegriffen sind beispielsweise darüber hinaus auch Modeerscheinungen der Sprache zu vermeiden (übrigens auch, um sich die Möglichkeit zu erhalten, die Frage möglichst lange zu späteren Zeitpunkten wiederholen zu können). Letztlich stellt jede Art von gruppenspezifischem Jargon eine Gefahr für die Validität der Ergebnisse dar, besonders dann, wenn es sich um den Jargon des Forschers handelt, der deswegen oft nicht merkt, dass er eine andere Sprache spricht als seine Befragten. Ein Beispiel für die Folgen der Verwendung von Jargon im Fragetext wurde oben in Abbildung 3 präsentiert. Dort handelte es sich um Bürokratensprache. Bei kommunikationswissenschaftlichen Untersuchungen ist dagegen vor allem die Verwendung von Mediensprache ein besonderes Problem. Es gibt eine Vielzahl von Begriffen und Redewendungen, die den meisten Menschen zwar geläufig sind, im Alltag jedoch so gut wie nie verwendet werden, sondern praktisch ausschließlich in den Massenmedien vorkommen. Meist werden diese Begriffe in der Berichterstattung mit einer bestimmten Deutung oder Wertung verknüpft. Durch die wiederholte Verwendung dieser Begriffe in einem bestimmten Deutungszusammenhang setzt bei den Mediennutzern ein Prozess des assoziativen Lernens ein. Man kann in diesem Zusammenhang von einer „sozialen Konditionierung durch Massenmedien“ sprechen (vgl. Petersen 2002, S. 242-251). Findet sich nun ein solcher Begriff im Fragebogen wieder, wird bei den Befragten auch die gemeinsam mit ihm gelernte Bewertung aktiviert und bestimmt damit das Antwortverhalten mit. Abbildung 4 zeigt ein Beispiel dafür, wie dieser Effekt der sozialen Konditionierung das Antwortverhalten der Befragten beeinflussen kann. Will man den Einfluss der Mediensprache auf die Meinungsbildung der Bevölkerung untersuchen, ist es nicht nur sinnvoll, sondern sogar notwendig, Frageformulierungen im spezifischen Medienjargon zu verwenden. In aller Regel verfolgen sozialwissenschaftliche - auch kommunikationswissenschaftliche - Untersuchungen aber andere Ziele. In diesen Fällen sind durch die Medien geprägte Formulierungen zu meiden. <?page no="56"?> Die Sprache des Fragebogens 57 Abbildung 4 Die lenkende Wirkung der „Mediensprache“ Frage an Halbgruppe A: „Neulich sagte uns jemand: ‚In der Bundesrepublik ist der Generationenvertrag in Gefahr: Die Jüngeren werden als Zahlmeister für die Rentner und Pensionäre missbraucht.’ Würden Sie ihm recht geben oder nicht recht geben? “ Frage an Halbgruppe B: „Neulich sagte uns jemand: ‚Die Jüngeren zahlen bei uns zu viel für die Älteren, für die wachsende Zahl der Rentner und Pensionäre. Die Älteren leben auf Kosten der Jugend.’ Würden Sie ihm recht geben oder nicht recht geben? “ Oktober 1996 Bundesrepublik Deutschland Bevölkerung ab 16 Jahre Halbgruppe A (Mediensprache) % Halbgruppe B (Alltagssprache) % Ja, Jüngere werden als Zahlmeister missbraucht / zahlen zu viel 46 21 Nein, werden nicht missbraucht / zahlen nicht zu viel 36 66 Unentschieden 18 ___ 100 13 ___ 100 n = 1091 1125 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6036) Selbst die Forderung, der Fragebogen möge für jedermann verständlich sein, ist in der Praxis nicht immer leicht zu erfüllen. Gerade bei im akademischen Umfeld entwickelten Fragebogen finden sich rasch For- <?page no="57"?> Das sozialwissenschaftliche Interview als soziale Interaktion 58 mulierungen wieder wie „Ethnozentrismus“ oder „Antisemitismus.“ Da werden Dinge „konzipiert“ oder „implementiert“. Anfang des Jahres 2012 wurde das Institut für Demoskopie Allensbach von einem Auftraggeber aus dem Bereich des Verkehrswesens gebeten, Fragen zu verwenden, bei denen vom „Regelverstoß eines anderen Verkehrsteilnehmers“ die Rede war, von „Nichtbenutzung eines vorhandenen Radwegs“ und von „sicherheitsrelevanten Aspekten des Radfahrens.“ Abgesehen davon, dass die Formulierungen an den schnarrenden Tonfall eines Polizeiverhörs erinnern, stellt sich die Frage, was die Befragten wohl mit dem Stichwort der „sicherheitsrelevanten Aspekte des Radfahrens“ hätten anfangen können. Mit gutem Grund hat Erwin Scheuch darauf hingewiesen, dass die Auffassungen der Bevölkerung selbst von scheinbar so eindeutigen Begriffen wie „Nettomonatseinkommen“ „mit der wirklichen Bedeutung des Terminus nur begrenzt etwas zu tun haben“ (Scheuch 1996, S. 18). Das bedeutet nicht, dass bei Umfragen der Begriff „Nettomonatseinkommen“ um jeden Preis zu meiden wäre - das ließe sich kaum durchhalten -, doch man kann sich die Folgen der Verunsicherung der Befragten durch die Verwendung einer ihnen nicht verständlichen Sprache kaum drastisch genug ausmalen. Im Jahr 1992 beging das Allensbacher Institut einmal den Fehler, ziemlich zu Beginn eines längeren Interviews die Befragten erklären zu lassen, was das Wort „Manie“ bedeute. Lediglich 14 Prozent waren in der Lage, eine zumindest vage zutreffende Antwort zu geben. Die Mehrheit wurde gezwungen, auf die Antwortmöglichkeit „Weiß nicht“ auszuweichen. Die Folgen dieser Frage durchzogen das gesamte weitere Interview. Einmal gleich zu Beginn mit der viel zu schweren Wissensfrage überfordert und frustriert und gleichzeitig darauf aufmerksam geworden, dass man sich ja immer mit der Antwort „Weiß nicht“ leicht und ohne sich Gedanken machen zu müssen, aus der Affäre ziehen kann, wählten auch bei den folgenden, eigentlich einfach zu beantwortenden Fragen auffallend viele Befragte die Kategorie „Weiß nicht“ aus. Offensichtlich hatten viele von ihnen die Lust verloren, sich bei der Umfrage noch besondere Mühe zu geben (Allensbacher Archiv, IfD-Umfrage Nr. 5069). In der Regel ist es durchaus möglich, auch scheinbar unvermeidliche Fachbegriffe zu umgehen, ohne umgekehrt die gebildeten Befragten allzu sehr vor den Kopf zu stoßen, die mit den abstrakten Begriffen <?page no="58"?> Die Sprache des Fragebogens 59 etwas würden anfangen können. Oft gelingt dies allerdings nur um den Preis einer etwas umständlichen, etwas behäbigen Sprache, die aber im Zweifelsfall eher in Kauf zu nehmen ist als die Folgen einer größeren Zahl von Missverständnissen oder Frustrationen auf Seiten der Befragten. Das folgende Fragebeispiel zeigt eine solche Lösung. Hier bestand die Aufgabe darin, die Aktualität von Klassenkampf-Vorstellungen zu ermitteln. Fragebeispiel 1 „Es gibt ja Bücher und Filme, in denen von armen Leuten erzählt wird, die sich zusammentun und gegen einige Reiche kämpfen, von denen sie schlecht behandelt werden. Wie empfinden Sie solche Erzählungen: Sind die altmodisch, oder sind die schon noch aktuell? “ ERZÄHLUNGEN SIND ALTMODISCH ........................ 1 SIND SCHON NOCH AKTUELL ................................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7002) Am Rande sei vermerkt, dass die Notwendigkeit, die Sprache der Befragten zu sprechen, in bestimmten Fällen auch bedeuten kann, dass im Fragebogen eine spezifische Fachsprache richtig angewendet werden muss. Diese Herausforderung ist für die Fragebogenkonstrukteure nicht geringer als die, für die ganze Bevölkerung verständliche und dennoch präzise und treffende Formulierungen zu finden. Bei einer Umfrage unter Einkäufern von glasverarbeitenden Industriebetrieben wimmelt es dann von Begriffen wie „Einscheibensicherheitsglas,“ „Verbundsicherheitsglas,“ Kreisausschnittsbiegungen“ oder „Biegeradien“, stets mit den dazugehörigen Abkürzungen (Noelle-Neumann/ Petersen 2005, S. 104-105). Wer hier die Fachsprache vermeidet oder gar falsch anwendet, begeht einen mindestens ebenso schweren Fehler wie derjenige, der bei einer Bevölkerungsumfrage Fachsprache verwendet. Er wird feststellen, dass er vom Befragten nicht ernst genommen wird. Menschen, die Jargon oder Fachsprachen verwenden, merken dies meist kaum noch. Das Spezialvokabular ist ein selbstverständlicher <?page no="59"?> Das sozialwissenschaftliche Interview als soziale Interaktion 60 Bestandteil ihrer Sprache. Das kann, wie oben beschrieben, zu Problemen führen, wenn Sozialforscher sich des Umstandes, dass sie eine Fachsprache verwenden, nicht bewusst werden. Ebenso sehr kann es aber zum Problem werden, wenn Befragte ihre als ganz normal und vor allem als einzig richtig empfundene Fachsprache im Fragebogen nicht wiederfinden. Für den Forscher bedeutet dies, dass er bereit sein muss, sich intensiv in die Probleme und vor allem die Sprache des betreffenden Fachgebietes einzuarbeiten - so, wie es sich aus Sicht der Befragten darstellt. Allerdings sind die Fälle, in denen sich der Forscher ein derart spezifisches Fachvokabular aneignen muss, wie im Falle der Kreisausschnittsbiegungen von Einscheibensicherheitsglas, Ausnahmen. In der Regel gilt - und dies ist das dritte der oben aufgelisteten Grundprinzipien -, dass sich der Forscher wesentlich mehr mit dem Gegenstand der Untersuchung beschäftigt hat als der Befragte. Das bedeutet, dass er dem Befragten eine Chance geben muss, sich in das Thema der Befragung oder einer Frage hineinzudenken. Man muss Themen und Themenwechsel ankündigen, um den Befragten auf die Themenwahl vorzubereiten. Hier zeigt sich eine weitere Verwendung der eben beschriebenen Einleitungsfloskeln. Sie dienen nicht nur der Höflichkeit, sondern sie sind oft auch notwendig, um zu verhindern, dass der Befragte „den Faden verliert“. Bei Fragen, die allzu direkt ins Thema einsteigen, muss man mit Verständigungsproblemen rechnen, wie etwa bei Fragebeispiel 2. Die dort gewählte Formulierung wäre vielleicht bei schriftlichen oder Internet-Befragungen noch akzeptabel, weil die Befragten dort durch mehrfaches Lesen nach und nach erschließen könnten, warum es bei der Frage geht. Bei persönlichen Befragungen und besonders bei Telefonumfragen würde die Frage dagegen kaum verstanden werden. Der Interviewer wäre mit dem Vorlesen fertig, bevor der Befragte sich überhaupt auf das Befragungsthema eingestellt hätte. Die Folge wären häufig Nachfragen, ein erneutes Vorlesen der Frage und damit eine unnötige Unterbrechung und Verlängerung des Interviews. <?page no="60"?> Die Sprache des Fragebogens 61 Fragebeispiel 2 „Was finden Sie besser: wenn man von einem Fernsehmoderator durch das Programm geführt wird oder wenn es keinen Moderator gibt? “ BESSER MIT MODERATOR ........................................ 1 BESSER OHNE MODERATOR.................................... 2 UNENTSCHIEDEN........................................................ 3 (Beispiel von Wilhelm Haumann) Eine akzeptable Lösung bietet dagegen Fragebeispiel 3. Hier lenkt der einführende Satz zunächst einmal die Gedanken auf das Thema. Der Befragte hat ein paar Sekunden Zeit, sich darauf einzustellen, dann erst folgt die eigentliche Frage „Was finden Sie besser ...? “ Fragebeispiel 3 „Bei manchen Fernsehsendern wird man ja von einem Moderator, also einem Sprecher, durch das Programm geführt. Bei anderen gibt es das nicht. Was finden Sie besser: wenn man von einem Fernsehmoderator durch das Programm geführt wird oder wenn es keinen Moderator gibt? “ BESSER MIT MODERATOR ........................................ 1 BESSER OHNE MODERATOR.................................... 2 UNENTSCHIEDEN .................................................. 3 (Quelle: Allensbacher Archiv, IfD- Umfrage Nr. 6092) Die Ausführungen und Beispiele aus diesem Kapitel machen deutlich, dass es nicht ganz richtig ist, wenn gesagt wird, die Sprache des Fragebogens müsse möglichst der Alltagssprache der Menschen entsprechen, denn die Alltagssprache der meisten ist durchzogen von Spezifika, die anderen Menschen unzugänglich bleiben oder auf sie zumindest befremdlich wirken. Stattdessen verlangt der Fragebogen - außer in den erwähnten Sonderfällen, wo die Verwendung einer besonderen Fach- <?page no="61"?> Das sozialwissenschaftliche Interview als soziale Interaktion 62 sprache geboten ist - eine Art reduzierter Alltagssprache. Verwendet wird gleichsam der kleinste gemeinsame Nenner, auf den sich alle Bürger verständigen können. Gleichzeitig muss die Sprache des Fragebogens etwas weiter ausholen, etwas umständlicher, behäbiger sein als die Alltagssprache, die oft mit gedanklichen Abkürzungen arbeitet, damit die Befragten bei den für sie oft ungewohnten Themen und Themensprüngen nicht auf der Strecke bleiben. Es ist die Sprache, in der sich die Großmutter mit der jugendlichen Enkeltochter unterhält oder die aus verschiedenen Bildungsschichten stammenden Nachbarn am Gartenzaun, die in ihren Familien oder ihren engeren Freundeskreisen jeweils sehr unterschiedliche Sprachen pflegen. Man könnte auch von einer „Adenauer-Sprache“ sprechen. Adenauer ist von Zeitgenossen, meist mit etwas höhnischem Unterton, vorgehalten worden, sein Wortschatz beschränke sich auf nur 1000 Worte (z. B. Im Kopf 1965, S. 41). Tatsächlich kann man annehmen, dass eben diese Art zu sprechen einer der wesentlichen Gründe für Adenauers anhaltende Popularität war: Er stellte damit sicher, dass ihn Menschen aller Bevölkerungsschichten sofort verstanden, ohne erst nachdenken zu müssen. Eben diese unmittelbare Eingängigkeit ist auch das wichtigste Merkmal guter Fragebogen. Wahrscheinlich ist es kein Zufall, dass Adenauer dem Vernehmen nach ein für einen Politiker ungewöhnlich gutes Gespür für Frageformulierungen besaß (Noelle-Neumann 2006, S. 174-175). <?page no="62"?> 63 3 Konstruktionsprinzipien des Fragebogens 3.1 Dramaturgie des Fragebogens Im Sommer des Jahres 1998 präsentierte der amerikanische Psychologe und Umfrageforscher Jon Krosnick bei einer Methodentagung in Italien eine sehr umfangreiche und aufwendige Analyse der Befragtenreaktionen auf verschiedene Fragemodelle. Er hatte in Experimenten verschiedenen Befragtengruppen jeweils dieselben Fragen mit unterschiedlichen Skalenvorlagen präsentiert. Mal sollten die Befragten ihre Antwort auf der Grundlage einer siebenstufigen Skala formulieren, mal wurde eine fünf-, mal eine neunstufige Skala vorgelegt. Während der Interviews registrierten die Forscher die Reaktionszeit, die die Befragten vom Beginn der Lektüre bis zur Formulierung ihrer Antwort benötigten (zur Methode vgl. Holbrook 2000). Es zeigte sich, dass die Antworten bei Vorlage einer siebenstufigen Skala um Sekundenbruchteile schneller gegeben wurden als bei fünf- oder neunstufigen Skalen. Krosnick zog aus diesem Befund sehr weitreichende Schlussfolgerungen. Das Experiment belege, dass die siebenstufige Skala der natürlichen Urteilsbildung der Menschen am nächsten käme. Deswegen sei die siebenstufige Skala allen anderen Skalen vorzuziehen. Er sprach es nicht ganz deutlich aus, doch aus seinem Vortrag ging klar hervor, dass er der Ansicht war, dass bei Umfragen möglichst alle Fragen in siebenstufigen Skalen präsentiert werden sollten. Doch eine solche Schlussfolgerung ist grundfalsch. Es soll an dieser Stelle nicht die Aussagekraft von Krosnicks Studie bestritten werden. Es leuchtet ein, mithilfe der Reaktionszeit der Befragten die Eingängigkeit und Verständlichkeit einer Frage zu messen. Es soll auch nicht bestritten werden, dass eine siebenstufige Skala für viele Menschen vielleicht etwas leichter kognitiv zu verarbeiten ist als eine neunstufige. Doch wer daraus die Aufforderung ableitet, Fragen künftig nur noch in sie- <?page no="63"?> Konstruktionsprinzipien des Fragebogens 64 benstufigen Skalen zu konstruieren, wird in der Umfrageforschung rasch scheitern. Krosnicks Vortrag ist typisch für viele Forschungbeiträge, die sich mit Fragen der kognitiven Verarbeitung von Frageinhalten oder Frageformen befassen. Die meisten sind sehr aufschlussreich und nützlich, dieser war es auch. Doch sie alle befassen sich mehr oder weniger unbewusst mit der Aufgabe, wie man eine gute Frage stellen kann. Gelegentlich findet sich dieser Anspruch sogar ausdrücklich ausgesprochen (z. B. bei Faulbaum/ Prüfer/ Rexroth 2009). Es ist legitim, ja sogar notwendig, sich mit der Qualität jeder einzelnen Frage in einem Fragebogen auseinanderzusetzen, doch man muss sich auch jederzeit der Tatsache bewusst sein, dass man in der Umfrageforschung in aller Regel nicht eine Frage stellt, sondern viele und dass die Qualität eines Fragebogens nicht die Summe der Qualität seiner Einzelfragen ist. Eine Aneinanderreihung von fünfzig perfekt formulierten Fragen kann einen katastrophal schlechten Fragebogen ergeben. Mit Sicherheit wäre das bei einem Fragebogen der Fall, der ausschließlich mit siebenstufigen Skalen arbeitet. Die negativen Auswirkungen der Monotonie eines solchen Fragebogens wären erheblich. Um zu verstehen, welche Aspekte bei der Konstruktion eines Fragebogens über die Beurteilung der einzelnen Fragen hinaus beachtet werden sollten, ist es hilfreich, sich noch einmal die eingangs erwähnten Funktionen des Fragebogens vor Augen zu halten: Es soll unter anderem den reibungslosen Ablauf des Interviews gewährleisten, den Befragten Informationen vermitteln, die sie zur Beantwortung der Fragen benötigen, die Aufmerksamkeit der Befragten steuern, das Interesse am Interview wachhalten und Aussagehemmungen abbauen. Ein Fragebogen ähnelt damit dem Drehbuch eines Films, in dem vor Drehbeginn der Verlauf der Handlung, das Tempo der Erzählung, die Gedankensprünge und Schnitte festgelegt werden. Und so, wie im Drehbuch nachfolgende Handlungselemente auf den vorhergehenden aufbauen und umgekehrt vorhergehende Elemente die Wahrnehmung der nachfolgenden beeinflussen, müssen auch bei der Erstellung von Fragebogen die Wechselwirkungen der Fragemodelle und angesprochenen Themen stets mitbedacht werden. Abbildung 5 zeigt die schematische Darstellung eines - keineswegs besonders umfangreichen - Fragebogens, in dem drei Themenkomplexe zur Sprache kommen. <?page no="64"?> Dramaturgie des Fragebogens 65 Abbildung 5a Schematischer Aufbau eines Mehrthemen-Fragebogens I <?page no="65"?> Konstruktionsprinzipien des Fragebogens 66 Abbildung 5b Schematischer Aufbau eines Mehrthemen-Fragebogens II <?page no="66"?> Dramaturgie des Fragebogens 67 Das Schema enthält viele Fachbegriffe, etwa Bezeichnungen von Fragetypen, die weiter unten noch ausführlicher dargestellt werden, doch auch ohne nähere Erläuterung der Details erkennt man die verschiedenen dramaturgischen Stränge und Regieanweisungen, die vorgenommen wurden um einen möglichst problemlosen Ablauf des Interviews zu ermöglichen. Einige Fragen in Abbildung 5 sind grau hinterlegt. Bei ihnen handelt es sich um die inhaltlichen Fragen im engeren Sinne, die eindeutig mit einem der drei Forschungsprojekte, die der Fragebogen abdeckt, in Verbindung gebracht werden können. Bei den weiß hinterlegten Fragen handelt es sich dagegen um Steuerungsfragen oder taktische Fragen, die durchaus auch inhaltlich von Interesse sein können, die aber in erster Linie dazu dienen, das Interview zu lenken. Oder aber es handelt sich um Fragen, die von analytischer Bedeutung sind, die aber keinem Projekt eindeutig zuzuordnen sind. Man sieht, dass nur wenig mehr als die Hälfte der Fragen projektgebunden sind. Nun handelt es sich im vorliegenden Fall um ein fiktives, vereinfachtes Beispiel. Bei vielen Umfragen werden drei Mal so viele Fragen gestellt. Dort ist der Anteil der Steuerungs- und Ablenkungsfragen geringer. Andererseits sind diese umso wichtiger, je länger der Fragebogen wird, denn mit fortschreitender Dauer des Interviews wird es immer schwieriger, die Konzentration der Befragten auf einem hohen Niveau zu halten. Die Reihenfolge der Fragen im Fragebogen wird nicht in erster Linie von der inhaltlichen Logik der Fragen bestimmt, sondern von den Aufmerksamkeitsrhythmen der Befragten. Je näher ein Fragebogen in seiner Themenmischung und seinem Rhythmus von Konzentration und zwischenzeitiger Entspannung einem zwanglosen alltäglichen Gespräch kommt, desto besser. Dabei ist es durchaus beabsichtigt, dass nach einigen Fragen zu einem Gegenstand das Thema gewechselt wird und nach einiger Zeit zum ursprünglichen Schwerpunkt zurückgekehrt wird. Vor vielen Jahren machte sich einmal ein Interviewer des Allensbacher Instituts die Mühe, einen der Fragebogen, die ihm zugeschickt worden waren, auseinanderzuschneiden, umzusortieren und dann ans Institut zurückzuschicken mit dem Kommentar: „Ich habe Ihren Fragebogen aufgeräumt.“ Dieser Interviewer hatte nicht verstanden, dass nicht logische Stringenz das wichtigste Kriterium der Sortierung ist, sondern ein <?page no="67"?> Konstruktionsprinzipien des Fragebogens 68 optimaler Spannungsbogen im Interview. Im Nachhinein, bei der Analyse, kann der Forscher die Fragen nach Belieben umsortieren. Das Anordnen der Fragen nach inhaltlicher Logik anstelle der Sortierung nach Kriterien der Gesprächspsychologie kann sogar die Qualität der Daten erheblich beeinträchtigen, nämlich dann, wenn das Interview ungewollt den Charakter eines „sokratischen Gesprächs“ annimmt: Eine Frage folgt logisch auf die nächste, eine Antwort baut folgerichtig auf der vorherigen auf, bis der Befragte, wie in einem Dialog Platons, schließlich auf eine Frage antworten könnte: „Dem vorher Eingestandenen gemäß muss die Antwort nun wie folgt lauten ...“ Damit antworten die Befragten aber nicht mehr, wie man es meistens anstrebt, spontan auf die eigentliche Frage, sondern ihre Reaktion ist wesentlich geprägt von ihrem Bestreben, möglichst widerspruchsfrei zu antworten. Es ist aber nicht die Aufgabe der Sozialwissenschaft, Widersprüche im Meinungsbild der Befragten aufzuklären oder gar abzustellen. Im persönlichen Gespräch kann man es häufig erleben, dass ein Gesprächspartner geradezu triumphierend auf die Widersprüche in der Argumentation des Gegenübers hinweist: „Eben hast Du noch gesagt, der Staat soll sich aus der Wirtschaft zurückhalten, jetzt forderst Du mehr Subventionen für erneuerbare Energien. Das ist ein Widerspruch. Beides gleichzeitig geht nicht, also jetzt entscheide Dich mal.“ Doch im Fragebogen haben solche Gesprächsmuster keinen Platz. Die Überzeugungen der meisten Menschen zu vielen Themen sind voll von Widersprüchen. Die Widersprüche gehören zum vollständigen Meinungsbild dazu. Der Gedanke, dass ein Fragebogen einen Spannungsbogen haben sollte, ist in der Forschung meist bemerkenswert wenig präsent. Nur selten wird in der Fachliteratur auf diesen Punkt verwiesen (z. B. Görtler/ Rosenkranz 2006; Behnke/ Baur/ Behnke 2006, S. 220). Es ist auch nicht leicht, konkrete Hinweise für den Aufbau eines solchen Spannungsbogens zu geben, weil es weder eindeutige, wissenschaftlich wirklich belastbare Erkenntnisse über die tatsächlichen Aufmerksamkeitsschwankungen im Interview gibt, noch ein Patentrezept, wie man das Interesse der Befragten am Interview wachhalten kann. So ist man auf Praxiswissen, also eine Mischung von plausiblen Vermutungen und Erfahrungswerten angewiesen. Das in Abbildung 5 dargestellte Schema illustriert, wie mit einem ständigen Wechsel der Fragemodelle und Themen sowie mit funktionalen Fragen versucht wird, das Interview <?page no="68"?> Dramaturgie des Fragebogens 69 abwechslungsreich zu halten. Zunächst wird der Befragte mit zwei „Eisbrecherfragen“ in das Interview hineingeführt. Es handelt sich um einfache, leicht zu beantwortende Fragen, mit denen das Frage- und Antwortspiel eingeübt wird und mit denen gleichzeitig eine angenehme Interviewatmosphäre hergestellt werden soll. Beispiele für mögliche Eisbrecherfragen finden sich im folgenden Hauptkapitel. Erst die dritte Frage widmet sich dem ersten Untersuchungsgegenstand der Befragung. Auch hier stehen eher einfache Fragen am Anfang, bevor mit Frage 4 das erste etwas komplexere Fragemodell zur Anwendung kommt, bei dem die Interviewer eine Liste mit verschiedenen Antwortmöglichkeiten zur Auswahl überreichen (ein sehr praktisches Erhebungsmodell, mit dem man rasch viele Informationen erhält, das aber natürlich nur bei persönlichen Interviews eingesetzt werden kann). Es empfiehlt sich, die komplexeren Fragemodelle, die die ganze Aufmerksamkeit der Befragten erfordern, nicht ganz an den Anfang der Erhebung zu stellen, aber auch nicht ganz ans Ende, wenn die Konzentration der Befragten bereits ihren Höhepunkt überschritten hat. Nach der sechsten Frage in diesem idealtypischen Modell wird das Thema gewechselt. In der Realität sind die Themenblöcke oft größer, doch spätestens nach zehn, fünfzehn Fragen sollte die Routine des Frage- und Antwortspiels durch einen Themenwechsel aufgebrochen werden. Der Wechsel der Perspektive soll dabei gleichsam als geistige Erfrischung dienen. Im vorliegenden Beispielfall geschieht das dadurch, dass sich der Fragebogen vom bisherigen politischen Thema ab- und einem neuen Gegenstand zuwendet. Auch bei Fragebogen, die sich nur einem einzigen Thema widmen, ist es wichtig, solche Momente der Ablenkung einzubauen, und sei es dadurch, dass man einige Fragen zu einem Thema stellt, das man gar nicht untersuchen will und die deswegen vielleicht auch gar nicht ausgewertet werden. Im Beispielfall ist das bei den Fragen 18 und 19 der Fall. Es handelt sich um Spielfragen, die dem Befragten eine kleine Verschnaufpause gewähren, bevor sich der Fragebogen wieder einem der eigentlichen Untersuchungsgegenstände zuwendet. Der Themenwechsel nach Frage 6 wird mit einer Filterfrage eingeleitet, also einer Steuerungsfrage, mit der der weitere Verlauf des Interviews festgelegt wird. Beispielsweise könnte an dieser Stelle ermittelt werden, welche Zeitungen der Befragte liest. Wenn sich die folgenden <?page no="69"?> Konstruktionsprinzipien des Fragebogens 70 Fragen mit den Nutzungsgewohnheiten bei regionalen Abonnementzeitungen befassen, werden Personen, die keine Regionalzeitung lesen, um diesen Themenblock herumgeleitet. Bei ihnen wird das Interview mit Frage 13 fortgesetzt, einer weiteren Filterfrage, die den dritten Themenblock einleitet. Hier könnte man sich beispielsweise die Frage vorstellen, ob man seine Lebensmittel meistens in einem normalen Supermarkt oder bei einem Discounter einkauft. Bei den folgenden Fragen wird der Fragebogen in zwei Stränge aufgeteilt. Je nachdem, wie die Antwort auf Frage 13 ausfällt, werden die Befragten mit unterschiedlichen Fragevarianten konfrontiert. Frage 16 stellt eine besondere Belastung für die Befragten dar: Hier überreichen die Interviewer einen Kartenstapel. Auf jeder Karte steht eine Aussage. Die Befragten werden gebeten, die Karten durchzusehen und zu sortieren. Ein solches Fragemodell (konkrete Beispiele finden sich im folgenden Hauptkapitel) belebt das Interview, weil es die Befragten aktiviert, doch es verlangt ihnen auch besondere Aufmerksamkeit ab, vor allem wenn, wie in diesem Fall, dieselben Karten zweimal hintereinander überreicht werden. So ist zum Beispiel denkbar, dass auf den Karten verschiedene Produkte stehen. Die Befragten werden gebeten, die Karten danach zu sortieren, ob sie diese Produkte „häufig“, „gelegentlich“, „selten“ oder „nie“ einkaufen. Die Karten mit Produkten, die zumindest „selten“ eingekauft werden, werden dann noch einmal überreicht mit der Bitte, nun noch anzugeben, ob man beim letzten Einkauf des betreffenden Produkts „sehr zufrieden“, „zufrieden“, „weniger zufrieden“ oder „gar nicht zufrieden“ war. Nach einem solchen Fragenblock ist es angebracht, mit den folgenden Spielfragen für etwas Entspannung zu sorgen. Mit Frage 20 kehrt der Fragebogen zum ersten Thema zurück, das auf diese Weise in zwei Portionen aufgeteilt ist. Dadurch wird es möglich, die Fragen 5 und 23, von denen man vermuten könnte, dass sie sich gegenseitig beeinflussen, weit auseinanderzuziehen, sodass die dazwischenliegenden Fragen als Puffer dienen. Allerdings ist der Effekt dieser Maßnahme oft begrenzt (Bishop 1987; Schwarz/ Schuman 1997). Eine elegantere Möglichkeit, Kontext-Effekte zu vermeiden, zeigt Frage 22: Hier werden die beiden sich potenziell gegenseitig beeinflussenden Fragen auf Halbgruppen verteilt. Jeder Befragte muss also nur auf eine der beiden Fragen antworten. Die auf diese Weise bei den betreffenden <?page no="70"?> Dramaturgie des Fragebogens 71 Fragen halbierte Fallzahl ist in der Regel ein geringeres Risiko für die Verlässlichkeit des Ergebnisses als die Gefahr von Verzerrungen, die von Kontexteffekten ausgehen kann. Allerdings kann diese Methode natürlich nur dann angewendet werden, wenn die Antworten auf beide Fragen nicht miteinander verrechnet werden sollen, was bedeuten würde, dass man Aussagen zu beiden Fragen von denselben Befragten bräuchte. Es folgen schließlich am Ende des Fragebogens die statistischen Angaben der Befragten und heikle Ermittlungen, von denen man annehmen kann, dass sie Irritationen, vielleicht sogar Widerstände bei manchen Befragten auslösen könnten: ein psychologischer Test und eine Ermittlung zum Alkoholkonsum mit der „Secret Ballot“-Methode, das heißt, der Interviewer übergibt dem Befragten ein Blatt zum Selbstankreuzen, das der Befragte dann in einen Umschlag steckt, sodass der Interviewer die Antwort nicht sehen kann. Die Ermittlung der Wahlabsicht, die inhaltlich zum politischen Thema gehört, wird unter die statistischen Angaben geschmuggelt, wo sie erfahrungsgemäß von manchen Befragten als etwas weniger heikel empfunden wird, als wenn sie von anderen Fragen zur Politik umgeben ist (die Methode des „Secret Ballot“, die sonst bei empfindlichen Themen von großem Nutzen sein kann, hat sich übrigens bei der Ermittlung der Wahlabsicht seltsamerweise nicht bewährt). Die Frage, die den größten Widerstand bei den Befragten erwarten lässt, ist die nach dem Einkommen. Sie ist deswegen aus pragmatischen Gründen die allerletzte: Etwaiges einsetzendes Misstrauen kann das Interwiew nicht mehr nachträglich beeinträchtigen. Verweigert gar jemand danach weitere Auskünfte, bleibt dies folgenlos, das Interview ist ja ohnehin beendet. Es folgen noch Angaben des Interviewers, die dieser nach Abschluss des Interviews alleine vornehmen kann und die ebenfalls noch zum Fragebogen gerechnet werden müssen, denn bei ihnen kann es sich um für die Analyse wichtige Informationen handeln, beispielsweise über die soziale Schicht des Befragten oder den Charakter des Wohnortes. Das fiktive Beispiel illustriert, wie viele verschiedene Aspekte bei der Konstruktion selbst eines so kleinen und vergleichsweise übersichtlichen Fragebogens abseits der inhaltlichen Fragen, die mit der Umfrage beantwortet werden sollen, beachtet werden müssen: Rhythmen der Aufmerksamkeit, gegenseitige Einflüsse von Fragen aufeinander, An- <?page no="71"?> Konstruktionsprinzipien des Fragebogens 72 spannung und Erschöpfung bei den Befragten, psychologische Aussagebarrieren. Alle diese Aspekte würden bei einem schematischen Fragebogen, bei dem immer wieder dasselbe Fragemodell zur Anwendung kommt, weil es, isoliert betrachtet, als optimal empfunden wird, nicht hinreichend berücksichtigt. Die größte Gefahr ist dabei die der allzu großen Monotonie des Interviews. Auf dieses Problem soll deswegen im folgenden Kapitel noch etwas detaillierter eingegangen werden. 3.2 Das Problem der Monotonie In der Tatsache, dass viele Fragebogen in der Sozialaber auch in der Marktforschung übermäßig lang und monoton sind, begegnet einem das schon mehrfach angesprochene Problem der mangelnden Einfühlung vieler Forscher in die Situation der Befragten in besonders ausgeprägter Form. Man kann dabei zwei Grundformen der Monotonie unterscheiden, eine formal bedingte und eine inhaltlich bedingte. Beide Varianten haben sich in den letzten Jahrzehnten, in denen die Ansprüche an die Differenziertheit der Daten immer weiter gewachsen sind, mehr und mehr zu einer erheblichen Gefährdung der Qualität von Umfragedaten entwickelt. Die „formal bedingte“ Variante der Monotonie stellt sich ein, wenn, wie es in der akademischen Forschung oft geschieht, eine große Zahl von Informationen mit dem immer gleichen formalen Fragenmodell ermittelt werden soll. Der häufigste Fall ist, dass Dutzende, wenn nicht sogar Hunderte von Aussagen aneinandergereiht und die Befragten aufgefordert werden, zu jeder dieser Aussagen auf einer fünf- oder siebenstufigen Skala anzugeben, wie sehr sie ihr zustimmen. Wer ein solches Verfahren wählt, tut dies oft in der Annahme, methodisch besonders klug vorzugehen: Alle Daten erhalten auf diese Weise die gleiche mathematische Struktur und sind deswegen - theoretisch - optimal miteinander vergleichbar. In der Fachliteratur wird man für ein solches Vorgehen auch Bestätigung finden. Dort kann man beispielsweise den Hinweis finden, dass man zur Bildung einer sozialwissenschaftlichen Skala etwa hundert Items, organisiert in Likert-Skalen, benötige (Friedrichs 1985, S. 173; vgl. auch Eichhorn/ Watzka 1993, S. 92), also hundert Aussagen, zu denen die Befragten auf einer Verbalskala angeben müs- <?page no="72"?> Das Problem der Monotonie 73 sen, ob sie - beispielsweise - ihnen „voll und ganz“ oder „eher“ zustimmen, ob sie ihnen neutral gegenüberstehen oder ob sie ihnen „eher nicht“ oder „gar nicht“ zustimmen. Der Psychologe Erp Ring hat aber bereits 1976 experimentell nachgewiesen, wie sehr ein solches Vorgehen die Validität der Umfrageergebnisse gefährdet. Er wies nach, dass bereits bei Listen mit 20 Items die Befragten den letzten Aussagen auf der Liste wesentlich seltener die extremen, eine eindeutige Meinungsäußerung dokumentierenden Skalenpunkte zuordnen und häufiger die neutrale Mittelposition auswählen (Abbildung 6), ein Kennzeichen dafür, dass die Aufmerksamkeit der Befragten nachlässt, und mit ihr die Bereitschaft, sich mit jedem einzelnen Punkt auf der Liste gedanklich auseinanderzusetzen. Abbildung 6 Auswirkungen der Monotonie von Fragebogen auf die Validität der Ergebnisse Häufigkeit in Prozent, mit der bei einer Image-Untersuchung für ein Markenprodukt verschiedene Positionen einer 7er-Skala ausgewählt wurden am Anfang und am Ende einer Liste aus 20 Items - (Quelle: Ring 1976) Erste 5 von 20 Items Letzte 5 von 20 Items 28 36 23 13 24 31 24 21 +3 oder -3 +2 oder -2 +1 oder -1 0 (Mittelposition) 0 10 20 30 40 0 Skalenposition Prozent <?page no="73"?> Konstruktionsprinzipien des Fragebogens 74 Die zunehmende Tendenz zur neutralen Mittelposition im Verlauf einer längeren Item-Liste bestätigt den bereits erwähnten Befund, dass die Befragten im Interview bei Überforderung und Desinteresse dazu neigen, den Weg der geringsten geistigen Anstrengung zu gehen (vgl. auch Noelle-Neumann/ Petersen 2000; Herzog/ Bachmann 1981; Petersen 2002, S. 186-188). Die Folge ist eine Verschlechterung der Datenqualität, denn die Ergebnisse verlieren an Differenzierungskraft. Da dies bereits bei Listen von 20 Items nachweisbar ist, muss man annehmen, dass der Effekt bei längeren Listen noch größer wird. Und 20 Items sind weit weniger, als bei vielen sozialwissenschaftlichen Untersuchungen zur Anwendung kommen. Vor allem auf dem Fachgebiet der Psychologie sind Listen mit 50 und mehr Items keine Seltenheit. Kürzlich wurde das Institut für Demoskopie Allenbach aufgefordert, ein Angebot über eine Untersuchung abzugeben, bei der mehr als 500 Aussagen mit immer wiederkehrenden monotonen Skalenabfragen getestet werden sollten. Die Vertreter der Organisation, die die Untersuchung in Auftrag geben wollte, zeigten sich darüber erstaunt, dass die Projektleitung am Institut einen solchen Fragebogen für problematisch erachtete. Noch eindrucksvoller als die Ergebnisse von Rings Experiment sind die einer Sekundäranalyse, die die Münchner Kommunikationswissenschaftler Olaf Jandura und Hans-Bernd Brosius im Jahr 2010 auf der Jahrestagung der World Association for Public Opinion Research (WA- POR) vorstellten. Sie untersuchten den Einfluss sogenannter „Response Sets“ auf die Qualität von Umfrageergebnissen. Mit dem Begriff „Response Sets“ sind Antwortmuster gemeint, bei denen man annehmen muss, dass sie nicht das Ergebnis der Beschäftigung der Befragten mit dem Inhalt einer Frage sind, sondern das Resultat des willkürlichen Ausfüllens eines Fragebogens, etwa wenn bei langen Item-Listen stets dieselbe Antwortkategorie gewählt wird, unabhängig vom Inhalt der zu bewertenden Aussagen, oder wenn die angekreuzten Kategorien eines Fragebogens mit langen Likert-Skalen regelmäßige Zickzack-Muster ergeben. Solche „Response Sets“ sind vor allem bei längeren Fragebogen zum Selbstausfüllen kein seltenes Phänomen. Jandura und Brosius stellten fest, dass jedes vierte von ihnen untersuchte Online-Interview und immerhin jeder zehnte schriftliche Fragebogen solche Muster enthielt. <?page no="74"?> Das Problem der Monotonie 75 Wenn man nun die betreffenden Fragebogen aus dem Datensatz entfernte, ergaben sich keine signifikanten Veränderungen der Umfrageergebnisse in Prozent, auch Korrelationen zwischen verschiedenen Variablen veränderten sich kaum. Deutlichere Veränderungen ergaben sich dagegen bei Faktorenanalysen. Doch vor allem bei Clusteranalysen zeigten sich massive Effekte: Sie ergaben ein vollkommen unterschiedliches Bild, je nachdem, ob man im Datensatz die Fragebogen mit Response Sets beließ oder entfernte (Jandura/ Brosius 2010). Das bedeutet: Eben jene multivariaten Analyseverfahren, deretwegen man die Fragebogen mit langen Skalenfragen belastet, werden durch die daraus folgende Monotonie der Interviews und die kognitive Überlastung der Befragten am meisten beeinträchtigt. Man erreicht letztlich eine Scheinpräzision dadurch, dass man die formale Organisation der erhobenen Daten verbessert, gleichzeitig ihre Validität aber so sehr beeinträchtigt, dass dies den formalen Fortschritt mehr als ausgleicht. 3.3 Der „taube Interviewer“ Die zweite, inhaltlich bedingte Variante der Fragebogenmonotonie kann man etwas salopp mit dem Stichwort des „tauben Interviewers“ umschreiben (vgl. Noelle-Neumann/ Petersen 2005, S. 127-128). Auch hier liegt die Ursache in den unterschiedlichen Perspektiven von Forschern und Befragten begründet. Der Forscher hat seinen Untersuchungsgegenstand bis in das Detail gedanklich durchleuchtet und nimmt dementsprechend viele verschiedene Facetten des Themas wahr, die dem Befragten oft kaum bewusst sind. So möchte der Wahlforscher wissen, welche Partei ein Befragter zu wählen gedenkt. Außerdem interessiert er sich dafür, welche Partei ihm am sympathischsten ist, welche Partei er an der Regierung sehen möchte, von welcher Partei er am wenigsten enttäuscht ist, welche Partei die besten Kandidaten, welche das beste Programm hat usw. Für den Forscher sind das alles wichtige, streng voneinander zu unterscheidende Punkte, denn man kann ja - theoretisch - eine Partei aus taktischen Gründen wählen, obwohl sie einem nicht sympathisch ist. Man kann - theoretisch - der Ansicht sein, die bevorzugte Partei habe keine guten Kandidaten. Man <?page no="75"?> Konstruktionsprinzipien des Fragebogens 76 kann - theoretisch - von der Partei, die man am sympathischsten findet, gleichzeitig schwer enttäuscht sein. Der Befragte aber bekommt bei einer solchen Frageserie den Eindruck, der Interviewer höre ihm nicht zu. Aus seiner Sicht hat er bereits bei der ersten Frage eine klare Antwort gegeben, der nichts hinzuzufügen ist, und doch hört der Interviewer nicht auf, ihm wieder und wieder dieselbe Frage zu stellen. Er findet sich in einer ähnlichen Situation wieder, wie die Befragte in einer amerikanischen Zeitungskarikatur, der es nicht gelingt, dem Reporter klarzumachen, dass sie über ihr Leben nicht klagen kann (Abbildung 7). Abbildung 7 Der taube Interviewer (© Mike Peters for the Freedom Forum. Dank an Wolfgang Donsbach, der das Beispiel fand) <?page no="76"?> Der „taube Interviewer“ 77 Als eine besonders große Schwierigkeit erweist sich das Phänomen des „tauben Interviewers“ bei Fragemodellen, die in der Psychologie oder in den Wirtschaftswissenschaften entwickelt wurden. Stärker noch als bei anderen Sozialwissenschaften haben sich hier zwei Konventionen in der empirischen Forschung durchgesetzt, die, wenn sie zusammenwirken, große methodische Probleme nach sich ziehen, nämlich einmal die Sitte, die Qualität einer Skala oder eine Frageserie darin zu bemessen, dass die Antworten auf alle Fragen oder Items möglichst gut miteinander übereinstimmen, und zweitens, einmal in der Fachliteratur akzeptierte Fragemethoden als allgemeinverbindlich zu erklären und Änderungen nicht mehr zuzulassen. Letzteres sollte in der Forschung ohnehin niemals akzeptiert werden, denn es bedeutet das Ende jeder Verbesserungsmöglichkeit. Es behindert die Kreativität und damit den wissenschaftlichen Fortschritt. Doch die eigentliche Brisanz liegt in der Kombination der beiden Konventionen. Sie führt vor allem bei der Übernahme von Untersuchungsmodellen, die ursprünglich für die Laborforschung entwickelt wurden, nicht selten dazu, dass Frageserien zum Einsatz kommen, obwohl allen an der Untersuchung Beteiligten klar ist, dass sie - zumindest für die Verwendung in Befragungen außerhalb von medizinischen oder psychologischen Labors - offensichtlich ungeeignet sind. Ein drastisches Beispiel hierfür ist das „State-Trait-Ärger-Ausdrucksinventar“ (STAXI), ein in der klinischen Psychologie verwendeter Test zur Intensität von Ärger (Schwenkmezger/ Hodapp/ Spielberger 1992). Die dabei verwendeten Aussagebatterien sollten zur Jahreswende 2011/ 2012 auch den Befragten in einer repräsentativen Bevölkerungsumfrage vorgelegt werden, um einen Vergleich zwischen den klinischen Fällen, bei denen der Test zur Anwendung kommt, und dem „Normalzustand“ in der Bevölkerung zu ermöglichen. Es stellte sich heraus, dass sich die Fragen nur nach erheblichen Modifizierungen in den Fragebogen der Bevölkerungsumfrage aufnehmen ließen und selbst dann noch zu erheblichen Irritationen bei den Befragten führten. Das Fragemodell bietet einen lebendigen Anschauungsunterricht darüber, welche Dimensionen das Phänomen des „tauben Interviewers“ annehmen kann. Dabei handelt es sich bei den in Fragebeispiel 4 wiedergegebenen Items nur um einen Auszug aus dem Fragenprogramm. <?page no="77"?> Konstruktionsprinzipien des Fragebogens 78 Fragebeispiel 4 Der „taube Interviewer“: Auszug aus dem STAXI-Fragebogen „Im Folgenden finden Sie eine Reihe von Aussagen, mit denen man sich selbst beschreiben kann. Lesen Sie jede Aussage und geben Sie anschließend an, wie Sie sich in diesem Moment fühlen (...).“ (Vorlage eines Bogens zum Selbstausfüllen) Wie ich mich in diesem Moment fühle: überhaupt ein ziemlich sehr nicht wenig Ich bin aufgebracht Ich könnte jemanden anschreien Ich könnte etwas kaputt machen Ich bin wütend Ich könnte auf den Tisch schlagen Ich könnte fluchen Ich bin verärgert Ich könnte jemanden treten Ich könnte laut schimpfen Ich bin zornig Ich könnte jemanden schlagen Ich bin sauer Ich könnte jemandem wehtun Ich könnte jemanden beleidigen Ich könnte jemanden schütteln Ich könnte brüllen (Quelle: Sonja Rohrmann: Entwurf STAXI-2-Fragebogen, Dezember 2011) In vielen Fällen beruht die Annahme, man könne einen komplexen Gegenstand nur mithilfe einer Skala erfassen, die aus einer Vielzahl von möglichst übereinstimmenden Einzelaussagen besteht, auf einem Missverständnis. In der Einzelfalldiagnose ist eine derart komplizierte und die Versuchsperson belastende Herangehensweise oft unvermeidlich, denn es geht ja darum, zweifelsfrei die Eigenschaften einer bestimmten Person zu bestimmen. In der Sozialforschung, die nicht die Einzelperson, sondern gesellschaftliche Gruppen im Blick hat und gleichzeitig <?page no="78"?> Der „taube Interviewer“ 79 eine große Zahl von Versuchspersonen befragt, kommt es aber auf Einzelfallgerechtigkeit nicht an. Will man von einer Person alles wissen, braucht man viele Fragen. Will man dagegen von allen nur Einzelnes erfahren, reicht eine kleine Zahl von Fragen. Entscheidend ist deren Validität, dass also mit dem Messinstrument auch das erfasst wird, was man wissen möchte. Ist das Instrument valide, braucht man nicht noch zwölf weitere, nahezu identische. Ist es aber nicht valide, nützt es auch nichts, es dutzendfach zu wiederholen. Der australische Wirtschaftswissenschaftler John D. Rossiter hat darauf hingewiesen, dass die Aussagekraft einer Einzelfrage in aller Regel kaum geringer ist als die von Skalen mit inhaltlich übereinstimmenden Aussagebatterien (Bergkvist/ Rossiter 2007). Seiner Ansicht nach führt die Methode, die Qualität einer Skala an der mathematischen Übereinstimmung der auf sie gegebenen Antworten (festgestellt meistens mit dem Konsistenzmaß Cronbachs Alpha) zu bemessen, in die Irre. Man könne auf diese Weise lernen, dass man mit vielen Items mehr oder weniger dasselbe misst, aber ob man auch das misst, was man messen möchte, erfährt man nicht (vgl. Rossiter 2011). Die perfekte Übereinstimmung, so könnte man hinzufügen, erhält man, indem man zehn Mal hintereinander dieselbe Frage stellt. Doch warum sollte man das tun? Von diesem Zustand aber sind Fragebogen wie der des STAXI nicht mehr weit entfernt. Nur die wenigsten Menschen wird man davon überzeugen können, dass es einen sinnvollen Unterschied gibt zwischen „ich bin aufgebracht“, „ich bin wütend“, „ich bin verärgert“, „ich bin zornig“ und „ich bin sauer“, ganz zu schweigen davon, dass diese Aneinanderreihung von mehr als einem Dutzend leicht unterschiedlicher Formulierungen des Gemütszustandes „ich bin wütend“ kaum die tatsächliche Stimmungslage des Befragten in einem Interview für eine Repräsentativumfrage treffen dürfte - außer vielleicht unmittelbar nach der Lektüre eben dieser Frage. Geradezu aussichtslos wird der Versuch, eine erkenntnisreiche Untersuchung zu gestalten, wenn solche Fragebatterien dann auch noch mit dem Argument als unveränderbar erklärt werden, dass sie die allgemein anerkannte und damit die gleichsam verbindliche Methode seien. Dies geschieht selbst dann, wenn es sich auf den ersten Blick erkennbar um schlechte Übertragungen aus dem Amerikanischen oder <?page no="79"?> Konstruktionsprinzipien des Fragebogens 80 um Formulierungen mit handwerklichen Fehlern handelt. So drängte im Frühjahr 2012 ein Auftraggeber aus dem Bereich des Verkehrswesens das Allensbacher Institut dazu, Frageserien mit gröbsten Schwächen, teilweise sogar unfreiwillig komischen Formulierungen in einen Fragebogen aufzunehmen. Unter anderem fanden sich in den Aussagen doppelte Verneinungen, übermäßig verdrehte Sprachkonstruktionen wie „Man hält mich nicht für eine reizbare oder leicht erregbare Person“, sprachliche Fehler wie den sogenannten „Berliner Perfekt“: „Verschiedentlich bin ich verärgert und verbittert gewesen“ oder die in Europa sicherlich anders als in Amerika zu wertende Aussage „Es würde mir keinen Spaß machen, in einer Stadt wie Las Vegas meinen Urlaub zu verbringen“. Obwohl die sprachlichen und teilweise auch die inhaltlichen Schwächen offensichtlich waren, gelang es nicht, den Auftraggeber davon zu überzeugen, dass die Frageserie einer erheblichen sprachlichen Überarbeitung bedurfte. Das Bewusstsein, eine „offiziell anerkannte“ Skala zu verwenden, beherrschte die Sichtweise vollkommen und verstellte damit den Blick auf die mangelnde Qualität des Instruments. Man muss sich in der Umfrageforschung von solchen vermeintlichen Autoritäten befreien. Es gibt nur einen Grund, eine schlechte Frage in einen Fragebogen aufzunehmen, und der ist, dass diese Frage bereits zu einem früheren Zeitpunkt oder an anderer Stelle schon einmal gestellt worden ist und die Möglichkeit des Vergleichs schwerer wiegt als die Schwächen der Formulierung. Andere Argumente sind methodisch irrelevant. Die Aussage, ein Instrument müsse deswegen unverändert verwendet werden, weil es allgemein anerkannt sei, sollte sogar Anlass zu einer besonders gründlichen Prüfung sein. Wie in der persönlichen Kommunikation dient auch hier die Berufung auf Autoritäten oder die allgemeine Meinung oft dazu, den Mangel an sachlichen Argumenten zu verdecken (vgl. Schopenhauer 1983, S. 57-58). Vor allem aber sind Autoritäten aus dem Bereich der Individualdiagnostik keine Autoritäten im Bereich der quantitativen Sozialforschung. Die beschriebenen Auswirkungen der Monotonie und der Effekt des „tauben Interviewers“ führen dazu, dass die Instrumente der Laborforschung mit ihren oft ausufernd langen und sich wiederholenden Item- Listen in der Umfrageforschung meist nicht, zumindest nicht ohne erhebliche Verluste in der Datenqualität angewandt werden können. Wer <?page no="80"?> Der „taube Interviewer“ 81 eine Gesellschaft untersuchen will, muss viele Fragen stellen. Auch deswegen sollte er jede dieser Fragen einmal stellen. Wer jede Frage zehnmal wiederholt, hat am Ende keinen Platz mehr, all die anderen Fragen anzubringen, die er auch noch beantwortet haben möchte. 3.4 Subjektive und objektive Fragebogenlänge Die Tatsache, dass man bei der Konstruktion des Fragebogens die Gesamtdramaturgie des Interviews im Blick halten muss und versuchen sollte, einen Spannungsbogen zu gestalten, der die Aufmerksamkeit der Befragten und - sofern welche zum Einsatz kommen - der Interviewer aufrechterhält, bedeutet auch, dass man sich intensiv mit der Frage auseinandersetzen muss, wie lang ein Fragebogen denn insgesamt sein darf. Auf diese Frage gibt es keine einfache Antwort. Die angemessene Länge eines Fragebogens ist, je nachdem, welche Position jemand in dem Untersuchungsprozess einnimmt, sehr unterschiedlich. Für den Forscher ist ein Fragebogen praktisch immer zu kurz. Immer gibt es noch weitere Aspekte, die er untersucht sehen möchte, immer muss er schweren Herzens kürzen, was ihm doch eigentlich wichtig erscheint. Für Interviewer sind die Fragebogen fast immer zu lang. Sie sind meist ungeduldiger als die Befragten selbst. Entscheidend ist aber auch hier das Urteil der Befragten, und das kann bemerkenswert stark schwanken. Wahrscheinlich kennt fast jeder Mensch aus eigenem Erleben, wie unterschiedlich schnell die Zeit vergehen kann. Wartet man auf einem abgelegenen Provinzbahnhof, in dessen Umgebung nichts Interessantes zu entdecken ist, auf einen Zug, der erst in ein paar Stunden eintreffen soll, scheint die Zeit fast stillzustehen. Unterhält man sich dagegen gut, ist man konzentriert mit einer Tätigkeit beschäftigt, die einen fordert und die gleichzeitig Spaß macht, scheint die Zeit nur so dahinzufliegen. Der ungarisch-amerikanische Psychologe Mihaly Csikszentmihalyi hält diesen Zustand, bei dem man sich selbst und die Zeit regelrecht vergisst, sogar für eines der wesentlichen Elemente individuellen Glücksempfindens (Csikszentmihalyi 1992). Nun wird sich jeder auch nur halbwegs vernünftige Forscher kaum einbilden, er könne einen Befragten mit einem sozialwissenschaftlichen Interview glücklich machen, <?page no="81"?> Konstruktionsprinzipien des Fragebogens 82 aber alle die hier beschriebenen Maßnahmen - die Themenwechsel, der Wechsel von Auflockerung und Anspannung, die Aktivierung der Befragten, das Einhalten des Spannungsbogens - dienen dazu, die Befragten einem solchen selbstvergessenen Zustand des ruhigen, konzentrierten Arbeitens so nahe zu bringen wie irgend möglich. Gelingt dies, verliert die Frage nach der maximalen Länge eines Fragebogens etwas an Brisanz. Ein abwechslungsreicher langer Fragebogen wird unter Umständen von den Befragten als kürzer empfunden als ein monotoner, kurzer Fragebogen. Das führt beispielsweise dazu, dass das Einfügen von Spielfragen einen Fragebogen objektiv länger, subjektiv dagegen kürzer machen kann. Testen kann man dies, indem man die Befragten am Ende eines Interviews schätzen lässt, wie lange die Befragung wohl gedauert habe. Bei einem guten Fragebogen wird die tatsächliche Länge des Gesprächs unterschätzt. Dennoch kann man auch, wenn man alle methodischen Mittel, die Befragten bei Laune zu halten, ausnutzt, deren Geduld überstrapazieren. Dabei hängt es stark vom Modus der Befragung ab, wie viel man den Menschen zumuten kann. Bei schriftlichen Befragungen sind die Grenzen des Erträglichen am schnellsten erreicht. Die Antwortbereitschaft der Zielpersonen sinkt kontinuierlich mit der Länge des Fragebogens (Connelly/ Brown/ Decker 2003). Hier wird bereits alles, was über zwei Doppelseiten hinausgeht, zum Problem, wobei nicht in erster Linie die Seitenzahl entscheidend ist, sondern die Zahl der Fragen, die man sinnvollerweise auf diesen Seiten unterbringen kann. Don Dillman, der führende amerikanische Experte auf dem Gebiet der schriftlichen Befragung, hat mit gutem Grund darauf hingewiesen, dass es unsinnig ist, vor lauter Angst, nicht zu viele Seiten zu füllen, stattdessen das Papier mit viel zu vielen, viel zu klein gedruckten Fragen vollzuquetschen (Dillman/ Parsons 2008, S. 267). Vier Seiten, das entspricht realistischerweise etwa 20 sehr kurzen oder acht umfangreicheren Fragen. Die Beantwortung sollte nicht mehr als 10 bis 15 Minuten in Anspruch nehmen (vgl. Noelle-Neumann/ Petersen 2009, S. 205). Nicht viel mehr Geduld kann man den Befragten bei Online- und Telefonumfragen abverlangen. Hier sind 20 Minuten in aller Regel das Äußerste. Bei speziellen, am betreffenden Thema interessierten Befragtengruppen kann man vielleicht noch etwas über diese Grenze hinausgehen. Bei Online-Befragungen kann man die Laune der Befragten <?page no="82"?> Subjektive und objektive Fragebogenlänge 83 noch ein wenig durch den Einsatz von Fortschrittsbalken heben (Vehovar/ Lozar Manfreda/ Koren 2008, S. 279), die Zahl der Abbrüche jedoch kaum verringern (Couper/ Traugott/ Lamias 2001). Die Vorstellungen darüber, wie lange Telefonumfragen sein dürfen, schwanken erheblich. Es gibt Berichte darüber, dass Interviewlängen von 40 Minuten noch keine erhöhte Zahl von Interviewabbrüchen zur Folge hätten (z. B. Frey/ Kunz/ Lüschen 1990, S. 49-50), doch nach den Erfahrungen des Instituts für Demoskopie Allensbach ist bei einer solchen Interviewdauer die Schmerzgrenze bereits weit überschritten. Am längsten kann man die Befragten noch bei persönlichen Interviews in Anspruch nehmen. Anscheinend sorgen die persönliche Anwesenheit der Interviewer und die im Vergleich zu Telefonumfragen wesentlich größere Bandbreite der verwendbaren Fragemodelle und damit auch der größere Abwechslungsreichtum im Fragebogen dafür, dass Interviews auch nach 40 Minuten noch nicht als zu lang empfunden werden. Auch eine Interviewdauer von rund einer Stunde wird meist noch einigermaßen klaglos akzeptiert (vgl. Noelle-Neumann/ Petersen 2005, S. 126-127). Diese Zeitangaben sind als grobe Faustregeln zu verstehen. Entscheidend ist, dass die richtige Interviewlänge nach psychologischem Maß bestimmt werden muss, nicht mechanisch nach der Stoppuhr. Dabei gilt: Je länger das Interview dauert, desto gründlicher muss daran gearbeitet werden, es durch den lebendigen Wechsel der Fragethemen und -modelle noch erträglich erscheinen zu lassen. Neben den bereits erwähnten Spielfragen und dem wiederholten Themenwechsel gibt es noch weitere Techniken, ein Interview subjektiv zu verkürzen. So kann es wichtig sein, den Befragten aus der passiven Rolle herauszuführen, die er bei vielen Interviews einnimmt. Hier gibt es oft ein gewisses Missverhältnis zwischen den Aktivitäten des Interviewers und des Befragten. Während der Befragte regungslos am Tisch sitzt und seine Antworten formuliert, ist der Interviewer laufend aktiv. Er blättert Seiten um, sortiert Vorlagen, trägt Antworten in den Bogen ein. Gibt man dem Befragten dagegen Karten in die Hand, auf denen verschiedene Aussagen stehen, und fordert man ihn auf, die Aussagen auszusortieren, denen er zustimmt (konkrete Beispiele für solche Fragemodelle finden sich im folgenden Hauptkapitel), zwingt man ihn damit buchstäblich dazu, „die Hände zu rühren.“ Erfahrungsgemäß wird das Interview <?page no="83"?> Konstruktionsprinzipien des Fragebogens 84 dadurch meist als kurzweiliger empfunden. Und man verändert auf eine subtile Weise ein wenig das Verhältnis zwischen Interviewer und Befragtem: Nun muss der Befragte nicht mehr nur die Impulse des Interviewers abwarten, sondern es haben beide etwas zu tun. Der Befragte wird enger in den Forschungsprozess eingebunden. Beide arbeiten gemeinsam an der Verfertigung des Interviews. Ein Beispiel für einen extrem langen Fragebogen, bei dem alle Register der psychologischen Verkürzung gezogen werden müssen, damit er überhaupt noch einigermaßen erträglich bleibt, bietet die „Allensbacher Markt- und Werbeträger-Analyse“ (AWA). Bei der AWA handelt es sich um eine umfangreiche Markt-Media-Studie, mit der die Leserschaft von rund 300 Zeitungen und Zeitschriften ermittelt wird, außerdem die Nutzung des Werbefernsehens und einiger der wichtigsten Online-Medien. Darüber hinaus werden zahlreiche Informationen über das Freizeit- und Konsumverhalten erhoben. Solche Markt-Media- Studien bieten eine wichtige Planungsgrundlage für die werbetreibende Wirtschaft, die mithilfe solcher Studien beispielsweise feststellen kann, mit welchen Medien sie die potenziellen Kunden eines Produktes, das sie bewerben möchten, erreichen können (vgl. hierzu Schulz/ Schneller 2009; Meyen 2004). Nun hat sich die Vielfalt der Medien und damit auch der Muster der Mediennutzung in den letzten Jahrzehnten immer weiter ausdifferenziert. Gleichzeitig sind die Planungsinstrumente der Marketingexperten immer anspruchsvoller geworden, sodass in die Fragebogen der Markt- Media-Untersuchungen mehr und mehr und immer detailliertere Fragen aufgenommen werden mussten. Die Initiatoren der größten deutschen Untersuchung dieser Art, der Media-Analyse (MA), haben bereits vor Jahrzehnten vor diesen überbordenden Ansprüchen kapituliert und die Untersuchung in mehrere getrennte Studien aufgegliedert, die im Nachhinein mit dem Verfahren der Datenfusion zusammengespielt werden. Dabei werden die Antworten von in ihrem Antwortverhalten möglichst ähnlichen Befragten aus den verschiedenen Teilstudien miteinander verknüpft. Aus mehreren Befragten wird auf diese Weise ein „virtueller Befragter“ (vgl. Koschnick 2003). Allerdings leidet unter der Fusion die Datenqualität doch deutlich (Tennstädt 1993). Will man also wirklich verlässliche Daten, kommt man nicht umhin, alle notwendigen Informationen „single source“ zu erheben, wie es in der Sprache der Me- <?page no="84"?> Subjektive und objektive Fragebogenlänge 85 diaforschung heißt, das bedeutetet: Es werden keine Daten fusioniert, keine künstlichen Befragten geschaffen. Alle Fragen müssen in einem Fragebogen untergebracht werden. Die Folge ist, dass der Fragebogen der AWA rund hundert teilweise sehr komplexe Fragen enthält. Das Interview dauert mindestens eineinhalb Stunden. Das ist das Äußerste, was man den Befragten noch zumuten kann, und auch dies nur, wenn man besondere fragebogentechnische Vorkehrungen trifft. So sind in das mündliche Interview Elemente einer schriftlichen Befragung eingebaut: Nach einer Frage, bei der die Befragten Karten mit Zeitschriftentiteln sortieren, je nachdem, wie oft sie diese Zeitschriften lesen, überreichen die Interviewer einen Bogen mit Aussagen zum Freizeitverhalten. Dazu wird die Frage gestellt: „Könnten Sie mir bitte helfen und in der Zeit, in der ich die von Ihnen gelesenen Zeitschriften eintrage und neu sortiere, die Fragen auf der Vor- und Rückseite dieses Blattes beantworten? “ Auf diese Weise wird nicht nur die Zeit, in der der Interviewer die Karten sortieren muss, ausgenutzt, sondern der Interviewer macht den Befragten gleichsam zu seinem Kollegen: „Könnten Sie mir bitte helfen“ - damit überträgt er scheinbar einen Teil der Verantwortung über den Interviewprozess. Und er appelliert an die Hilfsbereitschaft des Befragten: den armen Interviewer, der sich mit dem schrecklich langen Fragebogen so abmüht, den kann man ja nicht guten Gewissens im Stich lassen. Anders als in der Umfrageforschung sonst üblich, enthält der AWA- Fragebogen sogar eine Sollbruchstelle. Nach etwa der Hälfte der Fragen bieten die Interviewer den Befragten an, das Interview an dieser Stelle abzubrechen und an einem der kommenden Tage fortzusetzen. Nur sehr wenige Befragte nutzen die Gelegenheit zur Unterbrechung. Die meisten fügen sich gleichsam seufzend in ihr Schicksal. Dennoch ist das Anbieten der Unterbrechung von großer psychologischer Bedeutung: Mit der Zustimmung, nun auch noch den zweiten Teil des Interviews über sich ergehen zu lassen, erneuert der Befragte die Vereinbarung mit dem Interviewer und hat es nun umso schwerer, nachdem er schon zweimal dem Interview ausdrücklich zugestimmt hat, das Gespräch abzubrechen. Das Beispiel des AWA-Fragebogens wird hier ausdrücklich nicht zur Nachahmung empfohlen. Die übermäßige Länge des Interviews ist allein aus der methodischen Not geboren. Doch das Beispiel zeigt, dass <?page no="85"?> Konstruktionsprinzipien des Fragebogens 86 sich selbst objektiv viel zu lange Fragebogen mit den geeigneten Fragetechniken subjektiv gerade noch erträglich gestalten lassen. <?page no="86"?> 87 4 Formenlehre 4.1 Fünf inhaltliche Ausrichtungen und zwei Fragezwecke Es ist, wie im vorigen Abschnitt beschrieben, problematisch, sich ausschließlich mit der Funktion und der Qualität einzelner Fragen zu befassen und dabei die Dramaturgie des Fragebogens als Ganzes außer Acht zu lassen. Sobald man sich jedoch darüber klar geworden ist, dass ein Fragebogen nicht nur eine Aneinanderreihung von Fragen ist, sondern eine funktionale Einheit bildet, muss man sich selbstverständlich dennoch den Fragemodellen im Einzelnen zuwenden und sie nach Funktion und Konstruktion klassifizieren. Nur so wird der vielseitige Instrumentenkasten der fragebogengestützten Sozialforschung überschaubar. In der Fachliteratur hat es sich eingebürgert, Fragetypen abhängig von ihrem Inhalt in fünf Kategorien einzusortieren, nämlich als Faktfragen („Gibt es bei Ihnen in der Nähe eine U-Bahn-Station? “), Einstellungsfragen („Finden Sie das U-Bahn-Netz in der Stadt ausreichend oder nicht? “), Verhaltensfragen („Wie oft fahren Sie mit der U-Bahn? “), Wissensfragen („Können Sie mir sagen, was eine U-Bahn-Fahrkarte kostet? “) und Motivfragen („Warum fahren Sie mit der U-Bahn? “) (siehe z. B. Noelle-Neumann/ Petersen 2005, S. 104-108 oder die betreffenden Einträge in Tscheulin/ Helmig 2004). Der britische Umfrageforscher Robert M. Worcester unterscheidet Einstellungsfragen sogar noch etwas feiner in Fragen nach leicht veränderlichen Meinungen („opinions“), festeren Einstellungen („attitudes“) und langfristig entstandenen, nur schwer veränderbaren Werten („values“) (Worcester/ Mortimore 1999, S. 16-20). Solche formalen Klassifizierungen sind in der Praxis ohne Bedeutung. Vermutlich niemand, der an der Erstellung eines Fragebogens arbeitet, macht sich Gedanken darüber, ob eine bestimmte Frage als Faktfrage oder als Einstellungsfrage bezeichnet werden kann, zumal <?page no="87"?> Formenlehre 88 diese Kategorien in vielen Fällen auch nicht trennscharf sind. So manche Verhaltensfrage lässt sich auch als Faktfrage verstehen, und nicht wenige Faktfragen entpuppen sich bei näherer Betrachtung tatsächlich als Einstellungs- oder Wissensfragen. Worcesters Unterteilung in Meinungen, Einstellungen und Werte schließlich ist gänzlich unpräzise, die Einordnung eines Themas und damit einer Frage zu diesem Thema in eine dieser Kategorien meist vom subjektiven Eindruck des Analytikers abhängig. Doch dadurch werden solche Klassifizierungen nicht überflüssig. Sie helfen, die Vielzahl der möglichen Fragemöglichkeiten in der Sozialforschung gedanklich zu sortieren. Vor allem aber führen sie einem die Bandbreite der möglichen Untersuchungsthemen in der Umfrageforschung vor Augen. Gemeinhin neigt man in der Öffentlichkeit dazu anzunehmen, bei Umfragen gehe es allein oder in erster Linie um Meinungen. In der englischen Sprache hat sich das sogar in der Begriffsbildung niedergeschlagen. Dort nennt man die Umfrageforschung meist „Public Opinion Research“. Auch im Deutschen ist der Begriff „Meinungsforschung“ gängig. Gegen diese Verengung der Sichtweise wandte sich bereits im Jahr 1946 der amerikanische Sozialforscher Stuart Dodd. Er schlug vor, statt von „Public Opinion Research“ von „Demoscopy“ zu sprechen, abgeleitet aus den griechischen Begriffen „demos“ („das Volk“) und „skopein“ („beobachten“), denn darum ginge es ja schließlich, die Beobachtung der Bevölkerung auf der Basis von Stichproben, einschließlich ihrer Meinungen, Kenntnisse, Verhaltensweisen oder Lebensbedingungen, also um weit mehr als nur um Meinungen alleine (Dodd 1946, S. 473). Dieser Vorschlag Dodds wurde allerdings nur von wenigen Forschern aufgenommen. Der Begriff „Demoskopie“ hat sich nur in Deutschland durchgesetzt. Für die Praxis wichtiger als die etwas kleinliche formale Einteilung von Fragen in Fakt-, Einstellungs-, Verhaltens-, Wissens- und Motivfragen ist die grundsätzliche Unterscheidung zwischen, wie es im unpräzisen Alltagsjargon der angewandten Forschung heißt, „Analysefragen“ und „normalen Fragen.“ Die Begriffe erfüllen nicht die Ansprüche einer präzisen wissenschaftlichen Terminologie, denn selbstverständlich dient jede Frage im Fragebogen letztlich der Analyse, und auch „Analysefragen“ sind ganz normal. Gemeint sind mit diesen Begriffen zwei grundsätzlich zu unterscheidende Analysezwecke, zu denen eine Frage die- <?page no="88"?> Fünf inhaltliche Ausrichtungen und zwei Fragezwecke 89 nen kann, ob sie nämlich bei der Auswertung der Daten in erster Linie als unabhängige Variable oder als abhängige Variable betrachtet werden soll. Mit dem Begriff „Analysefrage“ werden die potenziellen unabhängigen Variablen bezeichnet. Es handelt sich um Fragen, bei denen weniger die Zahl der Befragten von Interesse ist, die sich für die zur Auswahl stehenden Antwortkategorien entscheiden, als die Möglichkeit, die Gesamtheit der Befragten in Gruppen zu unterteilen, deren Verhalten man miteinander vergleichen will. Das offensichtlichste Beispiel für eine solche Analysefrage ist die nach dem Geschlecht der Befragten. Es bedarf keiner Umfrage, um festzustellen, dass 52 Prozent der deutschen Bevölkerung weiblich sind. Dennoch gibt es kaum eine Bevölkerungsumfrage, bei der das Geschlecht der Befragten nicht mitermittelt wird, denn diese Information ist nötig, um später festzustellen, ob Frauen bei Fragen zum Wahlverhalten, den Konsumgewohnheiten, der Mediennutzung oder Werteorientierung oder zu welchem anderen Untersuchungsthema auch immer andere Antworten geben als Männer. Die in Ermangelung eines anderen griffigen Begriffs sogenannten „normalen Fragen“ - man könnte vielleicht, wie der Allensbacher Forscher Wilhelm Haumann, von „Zielfragen“ sprechen - sind dagegen jene, die in erster Linie als abhängige Variable betrachtet werden sollen. Hier interessiert vor allem die Prozentverteilung der Antworten. Beispiele sind die Leserzahlen verschiedener Zeitungen und Zeitschriften, Fragen nach Motiven zum Kauf von Produkten oder der Wahlentscheidung oder die berühmte „Sonntagsfrage,“ mit der die Parteistärken ermittelt werden. In vielen Fällen wird sich nicht festlegen lassen, ob eine Frage eindeutig als Analyse- oder als Zielfrage zu betrachten ist. In vielen, wenn nicht den meisten Fällen kann eine Frage zu beiden Zwecken dienen. Ein Beispiel ist die erwähnte „Sonntagsfrage“. In der Regel dient sie dazu, die aktuellen Stärken der Parteien zu ermitteln. Doch in vielen politischen Studien ist sie auch als Analysefrage von Nutzen, etwa wenn man untersuchen möchte, ob die Wähler der CDU ein bestimmtes politisches Thema anders beurteilen als die Wähler der SPD. Man kann die Funktion von Analyse- und Zielfrage bzw. die Logik von unabhängiger und abhängiger Variable auch im Sinne von Ursache und Wirkung verstehen. Bei der Analyse der meisten Umfragen werden verschiedene Variablen, also die Antworten auf verschiedene Fragen, <?page no="89"?> Formenlehre 90 statistisch miteinander in Beziehung gesetzt, etwa nach dem Muster der folgenden, sicherlich nicht besonders spannenden Forschungsfrage: Wenn sich jemand als konservativ bezeichnet, ist dann die Wahrscheinlichkeit, dass er CDU wählt, größer als bei jemandem, der sich nicht als konservativ einstuft? Die Antwort lautet natürlich „Ja“. Doch der statistische Zusammenhang zwischen zwei Variablen, hier die Selbsteinstufung als konservativ und die Parteipräferenz für die CDU, sagt, mathematisch betrachtet, nichts darüber aus, welche dieser Variablen die Ursache oder welche die Wirkung ist (wenn es sich überhaupt um Ursache und Wirkung handelt, was keinesfalls immer der Fall sein muss [vgl. Noelle-Neumann/ Petersen 2005, S. 415-434]). Dennoch liegt solchen Analysen stets eine implizite Ursache- Wirkung-Annahme zugrunde, und in aller Regel gibt es „natürliche Kandidaten,“ also eine plausible und eine weniger plausible Annahme darüber, welche Variable eher als Ursache und welche eher als Wirkung einzustufen ist. Um aus Gründen der Anschaulichkeit auch hier wieder das einfachste Beispiel anzuführen (in der Praxis sind die Fälle natürlich meist weniger eindeutig): Wer die Einstellung der Bevölkerung zur Einführung von Frauenquoten erfragt, wird feststellen, dass diese statistisch mit dem Geschlecht der Befragten zusammenhängt. Nach der statistischen Logik kann man nur den Zusammenhang zwischen diesen beiden Variablen feststellen, aber nichts darüber aussagen, welche dieser Variablen die andere beeinflusst. Doch natürlich ist nur eine sinnvolle Deutung des Ergebnisses möglich: Es ist vom Geschlecht abhängig, ob jemand Frauenquoten befürwortet: Frauen sind eher dafür als Männer. Die umgekehrte Interpretation macht dagegen keinen Sinn. Es ist nicht anzunehmen, dass das Geschlecht eines Menschen durch seine Meinung zur Frauenquote bestimmt wird. Es ist bei der Fragebogenentwicklung hilfreich, sich von vornherein zu überlegen, welche Frage etwas ermittelt, was eher als Ursache verstanden werden kann, welche also eher als Analysefrage bzw. unabhängige Variable genutzt werden soll und welche Frage eher einen Gegenstand erfasst, von dem man prüfen möchte, was auf ihn einwirkt, welche Frage also eher als Zielfrage bzw. abhängige Variable angesehen werden kann. Diese Unterscheidung ist nicht nur deswegen bereits bei der Fragebogenkonstruktion wichtig, weil sie hilft, die Strukturen der späteren möglichen Analysen besser zu überblicken, sondern weil <?page no="90"?> Fünf inhaltliche Ausrichtungen und zwei Fragezwecke 91 Analysefragen und Zielfragen durchaus unterschiedliche Formen annehmen können. Will man beispielsweise, wie bei Markt-Media-Studien, ermitteln, welches einzelne Medium wie viele Nutzer hat, wird man unter Umständen sehr detaillierte Fragen entwickeln. Man wird die Leserschaft verschiedener Zeitungs- und Zeitschriftentitel erheben, einzelne Fernsehsender und Internetseiten abfragen und komplizierte Modelle zur Ermittlung der Intensität der Mediennutzung entwickeln, weil die Mediennutzung selbst der Hauptgegenstand der Untersuchung ist. Benötigt man dagegen die Mediennutzung lediglich als unabhängige Variable, will man zum Beispiel bei einer Wahluntersuchung unterscheiden können, ob Zeitungsleser ein anderes Bild von der politischen Lage haben als Menschen, die sich vorwiegend aus dem Fernsehen informieren, wird man wesentlich gröbere Fragemodelle wählen, denn die feine Unterteilung wäre nicht nur nicht notwendig, sondern sie würde darüber hinaus den Fragebogen nur unnötig verlängern. Es macht keinen Sinn, hundert verschiedene Muster der Mediennutzung abzufragen, nur um am Ende Viel-Fernseher von Wenig-Fernsehern unterscheiden zu können. Die vorherige Klärung, ob eine Frage in erster Linie als Analyse- oder Zielfrage dienen soll, hilft also, den Fragebogen zu entlasten: Analysefragen können meist einfacher gehalten werden als Zielfragen. Die Einteilung der Gesamtheit der Befragten in Analysegruppen verlangt wenige grobe, nicht viele feine Kategorien. 4.2 Fragen zur Steuerung des Interviews Es wurde bereits oben, als der schematische Aufbau eines fiktiven Mehrthemen-Fragebogens präsentiert wurde, darauf hingewiesen, dass ein Fragebogen neben den Fragen, die aus inhaltlichen Gründen gestellt werden, eine Vielzahl von funktionalen Fragen oder anderen Steuerungselementen enthalten muss, die sicherstellen, dass das Interview reibungslos abläuft. An derselben Stelle wurde bereits auf die Eisbrecherfragen verwiesen, die am Anfang des Interviews stehen. Sie sollen die Befragten auf das Interview einstimmen, das Frage- und Antwortspiel einüben und eine etwaige Scheu vor der unbekannten Situation abbauen helfen. Eisbrecherfragen sollten einfach konstruiert sein und ein Thema ansprechen, zu dem jeder Befragte etwas zu sagen <?page no="91"?> Formenlehre 92 hat. Wie auch an vielen anderen Punkten ist es auch hier wichtig, dass der Fragebogen einer normalen alltäglichen Unterhaltung möglichst nahe kommt. Wenn man bei einem persönlichen Gespräch nicht recht weiß, wie man die Unterhaltung beginnen soll, oder wenn man eine Unsicherheit überbrücken will, beginnt man meist, zunächst vom Wetter zu sprechen. Die Erfahrung besagt, dass zu diesem Thema jeder eine Meinung hat und dass man damit die Unterhaltung leicht in Schwung bringen kann. Und so ist es auch in der Sozialforschung nicht die schlechteste Idee, das Interview mit Fragen nach dem Wetter oder ähnlichen unverfänglichen Themen zu beginnen. Die Fragebeispiele 5 und 6 zeigen bewährte Eisbrecherfragen, wobei Beispiel 6 gleichzeitig zwei seltene Abweichungen vom normalen Regelwerk der Frageformulierung illustriert, nämlich die Vorgabe einer Antwort, die die Interviewer im Falle einer Rückfrage geben sollten, und die Tatsache, dass eine Antwortkategorie vorgesehen ist, auf die im Fragetext nicht hingewiesen wird. Diese beiden, den praktischen Erfahrungen geschuldeten Details lassen die Frage nicht gerade idealtypisch und damit auch nicht als ideales Lehrbuchbeispiel erscheinen. Sie wird hier dennoch präsentiert, weil sie sich in der Praxis als außerordentlich geeignet erwiesen hat. Nebenher belegt das Beispiel, dass Eisbrecherfragen keineswegs immer unergiebig für die Analyse sein müssen. Die Frage nach den „Hoffnungen und Befürchtungen“ ist, so unpräzise sie auch erscheint, in der ökonomischen Forschung von besonderem Interesse, denn aus den Ergebnissen lassen sich bemerkenswert präzise Konjunkturprognosen ableiten (Noelle-Neumann 1989; Antholz 2005, Bruttel 2013). Fragebeispiel 5 Eisbrecherfrage „Manche Leute klagen ja in diesen Wochen über Frühjahrsmüdigkeit. Wie geht es Ihnen im Frühjahr: Fühlen Sie sich da manchmal“ besonders müde und abgespannt oder eigentlich nicht? “ FÜHLE MICH MÜDE UND ABGESPANNT.................. 1 EIGENTLICH NICHT ..................................................... 2 KEIN URTEIL................................................................. 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2693) <?page no="92"?> Fragen zur Steuerung des Interviews 93 Fragebeispiel 6 Eisbrecherfrage: „Hoffnungen und Befürchtungen“ „Sehen Sie den kommenden 12 Monaten mit Hoffnungen oder Befürchtungen entgegen? “ (Bei Nachfrage: „Allgemein oder persönlich? “ folgt der Hinweis: „Je nachdem, was Sie zurzeit mehr beschäftigt.“) MIT HOFFNUNGEN ...................................................... 1 MIT BEFÜRCHTUNGEN............................................... 2 MIT SKEPSIS ................................................................ 3 UNENTSCHIEDEN........................................................ 4 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10050) Ihrem Charakter nach mit den Eisbrecherfragen verwandt sind die Schlussfragen im Fragebogen. Sie sind für den Verlauf des Interviews von geringerer Bedeutung, denn sie haben nicht wie jene eine unverzichtbare Funktion. Man kann ein Interview auch abrupt nach der letzten inhaltlichen Frage beenden, ohne dass die gesamte Untersuchung Schaden nimmt. Es ist jedoch nicht nur eine Frage des Umgangstons, wenn man das Interview mit einer leichteren Frage ausklingen lässt und damit gleichsam abrundet, sondern eine Schlussfrage kann auch dazu beitragen, die Geduld des Befragten noch etwas zu verlängern. Es bietet sich nämlich an, die Schlussfrage ans Ende der inhaltlichen Ermittlungen, aber vor die Erhebung der soziodemographischen Merkmale wie Alter, Geschlecht, Bildungsabschluss usw. zu stellen. Man sollte die Schlussfrage mit einer Einleitungsfloskel wie „Eine Frage zum Schluss“ auch ausdrücklich als solche ankündigen. Die nachfolgenden statistischen Ermittlungen werden dann schon nicht mehr als Bestandteil des eigentlichen Interviews wahrgenommen, sondern als unvermeidliche Formalitäten zum Ende des Verfahrens. Meist sind diese statistischen Ermittlungen dann noch ausführlicher, als die Befragten erwarten. Sie können durchaus noch einmal 20, 30 Fragen umfassen. Deswegen ist es umso wichtiger, dass der Befragte vorher die Gewissheit erhält, dass es nun wirklich nicht mehr lange dauern kann. Inhaltlich bietet sich für die Abschlussfrage eine pauschale Frage an, die auch als inhaltlicher <?page no="93"?> Formenlehre 94 Abschluss des vorangegangenen Themas empfunden wird. Oder aber man wählt ein etwas spielerisches Thema, das aber, anders als bei der Eisbrecherfrage, durchaus auch einen etwas persönlicheren Charakter haben kann, denn zu diesem Zeitpunkt des Interviews muss ja nicht mehr vorsichtig Vertrauen zwischen dem Interviewer und dem Befragten aufgebaut werden. Fragebeispiel 7 zeigt eine solche, etwas „ernstere“ Schlussfrage, Beispiel 8 eine leichtere Variante, die aber immer noch für eine Eisbrecherfrage wohl etwas zu persönlich wäre. Fragebeispiel 7 Schlussfrage am Ende eines Interviews mit politischen Themen „Eine Frage zum Schluss: Fühlen Sie sich im Allgemeinen eher als Deutscher oder als Westdeutscher/ Ostdeutscher? “ 1 (Falls: „Beides gleich“: „Was überwiegt? “) EHER ALS DEUTSCHER ............................................. 1 EHER ALS WEST- / OSTDEUTSCHER....................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6036) Fragebeispiel 8 „Spielerische“ Schlussfrage „Eine Frage zum Schluss: Nach jüngsten Forschungen gab es möglicherweise Leben auf dem Mars: Glauben Sie persönlich, dass es intelligentes Leben auf irgendeinem Planeten des Sonnensystems gibt? “ GLAUBE ICH ................................................................. 1 GLAUBE ICH NICHT..................................................... 2 UNENTSCHIEDEN, WEISS NICHT ............................. 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6037) 1 Je nachdem, ob das Interview in den alten oder neuen Bundesländern stattfindet, wird die Variante „Westdeutscher“ oder „Ostdeutscher“ vorgelesen. <?page no="94"?> Fragen zur Steuerung des Interviews 95 Andere Fragetypen, mit deren Hilfe die Interviewatmosphäre beeinflusst und die Aufmerksamkeit der Befragten wachgehalten werden soll, wurden schon an anderer Stelle behandelt. Als Puffer- oder Ablenkungsfragen, die zwischen zwei Fragenkomplexen eingefügt werden, von denen man fürchtet, dass sie sich sonst gegenseitig beeinflussen könnten, sind im Prinzip alle Fragen geeignet, die sich einem anderen Thema widmen als die Fragen, die voneinander getrennt werden sollen. Spezielle Fragemodelle hierfür gibt es nicht. Auch Spielfragen stellen keinen gesonderten Fragentypus dar. Der Notwendigkeit, das Interview abwechslungsreich zu gestalten, wird man in den meisten Fällen mit einem lebendigen Themenwechsel genügen. Widmet sich der Fragebogen nur einen Thema und wäre ohne eine inhaltliche Abwechslung zu monoton, wird man ihn durch die Aufnahme von Fragen zu einem zusätzlichen Thema auflockern. Man kann sagen, dass alle Fragen Spielfragen sind, die sich einem Thema widmen, das nicht der eigentliche Gegenstand der Untersuchung ist. Lediglich zwei Regeln sind bei der Gestaltung von Spielfragen zu beachten. Erstens sollten die Themen nicht ihrerseits belastend sein und allzu viel Konzentration fordern. Stattdessen sollten sie wie bei Eisbrecher- und Schlussfragen thematisch und auch vom Fragemodell her eher einfach gestaltet sein. Schließlich sollen sie den Befragten eine kurze Pause zwischen zwei kognitiven Anstrengungen gewähren. Zweitens sollten die thematischen Wechsel nicht allzu kühn ausfallen. Man kann viele Gedankensprünge sprachlich gut abfedern, indem man eine Frage zu einem neuen Thema mit einer Einleitungsfloskel wie „Und jetzt zu etwas ganz anderem“ beginnt. Die thematischen Wechsel müssen auch nicht auf den ersten Blick plausibel erscheinen, doch sie dürfen auch nicht grotesk wirken. Wer nach einem langen Fragenkomplex über die Finanzpolitik plötzlich nach Ufos fragt und dann nach zwei Fragen zur Finanzpolitik zurückkehrt, darf sich nicht wundern, wenn sich die Befragten verschaukelt vorkommen. Benötigt man die Fragen nach den Ufos zu analytischen Zwecken, etwa als Indikatorfrage (dazu mehr unten), was durchaus sein kann, stellt man sie besser als Schlussfragen. Nur sehr selten kommen bei Repräsentativumfragen sogenannte Trainingsfragen zur Anwendung. Mit ihnen versucht man, die Befragten an komplizierte Fragebogenmodelle zu gewöhnen, die besondere <?page no="95"?> Formenlehre 96 Konzentration verlangen und bei denen sonst die Gefahr von Missverständnissen und damit von Fehlern bei der Beantwortung bestünden. Das ist beispielsweise bei längeren, aus der Psychologie entlehnten Tests der Fall, bei denen eine größere Zahl von Begriffen unter Zeitdruck verschiedenen Kategorien zugeordnet werden muss. Die Methode, solche komplizierten Fragemodelle zunächst an einem Beispiel spielerisch einzuüben, bevor sie dann auf das eigentlich interessierende Thema angewandt werden, wird vor allem bei Laborexperimenten der Psychologie genutzt. Bei Repräsentativumfragen spielt diese Technik deswegen nahezu keine Rolle, weil die komplexen Fragemodelle, die mit Trainingsfragen eingeübt werden sollen, viele Befragten auch nach einer solchen Übung noch überfordern würden. Hier ist an die oben ausführlich beschriebene Regel zu erinnern, dass eine Frage bei einer quantitativen Befragung sofort und unmittelbar verstanden werden muss. Andernfalls erhält man auch mit aufwendigen Handlungsanweisungen keine verlässlichen Resultate. Von zentraler Bedeutung für den reibungslosen Ablauf eines Interviews sind Intervieweranweisungen. Wenn sichergestellt werden soll, dass tatsächlich alle Interviews einer Umfrage einheitlich und damit vergleichbar ablaufen, bedarf es einer Vielzahl von Verhaltensanweisungen für den Interviewer. Diese Anweisungen müssen im Fragebogen an der Stelle stehen, an der sie relevant sind. Es reicht nicht aus, die Anweisungen zu einer Art Gebrauchsanleitung zu bündeln und dem Begleitschreiben zum Fragebogen beizufügen. Während des Interviews muss der Interviewer jederzeit wissen, was zu tun ist, ohne nachschlagen zu müssen. Intervieweranweisungen reichen von Leseregeln bei Fremdwörtern („Eine Frage zu Bill Gates [sprich: ‚Gäits’] ...“) über einfache Anweisungen zum Fortgang des Interviews („Interviewer: Jetzt bitte das gelbe Bildblatt 5 überreichen“) bis hin zu ausführlicheren Regieanweisungen („Interviewer: Bitte jetzt das gelbe Bildblatt 5 überreichen, dem Befragten Zeit zum Betrachten geben. Dann das hellgrüne Kartenspiel gründlich mischen und ebenfalls überreichen ...“). Der wahrscheinlich wichtigste Fragentyp zur Steuerung von Interviews ist die Filterfrage. Mit Filterfragen werden Merkmale der Befragten ermittelt, von denen es abhängt, wie das Interview fortgeführt wird. Enthält beispielsweise ein Fragebogen eine Frageserie zum Berufsleben, so wird der Frageserie die Frage „Sind Sie berufstätig? “ vorangestellt. <?page no="96"?> Fragen zur Steuerung des Interviews 97 Antwortet der Befragte mit „Ja“, werden die betreffenden Fragen gestellt, antwortet er mit „Nein“, wird der Interviewer angewiesen, den Fragenkomplex zu überspringen und das Interview weiter unten im Fragebogen fortzusetzen. Man erkennt, dass Filterfragen stets mit konkreten Intervieweranweisungen gekoppelt sind, es sei denn, es handelt sich um eine computergestützte Umfrage. Hier sorgt die Programmierung dafür, dass die zu überspringenden Fragen gar nicht erst auf dem Bildschirm erscheinen. Zum Einsatz kommen Filterfragen vornehmlich bei persönlichen, Telefon- und Online-Umfragen. Auch bei schriftlichen Befragungen kommen sie gelegentlich zum Einsatz, sind hier aber fehleranfällig, weil die Befragten ja selbst die entsprechenden Anweisungen befolgen müssen. In der Regel sollte versucht werden, bei Fragebogen zum Selbstausfüllen auf Filterführungen zu verzichten. Gelegentlich findet man in der Literatur den Hinweis auf Ausgleichsfragen (Tscheulin/ Helmig 2004, S. 33). Damit sind Fragen gemeint, die den bei Filterfragen ausgeschiedenen Befragten als Ersatzfragen gestellt werden. In der Praxis kommen solche Ausgleichsfragen jedoch so gut wie nie zur Anwendung. Das Überspringen einiger Fragen ist für Interviewer wie für Befragte in aller Regel eine willkommene Abkürzung des Interviews, die die Beantwortung anderer Fragen nicht messbar beeinflusst. Ausgleichsfragen sind damit praktisch immer überflüssig. Fragebeispiel 9 zeigt eine Filterfrage aus einer Repräsentativbefragung zum Thema Brillen. Sie ist gleichzeitig ein Beispiel für einen Fragentypus, der immer dann zur Anwendung kommt, wenn die Möglichkeit besteht, es aber nicht sicher ist, dass der Interviewer zum Fragezeitpunkt die richtige Antwort bereits kennt: die informelle Frage. Informell bedeutet, dass es dem Interviewer freigestellt wird, ob er die Frage stellt oder ob er die ihm bereits bekannte Antwort in den Fragebogen einträgt, ohne die Frage zu stellen. Streng genommen bedeutet eine solche informelle Frage eine Aufweichung des Prinzips der Standardisierung, wonach möglichst jede Frage jedem Befragten in exakt der gleichen Form vorgelegt werden sollte. Doch Fragebeispiel 9 zeigt deutlich, warum eine solche Abweichung von der sonst strikt zu befolgenden Regel notwendig sein kann: Trägt der Befragte während des Interviews eine Brille, ist die Frage offensichtlich überflüssig. Handelt es sich um eine sehr dicke oder auffällige Brille, kann die Frage sogar Irritationen hervorrufen oder gar <?page no="97"?> Formenlehre 98 als Beleidigung empfunden werden. Trägt der Befragte dagegen keine Brille, kann auf die Frage nicht verzichtet werden, denn es ist ja denkbar, dass er gelegentlich eine Brille trägt und nur beim Interview darauf verzichtet hat. Fragebeispiel 9 Informelle Filterfrage INFORMELL: „Sind Sie Brillenträger, ich meine, tragen Sie ständig oder gelegentlich eine Brille - abgesehen von normalen Sonnenbrillen oder Schutzbrillen? “ JA, TRAGE STÄNDIG EINE BRILLE............................ 1 JA, GELEGENTLICH EINE BRILLE ............................. 2 NEIN............................................................................... 3* ____________________________________________ *Gleich übergehen zu Frage Nr. XY (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10028) Gelegentlich kommt es vor, dass mit einer Filterfrage nicht Personen aus der Gesamtheit der Stichprobe „herausgefiltert“ werden sollen, bei denen bestimmte Fragen übersprungen werden sollen, sondern manchmal benötigt man einen Filter dazu, die Befragten auf zwei verschiedene Fragebogenstränge zu verteilen. Auch hierzu gibt es ein Beispiel aus der Untersuchung zum Thema Brillen, aus der schon das letzte Beispiel entnommen war. Im vorliegenden Fall wird der Filter allerdings nicht durch eine Frage an den Befragten gesetzt, sondern durch eine Interviewer-Einstufung, man kann auch sagen: eine Frage an den Interviewer. Dieses Modell wird immer dann gewählt, wenn dem Interviewer die Antwort bereits aus einer früheren Frage bekannt ist. Das ist häufig bei Mehrthemenumfragen der Fall, bei denen an verschiedenen Stellen auf dasselbe Untersuchungsthema zurückgekommen wird. Im vorliegenden Fall waren nach der in Fragebeispiel 9 dargestellten Filterfrage einige Fragen zum Brilletragen gestellt worden, dann folgten Fragenkomplexe zu anderen Themen. Mit der in Beispiel 10 <?page no="98"?> Fragen zur Steuerung des Interviews 99 gezeigten Interviewer-Einstufung kehrte der Fragebogen dann zum Thema Brilletragen zurück. Nach der Interviewer-Anweisung teilte sich das Interview in zwei mögliche Stränge, im gedruckten Fragebogen sinnvollerweise durch zwei Spalten repräsentiert (bei computergestützten Umfragen regelt dies natürlich die Programmierung im Hintergrund). Je nachdem, ob der Befragte eine Brille trug oder nicht, wurde das Interview in der linken oder rechten Spalte fortgesetzt. Fragebeispiel 10 Interviewer-Einstufung und Zweiteilung des Interviews INTERVIEWER-EINSTUFUNG nach Fragebeispiel 9: Trägt der/ die Befragte ständig oder gelegentlich eine Brille? JA, STÄNDIG EINE BRILLE ...................................... 1* JA, GELEGENTLICH EINE BRILLE .......................... 2* NEIN............................................................................ 3*** a) „Sind Sie persönlich, wie b) „Sind Sie persönlich mit Sie mit Ihrer Brille sehen können, Ihren Augen, ich meine, wie zufrieden? Würden Sie sagen ...“ Sie sehen können, zufrieden? Würden Sie sagen ...“ „vollkommen zufrieden“ ..................... 1 „vollkommen zufrieden“............. 1 „im Großen und Ganzen „im Großen und Ganzen zufrieden“ ........................................... 2 zufrieden“................................... 2 „nicht so zufrieden“ ............................ 3 „nicht so zufrieden“.................... 3 „gar nicht zufrieden“ ........................... 4 „gar nicht zufrieden“ .................. 4 UNENTSCHIEDEN ............................ 5 UNENTSCHIEDEN ................... 5 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10028, geringfügig abgewandelt) * *** <?page no="99"?> 100 4.3 Verwendungszwecke offener Fragen Wollte man eine systematische Typologie aller Fragetypen erstellen, dann müsste man als Erstes mit der grundsätzlichen Unterscheidung zwischen offenen und geschlossenen Fragen anfangen. Sie bildet gleichsam die erste Verzweigung des Evolutionsbaumes der Fragetypen. Bei den meisten in diesem Buch präsentierten Beispielen handelt es sich um geschlossene Fragen, das heißt, es wird nicht nur eine Frage gestellt, sondern es wird auch eine begrenzte Zahl von Antwortmöglichkeiten vorgegeben, unter denen der Befragte auswählen kann. Dabei gibt es eine Vielzahl von verschiedenen Formen, wie sich diese Antwortmöglichkeiten strukturieren lassen, doch gemeinsam ist allen diesen Fragen, dass die Befragten ihre Antwort nicht frei formulieren können. Diese Art der vorstrukturierten Frage ist dem oben ausführlich behandelten Prinzip der Standardisierung geschuldet, doch sie bedeutet eigentlich eine Abweichung von dem Ideal, wonach ein Interview einer Alltagskonversation möglichst nahe kommen sollte. Die ursprünglichste Form der Frage ist die offene Frage, bei der die Antwortmöglichkeiten nicht vorformuliert sind. Es ist ganz normal, wenn ein Gastwirt seinen Gast fragt: „Wie hat das Essen geschmeckt? “ Es wäre dagegen befremdlich, wenn er fortfahren würde: „Würden Sie sagen sehr gut, gut, weniger gut oder gar nicht gut? “ Fast niemand stellt im persönlichen Gespräch seinem Gegenüber geschlossene Fragen. Wozu auch? Der Gast wird die Frage leicht mit seinen eigenen Worten beantworten können, und er wird wahrscheinlich auch, je nach der konkreten Situation, von sich aus auf Einzelheiten eingehen wollen, die nicht ausdrücklich erfragt wurden: ob das Fleisch zäh war, die Nudeln zerkocht usw. Eine vorformulierte Antwortvorgabe würde den Gast dieser Möglichkeit berauben und damit die Lebendigkeit des Gesprächs von vornherein einschränken. Selbst der Logik nach geschlossene Fragen wie „Hast Du eben den Mann dort gesehen? “ werden ja in der Regel nicht mit der Absicht gestellt, dem Angesprochenen ein trockenes „Ja“ oder „Nein“ zu entlocken, sondern sie sind die Aufforderung, einen umfangreicheren Kommentar über den betreffenden Mann abzugeben. Im privaten Ge- <?page no="100"?> Verwendungszwecke offener Fragen 101 spräch werden geschlossene Fragen allenfalls gelegentlich als Drohung verwendet: „Jetzt aber keine Ausreden mehr: Ich will es klipp und klar wissen: ja oder nein? “ Aus allen diesen Gründen könnte man zunächst annehmen, die offene Frage sei auch im sozialwissenschaftlichen Interview die beste Form der Informationsermittlung, doch das ist ein Irrtum. Die Verwendung dieses Fragetypus bleibt auf wenige Spezialfälle beschränkt. Der Hauptgrund dafür liegt in der Tatsache begründet, dass offene Fragen, auch wenn sie allen Befragten im gleichen Wortlaut präsentiert werden, das Prinzip der Standardisierung aufweichen, also die Regel, wonach alle Antworten möglichst auf der gleichen Grundlage beruhen, als Reaktion auf die gleichen Signale erfolgen sollten, damit sie miteinander verglichen und gezählt werden können. Wie kann eine Frage, die allen Befragten in identischer Form gestellt wird, doch dazu führen, dass die Antworten auf verschiedener Grundlage gegeben werden? Die Antwort lautet, dass nicht nur die Frage, sondern auch die vorgegebenen Antwortmöglichkeiten dazu beitragen, den Frageinhalt klar zu fokussieren. Stellt man beispielsweise die Frage: „Was ist Ihre Meinung zu Bundeskanzlerin Merkel? “, hat das zur Folge, dass ein Befragter an die Politik der Bundesregierung denkt, der zweite sich mit den Persönlichkeitseigenschaften und ein dritter mit dem äußeren Erscheinungsbild der Bundeskanzlerin beschäftigt. Der Pionier der Sozialforschung Hans Zeisel hat deswegen bereits in seinem berühmten Handbuch „Say it with Figures“ aus dem Jahr 1947 auf die Multidimensionalität der offenen Frage hingewiesen. Er benutzte dazu ein Beispiel aus der Marktforschung. Auf die Frage, warum Frauen eine spezielle Gesichtscreme benutzten, habe es unter anderem die folgenden Antworten gegeben: „Frl. A: Ich hörte Radiowerbung für die Creme. Frl. B: Ich habe eine sehr fette Haut, und diese Creme soll sie trocken halten. Frl. C: Ich habe eine trockene Haut, und der Drogist sagte mir, dass diese Creme sie feucht halten würde. Frl. D: Man sagte mir, sie habe einen angenehmen Geruch.“ Und Zeisel fuhr fort: „Zwei Dinge sind (...) offensichtlich: Einmal, dass jede der Befragten uns nur einen Teil von dem sagte, was wir wissen <?page no="101"?> Formenlehre 102 wollen. Und zum anderen, dass die Antworten sich auf verschiedene Dimensionen von Gründen beziehen: auf das Medium, durch das auf die Creme aufmerksam gemacht wurde, auf die Eigenschaften der Creme und so fort“ (Zeisel 1970, S. 146-147). Zeisels Beispiel zeigt, warum die Mehrdimensionalität offener Fragen es oft unmöglich macht, aus den Antworten ein quantitativ verlässliches Ergebnis zu gewinnen: Wenn 30 Prozent der von ihm befragten Frauen angeben, sie hätten sich zum Kauf der Gesichtscreme entschieden, weil sie die Werbung im Radio gehört haben, bedeutet das nicht, dass die Radiowerbung nur bei 30 Prozent der Kundinnen zur Kaufentscheidung beigetragen hat. Es waren nur 30 Prozent, die bei der Frage zuerst oder in erster Linie an die Radiowerbung gedacht haben. Unter denen, die auf die Frage mit Verweisen auf die Eigenschaften der Creme antworteten, können viele weitere sein, die durch die Werbung auf das Produkt aufmerksam gemacht wurden, während umgekehrt die Kundinnen, die sich an die Radiowerbung erinnern, sicherlich auch einiges über die Eigenschaften der Creme zu sagen hätten. Würde man dagegen alle denkbaren Gründe für den Kauf der Creme auf einer Liste aufführen und sie den Befragten überreichen, würden sich viele von ihnen daran erinnern, dass es ja nicht nur die Eigenschaften der Creme waren, die den Kauf herbeigeführt hatten, sondern auch die Werbung und umgekehrt. Weil die Antwortvorgaben bei allen Befragten den gleichen „Frame“ setzen, also die gleichen Antwortmöglichkeiten vor Augen führen, stellen sie erst, und nicht die Frage allein, die Vergleichbarkeit und damit die Verlässlichkeit der Antworten her. Man spricht in einem solchen Zusammenhang von der „gestützten Erinnerung“ mithilfe der Antwortvorgaben im Gegensatz zur „ungestützten Erinnerung“, die mit der offenen Frage ermittelt wird. Ein weiteres Problem offener Fragen ist, dass sie weniger eloquente oder weniger geistesgegenwärtige Befragte gegenüber redegewandteren Personen benachteiligen. Die Beantwortung offener Fragen verlangt von den Befragten, dass sie ihre Antwort selbst formulieren. Das ist bei sehr einfachen Fragegegenständen sicherlich keine besondere Schwierigkeit, bei den komplexen Themen der Sozialwissenschaften oft aber eine erhebliche Herausforderung. Abbildung 8 zeigt, wie sehr diese beiden Effekte, die Formulierungshürde und die geringere Aktivierung von implizit vorhandenem Wissen in der ungestützten Ermittlung, das <?page no="102"?> Verwendungszwecke offener Fragen 103 Ergebnis einer Repräsentativumfrage beeinflussen können. Es lässt sich in dem vorliegenden Fall nicht im nachhinein feststellen, welchen Anteil die beiden Effekte am Gesamtergebnis haben, doch es wird deutlich, dass die Interpretation des Ergebnisses sehr unterschiedlich ausfallen dürfte, je nachdem, welche Fragevariante zugrunde gelegt wird. Die Frage betrifft inhaltlich eine intensive politische Debatte aus dem Jahr 2002. Bundeskanzler Schröder hatte im damaligen Bundestagswahlkampf unter dem Stichwort des „deutschen Weges“ propagiert, dass die deutsche Außenpolitik stärker als zuvor ihre Entscheidungen unabhängig von den Wünschen der Bündnispartner und vor allem der Vereinigten Staaten treffen sollte. Trotz der zahlreichen Nachteile, die dieser Fragetyp mit sich bringt, gibt es einige Gelegenheiten, bei denen der Einsatz einer offenen Frage unvermeidlich ist, beispielsweise wenn in einer Untersuchung das aktive Wissen der Befragten getestet werden soll. In diesem Fall wäre es falsch, die richtige Antwort im Fragebogen vorzugeben, selbst dann, wenn die Antwortvorgaben nicht vorgelesen werden und, wie es bei persönlichen Interviews meist der Fall ist, die Interviewer angewiesen werden, den Befragten nicht in den Fragebogen schauen zu lassen. In der Praxis lässt es sich nicht vermeiden, dass die Befragten dem Interviewer doch über die Schulter schauen, mit entsprechenden Einflüssen auf die Ergebnisse (Noelle-Neumann/ Petersen 2005, S. 129; Petersen 2002, S. 193-201). Hinzu kommt, dass das aus Quizsendungen im Fernsehen bekannte Multiple-Choice-Format, das den Befragten mehrere Antworten zur Auswahl vorlegt, dazu führt, dass viele Befragte die richtige Antwort einfach erraten. Damit taugt das Verfahren nicht einmal zur Messung passiven Wissens, denn selbst wer vollkommen ahnungslos ist und die Antwort im Geiste auswürfelt, liegt bei vier Antwortvorgaben mit einer Wahrscheinlichkeit von immerhin 25 Prozent richtig. Der zweite Untersuchungszweck, der den Einsatz offener Fragen verlangt, ist die Messung spontaner Reaktionen, etwa wenn geprüft werden soll, welche Gedanken einem Befragten beim Anblick eines bestimmten Produkts als Erstes durch den Kopf gehen, und es keine von vornherein überschaubare Bandbreite möglicher Reaktionen gibt. Einen solchen Fall zeigt Fragebeispiel 11. Offene Fragen werden deswegen oft bei aus der Psychologie entlehnten und für die Bedürfnisse der Umfrageforschung angepassten Testverfahren angewandt (siehe <?page no="103"?> Formenlehre 104 z. B. Noelle-Neumann/ Petersen 2005, S. 171-189; Ring 1992). Sie sind in erster Linie ein Mittel der Exploration, sehr geeignet für qualitative Vorstudien zu größeren Untersuchungen, bei denen weniger die quantitative Auswertung im Mittelpunkt der Betrachtung steht als die Erkenntnis, welche inhaltlichen Dimensionen das zu untersuchende Thema überhaupt annehmen kann. Abbildung 8 Gestützte und ungestützte Erinnerung Frage an Personen, die vom Stichwort des „deutschen Weges“ gehört haben: Variante 1: „Was glauben Sie: Was meint Schröder, wenn er vom ‚deutschen Weg’ spricht? Könnten Sie mir das in wenigen Worten sagen? “ Variante 2: „Was glauben Sie: Was meint Schröder, wenn er vom ‚deutschen Weg’ spricht? Können Sie mir das nach dieser Liste sagen? “ (Listenvorlage) Variante 1 (offene Frage) Befragte mit einfacher Schulbildung Variante 2 (Liste) Befragte mit einfacher Schulbildung - Auszug aus den Angaben - % - Auszug aus den Angaben - % Eigene deutsche Interessen durchsetzen gegen andere Länder, eigene deutsche Ideen verwirklichen 35 Dass Deutschland seine außenpolitischen Entscheidungen eigenständig trifft, teilweise auch gegen die Wünsche der USA oder der europäischen Staaten 85 Weiß nicht 65 Weiß nicht 15 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7027, August 2002. Dank an Wilhelm Haumann für den Hinweis) <?page no="104"?> Verwendungszwecke offener Fragen 105 Aus diesem Grund werden offene Fragen - das ist der dritte wichtige Verwendungszweck - immer dann eingesetzt, wenn man sich mit einer Untersuchung auf inhaltliches Neuland begibt. Hier ist man darauf angewiesen, zunächst einmal mit einer offenen Frage eine möglichst große Bandbreite von Reaktionen einzusammeln, bevor man sich an die Formulierung geschlossener Fragen macht. Verzichtet man auf diesen Zwischenschritt und beginnt man gleich mit der Formulierung geschlossener Fragen, läuft man Gefahr, dass man wesentliche Aspekte des Themas übersieht. Andere in der Literatur gelegentlich genannte Verwendungszwecke wie die Prüfung des Sprachgebrauchs oder die Feststellung der Aktualität eines Themas (Noelle-Neumann/ Petersen 2005, S. 130) spielen in der Praxis eine geringere Rolle. Meist lässt sich hier die offene Frage durch besser zu handhabende geschlossene Fragen ersetzen. Fragebeispiel 11 Offene Frage zur Ermittlung spontaner Reaktionen auf ein Plakatmotiv INTERVIEWER überreicht das in Abbildung 9 dargestellte Bildblatt. „Hier ist eine Frau abgebildet, die sich ein Werbeplakat anschaut. Was meinen Sie: Was könnte dieser Frau wohl gerade durch den Kopf gehen? “ ........................................................................................................................... ........................................................................................................................... ........................................................................................................................... ........................................................................................................................... ........................................................................................................................... WEISS NICHT, KEINE ANGABE.................................. 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8693) <?page no="105"?> Formenlehre 106 Abbildung 9 Bildvorlage zu Fragebeispiel 11 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8693) Es gibt noch einen einfachen praktischen Grund, warum meist versucht wird, offene Fragen zu vermeiden: Sie erfordern einen zusätzlichen Arbeitsschritt bei der Datenauswertung, die Verschlüsselung. Die meist mehrere Hundert jeweils individuell formulierten und gegebenenfalls von den Interviewern wörtlich mitprotokollierten Antworten müssen, damit sie sich überhaupt quantitativ auswerten lassen, nachträglich in eine überschaubare Zahl von Kategorien einsortiert werden. Dazu muss ein Kategorienschema entwickelt werden, dass die Struktur ersetzt, die bei geschlossenen Fragen im Vorfeld durch die Formulierung von Antwortkategorien geschaffen wird. Die Regeln, die es bei der Konstruktion eines solchen Kategorienschemas zu beachten gilt, fallen nicht mehr in den Bereich der Fragebogenkonstruktion und sind an anderer Stelle ausführlich beschrieben worden (Noelle-Neumann/ Petersen 2005, S. 377-395). Deswegen soll an dieser Stelle nur <?page no="106"?> Verwendungszwecke offener Fragen 107 kurz darauf hingewiesen werden, dass es sich um einen langwierigen und unter Umständen intellektuell außerordentlich herausfordernden Arbeitsgang handelt. Im Jahr 1994 kam man am Institut für Demoskopie Allensbach auf die Idee, die Befragten bei einer Bevölkerungsumfrage aufzufordern, sie möchten doch einmal den Unterschied zwischen Gleichheit und Chancengleichheit erklären. Die Antworten offenbarten eine heillose Konfusion. Viele Menschen waren mit dem Versuch, ihre meist vagen Gedanken zu diesem Thema in Worte zu fassen, hoffnungslos überfordert. Die Folge war, dass drei Experten am Institut eine Woche lang damit beschäftigt waren, das Verschlüsselungsschema zu erarbeiten und die Antworten von rund 1000 Befragten wenigstens einigermaßen passenden Kategorien zuzuordnen. In seltenen Fällen ergibt sich die Möglichkeit, den Arbeitsgang der nachträglichen Verschlüsselung einzusparen und stattdessen eine sogenannte Feldverschlüsselung durchzuführen. In diesem Fall werden die Antworten auf eine offene Frage noch während des Interviews von den Interviewern in ein Kategorienschema eingeordnet. Bei solchen Fragen handelt es sich also um eine Mischform zwischen offener und geschlossener Frage. Diese Methode kommt immer dann zum Einsatz, wenn der Fragegegenstand eine offene Frage verlangt, die möglichen Antworten aber in der Regel leicht einzuordnen sind. Ein Beispiel ist die Frage nach der Lieblingsfarbe einer Versuchsperson. Es wäre Unsinn, bei einer derart unmissverständlichen und meist leicht zu beantwortenden Frage Antwortkategorien vorzulesen oder gar schriftlich vorzulegen, denn man kann sich auch ohne solche Vorgaben darauf verlassen, dass die Befragten in neun von zehn Fällen einen von etwa zehn verschiedenen Farbtönen nennen. Die Frage wird also den Befragten als offene Frage präsentiert, und die Interviewer tragen die Antworten in das Kategorienschema ein, das im Fragebogen vorgegeben ist. Feldverschlüsselungen können auch dann sinnvoll sein, wenn zu erwarten ist, dass sich die Antworten der Befragten in eine überschaubare Zahl von im Vorfeld bereits bekannten Kategorien werden einsortieren lassen, die Antworten aber selbst sehr unterschiedliche konkrete Formen annehmen können. Das kann beispielsweise bei sehr persönlichen Fragen der Fall sein, wie etwa bei Fragebeispiel 12. Hier wurden die Befragten aufgefordert, den Interviewern von ihren Träumen zu erzählen. In einem solchen Fall ist eine offene Frage angebracht, denn <?page no="107"?> Formenlehre 108 man muss den Befragten den Raum geben, über ihre sehr persönlichen Erlebnisse im Traum mit ihren eigenen Worten zu berichten. Gleichzeitig aber gibt es in Träumen oft wiederkehrende Motive, die sich leicht verschlüsseln lassen. Deswegen bietet in diesem Fall die Feldverschlüsselung die Möglichkeit, der Erinnerung der Befragten freien Lauf zu lassen und dennoch die Antworten zu strukturieren. Fragebeispiel 12 Beispiel für eine Frage zur Feldverschlüsselung „Haben Sie in den letzten Monaten einen Traum gehabt, an den Sie sich noch erinnern? “ Falls „Ja“: „Und wovon haben Sie da geträumt? “ VON DER ARBEIT, VOM BERUF........................................................ 1 VON FAMILIENANGEHÖRIGEN, VERWANDTEN ............................. 2 VOM KRIEG .......................................................................................... 3 VOM TOD .............................................................................................. 4 VON VERSTORBENEN MENSCHEN ................................................. 5 REISEN, FAHREN ................................................................................ 6 VON GELD ............................................................................................ 7 VON SCHLANGEN, SPINNEN, UNGEZIEFER................................... 8 VON VIEL WASSER ............................................................................. 9 DASS ICH FLIEGE ............................................................................... 10 DASS ICH FALLE, ABSTÜRZE............................................................ 11 DASS ICH LAUFE, MICH BEWEGEN WILL UND NICHT KANN ....... 12 DASS ICH VERFOLGT WERDE .......................................................... 13 ANDERE ANGABEN (bitte notieren).................................................... ............................................................................................................... 14 KEINE ANGABE.................................................................................... 15 (Quelle: Noelle-Neumann/ Petersen 2005, S. 383) Allerdings illustriert das Beispiel auch die Grenzen der Möglichkeiten der Feldverschlüsselung. Bei dieser Methode lädt man ja den Interviewern eine anspruchsvolle strukturierende Aufgabe auf, die normalerweise besser von den Forschern selbst übernommen werden sollte. Im <?page no="108"?> Verwendungszwecke offener Fragen 109 vorliegenden Fall haben die Interviewer gegenüber den Forschern in der Zentrale aber den Vorteil, dass sie den unter Umständen ausführlichen und komplizierten Bericht der Befragten unverfälscht hören und nicht, wie das bei einer nachträglichen Verschlüsselung der Fall wäre, aus den mehr oder weniger unvollständigen Interviewprotokollen rekonstruieren müssen. Deswegen ist hier die Feldverschlüsselung der nachträglichen Erstellung eines Schlüsselplans vorzuziehen. Doch das Verfahren ist, weil die Verschlüsselung nicht von Experten vorgenommen wird, fehleranfällig und belastet die Interviewer erheblich. Fragebeispiel 12 zeigt, was man den Interviewern im äußersten Fall noch zumuten kann - und auch das nur in Ausnahmefällen. Am Schluss des Kapitels soll noch kurz auf eine andere, gelegentlich nützliche „Hybridform“ zwischen offener und geschlossener Frage hingewiesen werden: die Ergänzung einer geschlossenen Frage um ein kleines Element der offenen Frage. Das Grundprinzip findet sich auch im Verschlüsselungsschema von Fragebeispiel 12, nämlich die Antwortkategorie 14: „Andere Angaben bitte notieren.“ Ist man sich nicht ganz sicher, ob die Antwortkategorien einer geschlossenen Frage alle wichtigen Dimensionen des angesprochenen Themas abdecken, kann man in vielen Fällen mit einer solchen Ergänzung etwaige unerwartete Antworten gleichsam einfangen. Bei der Auswertung führt man dann eine Strichliste, wie oft die Ergänzungskategorie gewählt wurde und ob dort eine Antwort häufiger vorkommt. In diesem Fall weiß man zumindest, dass die betreffende Antwort auf einen bisher nicht beachteten wichtigen Aspekt des Themas hinweist, wenn man auch keine quantitativ verallgemeinerbaren Angaben über dessen tatsächliche Bedeutung hat, denn erfahrungsgemäß geben sich die allermeisten Befragten mit den ihnen vorgelegten Antwortkategorien zufrieden und machen nur dann zusätzliche Angaben, wenn eine für sie wirklich wichtige Antwortkategorie fehlt. Aus diesem Grund sollte die offene Ergänzung einer geschlossenen Frage auch die Ausnahme im Fragebogen bleiben. Gelegentlich neigen Forscher dazu, vor lauter Angst davor, etwas Wichtiges zu verpassen, an jede Frage die Aufforderung „Anderes bitte angeben“ anzuhängen. Doch jedes Element der offenen Frage bedeutet eine Schwächung des Prinzips der Strukturierung und damit eine Einschränkung der Verallgemeinerbarkeit und Vergleichbarkeit der Ergebnisse. Die ständige Wiederholung der Aufforderung, andere als die vorgege- <?page no="109"?> Formenlehre 110 benen Antworten zu geben, prägt sich dann den Befragten ein und verleitet dazu, die Pfade des strukturierten Interviews zu verlassen. Was aber gravierender ist: Für die Fragebogenkonstrukteure bedeutet die Möglichkeit, die Kategorie zu verwenden, eine ständige Versuchung, das Fragethema nicht gründlich genug zu durchdenken. Bei einem gut konstruierten Fragebogen wird die Kategorie „Anderes bitte angeben“ kaum ausgewählt und ist damit in den allermeisten Fällen auch überflüssig. Sie sollte den wenigen echten Zweifelsfällen vorbehalten bleiben. 4.4 Über zwei einfache Regeln und die Schwierigkeiten, sie einzuhalten Es gibt nur wenige feste Regeln der Frageformulierung, die im ganzen Feld von allen Beteiligten in der privaten wie der akademischen Forschung uneingeschränkt anerkannt werden, und es sollte auch nur wenige solche Regeln geben, denn die Entwicklung von Fragebogen verlangt Fantasie und Kreativität. Konventionen sind da meist nur hinderlich. Im Kapitel über den „tauben Interviewer“ wurde bereits ausführlich beschrieben, welche Probleme es mit sich bringen kann, wenn in der Sozialforschung die Forderung nach der Einhaltung von Regeln nicht mehr an einen konkreten sachlichen Grund geknüpft ist und sich damit gleichsam verselbständigt. Dennoch gibt es ein paar Formulierungsprinzipien, die bei der Fragebogenentwicklung beherzigt werden sollten und über die in der Forschung seit Jahrzehnten weitgehend Einigkeit besteht. Eine dieser Regeln wurde bereits in dem Kapitel über die Sprache des Fragebogens angesprochen: die Notwendigkeit, möglichst jeden Jargon, jede Art der Fachsprache zu vermeiden. Zwei weitere Grundregeln sollen im Folgenden vorgestellt werden: das Prinzip der „balancierten“ Frageformulierung und das Gebot der Eindeutigkeit und der Eindimensionalität. Beide lassen sich leicht erläutern, und so wird auch in wahrscheinlich jedem Handbuch zu den Methoden der Umfrageforschung auf sie verwiesen, sofern es sich überhaupt mit dem Thema der Frageformulierung beschäftigt (z. B. relativ ausführlich in Jacob/ Eirmbter 2000, bes. S. 148-167; Weisberg/ Krosnick/ Bowen 1996, S. 77-102; Noelle-Neumann/ Petersen 2005, S. 130-133; 195-196). Doch <?page no="110"?> Zwei Regeln und ihre Schwierigkeiten 111 der Teufel steckt im Detail. So leicht sich diese Regeln aufstellen lassen, so schwer lassen sie sich in der Forschungspraxis einhalten. Hinzu kommt, dass die Zahl der Ausnahmen, in denen es vorzuziehen ist, mit den Regeln zu brechen, vermutlich kaum geringer ist als die Zahl der Fälle, in denen die Regeln eingehalten werden sollten. Es lohnt sich dennoch, sie etwas genauer zu betrachten, denn sie verdeutlichen grundlegende Mechanismen, die das Antwortverhalten der Befragten wesentlich mitbestimmen. In den Gründerjahren der Umfrageforschung war die einfache Ja- Nein-Frage, oder fachlich korrekt ausgedrückt: die geschlossene Frage ohne ausformulierte Antwortalternative, der mit Abstand am häufigsten verwendete Fragetyp (Smith 1987). Die Pioniere wie George Gallup, Elmo Roper und Archibald Crossley, die die moderne Umfragemethode entwickelten und ihr in den 1930er-Jahren zum Durchbruch verhalfen (siehe hierzu Converse 1987; Noelle 1940; Zetterberg 2008; Frankovic 2012), konstruierten ihre Fragen vermutlich zunächst, wie sie es aus dem Alltagsleben gewohnt waren, ohne sich allzu tiefe Gedanken um etwaige Effekte der Formulierung zu machen. Typische Fragen lauteten: „Finden Sie, dass in einem Betrieb alle Arbeiter in der Gewerkschaft sein sollten? “ oder „Finden Sie, die Vereinigten Staaten sollten öffentliche Äußerungen gegen die Demokratie verbieten? “ Die vorgegebenen Antwortmöglichkeiten lauteten jeweils „Ja“, „Nein“ und allenfalls noch „Unentschieden“. Manche Fragen aus dieser Zeit haben bis in die Gegenwart überlebt, obwohl sie nicht den heute anerkannten Regeln der Frageformulierung folgen. Der bekannteste Fall ist die bereits in den 30er-Jahren von Gallup und seit den frühen 50er-Jahren auch in Deutschland immer wieder gestellte Frage: „Glauben Sie, dass man den meisten Menschen vertrauen kann? “ Die Möglichkeit, einen Trendvergleich über mehr als sechs Jahrzehnte vorzunehmen, wiegt hier schwerer als die Schwächen der Formulierung (vgl. Petersen 2012a). Doch bereits in den frühen 1940er-Jahren wiesen Donald Rugg, Hadley Cantril und andere Forscher mit zahlreichen Fragebogenexperimenten nach, dass solche „unbalancierten“ Fragen, bei denen sich der Befragte zwischen zwei möglichen Alternativen (nämlich zum Beispiel, ob man den meisten Menschen vertraut oder nicht vertraut) entscheiden muss, von denen aber nur eine im Fragetext ausdrücklich genannt ist, zu erheblichen Verzerrungen in den Ergebnissen führen können <?page no="111"?> Formenlehre 112 (Rugg 1941; Cantril 1944, S. 36). Die Befunde sind später wiederholt bestätigt worden (Noelle-Neumann/ Petersen 2005, S. 132). Dass dieser Effekt im Extremfall die Gesamtaussage eines Umfrageergebnisses ins Gegenteil verkehren kann, zeigt Abbildung 10. Sie gibt das Ergebnis eines Experiments wieder, das in eine Repräsentativumfrage unter Hausfrauen eingebaut war. Der einen Hälfte der Befragten wurde die unbalancierte Frage ohne Antwortalternative vorgelesen, der anderen Hälfte die balancierte Frage, in der beide Antwortmöglichkeiten, unter denen sich die Befragten entscheiden sollten, ausformuliert waren. Abbildung 10 Balancierte und unbalancierte Formulierung Frage an nicht berufstätige Hausfrauen: Gruppe A: „Würden Sie eigentlich gern berufstätig sein, wenn es möglich wäre? “ Gruppe B: „Würden Sie eigentlich gern berufstätig sein, oder machen Sie am liebsten nur Ihren Haushalt? “ Gruppe A (Alternative nicht ausformuliert) % Gruppe B (Alternative ausformuliert) % Es möchten gern berufstätig sein 52 38 Es möchten nicht berufstätig sein / machen lieber nur den Haushalt 32 46 Unentschieden 16 ___ 100 16 ___ 100 n = 295 292 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2090, Februar 1972) <?page no="112"?> Zwei Regeln und ihre Schwierigkeiten 113 Warum führt die balancierte Fragevariante zu anderen Ergebnissen als die inhaltlich eigentlich identische einseitige Formulierung? Es spricht viel dafür, dass hier die bereits oben im anderen Zusammenhang beschriebenen Heuristiken, also die gedanklichen Abkürzungsstrategien die entscheidende Rolle spielen, die viele Befragte bei der Formulierung ihrer Antwort unbewusst anwenden. Es wird nicht die Antwort ausgewählt, die nach sorgfältigem Wägen als die richtige angesehen würde, sondern die erstmögliche einigermaßen befriedigende. Am Beispiel der in Abbildung 10 wiedergegebenen Fragen lässt sich leicht nachvollziehen, welche Gedankengänge bei vielen Befragten mutmaßlich zur Antwortfindung führen. Die einseitig formulierte Frage „Würden Sie gern berufstätig sein, wenn es möglich wäre? “ führte bei vielen Hausfrauen zu der nahe liegenden, aber auch oberflächlichen Überlegung, dass dies doch eigentlich manchmal ganz nett wäre. Ein näheres Nachdenken über die Konsequenzen fand nicht statt. Die Antwort „Ja“ war damit schnell gefunden und als solche auch nicht falsch. Doch das Ziel der Umfrageforschung ist meistens, die Realität so wirklichkeitsgetreu wie irgend möglich abzubilden, und im realen Leben ist die Entscheidung, ob man nach einer Zeit als Hausfrau in den Beruf zurückkehrt oder nicht, eine folgenreiche Lebensentscheidung, bei der oft die Vor- und Nachteile länger gegeneinander abgewogen werden müssen, bevor man sich zu einem Entschluss durchringt. Die konkrete Entscheidungssituation kann man im Interview nicht simulieren, doch man kann, wie es bei der tatsächlichen Lebensentscheidung auch der Fall ist, die Konsequenzen der Entscheidung ins Bewusstsein heben: Entweder man ist berufstätig, oder man macht nur seinen Haushalt. Das eine folgt (jedenfalls in aller Regel) logisch aus dem anderen, doch es ist, wenn die Alternativen nicht ausdrücklich ausgesprochen werden, nicht gleichermaßen im Bewusstsein präsent. Wegen der beschriebenen heuristischen Urteilsfindung haben im Fragetext ausdrücklich angesprochene Antwortalternativen eine deutlich größere Chance, ausgewählt zu werden, als nicht angesprochene, lediglich implizit gefolgerte. Die einfache Konsequenz aus diesem Verhalten ist, dass jede Antwortalternative, die für den Befragten eine aktive Entscheidung bedeutet, im Fragetext möglichst gleichgewichtig erwähnt werden sollte. Man fragt nicht: „Sind Sie mit der Politik von Bundeskanzlerin Merkel einverstanden? “, sondern man fragt: „Sind Sie mit der Politik von Bundeskanzlerin <?page no="113"?> Formenlehre 114 Merkel einverstanden oder nicht einverstanden? “, obwohl beide Fragevarianten logisch das Gleiche bedeuten und die Ergänzung auf den ersten Blick deswegen überflüssig erscheint. Doch Abbildung 10 zeigt auch, warum es so schwierig ist, diese scheinbar einfache Regel zu befolgen. Präsentiert man das Beispiel Studenten und fragt sie, welche der beiden Frageformulierungen ihrer Meinung nach die bessere sei, entscheiden sie sich meistens spontan für die erste, weil ihnen die Sprache neutraler erscheint. Bei der balancierten Frage stören sich viele an dem Wort „nur“, das sie als herabwürdigend empfinden - möglicherweise durchaus mit Recht, obwohl sich trotz der Formulierung deutlich mehr Befragte für diese Antwort entschieden, als wenn die Alternative gänzlich fehlte. Was also ist eine „balancierte“ Formulierung, die allen Antwortmöglichkeiten wirklich die gleiche Chance gibt? In ganz einfachen Fällen wie der Frage „Sind Sie mit der Politik von Bundeskanzlerin Merkel einverstanden oder nicht einverstanden? “ fällt die Beantwortung dieser Frage leicht. Doch schon bei etwas weniger stereotypen Formulierungen wird die Entscheidung schwer. Es ist dann eine Frage des Feingefühls, ob man eine einigermaßen neutrale Formulierung findet oder nicht. Auch geübten Forschern gelingt dies oft nicht gänzlich befriedigend. Noch problematischer ist, dass sich die Regel zwar bei einfachen Fragen, bei der den Befragten die Wahl zwischen zwei Alternativen gegeben wird, relativ leicht befolgen lässt, aber was ist, wenn sie zwischen drei, vier oder noch mehr Antwortmöglichkeiten auswählen sollen, wenn vielleicht längere Listen mit Aussagen präsentiert werden? Da kann es unter Umständen sprachlich sehr kompliziert werden, zu jeder Aussage noch die Gegenposition zu präsentieren, was die Frage unnötig belasten würde. Oft gilt es auch, die Meinung zu einer These zu testen, zu der sich nicht leicht eine Gegenposition formulieren lässt. Hinzu kommt, dass es durchaus auch Gelegenheiten gibt, bei denen das sprachliche Ausbalancieren einer Frage dem Erkenntniszweck entgegensteht. Gelegentlich sind sogar massive Suggestivfragen nötig, wenn man einigermaßen verlässliche Ergebnisse erhalten will (dazu unten mehr). Und so finden sich auch in diesem Band viele Beispiele, bei denen das Prinzip der balancierten Formulierung bewusst vernachlässigt wird. Es ist nicht als eisernes Gesetz zu verstehen, sondern als gedankliche Leitlinie, die der Forscher stets im Hinterkopf haben sollte. <?page no="114"?> Zwei Regeln und ihre Schwierigkeiten 115 Die zweite Grundregel der Frageformulierung, über die sich alle Forscher weitgehend einig sind, erscheint noch einfacher und einleuchtender - und sie bereitet in der Praxis noch mehr Probleme. Es handelt sich um die Regel, dass man mit einer Frage stets nur einen einzigen Sachverhalt erfragen sollte und dass dieser Sachverhalt unmissverständlich formuliert sein muss. Es dürfte jedem sofort einleuchten, dass man, wenn man in einer Frage verschiedene inhaltliche Aspekte miteinander vermischt, am Ende nicht weiß, auf welchen der Aspekte der Befragte schließlich reagiert hat. Und ebenso klar ist es, dass die Befragten nur dann sinnvolle Antworten geben können, wenn sie die Fragen auch wirklich verstanden haben. Doch hier liegt die vielleicht größte Schwierigkeit der Fragebogenentwicklung überhaupt: Klar und unmissverständlich formulieren kann nur, wer seinen Fragegegenstand auch wirklich durchdacht hat. Sprachliche und damit auch gedankliche Unschärfen, wie sie im Alltagsgespräch durchaus oft akzeptabel sind, weil man im persönlichen Gespräch meist instinktiv zu wissen glaubt, was mit der unpräzisen Formulierung gemeint ist, machen einen Fragebogen in der Regel unbrauchbar. Die in Fragebeispiel 13 wiedergegebene Frage würde im persönlichen Gespräch wahrscheinlich durchaus funktionieren. Doch da verschiedene Befragte bei der Formulierung ihrer Antwort an unterschiedliche Dinge denken könnten, würde man die Ergebnisse nicht eindeutig interpretieren können. Die bessere Formulierung findet sich in Beispiel Nr. 14. Auch hier bleiben Unschärfen, doch immerhin ist der wichtigste gedankliche Bezugspunkt geklärt: Es geht um staatliche Hilfe, nicht um andere Arten der Familienförderung. Fragebeispiel 13 Beispiel für eine ungenügend präzise Frageformulierung „Wird jungen Familien heute genügend geholfen, oder würden Sie das nicht sagen? “ WIRD GENÜGEND GEHOLFEN .................................. 1 WÜRDE DAS NICHT SAGEN....................................... 2 UNENTSCHIEDEN........................................................ 3 (Beispiel: Wilhelm Haumann) <?page no="115"?> Formenlehre 116 Fragebeispiel 14 Richtige Lösung: Der Bezugspunkt ist geklärt „Werden junge Familien heute vom Staat genügend unterstützt, oder wird da nicht genug getan? “ WERDEN GENÜGEND UNTERSTÜTZT..................... 1 WIRD NICHT GENUG GETAN ..................................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5132) Die Aufgabe, pro Frage nur einen Aspekt eines Themas anzusprechen, ist häufig so schwer zu lösen, weil auch einfache Untersuchungsgegenstände bei näherer Betrachtung oft mehrdimensional sind. Hinzu kommt eine gewisse „Betriebsblindheit“, die umso stärker wird, je mehr Fachwissen man hat. Einem Experten erscheinen viele Dinge selbstverständlich, die aus Sicht der Befragten keineswegs besonders klar sind. Vor einigen Jahren plante ein Augenarzt in Südwestdeutschland eine Befragung unter Kontaktlinsenträgern. Dazu sollten die Befragten in Gruppen eingeteilt werden, abhängig davon, welche Arten von Kontaktlinsen sie benutzten. Also entwarf er die folgende Frage: Fragebeispiel 15 Verletzung des Prinzips der Eindimensionalität „Welche Kontaktlinsenart tragen Sie? “ TAGESLINSEN.............................................................. 1 ZWEI-WOCHEN-LINSEN.............................................. 2 MONATSLINSEN .......................................................... 3 JAHRESLINSEN............................................................ 4 FARBIGE LINSEN ......................................................... 5 WEISS NICHT, KEINE ANGABE.................................. 6 (Beispiel: Cornelius Doniga) <?page no="116"?> Zwei Regeln und ihre Schwierigkeiten 117 Man kann dieser Frage regelrecht die Gedankengänge ansehen, die zu der Formulierung geführt haben: Der Mediziner hatte zunächst die verschiedenen Typen von Kontaktlinsen im Blick, die zur Sehkorrektur getragen werden. Sie machen den mit Abstand größten Teil der in Deutschland verwendeten Linsen aus, und sie waren auch der eigentliche Gegenstand des Interesses. Systematisch und völlig korrekt listete er die verschiedenen Qualitäten auf: Tageslinsen, Zwei-Wochen-Linsen usw. Dann fiel ihm ein, dass es ja auch farbige Linsen gibt, die zu kosmetischen Zwecken verwendet werden. Die waren für ihn nicht von besonderem Interesse, doch da es sich ebenfalls um Kontaktlinsen handelt, beschloss er, sie der Vollständigkeit halber ebenfalls in die Liste aufzunehmen - und bemerkte nicht, dass er damit einen logischen Bruch in die Frage einführte. Die Frage nach der Haltbarkeit der Linsen und die Frage nach ihrer Farbe bewegen sich auf verschiedenen Ebenen: Wenn nun eine Befragte angibt, dass sie farbige Linsen trägt, ist damit immer noch nicht beantwortet, ob es sich um Tageslinsen, Monatslinsen oder andere handelt. Mindestens müsste man bei dieser Frage Mehrfachantworten zulassen (was ohnehin zu empfehlen ist, denn es ist ja nicht auszuschließen, dass jemand abwechselnd verschiedene Linsentypen trägt). Sauberer wäre es aber, beides in getrennten Fragen zu behandeln. Einen ähnlichen logischen Fehler enthält der folgende Fragenentwurf: Fragebeispiel 16 Zwei Fragen in einer „Sind Sie mit der Politik von Bundeskanzlerin Merkel einverstanden, oder hat sich Ihre Meinung über Merkel verschlechtert? “ EINVERSTANDEN ........................................................ 1 HAT SICH VERSCHLECHTERT .................................. 2 UNENTSCHIEDEN, KEINE ANGABE .......................... 3 (Beispiel: Wilhelm Haumann [vom Autor modifiziert]) <?page no="117"?> Formenlehre 118 Das Fragebeispiel mag aus heutiger Sicht etwas gesucht und plump erscheinen, doch es ist keineswegs wirklichkeitsfremd. In bestimmten gesellschaftlichen Situationen werden Fehler wie in Beispiel 16 leicht übersehen. Sie tauchen immer dann auf, wenn ein bestimmtes Antwortmuster oder bestimmte Voraussetzungen für die Beantwortung einer Frage als selbstverständlich angesehen werden, obwohl sie es nicht sind. Im vorliegenden Fall war der Frageentwurf in einer Zeit entstanden, in der das Ansehen der Bundeskanzlerin bei der Bevölkerung schlechter wurde, nachdem es in den Monaten zuvor außerordentlich hoch war. In der Öffentlichkeit hatte es phasenweise den Anschein, als sei praktisch niemand mit der Politik der Bundeskanzlerin unzufrieden. Dieses Meinungsklima spiegelt sich in der Frage, in der als selbstverständlich vorausgesetzt wird, dass die Befragten wenige Monate zuvor noch mit Merkels Politik einverstanden gewesen seien, sodass man nur noch danach fragen müsse, ob sich daran in der Zwischenzeit etwas geändert habe. Doch natürlich ist diese Annahme falsch, eine durch die öffentliche Meinung hervorgerufene „sozialoptische Täuschung“ (vgl. Niedermann 1996, S. 362). Jeder Politiker, selbst wenn er sich auf dem Höhepunkt seiner Popularität befindet, hat in der Bevölkerung zahlreiche Gegner, auch wenn diese in der Öffentlichkeit phasenweise kaum in Erscheinung treten. Bei Fragebeispiel 16 handelt es sich deswegen um zwei Fragen: die, ob man mit der Politik der Bundeskanzlerin einverstanden ist, und die, ob sich die Meinung über sie verändert hat. Deswegen muss die Frage „auseinandergenommen“ und damit gedanklich aufgeräumt werden (Fragebeispiele 17 und 18). Fragebeispiel 17 Lösung: Aus einer Frage werden zwei (I) „Sind Sie mit der Politik von Bundeskanzlerin Merkel einverstanden oder nicht einverstanden? “ EINVERSTANDEN ........................................................ 1 NICHT EINVERSTANDEN............................................ 2 UNENTSCHIEDEN, KEINE ANGABE .......................... 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10049) <?page no="118"?> Zwei Regeln und ihre Schwierigkeiten 119 Fragebeispiel 18 Lösung: Aus einer Frage werden zwei (II) „Und hat sich Ihre Meinung über die Politik von Angela Merkel in den letzten Monaten eher verbessert, eher verschlechtert oder ist sie gleich geblieben? “ EHER VERBESSERT ................................................... 1 EHER VERSCHLECHTERT ......................................... 2 IST GLEICH GEBLIEBEN ............................................. 3 UNENTSCHIEDEN, KEINE ANGABE .......................... 4 (Quelle: eigenes Beispiel) Wie sehr die Notwendigkeit, logisch eindeutige Fragen zu stellen, in der Praxis zu Konstruktionsproblemen führt, weil sie auch mit dem Ziel, möglichst alltagsnah zu formulieren, in Konflikt geraten kann, soll am Beispiel einer Frage erläutert werden, die im Rahmen einer Untersuchung zur materiellen Orientierung der Bevölkerung entstand (Binswanger u. a. 2010). Unter anderem sollte bei dieser Studie ermittelt werden, inwieweit das Gefühl, seine Ziele im Leben erreicht zu haben, zur allgemeinen Lebenszufriedenheit beiträgt. So wurde eine Frage entwickelt, bei der die Befragten aufgefordert wurden, anzugeben, in welchen Lebensbereichen sich ihre Erwartungen alles in allem erfüllt hatten und in welchen nicht. Es handelte sich um eine Kartenspielfrage mit Verteilvorgang, ein Fragemodell, dessen spezifische Vorzüge unten noch beschrieben werden. Den Befragten wurden Karten überreicht, auf denen Dinge standen wie „finanzielle Sicherheit“, „Freude am Beruf“, Gute Freunde“ oder „Ein schönes Haus, eine schöne Wohnung“. Außerdem überreichten die Interviewer ein größeres Blatt Papier, das in der ersten Entwurfsfassung in drei Felder unterteilt war. Das erste Feld war beschriftet mit „Meine Erwartungen wurden da erfüllt“, das zweite mit „Meine Erwartungen wurde da übertroffen“. Auf dem dritten Feld stand „Meine Erwartungen wurden da enttäuscht“. Die Befragten wurden gebeten, die Karten mit den verschiedenen Lebensbereichen auf die drei Felder zu verteilen, je nachdem, was auf sie zutraf. Jede Karte war mit einer Nummer versehen, sodass die Interviewer im Fra- <?page no="119"?> Formenlehre 120 gebogen nur noch die Kartennummern an den betreffenden Stellen einkreisen mussten. Im Fragebogen sah die Frage damit wie folgt aus: Fragebeispiel 19 Frage zum Erfolg im Leben: Erster Entwurf INTERVIEWER überreicht Kartenspiel und Bildblatt! „Sicher ist es kein ganz einfaches Thema, aber jeder Mensch hat ja gewisse Erwartungen an sein Leben. Wie ist das bei Ihnen: Wo, in welchen Bereichen haben sich Ihre Erwartungen erfüllt, und wo sind Ihre Erwartungen übertroffen bzw. enttäuscht worden? Bitte verteilen Sie die Karten entsprechend auf das Blatt. Karten mit Erwartungen, die Sie nicht haben, legen Sie bitte zur Seite.“ ERWARTUNGEN ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN ÜBERTROFFEN / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN ENTTÄUSCHT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / (Quelle: IfD-Umfrage Nr. 10046, nicht dokumentierter erster Entwurf) Noch während der Fragebogenkonferenz fiel auf, dass die Frage inhaltlich unbefriedigend war. Sie wäre nur dann angemessen gewesen, wenn es sich um eine Umfrage unter Menschen an ihrem Lebensende gehandelt hätte, die keine Pläne für die Zukunft mehr haben. Es handelte sich aber um eine Bevölkerungsumfrage, was bedeutete, dass viele Befragte sich in den vorgegebenen Antwortmöglichkeiten nicht wiedergefunden hätten. Was hätte beispielsweise ein ehrgeiziger und für die Zukunft hoffnungsvoller Student sagen sollen? Die allermeisten <?page no="120"?> Zwei Regeln und ihre Schwierigkeiten 121 Studenten haben vor allem ihre materiellen Vorstellungen vom Leben noch nicht erfüllt. Doch dass sie nicht in einem schönen Einfamilienhaus, sondern in einem bescheidenen Zimmer wohnen, bedeutet bei ihnen ja nicht, dass ihre Hoffnungen in dieser Hinsicht enttäuscht worden sind. Sie haben sich nur noch nicht verwirklicht. Für die mutmaßlich vielen Fälle, in denen Vorstellungen nicht erfüllt worden sind, der Befragte aber annimmt, dass sie sich in Zukunft noch erfüllen werden, musste also eine Antwortkategorie hinzugefügt werden. In der überarbeiteten Fassung sah die Frage deswegen so aus: Fragebeispiel 20 Frage zum Erfolg im Leben: Zweiter Entwurf INTERVIEWER überreicht Kartenspiel und Bildblatt! „Sicher ist es kein ganz einfaches Thema, aber jeder Mensch hat ja gewisse Erwartungen an sein Leben. Wie ist das bei Ihnen: Wo, in welchen Bereichen haben sich Ihre Erwartungen erfüllt, wo gehen Sie davon aus, dass sich Ihre Erwartungen noch erfüllen werden, und wo sind Ihre Erwartungen übertroffen bzw. enttäuscht worden? Bitte verteilen Sie die Karten entsprechend auf das Blatt. Karten mit Erwartungen, die Sie nicht haben, legen Sie bitte zur Seite.“ ERWARTUNGEN ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN WERDEN NOCH ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN ÜBERTROFFEN / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN ENTTÄUSCHT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / (Quelle: IfD-Umfrage Nr. 10046/ E, Projekt Denkwerk Zukunft) <?page no="121"?> Formenlehre 122 Mit dieser Überarbeitung war aber, zunächst unbemerkt, ein logischer Fehler in die Frage eingebaut worden: Nun konnte es geschehen, dass manche Befragten nicht mehr wussten, auf welches Feld sie ihre Karte legen sollten. Ob in einem bestimmten Bereich die Erwartungen an das Leben enttäuscht wurden oder nicht und ob man erwartet, dass sich die Wünsche in Zukunft noch erfüllen werden oder nicht, sind zwei logisch voneinander unabhängige Dinge. Jemand, der seit langer Zeit allein lebt und deswegen enttäuscht ist, muss deswegen ja nicht zwangsläufig jegliche Hoffnung auf einen Lebenspartner verloren haben. Und zahlreiche Menschen mit einem für sie unbefriedigenden Einkommen spielen regelmäßig Lotto. Man erkennt, wie rasch es auch professionellen Fragebogenentwicklern passieren kann, dass sich logische Fehler in eine Frage einschleichen. In diesem Fall handelt es sich um den gleichen Fehler wie bei dem oben gezeigten Beispiel zum Thema Kontaktlinsen, nur dass der Fehler an dieser Stelle nicht ganz so leicht zu erkennen ist. Ebenso erkennt man an dem Beispiel, dass es nicht immer leicht ist, eine solche Frage zu reparieren, und dass die Reparatur unter Umständen mit schmerzlichen Kompromissen verbunden sein kann. Die oben präsentierte Methode der Aufteilung in zwei Fragen wäre in diesem Fall unverhältnismäßig aufwendig gewesen. Man hätte einen Teil der Karten zweimal überreichen und darüber hinaus mit Filterfragen arbeiten müssen. Zunächst hätte man fragen müssen: „Wo wurden Ihre Erwartungen erfüllt und wo nicht? “ Dann hätte man die Karten mit den nicht erfüllten Hoffnungen noch einmal überreichen müssen mit der Aufforderung anzugeben, wo man alle Hoffnung aufgegeben hat und wo nicht. Möglich wäre das gewesen, doch das Interview wäre damit nicht unerheblich belastet worden. So wurde schließlich die Entscheidung gefällt, die Antwortkategorie „Meine Erwartungen wurden da enttäuscht“ fallen zu lassen und durch eine Kategorie zu ersetzen, die sich logisch besser in die Gesamtkonstruktion einfügte. Die endgültige Frage sah aus wie in Fragebeispiel 21. Die Befragten wurden nun aufgefordert anzugeben, in welchen Bereichen ihre Erwartungen übertroffen wurden, wo sie „in etwa“ erfüllt wurden, wo sie bisher nicht erfüllt wurden, man aber noch damit rechnet, dass dies in Zukunft geschehen wird, und schließlich, wo die Erwartungen nicht erfüllt wurden und man auch nicht mehr damit rechnet. Damit waren die logischen Schwächen beseitigt, die <?page no="122"?> Zwei Regeln und ihre Schwierigkeiten 123 Befragten konnten nun jede Karte eindeutig zuordnen. Doch der Preis der zumindest einigermaßen sauberen Fragekonstruktion war hoch: Die Frage hatte damit einiges von ihrer unmittelbaren Eingängigkeit, ihrer Lebensnähe verloren. Die neuen Antwortkategorien lagen sprachlich weiter von der Alltagssprache der Menschen entfernt, wirkten mechanischer als bei den früheren Entwürfen. Fragebeispiel 21 Frage zum Erfolg im Leben: Endgültige Fassung INTERVIEWER überreicht Kartenspiel und Bildblatt! „Sicher ist es kein ganz einfaches Thema, aber jeder Mensch hat ja gewisse Erwartungen an sein Leben. Wie ist das bei Ihnen: Wo, in welchen Bereichen wurden Ihre Erwartungen übertroffen, wo wurden sie in etwa erfüllt, wo rechnen Sie damit, dass sie sich in Zukunft noch erfüllen werden, und wo gehen Sie davon aus, dass sie auch in Zukunft nicht erfüllt werden? Bitte verteilen Sie die Karten entsprechend auf das Blatt. Karten mit Erwartungen, die Sie nicht haben, legen Sie bitte zur Seite.“ ERWARTUNGEN ÜBERTROFFEN / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN WURDEN IN ETWA ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN WERDEN IN ZUKUNFT ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ERWARTUNGEN WERDEN NICHT ERFÜLLT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10046) <?page no="123"?> Formenlehre 124 4.5 Die Strukturierung von Antwortmöglichkeiten - Von der Ja-Nein-Frage zur Cafeteria In den vorangegangenen Kapiteln wurden bereits verschiedene Frageformen vorgestellt, die in der Umfrageforschung zur Anwendung kommen. Die einfachsten Varianten sind die einfachen geschlossenen Fragen mit und ohne Antwortalternative. Sie prägten die frühen Umfragen der 30er- und 40er-Jahre und die Untersuchungen aus dem 19. und frühen 20. Jahrhundert, die als Vorläufer der modernen Umfrageforschung angesehen werden können (vgl. Oberschall 1997, S. 201-202). Bis heute gilt vor allem die geschlossene Frage mit Antwortalternative als ein Prototyp der Umfragemethode, doch sie ist bei Weitem nicht der einzige existierende und noch nicht einmal mehr der dominierende Fragetyp. In den folgenden Kapiteln können nicht alle existierenden Fragebogenmethoden vorgeführt werden. Der Kreativität der Forscher sind hier kaum Grenzen gesetzt, die über das ganze Buch verteilten Fragebeispiele zur Illustration diverser Forschungstechniken deuten zusammengefasst aber immerhin die Vielfalt der zur Verfügung stehenden Instrumente an. Auf einige wenige Grundformen der Fragestellung soll aber im Folgenden noch ausdrücklich hingewiesen werden, weil sie in der Forschungspraxis eine wesentliche Rolle spielen und weil sie helfen können, die Vielfalt der Fragemodelle gedanklich etwas zu gliedern und damit übersichtlicher zu machen. Eine der ersten Überlegungen, die man anstellen muss, wenn man sich an die Entwicklung einer Frage macht, ist, ob die Befragten aufgefordert werden sollen, sich bei zwei oder mehreren zur Auswahl gestellten Antwortmöglichkeiten für eine zu entscheiden, oder ob sie die Möglichkeit bekommen sollen, mehrere Antworten gleichzeitig auszuwählen. Ersteres ist in der Regel bei klassischen Ja-Nein-Fragen der Fall. Die Summe aller Antworten ergibt dann immer 100 Prozent. In vielen Fällen ist aber das Instrument der Mehrfachauswahl dem Fragegegenstand angemessener. Vor allem aber kann es unter bestimmten Umständen den Interviewverlauf erheblich beschleunigen, besonders bei persönlichen Umfragen. Hier lassen sich oft viele Aspekte eines Themas, die man sonst mühsam einzeln abfragen müsste, auf einer Liste zusammenstellen. Diese Liste wird dem Befragten übereicht mit <?page no="124"?> Die Strukturierung von Antwortmöglichkeiten 125 der Bitte, alle Punkte auszuwählen die seiner Ansicht nach zutreffen. Elisabeth Noelle-Neumann nannte dies im Entwurf des Inhaltsverzeichnisses für ihr nie geschriebenes Fragebogenbuch die „Cafeteria“. Und tatsächlich ist der Vergleich mit einem Schnellrestaurant durchaus treffend. Wie der Kunde einer Cafeteria bekommt der Befragte die verschiedenen Auswahlmöglichkeiten nebeneinander präsentiert und bedient sich dann daran ganz nach Belieben. Auf diese Weise kann man rasch eine große Zahl von Informationen ermitteln. Fragebeispiel 22 zeigt, wie in einer kommunikationswissenschaftlichen Untersuchung auf diese Weise mit einer einzigen Frage recht detaillierte Angaben zur Mediennutzung der Bevölkerung erfasst wurden. Fragebeispiel 22 Listenfrage INTERVIEWER überreicht Liste 1! „Über Politik kann man sich ja ganz unterschiedlich informieren. Was von dieser Liste hier nutzen Sie zumindest gelegentlich, um sich über die Politik zu informieren? Bitte nennen Sie mir einfach die entsprechenden Punkte.“ / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / NICHTS DAVON............................................................ 13 KEINE ANGABE ............................................................ 14 (Quelle: Universität Mainz, Institut für Publizistik, Umfrage WS 2009/ 2010) Am Beispiel dieser Frage kann man übrigens ebenfalls erkennen, dass es aus pragmatischen Gründen oft sinnvoll sein kann, von den strikten Regeln der Frageformulierung abzuweichen. Die Liste zu Fragebeispiel 22 (Abbildung 11) enthält nämlich einen bereits im vorigen Kapitel ausführlich besprochenen Fehler: Die Antwortvorgabe „Internet“ ermöglicht Überschneidungen, deren Ausmaß sich nicht feststellen lässt, mit den verschiedenen zur Auswahl gestellten Zeitungs- und Zeitschriftentiteln. Wählt ein Befragter die Antworten „Allgemeine Zeitung“ und „Internet“ aus, lässt sich nicht klären, ob er die gedruckte Zeitung <?page no="125"?> Formenlehre 126 gelesen oder die Internetseite des Blattes genutzt hat. Streng genommen müsste man für jeden Titel nachfragen, ob die gedruckte Version, die Internetseite oder eine Applikation fürs Mobiltelefon genutzt wurde. Abbildung 11 Listenvorlage zu Fragebeispiel 22 Liste 1 1. Allgemeine Zeitung 2. Mainzer Rhein-Zeitung 3. Eine überregionale Tageszeitung (z. B. Frankfurter Allgemeine Zeitung, Frankfurter Rundschau, Süddeutsche Zeitung, Die Welt) 4. Wochenzeitungen oder Magazine wie Spiegel, Focus, Die Zeit 5. Bild 6. ARD Tagesschau oder Tagesthemen 7. ZDF heute oder heute journal 8. SWR Landesschau oder Rheinland-Pfalz aktuell 9. Nachrichten- oder Informationssendungen anderer Sender (z. B. RTL aktuell, SAT.1 Nachrichten) 10. Politische Talkshows (z. B. Anne Will, Maybrit Illner, Hart aber fair, Menschen bei Maischberger) 11. Nachrichten- oder Informationssendungen im Radio 12. Internet (Quelle: Universität Mainz, Institut für Publizistik, Umfrage WS 2009/ 2010) <?page no="126"?> Die Strukturierung von Antwortmöglichkeiten 127 Da das Internet aber - so wichtig es sonst auch ist - noch immer nur vergleichsweise wenig zur politischen Information genutzt wird, wäre der Frageaufwand unverhältnismäßig groß gewesen, zumal eine Detailanalyse der Mediennutzung mit der Frage nicht angestrebt wurde. Stattdessen sollte sie als Analysefrage dienen zur Unterscheidung zwischen Menschen, die sich vorwiegend aus der Zeitung, dem Internet oder dem Fernsehen informieren. Hierfür war die unsaubere, aber einfache Fragevariante ausreichend und damit auch vorzuziehen. Nach dem hier vorgestellten Muster konstruierte Listenfragen sind vor allem bei mündlich-persönlichen Umfragen sehr beliebt, aber auch bei schriftlichen und Online-Umfragen kann man gut mit solchen Aufzählungen arbeiten. Hier bietet es sich allerdings meist an, die Befragten nicht nur Listenpunkte auswählen zu lassen, sondern dies auch gleich mit einer Skala zu verbinden. Zu beachten ist, dass sich solche Listen nicht endlos verlängern lassen. Bei persönlichen Interviews setzt hier allein schon das Papierformat dem Umfang natürliche Grenzen. Die Schrift muss locker gesetzt und groß genug sein (möglichst nicht kleiner als 14 Punkt), sodass maximal rund 20 Punkte auf die Liste passen. Werden es deutlich mehr, wird die Liste zu unübersichtlich und die Lektüre für die Befragten zu anstrengend. In solchen Fällen bietet es sich an, die Aussagen nicht auf Listen, sondern einzeln auf Kärtchen (etwa halbe Postkartengröße) zu drucken. Die Befragten werden dann aufgefordert, die Karten mit den zutreffenden Aussagen auszusortieren. Dieses Verfahren hat den zusätzlichen Vorteil, dass die Befragten im Interview aktiviert werden. Weist man die Interviewer zusätzlich an, die Karten zu mischen, bevor sie überreicht werden, sind außerdem Reihenfolgeeffekte ausgeschlossen, für die Listenfragen etwas anfällig sind (Ring 1974; Petersen 2002, S. 171-177). Listenfragen sind für den Fragebogenkonstrukteur praktisch: Sie lassen sich leicht zusammenstellen, es gibt kaum sprachliche Probleme bei der Formulierung, und die Listen lassen sich, im Gegensatz zu Kartenspielen, auch sehr leicht und billig herstellen. Doch gerade darin, dass Listen so verlockend einfach zu erstellen sind, liegt auch die größte Gefahr des Instruments: Es verleitet zur Denkfaulheit. Weiß man bei einem Thema nicht recht weiter oder fallen einem keine schönen Formulierungen ein, ist man rasch mit der Idee bei der Hand, eine Liste zusammenzustellen, in der man dann alles unterbringt, was man im <?page no="127"?> Formenlehre 128 Fragebogen ansprechen wollte, und, weil es ja so einfach ist, noch einiges mehr. Am Allensbacher Institut spricht man in diesem Zusammenhang abwertend von „Gardinenstangen“: Die eigentliche Frage ist die Gardinenstange, an die man dann bedenkenlos alles dranhängt, was einem so einfällt. Das Ergebnis sieht dann zwar hässlich aus, aber man hat sich die Mühe erspart, darüber nachzudenken, wohin die dort angehängten Gegenstände tatsächlich gehören. Ehe man sich versieht, besteht der Fragebogen fast nur noch aus Listenfragen und wird damit für die Befragten anstrengend und monoton. Man muss also bei der Fragebogenentwicklung aufpassen, dass man die Listenfrage nicht als allzu bequemen Ausweg ansieht, der einem die Mühe der Frageformulierung erspart. Ein guter Fragebogen muss auch einen Wechsel der Fragemodelle enthalten: Listen, Karten, Bildvorlagen und Einzelfragen sollten für ständige Abwechslung sorgen. Listenfragen oder nach dem gleichen Prinzip konstruierte Kartenspielfragen sind ideale Instrumente für Fragen, bei denen eine Mehrfachauswahl angeboten werden soll, wie dies auch bei Fragebeispiel 22 der Fall ist. Doch auch bei Fragen, bei denen nur eine Angabe möglich ist, können Listen ein sinnvolles Hilfsmittel sein. Ein Beispiel ist die berühmte Sonntagsfrage: „Wenn schon am nächsten Sonntag Bundestagswahl wäre, welche Partei würden Sie dann wählen? “ Hierzu wird eine Liste überreicht, auf der alle größeren Parteien aufgeführt sind und zusätzlich die Angabe „Andere Partei“. Auf diese Weise wird dem Befragten erspart, den Namen der bevorzugten Partei gegenüber dem Interviewer auszusprechen. Die Möglichkeit, einfach eine Zahl zu nennen, senkt ein wenig die Hemmschwelle. Es ist nicht immer leicht zu entscheiden, ob bei einer Frage nur eine oder mehrere Antworten zugelassen werden sollten. Analytiker bevorzugen meist die Klarheit und Eindeutigkeit der Einfachantwort und neigen dazu, die Befragten zu einer Entscheidung zwingen zu wollen. Doch erfahrungsgemäß widersetzen sich die Befragten oft hartnäckig solchen Wünschen. Im Zweifel empfiehlt es sich, Mehrfachantworten auch dann zuzulassen, wenn sie logisch kaum zu erwarten wären. Ein Beispiel aus dem Bundestagswahlkampf 1998, in dem das damals von der SPD geprägte Schlagwort der „neuen Mitte“ eine wesentliche Rolle spielte (von Webel/ Kepplinger/ Maurer 1999): Damals sollte im Rahmen der Wahlforschung geprüft werden, ob es der SPD gelungen war, eben <?page no="128"?> Die Strukturierung von Antwortmöglichkeiten 129 dieses Stichwort im Bewusstsein der Bevölkerung zu verankern, und ob die Bürger den Begriff auch tatsächlich der SPD zuordneten. Dazu wurde die folgende Frage gestellt: „Was denken Sie, welche Partei steht für die ‚neue Mitte’, welcher Partei würden Sie diesen Begriff ‚neue Mitte’ am ehesten zuordnen? “ Obwohl im Fragetext das Wort „Partei“ eindeutig im Singular steht, gab es bei einigen Befragten das Bedürfnis, mehrere Parteien zu nennen. Die Summe aller Angaben beträgt 102 Prozent. Es macht in aller Regel wenig Sinn zu versuchen, solches Antwortverhalten zu unterbinden, denn auch hier gilt, dass die Vorstellungen der Befragten Vorrang vor den Kategorien der Analytiker haben sollten. Die Vorstellung, das Schlagwort der „neuen Mitte“ sei mehreren Parteien zuzuordnen, ist Bestandteil der Wirklichkeit, die es abzubilden galt. Der Begriff hatte sich übrigens kaum in den Köpfen der Bevölkerung verfestigt: 21 Prozent ordneten die „neue Mitte“ der SPD zu, 23 Prozent anderen Parteien. Die Mehrheit, 58 Prozent, konnte mit dem Schlagwort nichts anfangen (IfD-Umfrage Nr. 6063). Kaum geeignet ist das Prinzip der Listenfrage für Telefonumfragen, obwohl es auch hier häufig zur Anwendung kommt und damit erheblich zum Gefühl der Monotonie beiträgt, das sich bei dieser Interviewmethode ohnehin besonders rasch einstellt. Am Telefon geht der besondere Vorteil der Listenfrage in persönlichen Interviews, nämlich dass man mit ihnen sehr einfach und vor allem schnell viele Informationen bekommt, fast vollständig verloren, weil man gezwungen ist, nach der einleitenden Frage alle Listenpunkte einzeln vorzulesen. Aus der rasch überreichten Liste wird auf diese Weise eine Frageserie, die von den Befragten schon nach wenigen Listenpunkten als quälend lang empfunden wird. Während bei persönlichen Umfragen Listen, wie beschrieben, rund 20, Kartenspiele auch noch wesentlich mehr Punkte enthalten können, ist bei vorgelesenen Frageserien am Telefon bereits nach etwa 10 Aussagen die Schmerzgrenze erreicht. Hinzu kommt, dass die Gefahr besteht, dass viele Befragte bei längeren Abfragen nach einer gewissen Zeit dazu neigen zu vergessen, wie denn eigentlich die einleitende Frage lautete. Man muss in solchen Fällen deswegen zusätzlich in die Liste kleine Erinnerungen einbauen, etwa in Form von Halbsätzen. Die in Fragebeispiel 22 wiedergegebene Frage nach den Quellen der politischen Information müsste man am Telefon beispielsweise etwa wie folgt formulieren: „Über Politik kann man sich ja ganz <?page no="129"?> Formenlehre 130 unterschiedlich informieren. Ich lese Ihnen jetzt Verschiedenes vor, und Sie sagen mir bitte jeweils, ob Sie sich zumindest gelegentlich damit über Politik informieren.“ Dann würden nach und nach die Listenpunkte vorgelesen. Spätestens bei Punkt 8 würde man aber eine Auffrischung der Erinnerung einbauen müssen: „Und wie ist es mit der Landesschau oder der Sendung Rheinland-Pfalz aktuell? Schauen Sie die manchmal, um sich über Politik zu informieren? “ Man erkennt, wie die eigentlich einfache Liste am Telefon zu einer langwierigen Prozedur wird. Dennoch kommt man um diese Methode bei Telefonumfragen kaum herum. Fragebeispiel 23 zeigt eine Frage, die ursprünglich für eine international vergleichende Umfrage entwickelt wurde, die in einigen Ländern telefonisch verwirklicht wurde. So wurde es notwendig, das komplizierte Fragemodell selbst in den Ländern anzuwenden, in denen die Interviews persönlich geführt wurden. Fragebeispiel 23 „Listenfrage“ am Telefon: Die Items werden einzeln vorgelesen „Ich möchte Ihnen nun Verschiedenes vorlesen, und Sie sagen mir bitte jeweils, ob Sie daran glauben oder nicht“ a) „Zunächst: die Seele. Glauben Sie daran oder nicht? “ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ b) „Gott“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ c) „Sünde“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ <?page no="130"?> Die Strukturierung von Antwortmöglichkeiten 131 d) „Ein Leben nach dem Tod“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ e) „Der Himmel“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ f) „Engel“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ g) „Die Auferstehung der Toten“ GLAUBE DARAN........................................................... 1 GLAUBE NICHT DARAN .............................................. 2 WEISS NICHT / KEINE ANGABE................................. 3 ____________________________________________ (Quelle: Universität Mainz, Institut für Publizistik, Umfrage WS 2009/ 2010 ) Eine besondere Schwierigkeit ergibt sich, wenn man eine listenartige Zusammenstellung von Punkten hat, zu denen man jeweils mehrere Informationen benötigt. Manchmal ist es möglich, eine Liste oder ein Kartenspiel mehrmals zu übergeben, doch nach zwei oder drei Durchgängen ist die Geduld der Befragten meist erschöpft. Eine fragebogentechnisch unbefriedigende, aber manchmal unvermeidliche Behelfslösung ist der sogenannte „Kasten,“ der immer dann zum Einsatz kommt, wenn man sonst eine monotone Serie gleichartiger Fragen zu ähnlichen Gegenständen stellen müsste. Man unterbricht praktisch das Gespräch. Der Interviewer wird für einen Moment von der Pflicht entbunden, Fragen in vorgegebener Reihenfolge und im Wortlaut vorzulesen. Stattdessen füllt er mithilfe der Angaben des Befragten ein Formular aus. Fragebeispiel 24 zeigt einen solchen „Kasten.“ Im Rahmen einer Unter- <?page no="131"?> Formenlehre 132 suchung über das Brillentragen wurde zunächst ermittelt, wie viele Brillen die Befragten im vorangegangenen Jahr gekauft hatten. Nun sollten einige Detailinformationen über jede dieser Brillen erhoben werden. Fragebeispiel 24 „Kasten“ INTERVIEWER-ANWEISUNG: Nun für alle der in den letzten 12 Monaten angeschafften Brillen, Gestelle und Gläser im Kasten unten eintragen, aus welchem Material sie sind. Was wurde neu angeschafft? Falls neue Brille oder neues Gestell angeschafft: „Aus welchem Material ist das Gestell? “ (Falls Bügel und Fassung aus unterschiedlichem Material: Entscheidend ist die Fassung der Gläser.) Falls neue Brille oder neue Gläser angeschafft: „Aus welchem Material sind die Gläser? “ Letzte Brillenanschaffung Komplett neue Brille.........1 Nur neues Gestell............2 Nur neue Gläser..............3 Gestell Aus Metall.......................1 Aus Kunststoff................2 Randlos..........................3 Brillengläser Aus Glas..........................1 Aus Kunststoff.................2 Weiß nicht.......................3 Vorletzte Brillenanschaffung Komplett neue Brille.........1 Nur neues Gestell............2 Nur neue Gläser..............3 Gestell Aus Metall.......................1 Aus Kunststoff................2 Randlos..........................3 Brillengläser Aus Glas..........................1 Aus Kunststoff.................2 Weiß nicht.......................3 Drittletzte Brillenanschaffung Komplett neue Brille.........1 Nur neues Gestell............2 Nur neue Gläser..............3 Gestell Aus Metall.......................1 Aus Kunststoff................2 Randlos..........................3 Brillengläser Aus Glas..........................1 Aus Kunststoff.................2 Weiß nicht.......................3 (Quelle: Noelle-Neumann/ Petersen 2005, S. 142) <?page no="132"?> Die Strukturierung von Antwortmöglichkeiten 133 Man erkennt, dass das Ausfüllen des Kastens keine leichte Aufgabe ist. Deswegen ist diese Frageform, anders als man zunächst annehmen könnte, auch für schriftliche und Internet-Umfragen nicht besonders gut geeignet. Das Instrument ist selbst dann noch relativ stark fehleranfällig, wenn geschulte Interviewer die Antworten eintragen. So bleibt der „Kasten“ eine Notlösung, die zudem nur dann eingesetzt werden kann, wenn so klare und eindeutige Sachverhalte ermittelt werden, dass die Lockerung der Standardisierung keine Auswirkungen auf die Verlässlichkeit der Ergebnisse haben kann. 4.6 Möglichkeiten und Probleme von Skalen Skalen sind eines der wichtigsten und gleichzeitig eines der problematischsten Werkzeuge der Umfrageforschung. Bei keinem anderen Aspekt des Forschungsinstruments treten die schon mehrfach angesprochenen Konflikte zwischen den Interessen des Analytikers und denen der Befragten so deutlich zutage wie beim Thema Skalen. Skalen können sehr unterschiedliche äußere Formen annehmen. Sie alle haben aber gemeinsam, dass mit ihrer Hilfe versucht wird, Intensitäten, Abstufungen einer Meinung oder Verhaltensweise zu erfassen. Man will also beispielsweise nicht nur wissen, ob jemand mit der Politik der Bundeskanzlerin einverstanden ist, sondern wie sehr er mit ihr einverstanden ist. Hinter der Idee der Skala steht das Konzept der verschiedenen Datenniveaus, die man mit einer Messung - sei es in den Sozialwissenschaften, sei es in der Technik, der Physik oder anderswo - erreichen kann (siehe hierzu die Übersicht bei Friedrichs 1985, S. 98- 99). Man unterscheidet vier verschiedene Qualitäten: 1. Das nominale Datenniveau. Mit diesem Begriff ist die Logik der Ja-Nein-Frage gemeint. Es gibt keine Abstufungen, sondern nur die Frage, ob etwas zutrifft oder nicht. Viele in Umfragen erhobene Daten sind zwangsläufig nominal, allen voran viele soziodemographische Ermittlungen: das Geschlecht, Gewerkschaftsmitgliedschaft, die Konfession. Entweder ist man Mitglied der katholischen Kirche oder nicht. Auch viele Meinungs- und Verhaltensfragen werden auf nominalem Niveau erhoben. Ein Beispiel ist die im vorigen Kapitel präsentierte Listenfrage zum Informationsverhalten. Fragebeispiel 25 zeigt ein weite- <?page no="133"?> Formenlehre 134 res: Eine einfache Frage zu einem Entscheidungskriterium beim Autokauf. Fragebeispiel 25 Frage auf nominalem Messniveau „Einmal angenommen, Sie möchten sich ein neues Auto kaufen. Wäre es Ihnen dann wichtig, dass das Auto möglichst wenig Benzin oder Diesel verbraucht, oder wäre Ihnen das nicht wichtig? ““ WÄRE WICHTIG ........................................................... 1 WÄRE NICHT WICHTIG ............................................... 2 UNENTSCHIEDEN, KEINE ANGABE .......................... 3 (Quelle: eigenes Beispiel) Oft ist es durchaus ausreichend und sogar sinnvoll, Fragen auf nominalem Niveau zu erheben, nicht zuletzt deswegen, weil solche einfachen Ja-Nein-Fragen in vielen Fällen der Alltagslogik besonders nahe kommen. Fragebeispiel 25 zeigt aber auch, warum man manchmal mit nominalen Fragen nicht auskommt. In einer wirklichen Umfrage würde die Frage kaum zu brauchbaren Ergebnissen führen, denn man kann annehmen, dass es den allermeisten Autofahrern bis zu einem gewissen Grade wichtig ist, dass das Auto nicht zu viel Benzin verbraucht. Eine Frage, bei der fast alle Befragten dieselbe Antwort wählen, ist aber in aller Regel sinnlos. Im vorliegenden Fall wäre es wichtig zu wissen, für wie viele Autofahrer der Verbrauch besonders wichtig ist und bei wem er gegenüber anderen Kriterien doch als eher nachrangig empfunden wird. Man benötigt also Abstufungen und wird deswegen versuchen, die Frage wenigstens auf ordinalem Messnivau zu erheben. 2. Der Begriff „ordinales Messniveau“ besagt, dass es möglich ist, die erhobenen Daten in eine Größenreihenfolge zu bringen, ohne dass sich die tatsächlichen Abstände numerisch verlässlich bemessen lassen. Wenn man etwa mit bloßem Auge erkennt, dass ein Elefant größer ist als eine Kuh, die wiederum größer ist als ein Hund, hat man damit eine Information auf ordinalem Niveau gewonnnen. Die meisten in der Um- <?page no="134"?> Möglichkeiten und Probleme von Skalen 135 frageforschung verwendeten Skalen erzeugen Daten auf dieser logischen Ebene, auch wenn manchmal mit großem analytischen Aufwand versucht wird, ein mathematisch höheres Niveau zu erreichen. Die Frage nach der Bedeutung des Benzinverbrauchs beim Autokauf lässt sich mit einer kleinen Verbalskala leicht auf ordinales Niveau heben: Fragebeispiel 26 Frage auf ordinalem Messniveau „Einmal angenommen, Sie möchten sich ein neues Auto kaufen. Wie wichtig wäre es Ihnen da, dass das Auto möglichst wenig verbraucht, würden Sie sagen ...“ „sehr wichtig“.................................................................. 1 „wichtig“.......................................................................... 2 „nicht so wichtig“ ............................................................ 3 „gar nicht wichtig“........................................................... 4 KEINE ANGABE ............................................................ 5 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5275) Mit dieser Frage wird man in der Praxis gut arbeiten können, für den mathematisch orientierten Analytiker stellt sie aber nicht das Ideal dar, denn die Abstände zwischen den Abstufungen bleiben unklar und damit nicht berechenbar. Niemand wird sicher sagen können, ob der „gefühlte Abstand“ zwischen den Kategorien „sehr wichtig“ und „wichtig“ der gleiche ist wie der zwischen „wichtig“ und „nicht so wichtig.“ Der Analytiker wird deswegen versuchen, das Datenniveau noch eine Stufe höher zu heben, auf das Niveau einer Intervallskala. 3. Intervall-Datenniveau bedeutet, dass die Abstände zwischen den Skalenstufen gleich groß und damit Differenzen zwischen den verschiedenen Skalenpunkten berechnet werden können. In der Umfrageforschung, wo es meistens um mehr oder weniger vage Meinungsäußerungen geht, wird man dieses Niveau streng genommen nur selten erreichen, doch man kann ihm nahe kommen, indem man den Befragten einen Maßstab mit numerisch definierten Skalenabständen vorgibt, <?page no="135"?> Formenlehre 136 auf dessen Grundlage sie dann ihre Entscheidung fällen. So könnte man die Frage nach der Bedeutung des Benzinverbrauchs als Kriterium beim Autokauf mit der Vorlage einer optischen Skala verbinden, die die Daten zumindest in die Nähe einer Intervallskala rückt. Fragebeispiel 27 Frage auf (annähernd) Intervall-Niveau INTERVIEWER überreicht das in Abbildung 12 gezeigte Bildblatt! „Einmal angenommen, Sie möchten sich ein neues Auto kaufen. Wie wichtig wäre es Ihnen da, dass das Auto möglichst wenig verbraucht? Könnten Sie es mir nach dieser Leiter hier sagen? 0 würde bedeuten, es ist Ihnen überhaupt nicht wichtig, und 10, es ist Ihnen ganz besonders wichtig. Welche Stufe nehmen Sie? “ GEWÄHLTE STUFE / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / KEINE ANGABE ............................................................ 99 (Quelle: eigenes Beispiel) 4. Der Vollständigkeit halber soll noch kurz das vierte, höchste Messniveau erwähnt werden: das metrische oder auch rationale Datenniveau. Hier sind nicht nur die Abstände zwischen den Skalenstufen gleich groß und klar numerisch definiert, sondern es gibt darüber hinaus noch einen inhaltlich begründeten Nullpunkt, sodass man sagen kann, dass bei jemandem, der auf der Skala die Stufe 10 einnimmt, die betreffende Merkmalsausprägung auch tatsächlich doppelt so stark vorhanden ist wie bei jemandem, der die Stufe 5 besetzt. In der Umfrageforschung erfüllen eigentlich nur die Daten über das Alter und das Einkommen der Befragten diese Bedingungen, außerdem gewisse Mengenangaben wie beispielsweise über die Zahl der im Haushalt vorhandenen Telefone, Polstermöbel oder Lampen. Analytiker versuchen stets, ein möglichst hohes Datenniveau zu erreichen, nicht zuletzt deswegen, weil bestimmte Analyseverfahren, besonders die in der akademischen Welt so beliebten multivariaten Ver- <?page no="136"?> Möglichkeiten und Probleme von Skalen 137 fahren wie Faktoren- oder multiple Regressionsanalysen, solche Daten verlangen. Je größer der akademische Anspruch, desto mehr Gewicht wird in der Regel darauf gelegt, dass möglichst viele Fragen auf hohem Niveau als Skalen angelegt sind. Der Fragebogenkonstrukteur steht dagegen vor dem Problem, dass Skalenfragen den Fragebogen meist deutlich komplizierter machen und damit das Interview erschweren, mit der Folge, dass zwar die formale Organisation der Daten auf ein hohes mathematisches Niveau gehoben wird, gleichzeitig aber die Qualität der Daten leidet, im - gar nicht so seltenen - Extremfall bis hin zum Verlust jeglicher Validität und damit jeglicher Aussagekraft. Im Kapitel über die Folgen der Monotonie ist auf diesen Punkt bereits ausführlich eingegangen worden. Abbildung 12 Bildblatt zu Fragebeispiel 27 (Quelle: Allensbacher Archiv) <?page no="137"?> Formenlehre 138 Jede Skalierung bedeutet eine potenzielle Belastung des Interviews, auch deswegen, weil es die meisten Menschen in Deutschland nicht gewohnt sind, im Alltag in den Kategorien der Skala zu denken, anders übrigens als die Bevölkerung in Amerika, wo Aussagen wie „Wie gut gefiel dir der Kinofilm auf einer Skala von 1 bis 10“ durchaus zur Umgangssprache gehören. Deswegen empfiehlt es sich, bei der Fragebogenentwicklung jeden Fall, in dem eine Skalenfrage gewünscht wird, zu durchdenken: Braucht man die Skala wirklich unvermeidlich, oder wird sie nur aus Gründen der akademischen Konvention gefordert? Wer dieses Gedankenspiel häufiger mitmacht, wird staunen, wie oft Letzteres der Fall ist. Nicht selten erlebt man es, dass die Ergebnisse bei der Analyse dann aus Gründen der Übersichtlichkeit in „zustimmende“ und „ablehnende“ und damit wieder auf nominales Datenniveau zusammengeworfen werden. Wenn aber eine Skala nicht aus analytischen Gründen unbedingt notwendig ist, sollte man auf sie verzichten. Die Validität der Daten steigt dadurch, und der Informationsverlust ist in den meisten Fällen überraschend gering. Man kann zwei grundsätzlich unterschiedliche Typen von Skalen unterscheiden. Den ersten Typus bilden jene Konstruktionen, die aus einer Vielzahl von Fragen oder Aussagen zusammengesetzt werden, die idealerweise denselben Gegenstand in unterschiedlicher Stärke erfassen. Solche Skalen werden meist analytisch aus einer größeren Zahl von Aussagen herausgefiltert (Friedrichs 1985, S. 175-176), beispielsweise mithilfe einer Faktorenanalyse (Noelle-Neumann/ Petersen 2005, S. 555-561). In der Regel werden dabei die Aussagen in langen Listen, sogenannten „Item-Batterien“, den Befragten vorgelegt mit der Aufforderung, zu jeder Aussage anzugeben, ob sie ihr - beispielsweise - „voll und ganz“ oder „eher“ zustimmen, ob sie ihr neutral gegenüberstehen oder ob sie sie „eher“ oder „voll und ganz“ ablehnen. Solche Verbalskalen werden auch nach ihrem Erfinder, dem amerikanischen Sozialforscher Rensis Likert, „Likert-Skalen“ genannt. In Likert-Skalen organisierte Item-Batterien sind in der Psychologie sowie in Teilen der Wirtschaftswissenschaften und der Soziologie außerordentlich weit verbreitet, so sehr, dass man manchmal den Eindruck gewinnen kann, dass es sich hierbei um die einzige in der Wissenschaft weithin akzeptierte Frageform handele. Wie jedoch das - zugegebenermaßen besonders abschreckende - Beispiel des STAXI-Tests im Kapitel über den „tauben <?page no="138"?> Möglichkeiten und Probleme von Skalen 139 Interviewer“ zeigt, bereiten Likert-Skalen im persönlichen und auch im telefonischen Interview Probleme und sollten deswegen nur zurückhaltend eingesetzt werden. Etwas weniger problematisch sind sie bei schriftlichen und Online-Umfragen, weil sie sich optisch gut für Fragebogen zum Selbstausfüllen umsetzen lassen. Zudem setzt hier die ohnehin eng begrenzte maximale mögliche Interviewlänge dem Umfang der Skalen einigermaßen erträgliche Grenzen. Angesichts der Dominanz der Likert-Skalen ist in der akademischen Welt etwas in Vergessenheit geraten, dass man auch aus einer Serie von nominalskalierten Fragen eine Skala mit mindestens ordinaler Aussagekraft konstruieren kann. Ein Beispiel hierfür ist die „Skala der Persönlichkeitsstärke.“ Sie besteht aus zehn einfachen Einzelaussagen wie „Gewöhnlich rechne ich bei dem, was ich mache, mit Erfolg“, „Ich bin selten unsicher, wie ich mich verhalten soll“ oder „Ich merke öfter, dass sich andere nach mir richten“. Die Befragten werden gebeten, die Aussagen herauszusuchen, von denen sie meinen, dass sie auf sie zutreffen. Mithilfe dieser Skala lassen sich recht verlässlich die Meinungsführer in der Gesellschaft identifizieren (Noelle-Neumann 2002; Weimann 1994; Petersen 2005a). Jeder Befragte erhält, abhängig davon, welche Aussagen er ausgewählt hat, einen Punktwert zugeordnet, der auf den Ergebnissen von Faktorenanalysen beruht, die bei der Entwicklung der Skala durchgeführt wurden (vgl. Noelle-Neumann 2002, S. 99). Vereinfacht kann man aber auch sagen, dass jemand umso weiter oben auf der Skala einsortiert wird, je größer die Zahl der Aussagen ist, bei denen er sagt: „Das trifft auf mich zu.“ Die Mehrzahl der Aussagen macht die Skalierung jedes einzelnen Items überflüssig. Die zweite Form der Skala ist die Skalierung der Antwortkategorien einer einzelnen Frage. Am Telefon werden dann die Befragten beispielswiese aufgefordert, auf einer Skala von 0 bis 10 anzugeben, wie sehr sie einer bestimmten Aussage zustimmen. Bei persönlichen Befragungen kann man gut mit Bildvorlagen arbeiten, wie beispielsweise der in Abbildung 6 gezeigten Leiter. Anders als lange Item-Batterien belasten solche Skalierungen das Interview bei Telefonumfragen nur wenig, wenn die Skala für die Befragten einigermaßen übersichtlich bleibt. Wie man es besser nicht macht, hat der Autor vor einigen Jahren selbst erlebt, als er telefonisch über verschiedene Dienstleistungen der Deutschen Bahn befragt wurde. Die Interviewerin las eine scheinbar endlo- <?page no="139"?> Formenlehre 140 se Serie von Aspekten des Bahnfahrens vor: „Sauberkeit der Bahnsteige“, „Zugänglichkeit der Fahrkartenautomaten“, „Freundlichkeit des Personals in den Zügen“, „Freundlichkeit des Personals auf den Bahnhöfen“ usw. Zu jeder dieser Aussagen wurde der Befragte erstens aufgefordert, auf einer Skala von 1 bis 10 zu sagen, wie wichtig ihm dieser Punkt ist, wobei 1 sehr wichtig und 10 sehr unwichtig bedeuten sollte. Zweitens war jeweils unmittelbar danach auf einer Skala von 1-7 anzugeben, wie zufrieden man mit dem betreffenden Aspekt ist, wobei 1 sehr unzufrieden und 7 sehr zufrieden bedeuten sollte. Eine solche Frage ist bestens geeignet, bei den Befragten perfekte Konfusion zu erzeugen: Zwei unterschiedliche und zudem noch logisch gegenläufige Skalen stürzten jedenfalls selbst den professionellen Umfrageforscher in Verwirrung. So lautete manche Antwort „2“, wo eigentlich „5“ richtig gewesen wäre und umgekehrt. Doch wer solche groben handwerklichen Fehler vermeidet, wird bei Telefonumfragen gut mit Skalen arbeiten können, wenn er das Instrument nicht übermäßig häufig einsetzt. Bei persönlichen Umfragen, wo man die Skalen als Bildblätter vorlegen kann, können sie sogar das Interview abwechslungsreicher machen und damit beleben. Gelegentlich sind sie sogar die Voraussetzung dafür, dass eine Frage überhaupt beantwortet werden kann. Abbildung 13 zeigt eine kleine Auswahl von Skalenvorlagen, darunter zwei mit einer sehr langen Tradition, nämlich die Thermometer-Skala (Nr. 3), die bereits der amerikanische Pionier der Umfrageforschung Hadley Cantril in den 40er-Jahren verwendete um beispielsweise zu ermitteln, wie intensiv sich jemand für ein bestimmtes Thema interessiert (Katz 1944, S. 54 und 60), und die Stapel- Skala (Nr. 1), benannt nach dem niederländischen Forscher Jan Stapel, der sie entwickelte. Diese Skala hat sich als Instrument zur Bewertung von Personen, wie etwa Politikern, aber auch zur Beurteilung von Gegenständen wie Werbeanzeigen oder Plakaten sehr bewährt (vgl. Auer 1981). Die Beispiele in Abbildung 13 zeigen, dass man einiges Einfühlungsvermögen benötigt, um zu entscheiden, welche äußere Form eine optische Skala annehmen soll. Die Skalenvorlage ist im Idealfall eine Art Vermittler zwischen dem Befragten und dem Analytiker. Der Analytiker interessiert sich letzten Endes nur für die Zahlen, doch für den Befragten bietet vor allem die optische Ausgestaltung eine Chance, seine sonst möglicherweise eher vagen Gedanken zu strukturieren. <?page no="140"?> Möglichkeiten und Probleme von Skalen 141 Abbildung 13 Beispiele für Skalen-Bildblätter +5 +4 +3 +2 +1 -1 -2 -3 -4 -5 (Quelle: Allensbacher Archiv) 1 3 4 5 2 <?page no="141"?> Formenlehre 142 Weil Skalenvorlagen neben der numerischen Information auch eine psychologische enthalten, ist es auch nicht egal, welche formale Ausgestaltung eine Skala hat. Die Stapel-Skala reicht von +5 bis -5. Es gibt auch noch eine Variante, bei der, anders als in Abbildung 7, in der Mitte ein je zur Hälfte schwarzes und weißes Kästchen steht, das mit einer Null beschriftet ist. Mit diesem zusätzlichen Nullpunkt verfügt die Skala über elf Stufen - wie auch die in Abbildung 12 gezeigte Leiter. Doch beide können sehr unterschiedliche Reaktionen auslösen. Dies zeigt ein Experiment, bei dem in einer repräsentativen Bevölkerungsumfrage die Frage gestellt wurde: „Wie erfolgreich waren Sie bisher in Ihrem Leben? “ Der einen Hälfte der Befragten wurde dazu die Leiter, der anderen Hälfte die Stapel-Skala vorgelegt. Es zeigte sich, dass die Gestaltung der Stapel-Skala nicht mit der Frageformulierung harmonierte. Die Befragten beschränkten sich bei ihrer Antwort fast ausschließlich auf die obere Skalenhälfte mit den positiven Werten. Als „negativ erfolgreich“ wollte sich offensichtlich niemand bezeichnen. Bei der Leiter dagegen verteilten sich die Antworten über die gesamte Skalenbreite - ein Zeichen dafür, dass sich alle Befragten in der Vorgabe wiederfinden konnten (Schwarz u. a. 1991; Petersen 2002, S. 201-206). Die Beispiele Nr. 2 und Nr. 4 in Abbildung 13 zeigen besonders deutlich, wie die einfühlsame Gestaltung einer Frage den Befragten die Antwort erleichtert, ja die Frage erst richtig erschließen hilft. Zu den Skalenvorlagen gehören die folgenden Fragen: Fragebeispiel 28 Frage zu Skala Nr. 2 in Abbildung 13 (perspektivische Leiter) „Man sagt von einem Menschen, dass er einem nahe oder fern steht. Das kann man auch auf Zeitungen übertragen. Könnten Sie mir nach diesem Bild hier sagen, wie nahe oder fern Ihnen die Allgemeine Zeitung steht? 1 würde bedeuten, dass Ihnen diese Zeitung sehr nahe steht, 10 würde bedeuten, dass Sie Ihnen fern steht. Welche Zahl würden Sie wählen? “ GEWÄHLTE STUFE / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / KEINE ANGABE ............................................................ 99 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 1430) <?page no="142"?> Möglichkeiten und Probleme von Skalen 143 Fragebeispiel 29 Frage zu Skala Nr. 4 in Abbildung 13 (laufende Männchen) „Wie schnell vergeht Ihnen bei der Arbeit die Zeit? Das ist sicher schwer zu sagen, deshalb habe ich ein Bildblatt mitgebracht. 1 auf dem Bildblatt würde bedeuten, die Zeit steht fast still, und 7, die Zeit bei der Arbeit vergeht rasend schnell. Welche Nummer von 1 bis 7 trifft auf Ihre Arbeitszeit am ehesten zu? “ GEWÄHLTE STUFE / 1 / 2 / 3 / 4 / 5 / 6 / 7 / KEINE ANGABE ............................................................ 99 (Quelle: Ring 1990, S. 358) Das Bild der perspektivischen Leiter macht das sonst etwas abstrakt, vielleicht auf manche Befragten auch befremdlich wirkende Konzept der „gefühlten Nähe“ zu einer Zeitung erst anschaulich. Und mit der Frage „Wie schnell vergeht Ihnen bei der Arbeit die Zeit? “ wären die Befragten ohne die unmittelbar eingängige Skalenvorlage hoffnungslos überfordert. Hier wird die Vermittlerfunktion der Skalenvorlage zwischen Befragten und Analytiker besonders deutlich: Erst die Skala macht die unbestimmten Gefühle der Befragten für diese beschreibbar und damit für die Analyse zugänglich. Die illustrative Kraft bildhafter Skalenvorlagen kann auch dabei helfen, den Befragten Sachverhalte zugänglich zu machen, die sonst für eine Repräsentativumfrage zu abstrakt wären. So ist es normalerweise keine gute Idee, die Bevölkerung mit Prozentzahlen zu konfrontieren oder sie gar Prozentwerte schätzen zu lassen. In Umfragen zu diesem Thema wie auch am Umgang der Öffentlichkeit mit statistischen Informationen jeglicher Art zeigt sich immer wieder, dass nur ein kleiner Teil der Bevölkerung mit dieser Art der Information umgehen kann (Petersen 2012b). Für eine Studie über die gesellschaftliche Toleranz gegenüber Rauchern wurde es nun aber aus analytischen Gründen dringend gewünscht, die Befragten schätzen zu lassen, wie viele Menschen in Deutschland rauchen. Alle Vorschläge, dies mit etwas vagen, aber der Alltagswahrnehmung der meisten Menschen entsprechenden <?page no="143"?> Formenlehre 144 Verbalskalen zu messen (z. B.: „Würden Sie sagen, fast alle, etwa drei Viertel, etwa die Hälfte, etwa ein Viertel oder nur ganz wenige? “) wurden von der Forschungsleitung als zu unpräzise zurückgewiesen. Schließlich wurde entschieden, trotz der bis dahin schlechten Erfahrungen mit ähnlichen Versuchen, tatsächlich Prozente schätzen zu lassen (Fragebeispiel 30), die Prozentwerte aber mithilfe eines Lineals zu visualisieren und gleichzeitig die verbalen Abstufungen („drei Viertel“, „die Hälfte“ usw.) als zusätzliche Beschriftung ins Bildblatt aufzunehmen (Abbildung 14). Es zeigte sich, dass die Befragten erstaunlich gut mit der Aufgabe zurechtkamen. Es gab kaum Ausfälle und „Unentschieden“-Antworten. Die optische Skalenvorlage hatte die Aufgabe auch für diejenigen Befragten lösbar gemacht, die sonst mit Prozentwerten nicht viel anzufangen wussten. Ohne das Bildblatt wäre die Frage unbrauchbar gewesen. Fragebeispiel 30 Die Schätzung von Prozentwerten „Was würden Sie sagen: Wie viel Prozent der Menschen in Deutschland rauchen? Das ist sicherlich schwer zu sagen, darum habe ich hier ein Blatt mitgebracht. Null würde bedeuten, dass niemand in Deutschland raucht, 100, dass alle Deutschen Raucher sind. Wenn Sie einmal nach dem gehen, was Sie wissen oder vermuten: Welche Zahl zwischen Null und 100 Prozent würden Sie wählen? “ ....................Prozent UNMÖGLICH ZU SAGEN / KEINE ANGABE .............. 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10015) Die Frage zeigt übrigens eine bewährte Technik, etwaige abwehrende Reaktionen unsicherer Befragter zu verhindern. Bei Fragen, bei denen die Gefahr besteht, dass sie den Unterton von Prüfungen annehmen, fängt man das Unbehagen mit abschwächenden Formulierungen ab, die dem Befragten die Scheu nehmen sollen, sich vor dem Interviewer <?page no="144"?> Möglichkeiten und Probleme von Skalen 145 wegen seines vermeintlich geringen Wissens zu blamieren. Mit den Formulierungen „Das ist sicherlich schwer zu sagen“ und vor allem „nach dem, was Sie wissen oder vermuten“ wird der Druck aus der Frage genommen. Der Wissensfrage wird damit der Charakter einer Meinungsfrage verliehen. Abbildung 14 Bildblatt zu Fragebeispiel 30 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10015) <?page no="145"?> Formenlehre 146 Ein Aspekt, der bei der Entwicklung von Skalen immer wieder zu Konflikten zwischen Fragebogenentwicklern und Analytikern führt, ist die Frage, ob eine Skala eine gerade oder ungerade Zahl von Abstufungen haben sollte. Viele Analytiker ziehen eine gerade Zahl vor, weil sie annehmen, dass die Befragten durch das Fehlen einer neutralen Mittelposition zu einer eindeutigen Entscheidung gezwungen werden. Doch oft ist diese Annahme ein Irrtum: Die Befragten lassen sich nicht zwingen. Dies zeigen die Erfahrungen mit Fragen nach der politischen Selbsteinstufung der Bevölkerung auf der Links-Rechts-Skala. Das Institut für Demoskopie Allensbach verwendet dazu als Bildvorlage ein Maßband, das von 0 bis 100 reicht, wobei Null ganz links und 100 ganz rechts bedeutet (Abbildung 13, Nr. 5). Andere Wahlforschungsinstitute verwenden eine Skala von 0 bis 10 (vgl. Roth 1998, S. 123-125). In beiden Fällen gibt es mit der Stufe 5 einen klaren mathematischen Mittelpunkt. Da sich die meisten Menschen in Deutschland selbst als politisch in der Mitte stehend einschätzen, wählt ein sehr großer Teil der Befragten dementsprechend die Stufe 5. Gelegentlich erlebt man es aber auch, dass ein Umfrageinstitut die Links-Rechts-Orientierung der Bevölkerung mit einer Skala von 1-10 ermittelt (Beispiele in Knutsen 1998; Merkel 2002). Der Mittelpunkt einer solchen Skala liegt nicht bei 5, sondern bei 5,5, eine Stufe, die den Befragten nicht zur Auswahl gestellt wird. Sie müssen sich, wenn sie politisch in der Mitte stehen, zwischen 5 (links von der Mitte) und 6 (rechts von der Mitte) entscheiden. Doch das funktioniert nicht. Den meisten Befragten fällt gar nicht erst auf, dass der Mittelpunkt der Skala nicht bei 5 liegt. Folglich wählen auch kaum mehr Befragte als bei einer Skalenvorlage von 0-10 die Stufe 6. Stattdessen entscheiden sich praktisch ebenso viele wie bei der elfstufigen Skala für die Stufe 5, nicht weil sie politisch links von der Mitte stehen, sondern weil sie dort die Mitte vermuten. Wenn also bei den Befragten das Bedürfnis besteht, den Mittelpunkt einer Skala auszuwählen, ihnen dieser Mittelpunkt aber verweigert wird, dann wählen sie die psychologische Mitte. Sie denken sich den Mittelpunkt in die Skala hinein und verweigern sich damit der Entscheidung, zu der man sie zwingen wollte (Petersen 2002, S. 208- 212). Auch hier muss also daran erinnert werden, dass die Vorstellungen der Befragten Vorrang vor den erdachten Strukturen der Analytiker <?page no="146"?> Möglichkeiten und Probleme von Skalen 147 haben müssen. Wenn der Mittelpunkt Bestandteil der Vorstellungen der Befragten ist - und das ist meistens der Fall -, muss er auch angeboten werden. Das bedeutet, das bipolare Skalen, also solche, bei denen der Mittelpunkt einer inhaltlich neutralen Position entspricht, in aller Regel eine ungerade Zahl von Skalenstufen haben sollten. Bei unipolaren Skalen, also solchen, bei denen der logische Nullpunkt einer Randposition auf der Skala entspricht, wie beispielsweise Cantrils Thermometer- Skala, ist dies dagegen nicht so wichtig. Optische Skalen können, wie gesehen, bei persönlichen wie auch bis zu einem gewissen Grade bei schriftlichen und Online-Umfragen das Interview durchaus bereichern. Doch was kann man tun, wenn man auf eine längere aus Einzelaussagen zusammengesetzte Skala nicht verzichten kann und - beispielsweise weil man die Ergebnisse mit denen anderer Untersuchungen vergleichen will - auch keine Vereinfachungen und Kürzungen vornehmen kann? In diesem Fall bietet sich bei persönlichen Befragungen die bereits oben im anderen Zusammenhang präsentierte Vorlage eines Kartenspiels mit Verteilvorgang an. Die bei diesem Verfahren ermittelten Daten entsprechen in ihrer logischen Struktur denen von langen Likert-Skalen, ohne dass es den Befragten im Interview auffällt. Durch die Aufgabe, die Karten zu verteilen, werden die Befragten von der Monotonie der langen Aussagenbatterie abgelenkt. Auf diese Weise kann man in einer für die Befragten einigermaßen erträglichen Form zumindest zwei oder drei solcher Item- Skalenbatterien im Fragebogen unterbringen. Fragebeispiel 31 illustriert das Prinzip noch einmal anhand einer Frage zum Informationsinteresse der Bevölkerung. Insgesamt wurden dabei 40 Karten überreicht. Auf zwei in der Praxis etwas seltener genutzte Skalentypen soll am Ende des Kapitels noch kurz eingegangen werden. Bei vielen Skalen - wie auch anderen Fragen - besteht ein gewisses logisches Problem darin, dass man die ermittelten Zahlen nicht leicht mit externen Informationen in Beziehung setzen kann, was ihre Aussagekraft erheblich steigern würde. Man erfährt aus einer Frage, in welchem Maße die Befragten mit ihrer wirtschaftlichen Situation zufrieden sind. Doch wie sind die Ergebnisse zu interpretieren? Liegen keine Vergleichswerte aus früheren Befragungen oder aus anderen Ländern vor, lässt sich kaum feststellen, ob die Zahlen positiv oder negativ zu deuten sind. In einem solchen Fall kann eine selbstverankernde Skala von Nutzen sein. <?page no="147"?> Formenlehre 148 Fragebeispiel 31 Ein Ersatz für Likert-Skalen: Kartenspiel mit Verteilvorgang INTERVIEWER überreicht Kartenspiel und Liste (Abbildung 15)! „Es ist ja oft so, dass man über das eine gern mehr erfahren möchte, anderes interessiert einen weniger. Könnten Sie jetzt bitte einmal die Karten hier ansehen und auf dieses Blatt verteilen, je nachdem, wie sehr Sie das interessiert. Sie sehen ja, was da steht.“ (Alles Zutreffende einkreisen) INTERESSIERT MICH GANZ BESONDERS / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / / 16 / 17 / 18 / 19 / 20 / 21 / 22 / 23 / 24 / 25 / 26 / 27 / 28 / / 29 / 30 / 31 / 32 / 33 / 34 / 35 / 36 / 37 / 38 / 39 / 40 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - INTERESSIERT MICH AUCH, ABER NICHT SO SEHR / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / / 16 / 17 / 18 / 19 / 20 / 21 / 22 / 23 / 24 / 25 / 26 / 27 / 28 / / 29 / 30 / 31 / 32 / 33 / 34 / 35 / 36 / 37 / 38 / 39 / 40 / - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - INTERESSIERT MICH KAUM, GAR NICHT / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / 9 / 10 / 11 / 12 / 13 / 14 / 15 / / 16 / 17 / 18 / 19 / 20 / 21 / 22 / 23 / 24 / 25 / 26 / 27 / 28 / / 29 / 30 / 31 / 32 / 33 / 34 / 35 / 36 / 37 / 38 / 39 / 40 / (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6040) Das Prinzip der selbstverankernden Skala hat bereits Hadley Cantril in den 60er-Jahren beschrieben (Cantril/ Kilpatrick 1960): Man fragt beispielsweise mithilfe einer Skalenvorlage, wie jemand seine wirtschaftliche Lage einschätzt. Dann legt man dieselbe Skala noch einmal vor und fragt nun, wie seine Situation vor fünf Jahren war. Mit einem solchen Instrument kann man die subjektive Entwicklung der Lage (oder natürlich auch eines anderen Untersuchungsgegenstandes) aus der Sicht der Befragten feststellen. Objektive Kriterien, wie etwa die <?page no="148"?> Möglichkeiten und Probleme von Skalen 149 Höhe des Einkommens, spielen keine Rolle. Die erste Frage nach der gegenwärtigen Situation setzt gleichsam den „Anker“, den Basiswert, mit dem sich das Ergebnis der zweiten Frage in ein relatives Verhältnis setzen lässt. Abbildung 15 Vorlage zum Verteilen und Kartenbeispiele zu Fragebeispiel 31 (Quelle: Schneller 1997) <?page no="149"?> Formenlehre 150 Auf einer auf diese Weise konstruierten selbstverankernden Skala wird ein armer Mann, der seine persönliche Situation heute trotz seiner Armut als wesentlich besser einstuft als die vor fünf Jahren, einen höheren Skalenwert bekommen als ein reicher Mann, der seine gegenwärtige wie auch seine vergangene Lage gleichermaßen als vorzüglich einschätzt. Die Skala misst in diesem Fall die Dynamik der persönlichen wirtschaftlichen Entwicklung aus Sicht der Befragten. Ein solcher Maßstab kann beispielsweise bei der Erforschung der Lebenszufriedenheit von großem Nutzen sein, denn es lässt sich zeigen, dass diese weniger vom absoluten Wohlstandsniveau abhängig ist als von dem Gefühl, dass sich die persönliche Situation verbessert (Petersen 2011). Aber auch die absoluten Werte können aufschlussreich sein. Wenn die Bevölkerung im Durchschnitt ihre gegenwärtige wirtschaftliche Situation trotz objektiv praktisch unveränderter ökonomischer Rahmendaten als schlechter einschätzt als die Lage vor fünf Jahren, ist das ein aufschlussreicher Hinweis auf eine psychologisch angespannte Lage im Land. Das Muster der selbstverankernden Skala lässt sich vielfältig variieren. Man kann die gegenwärtige Lage mit den Hoffnungen für die Zukunft vergleichen, die eigene Lage mit der anderer Leute oder die Einschätzung einer Institution mit einer anderen. Das Grundprinzip bleibt immer gleich: Der erste Wert setzt den Maßstab, an dem der zweite gemessen wird. Auf diese Weise erhält man Daten, die auf verschiedenen, weil subjektiv bestimmten Grundlagen beruhen und dennoch statistisch miteinander vergleichbar sind. Die zweite vergleichsweise selten genutzte Form der Skalenfrage ist das semantische Differential. Dieses Instrument wird in der Psychologie bei Laborexprimenten eingesetzt, beispielsweise zur Messung von Reaktionen auf Bildvorlagen oder Filme. So hat beispielsweise der Duisburger Psychologe Siegfried Frey dieses Verfahren genutzt, um die Wirkung der Körpersprache von Rednern zu untersuchen (Frey 1999). Das semantische Differential ist besonders gut für schriftliche Interviews geeignet, weil die Befragten den Bogen selbst ausfüllen sollten. Zum Vorlesen ist das Modell zu kompliziert. Man kann aber auch im Rahmen eines sonst mündlich-persönlich geführten Interviews einen Bogen mit einem semantischen Differential zum Selbstausfüllen überreichen lassen. Bei einem semantischen Differential werden die Befragten aufgefordert, einen ihnen vorgestellten Gegenstand in einem gedachten <?page no="150"?> Möglichkeiten und Probleme von Skalen 151 Raum zwischen einer Serie von Wortpaaren einzuordnen, ob sie beispielsweise einen abgebildeten Mann eher als stark oder schwach, als klug oder dumm, ehrlich oder unehrlich empfinden. Fragebeispiel 32 zeigt eine solche Frage. Sie stammt aus einem Laborexperiment zur Wirkung der Bildberichterstattung über Politiker, die in einen Skandal verwickelt sind. Für jedes getestete Politikerbild ließ sich mithilfe des semantischen Differentials ein eigenes Profil erstellen. Es zeigte sich, dass sich die Reaktionen auf Politikerbilder, die der Berichterstattung über den Skandal entnommen wurden, deutlich anders ausfielen als die Reaktionen auf Bilder derselben Politiker aus der Zeit vor dem Skandal, und zwar auch bei solchen Versuchspersonen, die die abgebildete Person nicht kannten und von dem Skandal nichts wussten (Eisinger/ Petersen 2009). Das gleiche Verfahren wurde auch in der kommunikationswissenschaftlichen Grundlagenforschung zum Test der Wirkung von verschiedenen Bildelementen bei Porträtfotos auf die Einschätzung der abgebileten Person angewandt (Petersen 2005b). Fragebeispiel 32 Anleitung zum semantischen Differential INTERVIEWER überreicht Stift und Bildblatt mit Skala zum Selbstankreuzen! „Hier ist ein Politiker abgebildet. Das ist sicherlich nicht leicht zu sagen, aber was glauben Sie, wie dieser Mann so ist? Unten auf dem Bild stehen links und rechts am Rand verschiedene Eigenschaften. Dazwischen sind Felder zum Ankreuzen. Zuerst kommen ‚stark’ und ‚schwach.’ Wenn Sie zum Beispiel bei dem abgebildeten Politiker an ‚stark’ denken, dann kreuzen Sie bitte links ein Kästchen an, entweder unter 2 oder unter 1, je nachdem, wie sehr Sie dabei an das Wort ‚stark’ denken müssen. Umgekehrt ist es, wenn Sie bei dem Politiker mehr an das Wort ‚schwach’ denken müssen. Dann machen Sie auf der rechten Seite Ihr Kreuz. Das Kästchen unter der Null kreuzen Sie dann an, wenn der Politiker Sie an keines der beiden Worte erinnert.“ (Quelle: Eisinger/ Petersen 2009) <?page no="151"?> Formenlehre 152 Abbildung 16 Bildvorlage zu Fragebeispiel 32 Was trift wohl auf diesen Politiker zu? Ist er eher ... 2 1 0 1 2 stark schwach klug dumm sympathisch unsympathisch ehrlich falsch offen verschlossen fröhlich ernst zuverlässig unzuverlässig vertrauenswürdig nicht vertrauenswürdig zuversichtlich ängstlich erfolgreich erfolglos beliebt unbeliebt (Quelle: Eisinger/ Petersen 2009) Je nachdem, welches Feld der Befragte ankreuzt, wird, wenn die Skala so konstruiert ist wie bei Fragebeispiel 32, eine Codeziffer von 1 bis 5 zugeordnet. (Die über den Begriffspaaren stehenden Ziffern dienen den Befragten als Orientierungshilfe. Für die endgültige Codierung sind sie ungeignet, weil die Ziffern 1 und 2 jeweils zweimal vorkommen.) <?page no="152"?> Möglichkeiten und Probleme von Skalen 153 Bei der Konstruktion eines semantischen Differentials kommt es gelegentlich zu Auseinandersetzungen um die Frage, ob man, wie im hier präsentierten Beispiel, alle positiven Ausagen auf der einen und alle negativen auf der anderen Seite des Differentials anordnen sollte oder ob es nicht methodisch sauberer sei, gelegentlich die „Richtung“ der Anordnung der Items zu wechseln. Auf diese Weise müsse sich der Befragte stärker auf die einzelnen Aussagen konzentrieren, und es werde auch verhindert, dass die positiven Aussagen, die angesichts der Leserichtung von links nach rechts als Erste gelesen würden, systematisch bevorzugt würden („primacy effect“). Dazu ist zu sagen, dass der „primacy effect“, obwohl seine Existenz oft angenommen und gut begründet wurde (Krosnick/ Alwyn 1987; Krosnick 1992), bisher nicht überzeugend nachgewiesen werden konnte (vgl. Petersen 2002, S. 171- 192). Wenn er überhaupt existiert, ist er jedenfalls erheblich geringer als das Fehlerrisiko, dass sich dadurch ergibt, dass der Befragte bei der Lektüre der Items ständig umdenken muss. Eine einheitliche Sortierung der Polaritäten ist, weil sie den Interviewablauf erleichtert, deswegen vorzuziehen. Wie bei allen Skalenfragen gilt aber auch beim semantischen Differential, dass man, bevor man sich dafür entscheidet, das Instrument einzusetzen, sich fragen sollte, ob man die skalierte Datenstruktur, die man dabei erhält, auch tatsächlich benötigt. In vielen Fällen wird ein einfaches Assoziationsprofil ebenso gute Dienste leisten. Hierbei legt man den Befragten nur jeweils einen der gegensätzlichen Begriffe vor und fragt, ob man bei der abgebildeten Person an diesen Begriff denken könnte, ob man also meint, die betreffende Person sei stark, klug, sympathisch, ehrlich usw. Die Analyse der Häufigkeiten, mit denen die Begriffe der abgebildeten Person zugeordnet werden, wird in der Regel die gleichen Schlussfolgerungen ermöglichen wie das Resultat eines vollständigen semantischen Differentials. 4.7 Umgang mit der Kategorie „Unentschieden“ Ein besonderes Charakteristikum der Fragekonstruktion bei Repräsentativumfragen ist die Sitte, zu jeder Frage, gleich wie heftig umstritten der Fragegegenstand auch sein mag, immer die Antwortmöglichkeit <?page no="153"?> Formenlehre 154 „Unentschieden“ oder „Keine Angabe“ anzubieten. In der Öffentlichkeit erscheint dieses Vorgehen wie eine Marotte, die gelegentlich zum Gegenstand des Spottes wird. „Dies ist der Augenblick der Entscheidung“, ruft im Comic der Wikingerhäuptling seinen Kriegern zu. „Seid Ihr Helden oder feige Memmen? “ Daraufhin liest der Assistent des Häuptlings von einem Zettel vor: „10 Helden, 10 feige Memmen und 2 Weißnicht“ (Browne 1986, Nr. F 164). Viele Analytiker lieben die Kategorie „Unentschieden“ nicht besonders, weil sie die Daten zu verwässern scheint. In der Sozialforschung hat man bei der Formulierung einer Frage ja meist einen bestimmten vermuteten Zusammenhang zwischen mehreren zu erfragenden Gegenständen im Hinterkopf: Man möchte wissen, ob die Anhänger einer bestimmten Partei auch eine bestimmte politische Position befürworten, ob der Kauf eines Produktes mit einer bestimmten Persönlichkeitseigenschaft verknüpft ist oder ob Reichtum glücklich macht. Wenn die Befragten bei den Fragen nach der Parteipräferenz, den Konsumgewohnheiten, dem Einkommen oder dem subjektiven Wohlbefinden auf Aussagen wie „Weiß nicht“, „teils, teils“, „Unentschieden“ oder „Keine Angabe“ ausweichen, ist das zunächst einmal ärgerlich, denn dies sind Antworten, mit denen man in der geplanten Analyse in der Regel nichts anfangen kann. Und doch kommt man um solche Ausweichkategorien nicht herum, und zwar aus drei Gründen. Erstens ist die Antwort „Unentschieden“ keinesfalls immer nur als ein Kennzeichen mangelnden Entschlusswillens und damit in der Analyse als Ausfall zu betrachten. Es gibt durchaus Fälle, in denen „Unentschieden“ etwas anderes bedeutet als „Keine Angabe“. In solchen Fällen müssen beide Kategorien auch getrennt erhoben werden. Howard Schuman und Stanley Presser haben in ihrem sehr lesenswerten Buch „Questions and Answers in Attitude Surveys“ aus dem Jahr 1981 mit Recht und sehr deutlich darauf hingewiesen, dass es eine sehr feine und schlecht festzulegende Trennlinie zwischen Meinungen und Nichtmeinungen gibt (Schuman/ Presser 1981, S. 147- 160). Zweitens ist auch in solchen Fällen, in denen „Unentschieden“ tatsächlich eine Ausweichkategorie ist, also keine Antwort, für die man sich nach gründlicher Überlegung und mit vollem Bewusstsein aus in- <?page no="154"?> Umgang mit der Kategorie „Unentschieden“ 155 haltlichen Gründen entscheidet, der Anteil derjenigen, die diese Antwort wählen, ein wichtiger Teil der Information. Dabei gibt es durchaus Fälle, in denen es unausweichlich ist, die „Unentschiedenen“ aus der Analyse auszuschließen, weil sonst die Aussagekraft des Ergebnisses beeinträchtigt wäre. Eine Wahlprognose muss selbstverständlich auf den Angaben derjenigen Befragten beruhen, die eine konkrete Parteiangabe machen (bzw. derjenigen, die mit hoher Sicherheit einer bestimmten Partei zugeordnet werden können [vgl. Noelle-Neumann/ Petersen 2005, S. 295]). Kaum ein Zeitungsleser wäre mit der Information zufrieden, dass nach einer Umfrage am kommenden Sonntag 25 Prozent der Befragten die CDU/ CSU wählen würden, 18 Prozent die SPD, 7 Prozent die Grünen, 3 Prozent die FDP, 4 Prozent die Linkspartei und 5 Prozent andere Parteien, während 37 Prozent unentschieden seien. Die Zahlen wären möglicherweise korrekt, doch sie würden nicht die Frage des Lesers beantworten, wer denn voraussichtlich die Wahl gewinnen würde. Diese Frage kann man nur dann beantworten, wenn man die Unentschiedenen aus der Rechnung herausnimmt. Dann ergeben sich 40 Prozent für die CDU/ CSU, 29 Prozent für die SPD, 11 Prozent für die Grünen, 5 Prozent für die FDP, 6 Prozent für die Linkspartei und 8 Prozent für andere Parteien - und damit Zahlen, mit denen der Leser etwas anfangen kann. Doch solche Fälle sind die Aunahme. Meistens bewegt sich der Anteil derjenigen Befragten, die auf eine Meinungsfrage mit „Unentschieden“ antworten, bei etwa 10 Prozent, in seltenen Fällen werden auch einmal 20 Prozent erreicht. Ob man diese Befragten bei der Anlyse der Daten berücksichtigt oder nicht, ändert in aller Regel nichts Wesentliches an der Gesamtaussage des Ergebnisses, also gibt es noch nicht einmal einen mathematischen Grund, die Unentschiedenen unter den Tisch fallen zu lassen (außer wenn die Rechenoperation dies zwingend voraussetzt). Folglich ist es allein schon aus Gründen der Vollständigkeit der Dokumentation angebracht, die Unentschiedenen mit zu berücksichtigen. Es gibt Fälle, bei denen der Anteil der „Unentschieden“-Antworten das wichtigste Ergebnis einer Frage ist. Dies ist oft dann der Fall, wenn sich auffallend viele Befragte nicht zu einer Antwort durchringen können. Ein Beispiel hierfür zeigt Abbildung 17. Würde man hier die Unentschiedenen aus dem Gesamtergebnis herausrechnen, erhielte man <?page no="155"?> Formenlehre 156 die Information, dass sich 48 Prozent derer, die eine eindeutige Antwort gaben, für die Verlängerung der Arbeitszeiten aussprachen und 52 Prozent für höhere Rentenbeiträge plädierten. Mit einer solchen Information würde man den Leser aber in die Irre führen, denn sie würde suggerieren, dass die Bevölkerung in dieser Frage in zwei fast gleich große Lager gespalten ist. Tatsächlich aber zeigt der Anteil von 37 Prozent Unentschiedenen, dass sie angesichts der zur Auswahl gestellten Alternativen äußerst verunsichert reagiert. Ergebnisse wie das in Abbildung 17 wiedergegebene sind typisch in Fällen, bei denen sich die Bevölkerung keine endgültige Meinung gebildet hat. Wenn ein Drittel der Befragten eine zur Auswahl gestellte Ansicht auswählt, ein weiteres Drittel die Gegenposition und das letzte Drittel auf „Unentschieden“ ausweicht, ist das ein fast sicheres Zeichen für Orientierungslosigkeit. Auch die Verweigerung einer klaren Antwort ist eine Antwort. Abbildung 17 „Unentschieden“ ist Teil der Information Frage: „In Zukunft wird es bei uns ja immer mehr Rentner geben. Nach dem heutigen Rentensystem gibt es da unter anderem zwei Möglichkeiten: Entweder man muss länger arbeiten, bis man in Rente gehen kann, oder die Beiträge zur Rentenversicherung steigen. Was ist Ihrer Meinung nach besser, länger arbeiten oder höhere Rentenbeiträge? “ Bundesrepublik Deutschland Bevölkerung ab 16 Jahre Juni 2003 % Lieber länger arbeiten 30 Lieber höhere Rentenbeiträge 33 Unentschieden 37 ___ 100 n = 2092 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7044) <?page no="156"?> Umgang mit der Kategorie „Unentschieden“ 157 Man kann sich die spezielle Aussagekraft der „Unentschieden“- Antworten zunutze machen, etwa wenn man die Festigkeit von Meinungen prüfen will. Liegt der Anteil der „Unentschieden“-Antworten bei einer Frage auffallend hoch, lohnt es sich meist zu prüfen, wie sich das Antwortverhalten verändert, wenn man die Frageformulierung geringfügig ändert. Treten dann starke Formulierungseffekte zutage, kann man sicher sein, dass man es mit einem hohen Grad an Verunsicherung in der Bevölkerung zu tun hat. Bei fest gefügten Meinungen lösen dagegen umgekehrt selbst massive Änderungen im Fragetext keine nennenswerten Effekte aus (vgl. Petersen 2002, S. 115-126). Schließlich - und das ist der dritte Grund, warum man auf die Kategorie „Unentschieden“ nicht verzichten kann - gibt es in vielen Fällen den ausgeprägten Wunsch der Befragten, sich nicht zu entscheiden. Und damit gilt auch hier die schon so oft erwähnte Regel, dass sich der Fragebogenkonstrukteur den Bedürfnissen der Befragten zu beugen hat. Der aktive Wunsch, sich in einer Frage neutral zu positionieren, wurde bereits im letzten Kapitel am Beispiel der Notwendigkeit einer Mittelposition bei vielen Skalenvorlagen angesprochen. Ignoriert man dieses Bedürfnis und versucht man, die Befragten zu zwingen, eine andere Antwort zu geben, kann das gesamte Interview scheitern. Als abschreckendes Beispiel kann hier das bereits in anderem Zusammenhang erwähnte Telefoninterview zur Zufriedenheit mit den verschiedenen Dienstleistungen der Deutschen Bahn dienen, dem das vielleicht schlechteste Untersuchungsinstrument zugrunde lag, das dem Autor je begegnet ist. Wie bereits im Kapitel über Skalen erwähnt, wurde für eine Vielzahl von Aspekten des Bahnfahrens erfragt, wie wichtig sie den Befragten sind und wie zufrieden diese mit den Leistungen der Bahn auf dem betreffenden Gebiet sind. Letztere Frage erwies sich als Problem, als nach Dingen gefragt wurde, zu denen der Befragte mangels eigener Erfahrungen keine Meinung hatte: „Freundlichkeit des Personals im Servicecenter“ - der Autor kauft seine Fahrkarten immer online oder am Automaten. „Schutz vor Belästigungen tagsüber“ - der Autor ist auf seinem heimatlichen Dorfbahnhof bisher glücklicherweise noch nie nennenswert belästigt worden. Also lautete die Antwort: „Dazu kann ich nichts sagen, wählen Sie bitte ‚Weiß nicht’.“ Darauf antwortete die Interviewerin, diese Antwort sei nicht vorgesehen, der Befragte solle eine andere wählen. Die Bemerkung, dass es ja wohl nicht <?page no="157"?> Formenlehre 158 das Problem des Befragten sei, wenn seine einzige ehrliche (und wohl auch kaum abwegige) Antwort im Bogen nicht vorgesehen sei, und dass man die Frage dann wohl überspringen müsse, wurde mit dem Hinweis beantwortet, man könne die Frage nicht überspringen, denn die Computersteuerung des Interviews schalte nicht weiter, bevor die Frage beantwortet sei. Als sich dieser Dialog zum zweiten Mal wiederholte, sah sich der Befragte gezwungen, das Interview abzubrechen. Aufschlussreich ist die Reaktion der Studenten eines Methodenkurses an der Universität Mainz auf diese Geschichte. Von ihnen wirkten viele überrascht, als ihnen von diesem Erlebnis berichtet wurde. Ein Student erzählte schließlich, kurz zuvor sei ihnen von einem Dozenten aus dem Fachgebiet Politikwissenschaft eben diese Methode, „Unentschieden“ nicht zuzulassen und die Befragten zu einer anderen Antwort zu zwingen, dringend empfohlen worden, weil die Befragten dadurch gezwungen würden, besser über ihre Antworten nachzudenken. Man kann die Empfehlung des Dozenten nur dadurch erklären, dass dieser sich noch nie die Mühe gemacht hatte, selbst ein Interview durchzuführen, denn tatsächlich ist ein solches Vorgehen nicht nur grob unhöflich, sondern es schadet auch der Datenqualität. Wer seine Befragten zuerst mit unübersichtlichen und logisch gegenläufigen Fragen verwirrt und ihnen dann auch noch sagt, ihre Antworten seien falsch und sie sollten sich gefälligst andere ausdenken, darf nicht erwarten, dass er trotzdem noch Ergebnisse erhält, die auch nur annähernd die Wirklichkeit widerspiegeln. Besonders absurd ist das im Fall der Kategorie „Weiß nicht“. Diese Antwort nicht zuzulassen, bedeutet nichts anderes, als die Befragten aufzufordern, eine Meinung, die sie nicht haben, zu erfinden. Außerordentlich befremdlich ist in diesem Zusammenhang nicht zuletzt auch der Programmierfehler: Ein Befragter muss immer die Möglichkeit haben, die Antwort auf eine Frage zu verweigern. Wenn das Programm in einem solchen Fall die Fortsetzung des Interviews nicht zulässt, ist das nicht das Problem des Befragten, sondern das des Forschers. Wie hartnäckig Menschen an einer von ihnen gewünschten Antwort festhalten können, auch wenn man versucht, sie davon abzubringen, zeigt Abbildung 18, in der die entscheidende Kategorie zwar nicht „Unentschieden“ ist, aber immerhin eine Antwort, die ebenfalls entschlossenes Nichtentscheiden dokumentiert. Die Frage ähnelt in Form und Inhalt stark der in Abbildung 17 präsentierten Formulierung, nur dass <?page no="158"?> Umgang mit der Kategorie „Unentschieden“ 159 es in diesem Fall nicht um die Kosten im Renten-, sondern im Gesundheitssystem ging. Mit der Frageformulierung wurde versucht, den Befragten gleichsam die Pistole auf die Brust zu setzen. Es wurde nur die Wahl zwischen zwei Möglichkeiten vorgegeben, die beide den meisten Menschen unangenehm sein mussten: „Was ist Ihnen lieber: wenn jeder sich an den Kosten (der Krankenversicherung) stärker selbst beteiligen muss oder wenn die Beiträge erhöht werden? “ Abbldung 18 Man kann Befragte kaum zu einer Entscheidung zwingen Frage: „Die Kosten im Gesundheitswesen steigen ja immer weiter. Um diese Kosten zu bezahlen, gibt es vor allem zwei Möglichkeiten: Man kann die Kranken stärker an den Kosten beteiligen, sodass jeder mehr selbst bezahlen muss, oder man kann die Beiträge für die Krankenversicherung erhöhen. Was ist Ihnen lieber: Wenn jeder sich an den Kosten stärker selbst beteiligen muss oder wenn die Beiträge erhöht werden? “ Bundesrepublik Deutschland Bevölkerung ab 16 Jahre März 1997 % Lieber stärker selbst beteiligen 22 Lieber höhere Versicherungsbeiträge 16 Keines von beiden 50 Unentschieden 12 ___ 100 n = 2174 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6042) Eigentlich bot die Frage keinen Ausweg. Für eines der beiden Übel musste man sich entscheiden. Dennoch entschied sich die Mehrheit der Befragten für die Antwortmöglichkeit „Keines von beiden“, die wohl- <?page no="159"?> Formenlehre 160 weislich im Fragetext verschwiegen, im Fragebogen aber angesichts der zu erwartenden Reaktionen vorgesehen war. Das Beispiel illustriert, dass es keinen Sinn macht, die Menschen von Antworten abbringen zu wollen, die sie geben wollen. Und auch hier hätte die Weigerung, die Antwort „Keiner von beiden“ zu akzeptieren, die entscheidende Information unterdrückt, nämlich die Tatsache, dass weite Teile der Bevölkerung zum damaligen Zeitpunkt nicht bereit waren, die unvermeidlichen Konsequenzen der Kostensteigerungen im Gesundheitswesen zur Kenntnis zu nehmen. So ist also als wichtigste Regel im Umgang mit der Kategorie „Unentschieden“ festzuhalten, dass es sie immer geben muss. Wie man sie nennt, ob „Unentschieden“, „Keine Angabe“, „Weiß nicht“ oder „Unmöglich zu sagen“, oder ob man einfach darauf verzichtet, die im Fragebogen vorgegebenen Antwortkategorien auszufüllen, wenn der Befragte keine eindeutige Angabe machen will, und das Ganze dann als „Missing Value“ verbucht, ist meist eine Frage des Sprachgefühls, abhängig vom Fragethema, manchmal auch vom Fragemodell. Doch den Befragten muss immer ein Ausweg offen bleiben, wenn sie eine bestimmte Frage nicht beantworten können oder wollen oder sich in den vorgegebenen Antwortkategorien nicht wiederfinden. Diesen Ausweg zu verbauen, ist nicht nur sinnlos, sondern zum Scheitern verurteilt und für die Qualität der Daten schädlich. Allerdings gibt es auch keinen Grund, die Befragten auf die Existenz der Ausweichkategorie aktiv hinzuweisen. Der Ausweg durch die Hintertür ist nämlich in aller Regel für die Befragten sehr bequem. Es wurde oben schon ausführlich auf den Einfluss heuristischer Urteilsbildung auf die Ergebnise von Repräsentativumfragen eingegangen, besonders auf die Tendenz, die Antwort auszuwählen, die unter den inhaltlich einigermaßen akzeptablen Möglichkeiten den geringsten gedanklichen Aufwand erfordert. In der Regel will man in der Umfrageforschung aber durchaus, dass sich die Befragten Gedanken um den Fragegegenstand machen und sich zwischen den zur Auswahl gestellten Kategorien entscheiden, statt sich mit einem bequemen „Weiß nicht“ aus der Affäre zu ziehen. Wer sich wirklich nicht entscheiden kann, wird dies im Interview von sich aus sagen und eine entsprechende Antwortmöglichkeit einfordern. <?page no="160"?> Umgang mit der Kategorie „Unentschieden“ 161 Howard Schuman und Stanley Presser haben mit einer ganzen Reihe von Feldexperimenten demonstriert, wie sehr sich die Ergebnisse von Umfragen ändern können, wenn die Antwortmöglichkeit „Unentschieden“ aktiv im Fragetext angeboten wird. Abbîldung 19 zeigt eines dieser Experimente. Abbildung 19 Effekt des Hinweises auf die Ausweichkategorie im Fragetext Frage Gruppe A: „Glauben Sie, dass die Mitglieder der Regierung kluge Leute sind, oder haben Sie den Eindruck, dass einige von ihnen nicht wissen, was sie tun? “ Frage Gruppe B: „ Glauben Sie, dass die Mitglieder der Regierung kluge Leute sind, oder haben Sie den Eindruck, dass einige von ihnen nicht wissen, was sie tun, oder haben Sie da keine Meinung? “ Vereinigte Staaten Mai 1978 ____________________________________ Gruppe A % Gruppe B % Sind kluge Leute 37 29 Wissen nicht, was sie tun 58 50 Keine Meinung 5 ___ 100 21 ___ 100 n = 597 594 (Quelle: Schuman/ Presser 1981, S. 121) Erneut bestätigt sich hier die Regel, dass im Fragetext ausgesprochene Antwortmöglichkeiten eine größere Chance haben, ausgewählt zu werden, als nicht ausgesprochene Kategorien, besonders dann, wenn ihre Auswahl kein ausgeprägtes Nachdenken erfordert. Die Schlussfolgerung, die aus dieser Erkenntnis zu ziehen ist, ist, dass die Ausweichka- <?page no="161"?> Formenlehre 162 tegorie „Unentschieden“ zwar stets im Fragebogen vorgesehen sein, aber nur dann auch ausdrücklich den Befragten angeboten werden sollte, wenn sie eine inhaltliche, substanzielle Entscheidung bedeutet. Dies ist nur sehr selten der Fall. Wenig sinnvoll ist es meist auch zu versuchen, verschiedene Unterkategorien der Nichtentscheidung zu bilden und beispielsweise zwischen „Unentschieden“, „Keine Meinung“ und „Keine Angabe“ zu unterscheiden. Man gewint damit nur in Ausnahmefällen wirklich verwertbare zusätzliche Informationen. Meistens erweitert man damit nur die Möglichkeiten, sich einer echten Entscheidung zu entziehen. In den 50er-Jahren stellte das Institut für Demoskopie Allensbach regelmäßig in seinen monatlichen Mehrthemenumfragen die Frage: „Sind Sie im Großen und Ganzen mit Adenauer einverstanden oder nicht einverstanden? “ Als Antwortkategorien waren im Fragebogen vorgesehen: „Einverstanden“, „Nicht einverstanden“, „Unentschieden“ und „Kein Urteil“. Es war Adenauer selbst, der in einem Brief das Institut darauf aufmerksam machte, dass die Unterscheidung zwischen „Unentschieden“ und „Kein Urteil“ Unsinn war, weil beides, wie er schrieb, doch eigentlich dasselbe bedeutete. Da sei es doch eigentlich besser, wenn es für beides nur eine Kategorie gebe. Dann bekäme man mehr konkrete Antworten (Noelle-Neumann 1992, S. 97). Er hatte vollkommen recht. 4.8 Interviewer-Beobachtungen In diesem Hauptkapitel konnten nur einige der wichtigsten Frageformen präsentiert werden, die in der Umfrageforschung zur Anwendung kommen. Einige weitere Fragetypen werden noch in den kommenden Abschnitten vorgestellt werden, in denen es hauptsächlich darum geht, mit welchen Fragetechniken man zu bestimmten Themen und unter bestimmten konkreten Rahmenbedingungen zu den Erkenntnissen gelangen kann, die man anstrebt. Zum Abschluss des Kapitels soll noch kurz auf einen Fragetypus eingegangen werden, der bei persönlichen Befragungen sehr nützlich sein kann, der aber bei der Forschungsplanung leicht übersehen wird, weil es sich nicht um Fragen im engeren Sinne handelt. Gemeint sind Beobachtungsnotizen, die die Interviewer nach Abschlus des Interviews in Abwesenheit des Befragten in den <?page no="162"?> Interviewer-Beobachtungen 163 Fragebogen eintragen. Interviewer bei persönlichen Repräsentativumfragen sind keine Experten für Sozialforschung, und sie sollten es auch nicht sein, denn je gründlicher ein Interviewer über den Zweck und die Funktion eines Fragebogens informiert ist, desto größer ist das Risiko, dass er das Antwortverhalten der Befragten beeinflusst (vg. Noelle- Neuman/ Petersen 2005, S. 320). Folglich sind Interviewer in aller Regel auch keine professionellen Beobachter. Doch die Fähigkeiten, die ein Forscher etwa bei der sozialwissenschaftlichen Methode der teilnehmenden Beobachtung benötigt (siehe z. B. Friedrichs 1985, S. 288-309; Diekmann 1995, S. 456-480), sind bei Interviewerbeobachtungen im Rahmen von Repräsentativumfragen auch nicht von Bedeutung. Einige am Rande einer Umfrage mitnotierte Beobachtungen könnten eine richtige, nach allen Regeln der Kunst angelegte systematische Beobachtung ohnehin nicht ersetzen. Doch sie können die Informationen, die in einer Repräsentativumfrage gewonnen werden, sinnvoll ergänzen, denn die Interviewer sind die einzigen, die die Befragten persönlich kennenlernen und sich einen Eindruck von deren Persönlichkeit und ihren Lebensverhältnissen verschaffen können. Ihre Erfahrungen und Beobachtungen lassen sich für die Analyse der Umfragedaten nutzbar machen. Wie dies praktisch geschehen kann, zeigt Fragebeispiel 33. Nachdem sich der Interviewer vom Befragten verabschiedet hat, füllt er noch einige Fragen aus, die an den Bogen angehängt sind und sich direkt an den Interviewer richten. Dieser wechselt damit praktisch die Rolle und wird nun selbst zum Befragten. Interviewer-Beobachtungen können von großem Nutzen sein, wenn es darum geht, die Befragten als Personen zu charakterisieren. In Fragebeispiel 33 dienen die Teilfragen c, e und f diesem Zweck. Man kann aus Beobachtungen dieser Art erstaunlich verlässliche Rückschlüsse beispielsweise auf die Persönlichkeitsstärke eines Befragten ziehen und damit komplizierte Item-Batterien mit Selbstaussagen überflüssig machen. Wie der Allensbacher „Ausdruckstest“ zeigt, ist es sogar möglich, dieses Prinzip noch weiter zu treiben, als in Beispiel 33 dargestellt. Der „Ausdruckstest“ macht sich die Tatsache zunutze, dass die meisten Menschen in der Lage sind, die Stimmung eines anderen Menchen an seiner Mimik und Gestik zu erkennen. Dies haben die Psychologen Paul Ekman und Wallace Friesen in zahlreichen Studien belegt. Unabhängig von Herkunft oder Erziehung nehmen Menschen wahr, ob ihr <?page no="163"?> Formenlehre 164 Gegenüber glücklich oder traurig, wütend oder verunsichert ist. Man kann dies an einzelnen Elementen der Gesichtsausdrücke festmachen (Ekman 1982). Ekman und Friesen entwickelten auf der Grundlage dieser Erkenntnis ein eigenes Verschlüsselungssystem, das „Facial Action Coding System“, mit dem diese Elemente definiert und damit zählbar gemacht werden (Ekman/ Friesen 1978; Schwab/ Unz 2011). Für die Übernahme in Repräsentativumfragen ist das Facial Action Coding System viel zu detailliert. Doch man kann den Interviewern durchaus zutrauen zu notieren, ob der Blick des Befragten eher frei oder eher ausweichend war, ob die Mundwinkel eher nach oben oder eher nach unten wiesen und ob der Befragte eher „ganz fröhlich“ oder „nicht so fröhlich“ aussah (vgl. Noelle-Neumann/ Petersen 2005, S. 190). Solche Beobachtungen sind natürlich äußerst grob, doch die quantitative Auswertung zeigt, dass sie durchaus von Substanz sind. Mithilfe dieser Notizen über den Gesichtsausdruck lassen sich die Befragten nach ihrer subjektiven Lebenszufriedenheit klassifizieren, ohne dass ihnen eine einzige Frage zu diesem Thema gestellt worden wäre (vgl. Petersen/ Mayer 2005, S. 81-95). Fragebeispiel 33 Interviewer-Beobachtungen a) Charakter des Wohnortes: Großstadtatmosphäre.................................................... 1 Klein-, mittelstädtisches Milieu in Ballungsgebiet......... 2 Klein-, mittelstädtisches Milieu in weniger dicht besiedeltem Gebiet........................................................ 3 Ländliche Gegend in der Nähe einer Mittel- oder Großstadt............................................................... 4 Ländliches Milieu mit kleineren Städten in der Nähe ... 5 ______________________________________________________________ b) Der/ die Befragte war zu dem Interview - SEHR GERN BEREIT ................................................... 1 GANZ GERN BEREIT ................................................... 2 NICHT SO GERN BEREIT............................................ 3 <?page no="164"?> Interviewer-Beobachtungen 165 c) Der/ die Befragte war während des Interviews - SEHR SELBSTSICHER, VON SICH ÜBERZEUGT .... 1 ZIEMLICH SELBSTSICHER ......................................... 2 ETWAS UNSICHER ...................................................... 3 ZIEMLICH UNSICHER .................................................. 4 ______________________________________________________________ d) Soziale Schicht des/ der Befragten A ..................................................................................... 1 B ..................................................................................... 2 C ..................................................................................... 3 D ..................................................................................... 4 ______________________________________________________________ e) Der/ die Befragte - STRAHLT KRAFT, ENERGIE AUS .............................. 1 IST LANGWEILIG, OHNE AUSSTRAHLUNG.............. 2 ______________________________________________________________ f) Mit dem/ der Befragten - WÜRDE ICH MICH GERN EINMAL PRIVAT UNTERHALTEN ............................................................ 1 WÜRDE KEINEN WERT DARAUF LEGEN ................. 2 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6094 [modifiziert]) Für die Analyse vieler Umfragedaten von besonderem Wert ist die Einschätzung der sozialen Schicht der Befragten (Teilfrage d), die allerdings eine ausführliche Instruktion der Interviewer voraussetzt. Es wurde oben mit gutem Grund betont, dass es meist keine gute Idee ist, strukturierende Aufgaben den Interviewern aufzuladen. Auch die Fehleranfälligkeit von Feldverschlüsselungen zeigt, dass man in dieser Hinsicht sehr zurückhaltend sein sollte. Meist ist es ein Kenzeichen von Denkfaulheit, wenn das Forscherteam zu dem Schluss kommt, dass ein Detail sich sprachlich nicht völlig befriedigend fassen lässt und man diesen Punkt deswegen den Interviewern erklären müsse. Bei einem guten Fragebogen muss man fast nichts erklären. Doch die Intervie- <?page no="165"?> Formenlehre 166 werbeobachtungen zur sozialen Schicht sind eine Ausnahme. Hier kann der Forscher dem Interviewer keine Strukturierungsleistung abnehmen, denn nur dieser verfügt über die nötigen Kenntnisse, die die Strukturirung erst ermöglichen. Will man ihn also die soziale Schicht des Befragten einstufen lassen, muss man ihm klare Informationen darüber geben, wie diese Schichten definiert sind, beispielsweise mit der in Abbildung 20 wiedergegebenen Instruktion, die dem Fragebogen beigefügt wird und die das Äußerste dessen darstellt, was man den Interviewern an abstrakter Information zumuten kann. Abbildung 20 Merkblatt zur Einstufung in die sozialen Schichten Nach Abschluss eines Interviews tragen Sie im statistischen Teil des Fragebogens ganz nach Ihrem Eindruck die soziale Schicht des Befragten ein. Der Befragte hat Ihnen dazu keine Auskünfte mehr zu geben. Wir möchten Ihnen noch für die Einordnung des Befragten in die "sozialen Schichten" einige Hinweise geben: Wir sprechen von den vier Schichten A, B, C und D. Bei der Einstufung des Befragten sind sowohl das Bildungsniveau als auch der Lebensstil und die finanziellen Verhältnisse zu berücksichtigen. Scharfe Grenzen zwischen diesen vier Schichten gibt es natürlich nicht. Letztlich entscheiden Sie mit Ihrem subjektiven Urteil. Zur A-Schicht gehören beispielsweise Akademiker, die gleichzeitig auch aufgrund ihrer Einkommens- oder Vermögensverhältnisse über dem Durchschnitt stehen. Die finanziellen Verhältnisse sind wichtig. So werden Sie beispielsweise einen Arzt, der mit einem durchschnittlichen Einkommen bei einem Krankenhaus angestellt ist, nicht in die A-Schicht, sondern in die B-Schicht einstufen. Auf der anderen Seite sind akademischer Grad oder Universitätsbildung nicht unbedingte Voraussetzung dafür, dass jemand zur A-Schicht gerechnet wird. Nehmen Sie den Generaldirektor oder ein Vorstandsmitglied eines großen Industrieunternehmens. Beide gehören ohne Zweifel zur A- Schicht, ganz unabhängig davon, ob sie in ihrer Jugend die Volksschule besuchten oder die Mittlere Reife erhielten oder eine Oberschule absolvierten. In die B-Schicht werden Sie mittlere Beamte und Angestellte, selbständige Geschäftsleute mit mittelgroßen Firmen, besser situierte Vertreter größerer Unternehmen, gut gestellte selbständige Handwerker, Eigentümer von Hotels oder größeren Restaurants einrangieren. Wichtig ist hier allerdings, dass <?page no="166"?> Interviewer-Beobachtungen 167 gewisse geistige Voraussetzungen vorhanden sind. Ein Gastwirt, der im Grunde nichts weiter versteht, als Bier einzuschenken, gehört in die C-Schicht - selbst wenn sein Einkommen noch in die B-Schicht hineinreichen sollte. Die C-Schicht übergehen wir zunächst, um erst von der D-Schicht zu sprechen: Die D-Schicht nimmt die sozial Schwachen auf: also Arbeiter mit geringem Verdienst, Rentner, Witwen, die von Fürsorgebeträgen leben und so weiter. Natürlich gehört ein Pensionär, der früher Ministerialrat war und heute eine entsprechend hohe Pension bekommt, in die A-Schicht und nicht in die D-Schicht. Alle übrigen Fälle, die nicht in A oder B, aber auch nicht in D einzustufen sind, gehören in die C-Gruppe. (Quelle: Allensbacher Archiv) Selbstverständlich sind die von den Interviewern auf der Grundlage einer solchen Instruktion vorgenommenen Einstufungen subjektiv und unscharf. Man muss annehmen, dass die Fehlerquote, also die Zahl der Einstufungen, die der Forscher bei einer Überprüfung als falsch einordnen würde, groß ist. Doch wie so oft in der Umfrageforschung wäre auch hier das Streben nach Präzision im Einzelfall nicht nur vergeblich, sondern es wäre auch ein Missverständnis des Instruments. Die auf diese Weise ermittelte soziale Schicht der Befragten erweist sich immer wieder als eine der ergiebigsten Analysekategorien mit erheblicher Differenzierungskraft, das heißt, die in die vier sozialen Schichten eingestuften Befragten zeigen bei anderen Fragen ein deutlich unterschiedliches Antwortverhalten. Das ist ein sicheres Zeichen dafür, dass die Interviewerbeobachtungen trotz aller Störanfälligkeit im Detail zu sehr realitätsnahen Ergebnissen führen. Das Prinzip der Beobachtung im Rahmen von Repräsentativumfragen lässt sich vielfältig abwandeln. Der österreichische Psychologe und Umfrageforscher Erp Ring hat diese Methode in einer Vielzahl von Studien eingesetzt. So ließ er notieren, ob die Befragten ein Bild mit der rechten oder linken Hand zeichneten, wie sich die Passanten bei einer Litfasssäule verhielten, auf der ein Testplakat angebracht war, oder welchen Weg die Besucher durch eine Wanderausstellung nahmen (Ring 1992, S. 205-209). <?page no="167"?> Formenlehre 168 Der Vollständigkeit halber soll noch auf eine besondere Variante der Interviewerbeobachtung hingewiesen werden, die in der Marktforschung eine gewisse Rolle spielt: der Einsatz von Interviewern, die sich als solche nicht zu erkennen geben und stattdessen als Kunden in Geschäften auftreten, beispielsweise in einem Buchgeschäft nach bestimmten Titeln fragen und hinterher notieren, wie sie beraten wurden. Mit solchem in der englischen Fachsprache Mystery Shopping genannten Vorgehen bewegt sich die Umfrageforschung allerdings in einer ethischen Grauzone. Die von den Fachverbänden der Umfrageforschung festgelegten Ethikrichtlinien, beispielsweise der „Code of Ethics“ der World Association for Public Opinion Research (WAPOR), legen ausdrücklich fest, dass der Befragte jederzeit das Recht haben muss, die Teilnahme an einer Studie zu verweigern, und nicht in eine Situation versetzt werden darf, in der ihm eine solche Verweigerung unmöglich wird (WAPOR 2011, § 22). Da die Besitzer der Geschäfte oder ihre Angestellten beim Mystery Shopping aber gar nicht merken, dass sie an einer Untersuchung teilnehmen, können sie ihre Teilnahme auch kaum verhindern. Vor allem aber ist Mystery Shopping anfällig für Missbrauch. Viele größere Unternehmen setzen die Methode zur Kontrolle ihrer Filialen ein, ein Vorgehen, dass zumindest für empirische Sozialforscher unakzeptabel ist, weil damit das Anonymitätsgebot der Umfrageforschung (WAPOR 2011, § 34) verletzt und damit auch die Regel gebrochen wird, dass den Befragten aus ihrem Antwortverhalten niemals Nachteile entstehen dürfen (WAPOR 2011, § 2). In den letzten Jahren hat es wiederholt Versuche gegeben, unter dem Druck interessierter Auftraggeber die Anonymitätsregeln in der Umfrageforschung zu verwässern, nicht zuletzt in der Absicht, die Einsatzmöglichkeiten des Mystery Shopping als Kontrollinstrument zu erweitern. Bisher wurden diese Bestrebungen von den Verbänden zurückgewiesen (Petersen 2007), doch das Potenzial des Mystery Shopping bleibt für viele Unternehmen eine stete Versuchung. Bei zurückhaltendem und verantwortungsbewusstem Einsatz können anonyme Testkäufe aber außerordentlich nützliche, weil unter sehr lebensnahen Bedingungen gewonnene Informationen erbringen. Die Methode ist vor allem in der Konsumgüterforschung von Bedeutung (vgl. Haas 2002; Geiger 2008). Das Grundprinzip lässt sich aber auch zu anderen Zwecken einsetzen. Fragebeispiel 34 zeigt einen Auszug aus einem Fragebogen zum Testkauf <?page no="168"?> Interviewer-Beobachtungen 169 in Spielzeuggeschäften. Die Interviewer lernten die Ermittlungspunkte auswendig und füllten den Erhebungsbogen erst aus, nachdem sie das Geschäft wieder verlassen hatten. Fragebeispiel 34 Kauftest zum Thema Modelleisenbahnen Kaufgespräch: „Ich möchte gerne elektrische Eisenbahnen ansehen. Es sollte ein Geschenk für (m)einen Mann sein. Könnten Sie mir da etwas zeigen? “ (Falls Verkäufer Fragen stellt: Interviewer-Antwort: „Das weiß ich noch nicht, erst mal sehen.“) Was wurde gleich oder nach diesen Fragen gezeigt? (Alles Zutreffende im Kasten einkreisen! ) Marke Größe / Spur Wie gezeigt? Fleischmann.....................1 Kleinsteisenbahn Spur N („Mini“)..................1 Normale Größe Spur HO............................2 Aufgebaute komplette Anlage.............................1 Karton mit ganzer Bahnanlage drin..............2 Einzelteile: Lokomotive, Wagen usw.........3 Katalog, Prospekt............4 Märklin..............................1 Kleinsteisenbahn Spur Z („Mini“)..................1 Normale Größe Spur HO............................2 Groß, auch für draußen Spur I.................................3 Aufgebaute komplette Anlage.............................1 Karton mit ganzer Bahnanlage drin..............2 Einzelteile: Lokomotive, Wagen usw.........3 Katalog, Prospekt............4 (weitere Kästen für andere Marken) <?page no="169"?> Formenlehre 170 (An späterer Stelle im Interview): INTERVIEWER-BEOBACHTUNGEN: a) Waren im Geschäft elektrische Eisenbahnen gut sichtbar ausgestellt, oder wurden sie erst hervorgeholt, als Sie danach fragten? GUT SICHTBAR AUSGESTELLT ................................ 1* WURDEN ERST HERVORGEHOLT ............................ 2 [*] Fiel dabei eine Marke besonders ins Auge? JA, UND ZWAR: FLEISCHMANN....................... 1 TRIX......................................... 2 ARNOLD.................................. 3 MÄRKLIN................................. 4 LEHMANN ............................... 5 ROCO ...................................... 6 ANDERE MARKE.................... 6 NEIN............................................................................... 7 ______________________________________________________________ b) Die Bedienung in diesem Geschäft war - SEHR FACHKUNDIG.................................................... 1 FACHKUNDIG ............................................................... 2 WUSSTE NICHT VIEL .................................................. 3 ______________________________________________________________ c) Das Geschäft liegt - IM GESCHÄFTSVIERTEL ............................................ 1 AUSSERHALB DES GESCHÄFTSVIERTELS............. 2 ______________________________________________________________ d) Ich wurde bedient von - EINEM MANN ................................................................ 1 EINER FRAU ................................................................. 2 ______________________________________________________________ e) Alter des Verkäufers / der Verkäuferin (geschätzt): UNTER 20 JAHREN...................................................... 1 ZWISCHEN 20 UND 29 JAHREN................................. 2 ZWISCHEN 30 UND 50 JAHREN................................. 3 ÜBER 50 JAHRE ........................................................... 4 (Quelle: Ring 1992, S. 206-207) <?page no="170"?> 171 5 Fragestrategien 5.1 Grundsatzentscheidung: Abstrakt oder konkret? Eine der ersten Entscheidungen, die man treffen muss, wenn man sich an die Entwicklung einer Frage begibt, ist, ob man den Gegenstand der Frage in abstrakter oder konkretisierter Form ansprechen will. Abstrakte Begriffe sind meist sachlich präziser, Konkretisierungen in aller Regel leichter verständlich. Für welchen Formulierungstyp man sich entscheidet, ist im Wesentlichen von der Geläufigkeit des zur Auswahl stehenden abstrakten Begriffs abhängig. Allerdings können auch geläufige abstrakte Begriffe für die Umfrageforschung ungeeignet sein, etwa dann, wenn es sich um Schlagworte handelt, die zwar in der Alltagssprache häufig verwendet werden, die aber nur eine Präzision der Sprache vortäuschen. Ein besonders eindrückliches Beispiel bietet hier der Begriff „Freiheit“. Jeder kennt ihn, jeder benutzt ihn, doch was bedeutet er? Das von Jacob und Wilhelm Grimm begründete „Deutsche Wörterbuch“ listete im Jahr 1878 zehn verschiedene Definitionen des Begriffes auf (Grimm/ Grimm 1878, Sp. 111-113), nach heutigem Sprachverständnis ist mindestens noch eine weitere hinzugekommen, wobei sich die Bedeutungen teilweise gegenseitig widersprechen (vgl. Petersen/ Mayer 2005, S. 33-37). Wer mit einem solchen Begriff in der Umfrageforschung versucht umzugehen, bekommt Probleme. Nicht immer lassen sich solche Schlagworte ersetzen, doch wer sie verwendet, ist gezwungen, gedankliche Aufräumarbeit zu leisten, etwa indem er die Befragten bittet anzugeben, welche Inhalte sie mit dem Wort verbinden. Oft wird es erst dadurch möglich, die Reaktionen der Befragten sinnvoll zu interpretieren. Oder aber man muss im Fragetext erklären, was mit dem Begriff im konkreten Fall gemeint ist. Am Beispiel des Begriffes „Freiheit“ wird damit deutlich, warum in vielen Fällen die Grundsatzfrage nach der Entscheidung zwischen der <?page no="171"?> Fragestrategien 172 abstrakten und der konkreten Formulierung zugunsten der letzteren entschieden werden muss. In vielen Fällen macht sie den Untersuchungsgegenstand für die Befragten erst zugänglich. Die Gründe für die Notwendigkeit von Konkretisierungen wurden bereits im Kapitel über die Sprache des Fragebogens behandelt. Abstrakte Begriffe, verallgemeinernde Kategorien oder Fachvokabular benötigen, auch wenn sie inhaltlich präzise sind, oft regelrechte Übersetzungen, um überhaupt verstanden zu werden. Dort wurde auch in Fragebeispiel 1 gezeigt, wie eine solche Konkretisierung aussehen kann: Das abstrakte Konstrukt „Aktualität von Klassenkampfvorstellungen“ wurde in eine alltagsnahe konkrete Beschreibung überführt. Einen im Prinzip ähnlichen Fall zeigt Fragebeispiel 35. Es handelt sich dabei um eine bereits im Jahr 1955 entwickelte und seitdem immer wieder bei Untersuchungen zum Thema Freiheit eingesetzte Frage (z. B. Petersen/ Mayer 2005; Ackermann 2012), mit der eine Einstellung erfasst wird, die man als wesentliche Voraussetzung für eine Freiheitsorientierung ansehen kann. Die Frage kommt ganz ohne Fachbegriffe und komplizierte Definitionen aus. Viele Befragte merken vermutlich gar nicht, dass sie es dabei mit einer fundamentalen weltanschaulichen Frage zu tun haben. Und doch ist diese Frage die vielleicht wichtigste, wenn es darum geht, die Bevölkerung in Gruppen mit mehr oder weniger ausgeprägter Freiheitsorientierung zu unterteilen. Nur wer glaubt, dass die meisten Menschen in der Lage sind, ihr Leben selbst zu meistern, wird auch die Handlungs- und Entscheidungsfreiheit des Einzelnen als gesellschaftliches Prinzip befürworten können. Wer dagegen der Ansicht ist, dass die meisten Menschen unentrinnbar ihren materiellen äußeren Lebensumständen ausgeliefert sind, wird sich eher für einen betreuenden Staat einsetzen, der stark in die Lebensentscheidungen des Einzelnen eingreift. In vielen Fällen bietet es sich an, bei der Übersetzung eines abstrakten Konzepts in eine konkrete und einfache Sprache den Gegenstand der Frage mit erzählerischen Elementen in eine kleine Geschichte gleichsam „einzupacken“. Viele solcher Fragen beginnen mit Formulierungen wie „Ich möchte Ihnen eine Geschichte erzählen ...“, „Neulich gab es einen Vorfall ...“ oder „Kürzlich sagte uns jemand ...“. Der anekdotenhafte Einstieg entspricht einem häufigen Muster in der Alltagskonversation und erleichtert deswegen den Zugang zum sonst oft etwas <?page no="172"?> Grundsatzentscheidung: Abstrakt oder konkret? 173 komplizierten Thema. Darüber hinaus rechtfertigt er die folgende, notgedrungen oft etwas längere Erzählung. Man kann diese Fragetechnik sprachlich vielfältig variieren. Fragebeispiel 36 zeigt eine Übersetzung der Frage, ob man im Alltagsleben dem Gleichheitsprinzip oder dem Leistungsprinzip den Vorrang gibt. Das Beispiel zeigt auch, dass in dieser Weise konkretisierte Fragen nicht nur verständlicher sind als die abstrakten Formulierungen, die sie ersetzen, sondern zumindest in manchen Fällen auch die valideren, weil wirklichkeitsnäheren Ergebnisse zutage fördern. Zumindest kann man ernsthaft daran zweifeln, dass die Antworten auf die Frage die gleichen wären, wenn den Befragten bewusst wäre, dass sie sich bei der Formulierung ihrer Antwort zwischen dem Leistungs- und dem Gleichheitsprinzip entscheiden. Da die meisten Menschen aber auch im Alltag kaum derart grundlegende Kategorien vor Augen haben, wenn sie sich über eine aus ihrer Sicht ungerechte Bezahlung von Angestellten ärgern, dürfte mit der in einer Geschichte konkretisierten Frageformulierung verlässlicher als mit einer abstrakten Variante ermittelt werden, welchem Prinzip im tatsächlichen Leben der Vorrang eingeräumt wird. Fragebeispiel 35 Sprachliche Konkretisierung einer liberalen Grundhaltung „Zwei Männer unterhalten sich über das Leben. Der erste sagt: ‚Jeder ist seines Glückes Schmied. Wer sich heute wirklich anstrengt, der kann es auch zu etwas bringen.’ Der zweite sagt: ‚Tatsächlich ist es so, dass die einen oben sind, und die anderen sind unten und kommen bei den heutigen Verhältnissen auch nicht hoch, sosehr sie sich auch anstrengen.’ Was würden Sie persönlich sagen: Wer von den beiden hat eher recht - der erste oder der zweite? “ DER ERSTE .................................................................. 1 DER ZWEITE................................................................. 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10077) <?page no="173"?> Fragestrategien 174 Fragebeispiel 36 Leistungs- oder Gleichheitsprinzip? Die zwei Sekretärinnen „Jetzt möchte ich Ihnen einen Fall erzählen: Zwei Sekretärinnen sind gleich alt und tun praktisch die gleiche Arbeit. Aber eines Tages stellt die eine fest, dass die andere 200 Euro im Monat mehr bekommt. Die besser bezahlte Sekretärin ist jedoch tüchtiger, zuverlässiger und arbeitet rascher. Halten Sie es für gerecht, dass die eine mehr bekommt, oder halten Sie es für nicht gerecht? “ GERECHT ..................................................................... 1 NICHT GERECHT ......................................................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10023) Trotz solcher Beispiele fällt die Entscheidung, ob man sich für eine abstrakte oder konkrete Frageformulierung entscheiden sollte, keinesfalls immer eindeutig zugunsten der konkreten Formulierung aus, wenn auch die Zahl der Fälle, in denen die Konkretisierung der Abstraktion vorzuziehen ist, weitaus überwiegt. Die abstrakte Formulierung ist immer dann zu wählen, wenn sie selbst - und nicht ein möglicherweise hinter ihr stehendes gedankliches Konzept - der Gegenstand der Untersuchung ist. Dies ist beispielsweise oft beim Test von Werbeslogans und Wahlplakaten der Fall. Ein Beispiel ist das im Kapitel zur Strukturierung von Antwortmöglichkeiten erwähnte Wahlkampf-Schlagwort der „neuen Mitte.“ Hier wäre es Unsinn gewesen, den Begriff durch eine wie immer geartete inhaltliche Beschreibung zu ersetzen. Dass der Begriff für die meisten Menschen unverständlich war, war irrelevant, denn seine Zugkraft lag nicht in der objektiven Begriffsbedeutung, sondern in der Sprache selbst. Man kann vielleicht die Regel aufstellen, dass ein Fragetext umso alltagsnäher und erzählender sein muss, je mehr Inhalte im Mittelpunkt der Betrachtung stehen, die durch die Sprache erfasst und transportiert werden müssen, während er umgekehrt umso abstrakter sein kann, je mehr die Sprache selbst der Gegenstand der Untersuchung ist. Im Extremfall kann dabei der übliche sprachliche Verband, in den die zu testenden Begriffe normalerweise eingebunden sind, vollkommen auf- <?page no="174"?> Grundsatzentscheidung: Abstrakt oder konkret? 175 gelöst werden. Das bedeutet nicht, dass die Begriffe dadurch inhaltsleer werden, sondern man verzichtet lediglich darauf, den Inhalt mit zusätzlichen Worten zu erläutern. Man überträgt die Aufgabe, die Sprache mit einem konkreten Inhalt zu füllen, den Befragten. Wie man mit der Herauslösung von Begriffen aus ihrem üblichen sprachlichen Zusammenhang deren „gefühlten Inhalt“ sichtbar machen kann, lässt sich am Beispiel von Assoziationstests illustrieren, etwa wie in Fragebeispiel 37. Die dort gezeigte Frage wird seit Jahrzehnten immer wieder in leicht abgewandelter Form wiederholt, um die „Aura“ zu erfassen, die den Begriff „Europa“ umgibt. Aus den Ergebnissen lässt sich ablesen, ob und in welchem Maße „Europa“ und, weil mit diesem Begriff eng verbunden, auch die Europäische Einigung einen eher positiven oder eher negativen Klang hat. So ließ sich mit dieser Frage zeigen, dass die Assoziationen zum Begriff „Europa“ in den 1990er-Jahren auch in krisenhaften Phasen der europäischen Integration bemerkenswert stabil blieben. Die Gefühle, die die Menschen mit dem Thema Europa verbanden, wurden von Diskussionen über „Eurosklerose“ - ein vor 20 Jahren geläufiges politisches Schlagwort - oder angeblich ausufernde Bürokratie nicht beeinträchtigt. Im Jahr 2011 dagegen verdüsterte sich das Assoziationsprofil des Begriffs „Europa“ deutlich. Begriffe wie „Fortschritt“, „Zukunft“ oder „Einheit“ wurden deutlich seltener, Aussagen wie „Niedergang, Verfall“ oder „Zerstrittenheit“ spürbar häufiger dem Begriff „Europa“ zugeordnet. Obwohl in der Frageformulierung nicht von Griechenland, dem Euro oder dem Thema Schulden die Rede ist, hatte - so muss man annehmen - die Schuldenkrise in der Euro-Zone, die zum Zeitpunkt der Befragung von der Bevölkerung als besonders gefährlich eingeschätzt wurde, begonnen, die Wahrnehmung des Kontinents als Ganzes zu beinträchtigen. Dies geschah vermutlich, ohne dass es den Befragten selbst bewusst wurde (vgl. Petersen 2012c). Es bietet sich oft an, Assoziationstests, wie in Fragebeispiel 37, als geschlossene Frage zu formulieren. Die Vorteile liegen, wie bereits beschrieben, in der im Vergleich zur offenen Frage einfacheren statistischen Auswertung und besseren Verallgemeinerbarkeit der Ergebnisse. Die Vorgabe von Begriffen bedeutet aber natürlich auch, dass der Begriff „Assoziationstest“ für dieses Fragemodell eigentlich nicht mehr korrekt ist, denn von einer eigenen freien Assoziation der Befragten kann keine Rede sein. Will man wirklich spontane Reaktionen der Be- <?page no="175"?> Fragestrategien 176 fragten messen, benötigt man eine offene Frage wie in Fragebeispiel 38. Hier liegt einer der wenigen Fälle vor, in denen es sich lohnen kann, die Nachteile offener Fragen in Kauf zu nehmen. Das Risiko, dass die Frage keine brauchbaren Ergebnisse erzeugt, ist allerdings recht groß. Oft erlebt man es, dass zu wenig verwertbare Antworten gegeben werden. Ein offen formulierter Assoziationstest sollte deswegen nur eine Ergänzung eines umfangreicheren Fragenprogramms zum gleichen Themenkomplex sein, auf die man bei der Analyse im Notfall auch verzichten kann. Im Zweifelsfall kann es auch eine elegante Lösung sein, nach dem Prinzip des Feldexperiments die Befragtenstichprobe in zwei jeweils repräsentative Teilstichproben zu untergliedern. Der einen Hälfte der Befragten wird der offene, der anderen Hälfte der geschlossene Assoziationstest präsentiert. Sind die Angaben des offen formulierten Tests ergiebig genug, werden sie zur Analyse herangezogen, andernfalls kann man auf die geschlossene Variante zurückgreifen. Fragebeispiel 37 Gestützte Assoziationen „Wenn Sie einmal an das Wort ‚Europa’ denken - es kann einem dazu ja alles Mögliche einfallen. Darf ich Ihnen mal einiges vorlesen? Sagen Sie mir dann bitte, ob man bei ‚Europa’ wirklich daran denken könnte.“ (Jeweils Zutreffendes einkreisen) a) „Denken Sie bei ‚Europa’ zum Beispiel an Freiheit? “ JA ................................................................................... 1 NEIN............................................................................... 2 UNENTSCHIEDEN........................................................ 3 b) „An Zerstrittenheit? “ JA ................................................................................... 1 NEIN............................................................................... 2 UNENTSCHIEDEN........................................................ 3 (Es folgen nach dem gleichen Muster bis maximal acht weitere Begriffe) (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10020 [gekürzt]) <?page no="176"?> Grundsatzentscheidung: Abstrakt oder konkret? 177 Fragebeispiel 38 Offener Assoziationstest „Vielleicht kennen Sie das Spiel, das ich Ihnen jetzt beschreiben möchte. Jemand sagt ein Wort, und nun muss sich der andere schnell hintereinander mehrere neue Wörter ausdenken, die irgendwie mit dem ersten zu tun haben: Zum Beispiel: Ich sage ‚Wald’. Da könnte einem einfallen: Eiche, Bäume, Strauch, Hirsch, Jäger usw. Jetzt möchte ich Ihnen auch ein solches Wort nennen: Erzählen Sie bitte schnell hintereinander, was Ihnen da alles durch den Kopf geht, auch Einzelheiten, Dinge, die Sie nebensächlich finden. Das Wort heißt ‚Europa.’“ ........................................................................................ ........................................................................................ ........................................................................................ ........................................................................................ ........................................................................................ KEINE ANGABE ............................................................ 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7097 [modifiziert]) Fragebeispiel 38 zeigt, dass sich die Herauslösung eines Begriffes aus dem sprachlichen Zusammenhang und die Einbettung einer Frage in eine anekdotische Erzählung nur scheinbar gegenseitig ausschließen. Aus dem sprachlichen Zusammenhang isoliert ist nur der zu testende Begriff „Europa“. Das vermeintliche Spiel wird dagegen so anschaulich, anekdotisch und konkret wie nur möglich beschrieben. Man hätte einen offenen Assoziationstest zum Begriff „Europa“ auch einfacher konstruieren können, als es bei Fragebeispiel 38 der Fall ist. Die Formulierung hätte dann ähnlich gelautet wie bei Fragebeispiel 37, etwa wie <?page no="177"?> Fragestrategien 178 folgt: „Wenn Sie einmal an das Wort ‚Europa’ denken - es kann einem ja dazu alles Mögliche einfallen. Woran denken Sie, wenn Sie ‚Europa’ hören? Bitte nennen Sie mir alles, was Ihnen bei ‚Europa’ durch den Kopf geht.“ Doch bei einer solchen einfacheren Fragekonstruktion ist das Risiko, dass nur wenige Befragte überhaupt eine Antwort geben, besonders groß. Die Einbettung des Assoziationstests in ein Spiel und die Illustration durch das Beispiel mit dem Begriff „Wald“, das ein wenig den Charakter einer Übungsfrage hat, erleichtert es den Befragten, ihren Assoziationen freien Lauf zu lassen, und es mindert die bei vielen Menschen ohnehin latent vorhandene Sorge, sie könnten im Interview etwas Falsches sagen. 5.2 Die Präsentation komplexer Sachverhalte Einer der am häufigsten zu hörenden Vorwürfe gegenüber der Umfrageforschung ist, dass die Methode viel zu holzschnittartig sei, um der komplexen Realität, die sie untersuchen soll, gerecht werden zu können. Im Extremfall mündet dies sogar in der Behauptung, die soziale Realität könne angesichts ihrer Vielschichtigkeit überhaupt nicht quantitativ untersucht werden (vgl. Buser 1973, S. 1-12). Es wurde bereits oben, in dem Kapitel über die Prinzipien der analytischen Vorgehensweise, ausführlich dargelegt, dass solche Vorstellungen auf einem Missverständnis beruhen. Die Aufgabe der empirischen Sozialforschung besteht nicht zuletzt darin, den ohne Zweifel komplexen Untersuchungsgegenstand in handhabbare Einzelteile zu zerlegen. Darüber hinaus sorgt die quantitative Gruppenanalyse, bei der vom Individuum abstrahiert wird, dafür, dass aus den Antworten auf einfache Fragen keineswegs nur oberflächliche und holzschnittartige, sondern im Gegenteil äußerst komplexe und weitreichende Schlussfolgerungen gezogen werden können. Und doch lenkt der Hinweis auf die Diskrepanz zwischen der Komplexität des Untersuchungsgegenstandes und der Einfachheit der Fragen den Blick auf ein erhebliches Problem in der Forschungspraxis. Trotz aller fragebogentechnischen Möglichkeiten der Zerlegung ist es oft außerordentlich schwer, den Befragten mit einfachen Worten komplizierte Themen so zu erläutern, dass sie in die Lage versetzt werden, <?page no="178"?> Die Präsentation komplexer Sachverhalte 179 auf sie zu reagieren. Besonders ausgeprägt zeigt sich dieses Problem in der politischen Umfrageforschung. Details von Gesundheits- und Steuerreformen, der Rentenfinanzierung oder des Datenschutzrechtes, um nur einige Beispiele zu nennen, sind nahezu täglich Gegenstand heftiger politischer Auseinandersetzungen, der Medienberichterstattung und damit auch der politischen Meinungsbildung in der Bevölkerung. Doch wie soll man herausfinden, ob die Bürger abseits des politischen Schaukampfes den inhaltlichen Bestimmungen einer geplanten Steuerreform zustimmen, wenn diese inhaltlichen Bestimmungen selbst für Experten kaum zu überblicken sind? Bei derart komplizierten Themen wie einer Steuerreform ist die Aufgabe, den Befragten die relevanten Dimensionen des Themas vor Augen zu führen, ohne sie gleichzeitig in ihrer Meinungsbildung allzu sehr zu beeinflussen, kaum zu lösen. Doch auch alltäglichere Themen verlangen manchmal Erläuterungen, die zwei oder mehr Sätze und den einen oder anderen Nebensatz in Anspruch nehmen. Die Aufmerksamkeit der meisten Menschen und damit ihre Bereitschaft, solchen Erläuterungen zuzuhören, sind aber außerordentlich begrenzt. Erp Ring hat bereits in den 1970er-Jahren gezeigt, dass bei Listenfragen die Punkte, die nicht ganz am Anfang oder am Schluss der Liste stehen, bei den Befragten messbar weniger Beachtung finden (Ring 1974). Und nach dem in der Psychologie entwickelten „Zwei-Speicher-Modell“ der Informationsverarbeitung werden Informationen, die jemand aufnimmt, bereits nach 15 bis 30 Sekunden wieder aus dem Gedächtnis gelöscht, wenn sie in dieser Zeit nicht als besonders interessant und relevant identifiziert wurden (Klatzky 1980, S. 17; Peterson/ Peterson 1959). Symptomatisch ist, dass sich die Massenmedien, vor allem das Fernsehen, bewusst oder unbewusst diesen kurzen Aufmerksamkeitszyklen angepasst haben. Die Länge der „Soundbites“, also der Zeitfenster, die den Politikern oder anderen Personen des öffentlichen Lebens zur Verfügung stehen, um ihr Anliegen oder ihre Argumentation vorzubringen, ist im amerikanischen Fernsehen in der Zeit von 1960 bis 1992 von 42 auf unter 10 Sekunden gesunken (Patterson 1994, S. 74). Ähnliche Entwicklungen sind auch für Deutschland anzunehmen. Jedenfalls findet sich der Umfrageforscher, der seinen Befragten einen komplexen Sachverhalt zu erklären versucht, in einer ähnlichen Lage wieder wie der Teilnehmer einer Fernsehdiskussion. Sobald dieser versucht, seine <?page no="179"?> Fragestrategien 180 Argumentation mit einem zweiten oder gar einem Nebensatz zu erläutern, beginnt das Publikum im Studio zu murren, und der Moderator schneidet dem Redner das Wort mit dem Argument ab, das würde nun doch alles viel zu kompliziert. Wie kann man nun die kurzen Aufmerksamkeitsrhythmen der Befragten überwinden, die dazu führen können, dass jemand, wenn er dem Ende einer etwas längeren Argumentation zuhört, deren Anfang schon wieder zu vergessen beginnt (vgl. Petersen 2002, S. 177-192)? Bei Telefonumfragen gibt es keine Möglichkeiten, dieses Problem befriedigend zu lösen. Hier gilt das Prinzip der radikalen Kürze der Frageformulierung. Schon nach wenigen Sekunden sinkt hier die Aufmerksamkeit rapide. Hinzu kommt die ohnehin im Vergleich zu anderen Befragungsmethoden schlechtere Verständigung am Telefon. Antwortkategorien, die intensiveres Nachdenken erfordern, werden am Telefon seltener ausgewählt als bei persönlichen Interviews, ein Zeichen dafür, dass am Telefon kürzer, flüchtiger geantwortet - und damit auch weniger gründlich zugehört - wird (Noelle-Neumann/ Petersen 2000; Petersen 2000). Komplexe Sachverhalte lassen sich telefonisch kaum vermitteln. Etwas besser ist die Situation bei schriftlichen und Internet- Umfragen, doch hier besteht die Gefahr, dass umfangreichere Texte rasch „diagonal“ gelesen und damit letztlich überlesen werden. Das ist im Prinzip auch bei persönlichen Befragungen der Fall, doch hier wirkt die Anwesenheit des Interviewers, die in mancherlei anderer Hinsicht durchaus auch problematisch sein kann, als ein gewisses Korrektiv. Und so gibt es bei Face-to-Face-Umfragen immerhin einige Möglichkeiten, komplexere Argumentationen so zu präsentieren, dass die Aufmerksamkeit der Befragten etwas besser erhalten bleibt. Eine vergleichsweise weit verbreitete und seit Jahrzehnten besonders bewährte Methode der Präsentation komplizierterer Argumentationen ist das Dialogbildblatt. Diese Fragemethode setzt allerdings voraus, dass nicht nur ein zu testendes Argument existiert, sondern dass sich auch ein ebenso komplexes und zumindest einigermaßen plausibles Gegenargument formulieren lässt. Den Befragten wird ein Bildblatt präsentiert, das zwei Personen im Schattenriss zeigt. Jeder Figur ist, wie in einem Comic, eine Sprechblase zugeordnet. In die Sprechblasen lassen sich nun nahezu beliebige Argumente hineinschreiben, wobei die Länge von ungefähr 40 Wörtern möglichst nicht überschritten werden soll- <?page no="180"?> Die Präsentation komplexer Sachverhalte 181 te, weil sonst die Aufmerksamkeit der Befragten spürbar zurückgeht (vgl. Petersen 2002, S. 188). Doch auch innerhalb dieses begrenzten Rahmens lassen sich bereits wesentlich kompliziertere Argumentationen unterbringen als bei einer einfachen, vom Interviewer vorgelesenen Frage. Fragebeispiel 39 zeigt eine solche Frage, die seit Jahrzehnten bei Wertestudien verwendet wird. Sie ist übrigens auch ein Beispiel für einen Kompromiss, der bei der im vorigen Kapitel besprochenen Grundsatzentscheidung getroffen werden kann, ob man in der Frageformulierung abstrakte Begriffe oder konkrete Umschreibungen verwenden will. Der abstrakte und mehrdeutige Begriff wird beibehalten, aber durch eine Erläuterung inhaltlich geklärt und konkretisiert. Fragebeispiel 39 Beispiel für eine Dialogfrage INTERVIEWER überreicht Bildblatt! „Hier unterhalten sich zwei, was letzten Endes wohl wichtiger ist, Freiheit oder möglichst große Gleichheit, soziale Gerechtigkeit - wenn Sie das bitte einmal lesen. Welcher von beiden sagt eher das, was auch Sie denken? “ DER OBERE.................................................................. 1 DER UNTERE ............................................................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10077 [geringfügig modifiziert]) Das Prinzip der Dialogfrage ist die vielleicht erfolgreichste Übernahme von Verfahren der Individualpsychologie in die quantitative Sozialforschung. Das Fragemodell ist eine einfache Variante der Methode des projektiven Tests, die unten noch ausführlicher behandelt werden wird. Die Befragten werden aufgefordert, sich gedanklich in eine vorgestellte Situation oder die Position einer vorgestellten Person zu versetzen. Aus dieser Perspektive heraus, in der man sich ein wenig aus der eigenen Position herausbegibt, fällt es vielen Menschen anscheinend leichter, unbefangen zu antworten, als wenn ihnen die Argumente einfach <?page no="181"?> Fragestrategien 182 schriftlich auf einer Liste präsentiert werden, obwohl der dabei vermittelte Inhalt mit dem eines Dialogblattes identisch wäre. Abbildung 21 Dialogbildblatt zu Fragebeispiel Nr. 39 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10077) <?page no="182"?> Die Präsentation komplexer Sachverhalte 183 Der Nutzen von Dialogvorlagen ist schon von den Pionieren der Umfrageforschung erkannt worden, und so finden sich solche Bildblätter bereits in zahlreichen Befragungen der 40er- und 50er-Jahre. Kurioserweise hat sich das Comic-Format damit in der Umfrageforschung zu einem Zeitpunkt durchgesetzt, an dem ihm in der Unterhaltungskultur noch der Ruf des Minderwertigen und Anrüchigen anhaftete (vgl. Herbers 2011, S. 72-73). In der älteren Methodenliteratur (z. B. Hüttner/ Schwarting 2002, ursprünglich verfasst Anfang der 60er-Jahre) werden Dialogfragen gelegentlich auch als „Ballonfragen“ bezeichnet, weil den abgebildeten Personen die Sprechblasen wie Ballons vor den Gesichtern stehen. Anscheinend bedurfte die damals noch ungewohnte Darstellungsform einer bildhaften Umschreibung. Prinzipiell lässt sich das Prinzip des Dialogbildblattes nahezu beliebig variieren. So gibt es auch Varianten, in denen drei Personen im Gespräch dargestellt sind (z. B. bei Noelle 1963, S. 67), in Einzelfällen sind auch schon bis zu fünf Argumente auf diese Weise präsentiert worden (Ring 1975, S. 90), doch die Ergebnisse solcher Fragen fallen oft unklar und damit analytisch unbefriedigend aus. Offensichtlich ist die Logik des Dialogs den meisten Menschen aus dem Alltag so sehr vertraut, dass sie auch im Interview leicht akzeptiert wird. Stehen dagegen mehr Argumente zur Auswahl, reagieren viele Befragte verwirrt, auch deswegen, weil dann oft nicht klar wird, welche Argumente welchen gegenüberstehen und welche sich möglicherweise gegenseitig ergänzen oder teilweise überschneiden. Die Gefahr, dass man mit Trialogen oder gar mehr auf einem Bildblatt präsentierten Argumenten die Prinzipien der Eindimensionalität und Trennschärfe der vorgegebenen Antwortkategorien verletzt, ist sehr groß. Oft ist der Eindruck, dass man drei oder mehr Argumente zur Auswahl stellen müsste, auch ein Zeichen dafür, dass man ein Thema nicht gründlich genug durchdacht und seine verschiedenen logischen Ebenen nicht sauber voneinander getrennt hat. Arbeitet man die Konturen eines Themas gedanklich klar heraus, stellt sich meistens heraus, dass sich seine inhaltlichen Aspekte in Dialogen darstellen lassen. Gelegentlich gibt es die Situation, in der eine Argumentation oder ein etwas komplexeres Thema zwar in zwei oder drei Sätzen beschrieben werden können, sich aber keine sinnvolle Gegenposition formulieren lässt. In diesem Fall lässt sich die betreffende Aussage auch als <?page no="183"?> Fragestrategien 184 Monolog darstellen, also auf einem Bildblatt, das nur eine Person mit Sprechblase zeigt. Gelegentlich hat sich diese Frageform als nützlich erwiesen, wenn Thesen getestet werden sollten, bei denen das Bedürfnis der Befragten bestehen könnte, ihnen im Prinzip zuzustimmen, gleichzeitig aber eine gewisse Distanz zu bewahren. So wurde etwa mit dieser Technik die Zustimmung zu Aussagen getestet, die man als Hinweis auf eine Neigung zum politischen Extremismus deuten kann (IfD- Umfrage Nr. 10032). Bei einer anderen Untersuchung wurde auf diese Weise die Zustimmung zu einer „politisch unkorrekten“ Aussage über den Zusammenhang zwischen AIDS und der öffentlichen Sexualmoral ermittelt (IfD-Umfrage Nr. 6221). Doch meistens wirkt die comicartige Darstellung, die bei Dialogen so überzeugend ist, bei Monologen eher etwas bemüht und fehl am Platz. Meist genügt bei der Darstellung von Aussagen, denen keine Gegenposition gegenübergestellt werden kann, eine einfache schriftliche Vorlage ohne grafische Unterstützung. Fragebeispiel 40 zeigt eine solche Vorlage aus einer Untersuchung über Studiengebühren. Das Beispiel zeigt, wie weit man bei der Beschreibung komplexer Themen im äußersten Fall gehen kann. Fragebeispiel 40 Schriftliche Vorlage eines komplexen Konzeptes INTERVIEWER überreicht Bildblatt! „Hier auf dem Blatt sind einmal Einzelheiten einer möglichen Regelung zu Studiengebühren aufgeschrieben. Wenn Sie sich das bitte einmal durchlesen würden.“ INTERVIEWER: Der/ Dem Befragten ausreichend Zeit zum Lesen lassen! „Finden Sie, das ist alles in allem eine gute oder keine gute Regelung, um Studiengebühren zu erheben? “ GUTE REGELUNG ....................................................... 1 KEINE GUTE REGELUNG ........................................... 2 UNENTSCHIEDEN / KEINE ANGABE ......................... 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10049) <?page no="184"?> Die Präsentation komplexer Sachverhalte 185 Abbildung 22 Vorlage eines Konzepts für Studiengebühren Einzelheiten einer Regelung zu Studiengebühren - Jede Hochschule kann frei entscheiden, ob und in welcher Höhe sie Studiengebühren erhebt. - Die Studiengebühren dürfen nicht höher sein als 500 Euro pro Semester bzw. Halbjahr. - Studenten können einen Kredit mit günstigen Zinsen aufnehmen. Dieser Kredit muss erst zurückgezahlt werden, wenn die Studenten ein eigenes Einkommen haben. - Dieser Kredit muss nicht zurückgezahlt werden, wenn die Studenten im Rahmen der staatlichen Ausbildungsförderung (Bafög) bereits einen anderen hohen Kredit zurückbezahlen müssen. Das betrifft die Mehrheit der Bafög-Empfänger. - Die Einnahmen aus den Studiengebühren kommen direkt der Hochschule zugute und dürfen ausschließlich zur Verbesserung der Lern- und Studienbedingungen eingesetzt werden. (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10077) Die Erläuterungen sind, obwohl sie so einfach wie nur irgend möglich gehalten wurden, so ausführlich, dass sie die Dimensionen einer möglichen Sprechblase bei einem Monolog gesprengt hätten. So wäre dieses Fragemodell allein schon aus grafischen Gründen ausgeschieden, wenn man es hätte verwenden wollen. Doch in diesem Fall wäre es ohnehin fehl am Platze gewesen: Eine Meinungsäußerung lässt sich gut einer in einer Zeichnung schemenhaft dargestellten Person zuordnen. Für eine sachliche Erläuterung taugt das Modell dagegen nicht. Man muss sich nur vorstellen, wie die in Abbildung 22 wiedergegebene Erläuterung wirken würde, wenn man sie einer erdachten Person in den Mund legen würde. Allein schon die Vorstellung erzeugt den Ein- <?page no="185"?> Fragestrategien 186 druck des Unangemessenen. Warum sollte ein Befragter auf die Information anders reagieren, wenn sie ihm als die Aussage einer erdachten Person vorgeführt wird? Gebrauchsanweisungen werden ja normalerweise auch nicht in Comicform präsentiert. Und niemand muss sich in jemand anderen gedanklich hineinversetzen, um die Information zu erfassen, an der ohnehin nichts Wertendes, Persönliches oder gar Emotionales haftet. Das projektive Verfahren des Dialogs und - mit Einschränkungen - des Monologs ist gut geeignet zum Test von persönlichen Aussagen nahezu aller Art: Meinungen, Verhaltensweisen, Argumente, Beobachtungen. Sachinformationen eher technischer Natur präsentiert man dagegen besser in nüchterner Form. Sprachlich liegt das in Abbildung 22 wiedergegebene Beispiel übrigens an der äußersten Grenze des methodisch noch Akzeptablen. Die trotz aller Vereinfachung noch immer von bürokratischen Fachbegriffen geprägte Wortwahl („im Rahmen der staatlichen Ausbildungsförderung ...“) ist eigentlich schon ein Bruch der oben betonten Regel, dass in der Umfrageforschung jede Form von Jargon zu vermeiden ist. Bei der Anwendung hat diese Frage allerdings noch keine nennenswerten Irritationen bei den Befragten ausgelöst. Wollte man den Befragten ein noch komplizierteres Thema vorstellen, beispielsweise die Elemente einer Rentenreform, käme man nicht mehr umhin, das vorzustellende Konzept in mehrere Elemente aufzuteilen und diese einzeln abzufragen. Eine schwer zu bewältigende Komplexität in der Umfrageforschung kann, wie gesehen, ihre Ursache im zu untersuchenden Thema haben, sie kann aber auch in der angestrebten Datenstruktur angelegt sein. Über die Belastungen, die von allzu abstrakten Ansätzen und komplizierten Skalierungen ausgehen, wurde schon ausführlich berichtet. Es wurde darauf verwiesen, dass der Informationsgehalt der Ergebnisse in vielen Fällen kaum geringer wird, wenn man wesentlich einfachere Fragemodelle verwendet. Doch auch in den Fällen, in denen es unvermeidlich ist, den Daten eine komplexe Struktur zu geben, ist es oft möglich, das Interview erheblich zu entlasten, wenn man sich vor Augen führt, dass an einer Repräsentativumfrage nicht nur einige wenige, sondern hunderte, wenn nicht tausende Menschen beteiligt sind und dass es keinesfalls immer nötig ist, alle Befragten mit dem kompletten Frageprogramm zu traktieren. <?page no="186"?> Die Präsentation komplexer Sachverhalte 187 Ein Beispiel hierfür bietet die Methode der Conjoint-Messung, die sich zeitweise in der Marktforschung einer besonders großen Beliebtheit erfreute. Die Grundidee des Verfahrens, das in der praktischen Durchführung sehr unterschiedliche Formen annehmen kann, ist, dass man unter verschiedenen Einflussfaktoren auf eine Entscheidung - in der Marktforschung meist eine Kaufentscheidung - eine Hierarchie bilden möchte: Ist der Preis wichtiger als das Design? Welche Rolle spielen die vermutete Produktqualität, der Markenname, technische Details usw.? Beim Conjoint-Verfahren fragt man diese Elemente nicht einfach oberflächlich ab - wie sehr solche direkten Fragen in die Irre führen können, wird unten noch demonstriert werden -, sondern man führt die Entscheidung quasi-experimentell herbei. In einer Serie von Paarvergleichen werden beispielsweise zwei Produkte vorgeführt und dazu die Frage gestellt, für welches der beiden Angebote man sich entscheiden würde. Solche Paarvergleiche werden nun viele Male nacheinander vorgeführt: Mal ist das eine Produkt teuer, hat dafür aber den bekannteren Namen, mal unterscheidet sich das Design, mal nur der Preis. Nach und nach werden alle - oder zumindest alle wesentlichen - möglichen Kombinationen durchgetestet. Mit der Struktur ihrer Antworten bilden die Befragten eine Reihenfolge, ohne dass ihnen dies bewusst sein muss. Immer wieder müssen sie sich entscheiden, welches Merkmal gleichsam „sticht“: Wählt man die billigere oder die schönere Version? Wählt man die schönere Version auch dann noch, wenn sie technisch unterlegen ist? Und so weiter. Am Ende des Spiels lassen sich die getesteten Entscheidungskriterien (meistens) in eine klare Reihenfolge bringen (vgl. Gustafsson/ Herrmann/ Huber 2007; Daiber/ Hemsing 2005). Die Methode ist pfiffig ausgedacht, und sie wird vor allem bei Labortests auch mit großem Erfolg angewandt. An sich ist es eine gute Idee, Entscheidungskriterien nicht abstrakt abzufragen, sondern die Entscheidung im Interview tatsächlich herbeizuführen. Doch man erkennt auch rasch, wie belastend die Prozedur und wie künstlich die Entscheidungssituation für die Befragten ist. Sie müssen sich nicht, wie es unter realen Bedingungen der Fall ist, einmal, vielleicht zweimal zwischen zwei verschiedenen Produktvarianten entscheiden, sondern je nach der Zahl der zu prüfenden Elemente werden leicht Dutzende Entscheidungen daraus. Damit wird das ganze Verfahren wirklichkeits- <?page no="187"?> Fragestrategien 188 fern und für die Befragten anstrengend und verwirrend. Eine solche Conjoint-Abfrage oder ähnliche Aufgaben, bei denen, wie bei den ebenfalls im Labor bewährten Verfahren des Card Sortings oder des Q - Sorts (vgl. Schwender 2011), vorgegebene Gegenstände, Bilder oder Begriffe in Rangreihen oder Gruppen sortiert werden müssen, lassen sich allenfalls nur in sehr reduzierter Form in bevölkerungsrepräsentative Umfragen einbauen, wenn man nicht einen erheblichen Verlust der Datenqualität in Kauf nehmen will. Doch bei der Übertragung solcher Methoden vom Umfeld der Laborforschung auf die Bedingungen der quantitativen Befragung wird oft übersehen, dass man bei letzterer, weil man große Zahlen von repräsentativ ausgewählten Personen befragt, nicht unbedingt von jedem einzelnen Befragten alles wissen muss. Unter Umständen kann es reichen, jeden Befragten nur mit einem kleinen Teil des gesamten Testprogramms, verschiedene Befragtengruppen aber mit unterschiedlichen Elementen des Modells zu konfrontieren, die erst in der Analyse zusammengefügt werden. Auf diese Weise wird die Last des Abfragemodells auf mehrere Befragtengruppen verteilt. Ein Beispiel hierfür bietet eine Marktforschungsuntersuchung über Waschmittel, bei der geprüft werden sollte, anhand welcher Kriterien die Verbraucher die Produkte bewusst oder unbewusst in Kategorien eingruppieren: Werden, so lautete die Forschungsfrage, die Produkte in erster Linie anhand ihrer physischen Form kategorisiert, unterscheiden die Kunden also in erster Linie zwischen Tabs und „Megaperls“, pulverförmigen und flüssigen Waschmitteln, oder sind die Anwendungsbereiche das wichtigere Unterscheidungskriterium, also die Eingruppierung in Voll-, Color-, Schon- oder Spezialwaschmittel? Von der Beantwortung dieser Frage ließen sich wichtige strategische Grundsatzentscheidungen in der Vermarktung ableiten, etwa zu der Frage, welche Produkte man gemeinsam bewirbt oder welche Einsortierung in die Regale man dem Einzelhandel empfiehlt. Es wurde beschlossen, die befragten Verbraucher Waschmitteltypen in ein imaginäres Supermarktregal einsortieren zu lassen. Dazu wurden Kärtchen hergestellt, auf denen jeweils eine Waschmittelpackung abgebildet war. Außerdem stand auf jedem Kärtchen eine Beschreibung des Waschmittels, die zwei Informationen enthielt, eine über die Form und eine über die Anwendung. Die Beschriftungen lauteten beispielsweise <?page no="188"?> Die Präsentation komplexer Sachverhalte 189 „Flüssiges Colorwaschmittel“, „Pulver-Vollwaschmittel“ oder „Megaperls- Feinwaschmittel“. Zu diesen Karten wurde das Bild eines Waschmittelregals mit acht verschiedenen Fächern vorgelegt. Jedes Fach war mit einer Beschriftung versehen, die aber nur eine Eigenschaft beschrieb. Es gab beispielsweise ein Fach für Vollwaschmittel und eines für Flüssigwaschmittel (Abbildung 23). Die Befragten wurden nun aufgefordert, sich vorzustellen, sie arbeiteten in einem Supermarkt und müssten die auf den Karten abgebildeten Waschmittel in das Regal einsortieren. Man kann sich leicht vorstellen, wie schwierig diese Aufgabe für Befragte wäre, die für sämtliche Karten einen Platz im Regal finden müssten. Bei jeder Karte muss eine neue Entscheidung gefunden werden, bei jeder Karte gibt es einen Konflikt: Sortiert man das flüssige Vollwaschmittel bei den Flüssigwaschmitteln oder bei den Vollwaschmitteln ein? Viele Befragte würden nach zwei oder drei Entscheidungen das Prinzip der Frage erkennen und beginnen, ihre Antworten zu revidieren oder systematisch an einer Sortierungsvariante festzuhalten, auch wenn sie ihnen im einen oder anderen Fall nicht richtig erscheint, nur um nicht widersprüchlich zu wirken. Den meisten dürfte nach einiger Zeit auch die Künstlichkeit der ganzen Konstruktion auffallen - kurz: den Antworten würde jede Spontaneität fehlen und damit das intuitive Element, das mit dieser Frage doch gerade erfasst werden sollte. Doch es war auch gar nicht nötig, die Befragten den ganzen Kartensatz sortieren zu lassen: Die Interviewer wurden angewiesen, die Karten zu mischen und dem Befragten verdeckt hinzuhalten. Dieser zog dann eine Karte und sortierte nur sie in das abgebildete Regal ein (Fragebeispiel 41). Das Mischen der Karten stellte sicher, dass die Gesamtstichprobe von insgesamt 1200 Befragten in acht jeweils repräsentative, weil durch den Zufall bestimmte Teilgruppen zu jeweils etwa 150 Personen untergliedert wurde. Jede Karte wurde also von 150 Befragten einsortiert, eine für die meisten Analysezwecke vollkommen ausreichende Fallzahl. Spielte man die Ergebnisse in der Analyse zusammen, hatte man auch quantitativ verlässliche Informationen über den gesamten Kartensatz, konnte Rangreihen bilden, komplexe Prioritätenstrukturen erkennen, und dies ungestört durch die Ergebnisverzerrungen, die durch Ermüdung, Überforderung, allmähliches Verstehen und Rationalisierungen des eigenen Verhaltens entstehen, weil ja jeder Befragte nur <?page no="189"?> Fragestrategien 190 eine einzige Karte überreicht bekam, nur eine einzige Entscheidung fällen musste. Fragebeispiel 41 Das Kartenziehverfahren ersetzt komplizierte und belastende Sortiervorgänge a) INTERVIEWER: Die Karten mischen und aufgefächert wie ein Kartenspiel mit der Rückseite nach oben dem/ der Befragten entgegenhalten! „Hier habe ich Karten mit verschiedenen Waschmittelformen. Würden Sie bitte eine Karte davon ziehen? “ (INTERVIEWER: Jetzt bitte die Karte ziehen lassen! ) ___________________________________________________________ b) INTERVIEWER-NOTIZ: Gezogene Karte hat den Buchstaben / A / B / C / D / E / F / G / H / 1 2 3 4 5 6 7 8 ___________________________________________________________ c) INTERVIEWER überreicht großes Bildblatt! „Hier auf dem Blatt ist ein Regal mit Fächern für verschiedene Waschmittel abgebildet. Stellen Sie sich nun bitte vor, Sie arbeiten in einem Supermarkt und sollen das Waschmittel, das Sie eben gezogen haben, in das Regal einsortieren. Sie können dieses Waschmittel natürlich nur in ein einziges Fach stellen. In welches Fach würden Sie das Waschmittel am ehesten stellen, wo gehört es Ihrer Ansicht nach am ehesten hin? “ Fach Nr. / 1 / 2 / 3 / 4 / 5 / 6 / 7 / 8 / KEINE ANGABE ............................................................ 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8674 [geringfügig modifiziert]) <?page no="190"?> Die Präsentation komplexer Sachverhalte 191 Abbildung 23 Bildblatt und Kartenspiel (Auswahl) zu Fragebeispiel 41 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8674) <?page no="191"?> Fragestrategien 192 Dem einen oder anderen Leser mag bei Fragebeispiel 41 die etwas umständliche Frageformulierung aufgefallen sein, vor allem der Satz „Sie können dieses Waschmittel natürlich nur in ein einziges Fach stellen.“ Das, so könnte man meinen, sei doch selbstverständlich. Sonst mache die Frage doch gar keinen Sinn, also müsse man das nicht aussprechen. Doch solche Selbstverständlichkeiten gibt es in der Umfrageforschung nicht. Darum ist der Satz notwendig. Die Bereitschaft der Befragten, sich über die Strukturvorgaben des Forschers hinwegzusetzen, ist bemerkenswert ausgeprägt, und sie wird umso stärker, je komplizierter die vorgegebene Struktur ist. Würde der Hinweis darauf, dass jedes Waschmittel natürlich nur einmal ins Regal gestellt werden kann, fehlen, würden nicht wenige Befragte kurzerhand verkünden, dass das flüssige Vollwaschmittel sowohl bei den Flüssigwaschmitteln als auch bei den Vollwaschmitteln einsortiert werden könnte. Damit würden sie die Funktion der Frage natürlich vollkommen aushebeln. Wie leicht es passieren kann, dass die Befragten mit ihren Antworten den vorgegebenen Strukturen entgleiten, erfuhr das Institut für Demoskopie Allensbach einmal bei einer Frage, die im Prinzip ähnlich angelegt war wie die Frage nach den Waschmittelzuordnungen. In diesem Fall ging es um die Frage, auf welche Dinge die Verbraucher bei „gesundem Essen“ besonderen Wert legten. Zur Auswahl standen Aussagen wie „Abwechslungsreich“, „Schonende Zubereitung“ oder „Preiswert“. Auch hier sollte eine Rangfolge der Prioritäten erstellt werden. Es war offensichtlich, dass bei einer Auflistung derart wohlfeiler Punkte die Gefahr bestand, dass viele Befragte sagen würden, alle diese Aspekte seien ihnen gleich wichtig. Die Befragten aufzufordern, die insgesamt acht Punkte selbst in eine Rangordnung zu bringen, wäre aus den mehrfach beschriebenen Gründen eine zu große Belastung gewesen. Also behalf man sich mit einem Trick, der dazu diente, die Aufgabe beherrschbar und gleichzeitig anschaulich und lebendig zu machen, und der die Befragten außerdem dazu zwingen sollte, auch dann eine Prioritätenentscheidung zu fällen, wenn sie dies eigentlich vermeiden wollten. Die Interviewer überreichten Kärtchen, auf denen Gewichte abgebildet waren, und dazu einen großen Bogen, der in acht Felder untergliedert war, die mit den verschiedenen Aspekten gesunden Essens beschriftet waren. Dazu wurde die Frage gestellt: „Hier auf dem Blatt steht etwas, was bei einem gesunden Essen außer den Zutaten <?page no="192"?> Die Präsentation komplexer Sachverhalte 193 noch wichtig sein kann. Worauf legen Sie bei gesundem Essen besonderes Gewicht? Dafür habe ich diese sieben Kärtchen mit Gewichten mitgebracht. Bitte verteilen Sie diese sieben Kärtchen auf dieses Bildblatt mit den acht Feldern.“ Das spielerische Element mit den Kärtchen, die die Redewendung vom „Gewicht“, das man auf etwas legt, illustrierten, sollte es den Befragten leichter machen, ihre Entscheidungen zu fällen. Der eigentliche Trick bestand aber darin, dass es ein Kärtchen weniger gab als Felder, auf die die Karten verteilt werden konnten. Das bedeutete, dass die Befragten auch dann eine Prioritätenentscheidung fällen mussten, wenn sie eigentlich allen genannten Aspekten gesunder Ernährung das gleiche Gewicht beimessen wollten. Sie konnten es drehen und wenden, wie sie wollten, mindestens ein Feld würde immer leer bleiben. Am Institut war man ein wenig stolz, eine so elegante Lösung gefunden zu haben, die die anspruchsvolle Aufgabe in einem Spiel versteckte. Beim Pretest, also den Probeinterviews, die vor dem Start der Feldarbeit geführt werden müssen, um zu prüfen, ob der Fragebogen noch Fehler enthält, stellte sich dann aber heraus, dass die Frage - wie eigentlich alle Fragen, bei denen man versucht, den Befragten Strukturen aufzuzwingen, die nicht ihren eigenen Vorstellungen entsprechen - nicht funktionierte. Die Befragten unterliefen das so trickreich erdachte Regelwerk einfach, indem sie es uminterpretierten. Fröhlich legten sie sämtliche sieben Karten auf ein Feld und verkündeten, auf den betreffenden Punkt legten sie größten Wert, sammelten die Karten wieder ein, legten sie dann wiederum sämtlich nach und nach auf alle anderen Felder und gaben dabei jedes Mal zu Protokoll, dass sie auch all den anderen Punkten maximale Priorität gäben. Die Frage funktionierte erst (einigermaßen), nachdem im Fragetext ausdrücklich klargestellt wurde, dass man jede Karte selbstverständlich nur einmal verteilen könne und dass, jawohl, in jedem Fall mindestens ein Feld leer bleiben müsse. Die endgültige Frage ist deswegen mit ihren umständlichen Regieanweisungen und vor allem mit ihrer den Bedürfnissen der Befragten offensichtlich widersprechenden Logik vom Ideal einer guten, intuitiv verständlichen und leicht akzeptablen Frage ein gutes Stück weit entfernt. Sie ist dennoch ein anschauliches Beispiel dafür, wie man eine Aufgabe so bildhaft gestalten kann, dass ihre Komplexität darüber etwas in den Hintergrund rückt (Fragebeispiel 42; Abbildung 24). <?page no="193"?> Fragestrategien 194 Fragebeispiel 42 Bildung von Prioritäten durch „Gewichte“ INTERVIEWER überreicht das Bildblatt und die Kärtchen mit Gewichten! „Hier auf diesem Blatt steht etwas, was bei einem gesunden Essen außer den Zutaten noch wichtig sein kann. Worauf legen Sie bei gesundem Essen besonderes Gewicht? Dafür habe ich diese sieben Kärtchen mit Gewichten mitgebracht. Bitte verteilen Sie diese sieben Kärtchen auf dieses Bildblatt mit den acht Feldern, je nachdem, worauf Sie besonderes Gewicht legen. Mindestens ein Feld bleibt am Ende also frei. Sie können auch alle sieben Karten auf ein Feld legen. Je mehr Kärtchen Sie einem Feld zuordnen, desto mehr Gewicht legen Sie darauf.“ (INTERVIEWER: Die Kärtchen dürfen nur einmal verteilt werden! Die Anzahl der Kärtchen, die der/ die Befragte auf jedes Feld gelegt hat, zählen und hinter dem entsprechenden Buchstaben und Text einkreisen! Bei Feldern, auf denen keine Kärtchen liegen, unbedingt die Null einkreisen! ) Feld A: Abwechslungsreich / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld B: Schnelle Zubereitung / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld C: Dass es einem gut tut, dass man sich damit wohl fühlt / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld D: Muss appetitlich sein, lecker schmecken / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld E: Schonende Zubereitung / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld F: Einfach, unkompliziert / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld G: Preiswert / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / Feld H: Dass man sich dafür Zeit nimmt, in Ruhe essen kann / 0 / 1 / 2 / 3 / 4 / 5 / 6 / 7 / KEINE ANGABE ............................................................ 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6075 [geringfügig modifiziert]) <?page no="194"?> Die Präsentation komplexer Sachverhalte 195 Abbildung 24 Bildblatt und Karten zur Frage nach gesundem Essen (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6075) 5.3 Erinnerungs- und sonstige Stützen Der Verstand, schrieb der berühmte französische Philosoph René Descartes, sei die „bestverteilte Sache der Welt“. Jeder Mensch glaube, er habe genug davon (Descartes 1995, S. 3). Ähnliches könnte man mit umgekehrten Vorzeichen auch über die Schlagfertigkeit sagen: Auch sie scheint recht gut verteilt zu sein, denn vermutlich niemand ist der Ansicht, er verfüge über genug davon. Wahrscheinlich kennt jeder die <?page no="195"?> Fragestrategien 196 Situation, in der einem die richtigen Worte im entscheidenden Augenblick fehlen: die treffende Widerlegung eines Arguments, das man entkräften möchte, die elegante Replik auf eine unverschämte Äußerung, die zum Verständnis des Textes zentrale Lateinvokabel in der Klassenarbeit. Meist fallen sie einem dann doch schließlich ein - Stunden oder gar Tage später, wenn die Situation, in der man sie so dringend gebraucht hätte, längst vorbei ist. Schon bei der Darstellung selbst entwickelter Gedankengänge ringen die meisten Menschen um die richtigen Begriffe. Im Interview, bei dem die Gesprächsführung vom Fragebogen vorgegeben ist, sind die Aufgaben, sich auf etwas zu besinnen, an das man lange nicht gedacht hatte, spontan eine treffende Formulierung für einen komplizierten Sachverhalt zu finden oder alle Aspekte eines bestimmten Themas, das einen sonst nicht besonders beschäftigt, gleich präsent zu haben, noch ungleich schwerer. Dies ist der wichtigste Grund, warum offene Fragen in der Umfrageforschung praktisch nur dann zum Einsatz kommen, wenn unverfälschte Spontanreaktionen eingefangen werden sollen oder aktives Wissen geprüft werden muss. Der Regelfall ist dagegen die gestützte Ermittlung, also die Frageform, bei der dem Gedächtnis und der Formulierungskunst der Befragten mit Vorgaben auf die Sprünge geholfen wird. Jede zur Auswahl gestellte Antwortkategorie, jede Liste oder Bildvorlage ist in diesem Sinne eine Stütze, an der sich der Befragte gleichsam festhalten kann, an der er sich orientieren kann. Solche Vorgaben können durchaus unerwünschte methodische Nebeneffekte haben. Sie können die Gedanken der Befragten von den Bahnen ablenken, die sie sonst unter Alltagsbedingungen hätten, oder sie können die Befragten ungewollt unter Druck setzen (vgl. Petersen 2002, S. 201-223). Doch diese Nachteile sind gering im Vergleich zu denen solcher Fragen, die auf Stützen verzichten. Die Umfrageforschung hat schon früh eine große Vielfalt von Fragetechniken entwickelt, mit denen die Erinnerung der Befragten aktiviert werden soll. Dies ist besonders dann von großer Bedeutung, wenn nicht Meinungen, sondern Verhaltensweisen möglichst präzise gemessen werden sollen, wie beispielsweise in der Leserschaftsforschung. Wer ermitteln möchte, welche Personen welche Zeitungen und Zeitschriften wie oft lesen, steht vor einem methodischen Problem, das wesentlich größer ist, als es auf den ersten Blick scheint. Man muss sich <?page no="196"?> Erinnerungs- und sonstige Stützen 197 nur einmal selbst die Frage stellen, was man in den letzten drei Tagen zu Mittag gegesssen hat, um zu erkennen, wie schwer es für die meisten Menschen ist, verlässliche Angaben auch über ganz regelmäßiges eigenes Verhalten zu machen. Die beste Chance, sich an die Mahlzeit von vor drei Tagen zu erinnern, besteht darin, sich die konkrete Situation so deutlich wie möglich vor Augen zu führen. Was für ein Wochentag war das noch? Wo genau war man? Was hat man vorher getan? Was geschah sonst noch? War Besuch im Haus? Hat jemand angerufen? Oft führt erst die detaillierte Rekonstruktion des betreffenden Tages dazu, dass schließlich auch das Detail im Gedächtnis wieder auftaucht, an das man sich erinnern wollte. Mit der gedanklichen Rekonstruktion des Tagesablaufes macht man sich meist unbewusst die Mechanismen assoziativen Lernens zunutze. Gedanken, Ideen, Ereignisse prägen sich nicht isoliert ins Gedächtnis ein, sondern verknüpft mit der Erinnerung an die Umstände, unter denen der Gedanke gefasst wurde. Will man den Gedanken später aktivieren, hilft dabei die Erinnerung an die betreffenden Umstände. Vermutlich kennt fast jeder die folgende, meist etwas ärgerliche Situation: Man beschließt in der Küche, ins Wohnzimmer zu gehen, um dort etwas zu erledigen. Kommt man aber im Wohnzimmer an, hat man schon wieder vergessen, was man dort eigentlich wollte. Da hilft es nur, in die Küche und damit an den Ort zurückzukehren, an dem der Gedanke gefasst wurde. Kaum ist die Ausgangssituation wieder hergestellt, fällt einem auch wieder ein, was man im Wohnzimmer vorhatte. Der Anblick der Küche aktiviert auch wieder den Gedanken, der bei eben diesem Anblick gefasst worden war und deswegen im Gedächtnis mit ihm verknüpft ist. Weil das menschliche Gehirn in dieser Weise assoziativ arbeitet, besteht auch in der Umfrageforschung die Chance, einigermaßen präzise Angaben der Befragten über ihr Verhalten zu erhalten, darin, möglichst detaillierte und konkrete Erinnerungen wachzurufen, im Extremfall, indem man mit den Befragten einen bestimmten Tag Stunde für Stunde durchgeht. Die bereits oben besprochene Grundsatzentscheidung, ob man ein Thema mit abstrakten, verallgemeinernden oder konkreten Fragen angeht, muss in diesem Fall eindeutig zugunsten der konkreten Fragen ausfallen. Allgemeinere Formulierungen können dabei als Einleitung dienen, die eigentliche Messung wird dann aber mit der größt- <?page no="197"?> Fragestrategien 198 möglichen Konkretisierung vorgenommen. Vor allem in der Mediaforschung finden sich zahlreiche Beispiele für dieses Vorgehen. Will man etwa die Leserschaft einer wöchentlich erscheinenden Zeitschrift ermitteln, könnte man mit einer Frage wie in Beispiel 43 beginnen: Fragebeispiel 43 Ermittlung des „weitesten Leserkreises“ einer Wochenzeitschrift INTERVIEWER überreicht Titelkarten und Bildblatt zum Verteilen! „Hier habe ich einige Titelkarten von Zeitschriften. Würden Sie alle diese Karten auf das Blatt hier verteilen - je nachdem, wie oft Sie die einzelnen Zeitschriften lesen oder durchblättern - egal ob zu Hause oder anderswo.“ (Zutreffendes im Kasten einkreisen) A Lese ich regelmäßig, und zwar alle Hefte, die herauskommen B Lese ich ziemlich regelmäßig, wenn auch nicht alle Hefte C Lese ich noch ziemlich oft D Lese ich so ab und zu E Lese ich (ganz) selten F Nur dem Namen nach bekannt G Unbekannt 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5077 [modifiziert]) Bei den im Fragetext erwähnten Titelkarten handelt es sich um Kärtchen, auf denen die Titellogos der Zeitschriften wiedergegeben sind. Das Bildblatt zum Verteilen ist in sieben Felder unterteilt, die mit den gleichen Kategorien beschriftet sind, die auch im „Kasten“ der Frage zu sehen sind: „Lese ich regelmäßig, und zwar alle Hefte, die herauskommen“, „Lese ich ziemlich regelmäßig, wenn auch nicht alle Hefte“ usw. <?page no="198"?> Erinnerungs- und sonstige Stützen 199 Man könnte nun meinen, diese Frage reiche aus, um die Leserschaft der Zeitschriften ziemlich genau quantitativ zu bestimmen. Eine präzisere Antwort als „Lese ich regelmäßig, und zwar alle Hefte, die herauskommen“ kann es ja kaum geben. Doch um herauszubekommen, wie viele Menschen die Zeitschriften im Erscheinungsintervall lesen, reicht diese Information nicht aus. Zum einen bleibt unklar, wie viele derjenigen, die sagen, sie läsen die Zeitschrift „ziemlich oft“ oder „ab und zu“, dies bei der aktuellen Ausgabe tatsächlich getan haben, zum anderen sind Angaben über das „normale“ Mediennutzungsverhalten wenig verlässlich (vgl. z. B. Schwarz u. a. 1985). Und so dient die Frage nach der Lesehäufigkeit auch nur dazu, den weitesten Kreis derer zu bestimmen, die überhaupt einmal mit der Zeitschrift in Kontakt kommen. In der Mediafoschung spricht man vom „weitesten Leserkreis“ (WLK). Er umfasst alle Befragten, die zumindest sagen, dass sie die Zeitschrift „(ganz) selten“ lesen (vgl. Schulz/ Schneller 2009, S. 206-215). Die eigentliche Leserzahl wird dann in einem zweiten Schritt ermittelt, bei dem nicht nach der allgemeinen Lesehäufigkeit gefragt wird, sondern ganz konkret danach, wann genau man zum letzten Mal eine solche Zeitschrift in der Hand hatte (Fragebeispiel 44). Man fragt also nach einer bestimmten, tatsächlich erlebten Lesesituation, nicht nach „typischem“ Verhalten. Eine Abstraktionsleistung wird den Befragten damit nicht abverlangt. Ausnahmen vom „normalen“ Leseverhalten werden nicht identifiziert. Manch einer, der eine Zeitschrift nur sehr selten liest, wird dies zufällig gerade am Tag vor dem Interview getan haben, andere, die die Zeitschrift sonst regelmäßig lesen, haben vielleicht letzte Woche vergessen, sie anzuschauen, doch auch solche Abweichungen vom „normalen“ Leseverhalten sind Bestandteil der Wirklichkeit, die es abzubilden gilt. Diejenigen, die eine Zeitschrift im letzten Erscheinungsintervall gelesen haben, hier also innerhalb der letzten sieben Tage, bilden die „Leser pro Nummer“ (LpN). Diese Zahl sagt mehr über die tatsächlichen Lesefrequenzen aus als die Ergebnisse der direkten Frage nach der Häufigkeit der Lektüre. Ein kleines Detail der Frageformulierung verdient vielleicht noch eine zusätzliche Erläuterung: Warum wird bei der Ermittlung des „Lesers pro Nummer“ nach der letzten Lektüre abgesehen von heute gefragt? Der Grund ist einfach: Interviews können zu den verschiedensten Tageszeiten stattfinden. Die Wahrscheinlichkeit, dass der Befragte eine <?page no="199"?> Fragestrategien 200 Zeitschrift am Tag des Interviews gelesen hat, ist bei einem abendlichen Interview natürlich größer als bei einem, das am Morgen stattfindet. Würde man die Frage um die Antwortkategorie „heute“ erweitern, würde das nur scheinbar die Präzision erhöhen. Die Frage würde im Gegenteil logisch unsauber, denn morgens und abends befragte Personen würden mit unterschiedlichen Maßstäben gemessen. Deswegen fragt man selbst, wenn es um die Lektüre von Tageszeitungen geht, ob die Zeitung „gestern“ gelesen wurde. Antwortet der Befragte mit „Nein“, so gilt diese Antwort auch dann, wenn der Interviewer den Befragten bei der Lektüre der tagesaktuellen Ausgabe angetroffen hat. Fragebeispiel 44 Ermittlung des „Lesers pro Nummer“ ACHTUNG INTERVIEWER, alle Karten, die in die Spalten F und G eingekreist wurden, weglegen. Sie werden nicht mehr gebraucht. Alle auf den Spalten A bis E einsortierten Titelkarten nach dem ‚Einkringeln’ wieder überreichen und das Bildblatt vor die/ den Befragte(n) hinlegen! „Könnten Sie mir noch sagen, wann Sie diese Zeitschriften zum letzten Mal gelesen oder durchgeblättert haben, abgesehen von heute? Würden Sie bitte die Karten auf das Bildblatt verteilen: Zeitschriften, die Sie zufällig gerade gestern zum letzten Mal in der Hand hatten, auf die erste Spalte, Zeitschriften, die Sie in den letzten 7 Tagen mal in der Hand hatten, auf die zweite Spalte usw.“ (Zutreffendes im Kasten einkreisen! ) 1 Gestern in der Hand gehabt 2 Innerhalb der letzten 7 Tage 3 8 bis 14 Tage her 4 Länger her 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5077 [modifiziert]) <?page no="200"?> Erinnerungs- und sonstige Stützen 201 Das Wecken der Erinnerung durch das Abfragen ganzer Tagesabläufe hat in den frühen Jahren der Rundfunkhörerforschung eine große Rolle gespielt. Erste Ansätze dazu finden sich bereits in Paul Lazarsfelds erster Hörerbefragung für den Wiener Rundfunk (RAVAG) aus dem Jahr 1932 (Mark 1996, S. 70). In den 50er- und 60er-Jahren wurden mit solchen biografischen Fragetechniken ganze Tagesverlaufskurven der Rundfunknutzung erstellt (siehe z. B. Eberhard 1962, S. 62-63). Heute sind diese komplizierten Abfragen weitgehend durch technische Messungen der Hörer- und Zuschauerbeteiligung ersetzt worden, doch bei anderen Untersuchungsgegenständen ist die Methode noch immer unersetzlich. Nicht nur bei der Frage, welche Medien die Bevölkerung nutzt, ist das Wecken konkreter Erinnerungen durch gestützte Ermittlungen die verlässlichste verfügbare Methode, sondern auch bei der Beantwortung der Frage, wie die Medien genutzt werden. Das klassische Verfahren hierbei ist der Copytest, eine Methode, die bereits der Begründer der modernen Umfrageforschung George Gallup in seiner Dissertation aus dem Jahr 1928 beschrieb (Gallup 1928). Beim Copytest wird anhand der Originalausgaben von Zeitungen oder Zeitschriften Artikel für Artikel ermittelt, welche Teile der Zeitung gelesen wurden. Auch hier könnte man theoretisch mit einer allgemeinen Formulierung erfragen, welche Ressorts besonderen Zuspruch erfahren, und für einen ersten Überblick oder für Langzeitanalysen, bei denen es lediglich darum geht festzustellen, ob das Interesse der Mediennutzer für Politik oder Sport im Laufe der Zeit zunimmt oder nicht, ist diese Methode auch durchaus ausreichend. Fragebeispiel 45 zeigt, wie eine solche Abfrage aussehen kann. Wesentlich präziser ist aber die Ermittlung mit der Methode des Copytests, die in Fragebeispiel 46 wiedergegeben ist. Sie lässt sich gut mit experimentellen Ansätzen verknüpfen, mit denen man beispielsweise erkennen kann, ob ein Artikel häufiger gelesen wird, wenn er an anderer Stelle in der Zeitung plaziert wird, oder ob eine Anzeige größere Aufmerksamkeit erfährt, wenn sie mehr Platz auf einer Seite einnimmt (vgl. Noelle-Neumann/ Petersen 2009, S. 321). Auch Copytests leiden darunter, dass die Befragten dazu neigen, eher Auskunft über „normale“ Verhaltensweisen zu geben als über das Leseverhalten im konkreten <?page no="201"?> Fragestrategien 202 Einzelfall, doch sie kommen diesem immer noch wesentlich näher als die allgemein gehaltene Ermittlung. Fragebeispiel 45 Allgemein gehaltene Ermittlung von Leseinteressen INTERVIEWER überreicht Liste (die Liste enthält die Antwortvorgaben „Lese ich immer, fast immer“, „lese ich gelegentlich“ und „lese ich selten, nie“.)! „In jeder Tageszeitung gibt es ja verschiedene Teile, Sparten oder Ressorts, die jeden Tag in der Zeitung stehen. Hier sind einmal die wichtigsten aufgeschrieben. Könnten Sie bitte zu jedem Teil angeben, wie häufig Sie den im HAMBURGER ABENDBLATT lesen? “ (Jeweils Zutreffendes einkreisen! ) a) „Politik“? LESE ICH IMMER, FAST IMMER ....................... 1 LESE ICH GELEGENTLICH ................................ 2 LESE ICH SELTEN, NIE ...................................... 3 ______________________________________________________________ b) „Wirtschaft“? LESE ICH IMMER, FAST IMMER ....................... 1 LESE ICH GELEGENTLICH ................................ 2 LESE ICH SELTEN, NIE ...................................... 3 ______________________________________________________________ c) „Kultur und Medien (Feuilleton)“? LESE ICH IMMER, FAST IMMER ....................... 1 LESE ICH GELEGENTLICH ................................ 2 LESE ICH SELTEN, NIE ...................................... 3 ______________________________________________________________ d) „Hamburg-Teil“? LESE ICH IMMER, FAST IMMER ....................... 1 LESE ICH GELEGENTLICH ................................ 2 LESE ICH SELTEN, NIE ...................................... 3 ______________________________________________________________ (Es folgen vier weitere Abfragen nach dem gleichen Muster) (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2460) <?page no="202"?> Erinnerungs- und sonstige Stützen 203 Fragebeispiel 46 Copytest INTERVIEWER überreicht das HAMBURGER ABENDBLATT vom 15. April 2004 und legt Liste bereit! „Ich habe hier das Hamburger Abendblatt vom Donnerstag, dem 15. April 2004. Haben Sie diese Ausgabe schon gelesen oder durchgeblättert? Wenn Sie sich nicht ganz sicher sind, können Sie gern auch einen kurzen Blick in die Zeitung werfen.“ SCHON GELESEN, DURCHGEBLÄTTERT ....... 1 NEIN...................................................................... 2* ________________________________________ * Gleich übergehen zu Frage XY ______________________________________________________________ „Es ist ja häufig so, dass man nicht alles von A bis Z durchliest, sondern vor allem das, was einen interessiert. Ich möchte jetzt mit Ihnen diese Ausgabe durchgehen und mir bei den einzelnen Beiträgen notieren, ob Sie sie ganz gelesen haben oder nur teilweise oder ob Sie nur die Überschriften, Bilder, Grafiken gesehen oder ob Sie den Beitrag gar nicht beachtet haben. Hier sind Ihre Antwortmöglichkeiten noch einmal aufgeschrieben.“ (INTERVIEWER überreicht Liste mit den Antwortvorgaben! ) ______________________________________________________________ INTERVIEWER jetzt das HAMBURGER ABENDBLATT vom 15. 4. 2004 von vorne bis hinten mit dem Befragten durchgehen und für jeden Beitrag in dem entsprechenden Feld die zutreffende Zahl einkreisen. ______________________________________________________________ Seite 3: Standort Deutschland - warum nicht? GANZ GELESEN.................................................. 1 TEILWEISE GELESEN ........................................ 2 NUR ÜBERSCHRIFTEN GELESEN BZW. BILDER/ GRAFIKEN ANGESEHEN........... 3 GAR NICHT BEACHTET ..................................... 4 ______________________________________________________________ <?page no="203"?> Fragestrategien 204 Seite 6: Norddeutschland: Sie stiften ihr Geld für Kirchen in Mecklenburg- Vorpommern GANZ GELESEN.................................................. 1 TEILWEISE GELESEN ........................................ 2 NUR ÜBERSCHRIFTEN GELESEN BZW. BILDER/ GRAFIKEN ANGESEHEN........... 3 GAR NICHT BEACHTET ..................................... 4 ______________________________________________________________ Seite 8: Kultur und Medien: Auftakt mit Hexe Lilly GANZ GELESEN.................................................. 1 TEILWEISE GELESEN ........................................ 2 NUR ÜBERSCHRIFTEN GELESEN BZW. BILDER/ GRAFIKEN ANGESEHEN........... 3 GAR NICHT BEACHTET ..................................... 4 ______________________________________________________________ Seite 15: Hamburg: Nikolaus im April - Hamburger sind in Sonnenlaune GANZ GELESEN.................................................. 1 TEILWEISE GELESEN ........................................ 2 NUR ÜBERSCHRIFTEN GELESEN BZW. BILDER/ GRAFIKEN ANGESEHEN........... 3 GAR NICHT BEACHTET ..................................... 4 ______________________________________________________________ (Es folgen vier weitere Abfragen nach dem gleichen Muster.) (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2460 [modifiziert]) Meistens kann man sich bei Copytests auf eine Auswahl von Beiträgen beschränken (vgl. Donsbach 1991). Das Prinzip des Copytests lässt sich auch auf Fernsehprogramme und Online-Angebote übertragen. Der Interviewer führt in diesem Fall dem Befragten Programmteile bzw. die betreffenden Internetseiten vor. Auch moderne apparative Messungen, vor allem die in der Laborforschung verbreitete und technisch inzwischen sehr ausgereifte Methode des Eyetracking, folgen im Grunde derselben Logik. Beim Eyetracking werden die Augenbewegungen von <?page no="204"?> Erinnerungs- und sonstige Stützen 205 Versuchspersonen bei der Lektüre einer Zeitungs- oder Internetseite registriert. Damit wird festgestellt, welche Teile des Medienangebots beachtet werden (vgl. Geise/ Schumacher 2011). Allerdings lassen sich solche aufwendigen technischen Methoden bei Repräsentativumfragen kaum einsetzen, sodass der Copytest bis heute bei quantitativen Untersuchungen unersetzlich ist. Eine besondere Variante der Methode ist der Dummytest, bei dem nicht eine Originalausgabe einer Zeitung oder Zeitschrift vorgelegt wird, sondern eine fiktive, extra für den Test angefertigte („Dummy“), beispielsweise in einer neuen zu testenden Gestaltungsform, die mit der bisherigen Gestaltung verglichen werden soll. Der Dummy wird dann den Versuchspersonen zur Lektüre übergeben und das Interview zu einem späteren Zeitpunkt verabredet. Das Abfragemodell selbst entspricht im Prinzip dem des Copytests. Auch das Beleben der Erinnerung an optische Eindrücke ist ein wesentliches Element vieler Umfragen - wenn auch naturgemäß nur der persönlichen, schriftlichen oder Internet-Umfragen. Man könnte meinen, dass vor allem letztere besonders gute Chancen böten, optische Elemente in den Fragebogen einzubauen. Der schwedische Pionier der Sozialforschung Hans Zetterberg geriet angesichts dieser Möglichkeiten auf einer Tagung in Italien schon im Jahr 2002 ins Schwärmen: Es werde eine Revolution der Umfrageforschung geben. Es würden Dinge möglich sein, die man sich heute, also 2002, kaum vorstellen könnte: Man könne Bilder zeigen, Filme vorführen, Dinge sortieren lassen usw. (vgl. Busch Zetterberg/ Zetterberg 2002). Nur kann man schon seit vielen Jahrzehnten in der Umfrageforschung Bilder zeigen, Dinge sortieren lassen und - zugegebenermaßen mit etwas größerem Aufwand - Filme vorführen (vgl. Noelle-Neumann/ Petersen 2009, S. 293-294). Man muss diese Möglichkeiten nur nutzen. Doch eben dies ist gerade bei Online-Studien nur selten der Fall. Thomas Zerback, Nikolaus Jackob und andere haben im Jahr 2008 mit einer Inhaltsanalyse von in Fachzeitschriften veröffentlichten Online- Befragungen geprüft, inwieweit die Möglichkeiten des Mediums genutzt wurden. Sie stellten fest, dass in 78 Prozent der Online-Befragungen keinerlei Designelemente verwendet wurden, 13 Prozent zeigten Grafiken oder Fotos, eine einzige Studie verwendete Audio-Elemente. Videoelemente kamen nicht vor (Zerback u. a. 2008, S. 28). Zugespitzt könnte man sagen: Online-Umfragen bieten viele Möglichkeiten für <?page no="205"?> Fragestrategien 206 kreative, intuitive, komplexe und anschauliche Fragetechniken, doch diese Möglichkeiten werden in der Praxis kaum genutzt. Dies zeigt, dass es weniger eine Frage des Mediums als der Forschungskultur ist, ob die technischen Möglichkeiten ausgeschöpft werden und damit das ganze Potenzial der Methode durch originelle, kreative Ansätze erschlossen wird. Bei der Vorlage von Bildern als Gedächtnisstütze geht man in der Umfrageforschung praktisch so vor, wie die Kommissare in zahllosen Fernsehkrimis: Der Polizist hält dem Zeugen ein Foto vor und fragt: „Kennen Sie diesen Mann? “ - Und siehe da: Der Zeuge, der zunächst den Täter nicht beschreiben konnte, sagt angesichts des Fotos: „Das ist er! “ Wahrscheinlich sind diese Szenen gar nicht so wirklichkeitsfern. Jedenfalls kann man sich diesen Effekt des Wiedererkennens auf vielfältige Weise zunutze machen, etwa indem man Abbildungen verfremdet, um zu prüfen, welches Element eines Bildes das Erkennen auslöst. Ein anschauliches Beispiel für ein solches Vorgehen bieten sogenannte „neutralisierte“ Bildvorlagen. Sie kommen vor allem in der Umfrageforschung für die Rechtspraxis, aber auch für spezielle Aufgaben in der Marktforschung zum Einsatz. Den Befragten einer Repräsentativumfrage wird das Bild eines Produkts oder seiner Verpackung in einer derart verfremdeten Form vorgelegt, dass die optischen Elemente des Produkts oder der Verpackung, die Gegenstand der Untersuchung sind, deutlich erkennbar sind, nicht jedoch Faktoren, die die Wirkung dieser Elemente auf den Befragten beeinflussen und damit die Validität der Ergebnisse beeinträchtigen könnten. Abbildung 25 zeigt das neutralisierte Bild der Verpackung eines Körperpflegemittels. Die Gestaltung der Verpackung ist mit ihrer charakteristischen optischen Einteilung erkennbar, der Name des Produkts ist dagegen unkenntlich gemacht. Mit einer solchen Bildvorlage wird ermittelt, ob die Befragten die Produktmarke allein aufgrund der Form oder Farbe der Verpackung erkennen (Noelle-Neumann/ Schramm 1961, S. 65-70). Solche neutralisierten Bilder lassen sich besonders gut in experimentellen Untersuchungsanordnungen einsetzen. Ein Beispiel dafür findet sich unten im Abschnitt über Pretests. Auch für die kommunikationswissenschaftliche Grundlagenforschung ist der Einsatz neutralisierter Bildvorlagen von Interesse, weil er es ermöglicht, einzelne Elemente eines Bildes zu isolieren und damit auch <?page no="206"?> Erinnerungs- und sonstige Stützen 207 ihren Anteil an der Gesamtwirkung einer Abbildung zu bestimmen, ohne dass dabei der Gesamteindruck des Bildes allzu sehr beeinträchtigt wird. Die Neutralisierung der in Abbildung 25 gezeigten Verpackung bewirkt, dass der Inhalt des Schriftzuges, der auf der Verpackung zu sehen ist, aus dem Bild herausgenommen wird, ohne dass die Schrift selbst verschwindet. Sie wird (mit Ausnahme des Wortes „Öl“, was der spezifischen Untersuchungsaufgabe geschuldet ist) lediglich unlesbar gemacht. Ihr Anteil an der optischen Gesamtwirkung des Bildes bleibt aber erhalten. Abbildung 25 Neutralisierte Bildvorlage (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5009) <?page no="207"?> Fragestrategien 208 Gelegentlich sorgen Erinnerungsstützen, ähnlich wie Skalenvorlagen, dafür, dass eine Frage erst richtig strukturiert und damit beantwortbar wird, etwa wie in Fragebeispiel 47. Es stammt aus einer umfangreichen Studie über das Thema Flucht und Vertreibung nach dem Zweiten Weltkrieg. Dabei sollte auch ermittelt werden, welche Kenntnisse über die ehemaligen deutschen Ostgebiete in der Bevölkerung heute noch vorhanden sind. Dazu legten die Interviewer unter anderem eine Europakarte vor, auf der die Umrisse der Länder eingezeichnet waren, aber keine Beschriftungen. Die Befragten wurden gebeten, auf die Karte ein Kreuz zu zeichnen, das markierte, wo sich das Sudetenland befindet. Fragebeispiel 47 Gestützter Geografietest mit Landkarte INTERVIEWER überreicht Bildblatt und Bleistift! „Ich habe hier eine Karte von Europa. Wissen Sie zufällig, wo das Sudetenland liegt? Könnten Sie bitte auf dieser Karte hier ein Kreuz einzeichnen, wo ungefähr? “ (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7036) Anders als sonst üblich sind bei dieser Frage keine Antwortkategorien im Fragebogen vorgegeben, es gibt keine Feldverschlüsselung (wie viele Interviewer wissen wohl, wo das Sudetenland liegt? ), und dennoch handelt es sich auch nicht um eine klassische offene Frage. Die Verschlüsselung der Ergebnisse fand bei der Auswertung mithilfe einer Schablone statt, die über die von den Befragten mit einem Kreuz versehenen Landkarten gelegt wurde. Hierzu wurde in eine Version der Landkarte das Sudetenland schwarz eingezeichnet sowie eine schraffierte Fläche um das exakte Gebiet herum. Diese Zeichnung wurde auf eine durchsichtige Folie kopiert, die man über die Zeichnungen der Befragten legen konnte. Befand sich das Kreuz im schwarzen Bereich, war es als exakt richtig gesetzt einzustufen. Befand es sich im schraffierten Bereich, konnte man die Antwort als „vage richtig“ klassifizieren (Abbildung 26). <?page no="208"?> Erinnerungs- und sonstige Stützen 209 Abbildung 26 Bildblatt zu Fragebeispiel 47 mit eingezeichnetem Muster zur Auswertung (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7036) 5.4 Die Überwindung von Aussagebarrieren Es gibt ein sehr verbreitetes Vorurteil gegenüber der privatwirtschaftlichen Umfrageforschung, das besagt, ein Auftraggeber müsse nur genug Geld anbieten, dann würde das Umfrageinstitut schon die von ihm gewünschten, das heißt, die für sein Unternehmen, seine Partei, seine <?page no="209"?> Fragestrategien 210 Organisation besonders günstig erscheinenden Zahlen liefern. In Zeitungskarikaturen wird dieses Vorurteil in zahllosen, aber stets unoriginellen Variationen illustriert: Da steht dann ein Kunde vor einer Imbissbude mit der Aufschrift „Demoskop“. Der Verkäufer fragt den Kunden: „Wie viel Geld wollen Sie denn anlegen? “ Eine Preistafel neben dem Verkaufsfenster informiert darüber, dass 30 Prozent 1000 Euro kosten, 40 Prozent 2000 Euro und mehr als 50 Prozent 4000 Euro. Der Autor hat diese Vorstellung von „käuflichen Zahlen“ immer für naiv gehalten, denn ein Umfrageinstitut, das solche Wunschdaten liefert, verliert damit in kurzer Zeit seine Glaubwürdigkeit und untergräbt damit das Fundament seiner wirtschaftlichen Existenz (von der Selbstachtung ganz zu schweigen). Und ein Auftraggeber, der dumm genug ist, Zahlen zu bestellen, die sein Unternehmen fälschlicherweise in einem günstigen Licht darstellen, schadet sich damit nur selbst, denn die Zahlen wiegen ihn in Sicherheit und verführen damit zur Untätigkeit, während die korrekten Ergebnisse ihm möglicherweise gezeigt hätten, dass im Interesse des Unternehmens Handeln geboten wäre. Eine der wichtigsten Aufgaben der Marktforschung besteht ja gerade darin, mögliche Gefahren für ein Unternehmen rechtzeitig zu erkennen. Dann aber erhielt das Institut für Demoskopie Allensbach eines Tages den Anruf eines Markenherstellers in der Konsumgüterindustrie, der ganz unverblümt darum bat, ihm ein Angebot für eine Umfrage zu machen, die mit Suggestivfragen für ihn besonders positiv erscheinende Zahlen ergeben sollte. Die Geschichte ließe sich als ärgerliche, aber folgenlose Anekdote gedanklich abhaken, hätte sich aus der Anfrage nicht ein für das Thema Fragebogenentwicklung aufschlussreiches Gespräch ergeben: Auf die Mitteilung hin, das Allensbacher Institut betreibe keine ergebnisorientierte, sondern nur erkenntnisorientierte Umfrageforschung, reagierte der Anrufer nicht etwa zerknirscht oder leitete einen eleganten sprachlichen Rückzug ein, sondern er zeigte sich vollkommen verblüfft und geradezu verärgert. Er selbst habe doch schon öfter Allensbacher Studien gesehen, in denen Suggestivfragen verwendet worden seien. Warum gebe man sich nun plötzlich so moralisch? Er verstand nicht, dass der Bruch der standesethischen Regeln nicht in der Frageform, sondern in der Art der beabsichtigten Verwendung lag. Tatsächlich wäre es nicht nur sinnlos, sondern sogar methodisch falsch, bestimmte Fragetechniken pauschal als unerlaubt zu deklarieren. <?page no="210"?> Die Überwindung von Aussagebarrieren 211 Unter Umständen haben selbst massive Suggestivfragen in der Umfrageforschung ihre Berechtigung, ja sie können sogar notwendig sein. Entscheidend ist nur, dass die Verwendung der Fragen einem Erkenntniszweck und nicht manipulativen Zwecken dient. Den Zweck sieht man einer gut formulierten Frage aber in der Regel nicht an. Es gibt eine ganze Reihe von Gründen, warum die Befragten bei Repräsentativumfragen sich unter Umständen weigern, vollständige und ehrliche Antworten zu geben. Die Furcht, sich mit einer ehrlichen Antwort bloßzustellen, ist das wahrscheinlich wichtigste Motiv, wobei diese Furcht je nach Untersuchungsgegenstand sehr unterschiedlich stark sein kann. Dagegen ist die Neigung der Bevölkerung zu Prestige-Antworten meist bemerkenswert wenig ausgeprägt. Nur wenige Menschen versuchen aus Eitelkeit, im Interview Wissen, Eigentum oder Status vorzutäuschen. Erfahrungsgemäß hat die große Mehrheit der Menschen in Deutschland kaum Hemmungen, Unwissen zuzugeben. Testen kann man das mit sogenannten Nonsens-Fragen, bei denen nach Gegenständen gefragt wird, die es nicht gibt und über die die Befragten folglich auch keine Meinung haben können. Ob man sich nach der „Kontra- Kompetenz-Reform“ oder der „Imponderabilienvorlage der Bundesregierung“ erkundigt, oder ob man nach dem nicht existenten Ort „Fulstein“ fragt, immer geben die Befragten praktisch einhellig und ohne Zögern zu Protokoll, dass sie von diesen Dingen noch nie etwas gehört haben. Der Anteil derer, die eine Meinung dazu äußern, liegt meist im unteren einstelligen Prozentbereich (vgl. Noelle- Neumann/ Petersen 2005, S. 87-89). Man spricht auch von der „Nonsens-Grenze“: Keine Äußerung ist zu abseitig, keine These zu absurd, um nicht von drei, vier Prozent der Bevölkerung vertreten zu werden, aber - zum Glück für Sozialwissenschaftler - sind es auch nicht mehr. So ist es weniger die Prahlsucht als vielmehr die Isolationsfurcht der Befragten, die die Ergebnisse von Umfragen verzerren kann. Es wurde oben schon das von Hans Zetterberg beschriebene Missverhältnis zwischen den Angaben der Bevölkerung über ihren Alkoholkonsum und die tatsächlichen Absatzzahlen der Getränkehersteller hingewiesen. Immer dann, wenn jemand befürchten muss, dass sein tatsächliches Verhalten mit dem angenommenen gesellschaftlich erwünschten Verhalten nicht übereinstimmt, gerät er in Versuchung, seine Antwort in die Richtung „sozialer Erwünschtheit“ anzupassen. Man spricht auch <?page no="211"?> Fragestrategien 212 vom Versuch der Anpassung der Antworten an das „Ich-Ideal“ (Noelle- Neumann/ Petersen 2005, S. 96) oder - in Anlehnung an den amerikanischen Psychologen Leon Festinger (1957) - von der Vermeidung „kognitiver Dissonanz“. Man muss solches Antwortverhalten als Ausweichreaktion auf vermeintlich bedrohliche Situationen verstehen (vgl. Bradburn/ Sudman 1979, S. 65-66). Die „Bedrohung“ kann dabei von der formalen Organisation einer Frage ausgehen, wenn, wie dies beispielsweise Norbert Schwarz demonstriert hat, eine Skalenvorgabe zum Fernsehkonsum dem Befragten suggeriert, sein Nutzungsverhalten unterscheide sich erheblich von einer „normalen“ Fernsehnutzung (vgl. Schwarz 1985; zur Interpretation Petersen 2002, S. 214-216). Sie kann aber auch im Frageinhalt angelegt sein, mit der Folge, dass eine nach den üblichen Regeln formulierte neutrale Frage unbeabsichtigt die implizite Bedrohung mitvermittelt. In solchen Fällen kann es sinnvoll sein, dem psychologischen Druck mit Suggestivfragen entgegenzusteuern. Ein einfaches Beispiel für eine solche Suggestivfrage stammt aus einer Untersuchung, bei der ermittelt werden sollte, wie viele Menschen sich nie oder nur selten die Haare waschen. Weil anzunehmen war, dass es den betreffenden Befragten schwerfallen würde, dies zuzugeben, wurde beschlossen, ihnen in der Einleitungsfloskel zur Frage ein Argument an die Hand zu geben, dass es ihnen ermöglichte, das seltene Haarewaschen zu rechtfertigen und damit gegenüber dem Interviewer das Gesicht zu wahren (Fragebeispiel 48). Fragebeispiel 48 Suggestivfrage zur Ermunterung bei „sozial unerwünschtem“ Verhalten „Viele Menschen sagen ja, dass es schädlich für das Haar und die Kopfhaut ist, wenn man sich allzu oft den Kopf wäscht. Könnten Sie mir sagen, wann Sie zum letzten Mal Ihre Haare gewaschen haben - einmal abgesehen von heute? “ VOR..............TAGEN WASCHE DIE HAARE NICHT .......................... 2 WEISS NICHT MEHR, KEINE ANGABE.......... 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 1024 [geringfügig modifiziert]) <?page no="212"?> Die Überwindung von Aussagebarrieren 213 Dem Leser mag die in Fragebeispiel 48 wiedergegebene Formulierung plump erscheinen, doch es hat sich in vergleichbaren Fällen wiederholt gezeigt, dass solche Einleitungstexte den von den Befragten empfundenen Druck vermindern können. Gerade das Argument „Viele Menschen sagen ja ...“, das streng genommen ja gar keins ist, ist hier außerordentlich nützlich. Es gibt dem Befragten das Gefühl, dass er mit seiner sozial unerwünschten Verhaltensweise nicht allein steht. Die Furcht, am Rande zu stehen, ist aber eine der größten Triebfedern des „sozial erwünschten“ Antwortverhaltens. Schon Schopenhauer (1983) hatte erkannt, dass die Berufung auf die Mehrheit zu den stärksten Waffen einer verbalen Auseinandersetzung gehört, und dies unabhängig von der sachlichen Richtigkeit einer Aussage. Man kann dies oft im persönlichen Gespräch beobachten. Die Behauptung „Da stehen Sie mit Ihrer Meinung aber ganz allein“ setzt den Gegner eines Streitgesprächs unter erheblichen Rechtfertigungsdruck, während „Das sage nicht nur ich, das sagen viele“ als starkes Argument empfunden wird - obwohl dies eigentlich Unsinn ist. Diesen Effekt kann man sich in der Umfrageforschung zunutze machen. Bei einem ähnlichen Fall, ebenfalls zum Thema Körperhygiene, wurde die Technik der suggestiven Einleitungsfrage zusätzlich mit einer suggestiven Antwortvorgabe kombiniert: Fragebeispiel 49 Suggestivfrage, kombiniert mit suggestiver Gestaltung der Antwortkategorien „Manche Leute sagen: Wer gesunde Zähne hat, soll gar nicht so oft die Zähne putzen. Wie stehen Sie dazu: Verwenden Sie Zahnpasta täglich oder nicht täglich? “ TÄGLICH............................................................ 1 ALLE 2 TAGE .................................................... 2 ALLE 3 TAGE .................................................... 3 ALLE 4 TAGE .................................................... 4 ALLE 5 TAGE .................................................... 5 ALLE 6 TAGE .................................................... 6 ALLE 7 TAGE UND SELTENER....................... 7 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 099) <?page no="213"?> Fragestrategien 214 Mit den Antwortvorgaben machte man sich den Effekt zunutze, den später Norbert Schwarz in seinem erwähnten Experiment zum Fernsehkonsum illustrierte: Praktisch alle Befragten fanden sich am Rand der vorgegebenen Skala wieder. In der Mitte der Vorgaben konnten sich dagegen diejenigen einordnen, die tatsächlich am Rand der Gesellschaft standen. Schon die Verteilung der Antworten zeigt, dass die feine Untergliederung in „alle 2 Tage“, „alle 3 Tage“, „alle 4 Tage“ usw. unsinnig gewesen wäre, hätte sie analytischen Zwecken dienen sollen: 87 Prozent der Befragten antworteten auf die Frage, sie putzten sich täglich die Zähne, vier Prozent sagten „alle zwei Tage“, lediglich drei Prozent gaben an, noch seltener Zahnpasta zu benutzen. Doch man kann annehmen, dass es bei einer neutralen Fragekonstruktion noch weniger gewesen wären. Ungewöhnlich bei dieser Frage ist, dass die Antwortkategorien, anders als dies sonst meistens der Fall ist, nicht im vorgelesenen Fragetext, sondern nur als Vorgabe zum Ankreuzen im Fragebogen enthalten sind, sodass der Befragte sie theoretisch gar nicht zu Gesicht bekommen sollte, denn die Interviewer sind angewiesen, die Befragten möglichst nicht in den Fragebogen schauen zu lassen, um etwaige Kontexteffekte zu vermeiden. Doch in der Praxis lässt sich dieses Prinzip nur selten durchsetzen, außer mit einem groben Bruch der Höflichkeitsregeln, der dem Interview mehr schaden würde als der Blick des Befragten auf den Bogen. Und so lässt sich nachweisen, dass tatsächlich viele Befragte im persönlichen Interview mehr oder weniger intensiv auf den Fragebogen sehen (vgl. Petersen 2002, S. 197-201). Was man generell durchaus als Nachteil dieser Befragungsform deuten kann, wird an dieser Stelle elegant ausgenutzt: Man kann annehmen, dass Menschen, die sich unter Druck gesetzt fühlen, dazu neigen, ihre Umgebung besonders aufmerksam zu beobachten. Der Befragte wird nun aufgefordert anzugeben, wie oft er sich die Zähne putzt. Er schämt sich ein wenig der ehrlichen Antwort und schaut nun, welche Möglichkeiten es gibt, das Gesicht zu wahren. Er schielt auf den Fragebogen, welche Antwortmöglichkeiten es so gibt - und stellt erleichtert fest, dass er mit seiner Antwort mitten im anscheinend akzeptierten Spektrum liegt. Die große Mehrheit derjenigen, die sich täglich die Zähne putzen, braucht dagegen solche psychologischen Hilfen nicht. In diesem Fall kann sie sich auch am Rand <?page no="214"?> Die Überwindung von Aussagebarrieren 215 der Skala wiederfinden. Sie wird dennoch keinen Grund haben, die wahre Antwort zu verschweigen oder in Richtung einer vermeintlichen sozialen Erwünschtheit zurechtzubiegen. Eine andere Möglichkeit, Aussagebarrieren für die Befragten zu verringern, bietet im persönlichen Interview die Secret Ballot Technique. Bei diesem Verfahren wird versucht, den Befragten zusätzliche Sicherheit dadurch zu vermitteln, dass man bei bestimmten heiklen Fragen sicherstellt, dass der Interviewer nicht erfährt, welche Antwort der Befragte gibt. Dazu wird in das mündliche Interview ein Element der schriftlichen Befragung eingebaut: Der Interviewer übergibt dem Befragten ein Blatt zum Selbstausfüllen und einen Umschlag. Der Befragte wird gebeten, die Fragen auf dem Blatt zu beantworten, den Zettel zusammenzufalten, in den Umschlag zu stecken und ihn erst dann dem Interviewer zurückzugeben. Der Interviewer wird instruiert, erkennbar wegzuschauen, während der Befragte das Blatt ausfüllt. Diese Methode hat sich wiederholt bei Studien beispielsweise zum Sexualverhalten (Knudsen/ Pope/ Irish 1967; vgl. auch Heerwegh 2005), zum Drogenkonsum (Aquilino/ LoSciuto 1990) und zur Erforschung rassistischer Einstellungen (Krysan 1998) bewährt. Der Gedanke liegt nahe, das Verfahren auch in der Wahlforschung bei der Ermittlung der Wahlabsicht einzusetzen. Einige amerikanische Studien weisen in der Tat darauf hin, dass dies in den Vereinigten Staaten sinnvoll wäre, wenn es dort noch mündliche Repräsentativumfragen gäbe (vgl. Benson 1941; Bishop/ Fisher 1995), doch nach den Erfahrungen des Allensbacher Instituts gilt dies nicht für Deutschland. Seltsamerweise werden die Parteizahlen nicht verlässlicher, wenn sie per Secret Ballot ermittelt werden. Doch zur Untersuchung wirklich heikler Themen, bei denen soziale Erwünschtheit sonst die Ergebnisse verzerren würde, kann das Verfahren sehr nützlich sein. Fragebeispiel 50 zeigt eine Secret-Ballot-Ermittlung aus einer Untersuchung zum Risikoverhalten junger Verkehrsteilnehmer. Der Auftraggeber der Studie bestand darauf, möglichst detaillierte Informationen über den Alkoholkonsum der Befragten zu ermitteln, idealerweise mit konkreten Mengenangaben. Dahinter stand die Vorstellung, man könne auf der Grundlage der Angaben Promillewerte berechnen, aus denen dann, in Kombination mit anderen Antworten zum Verhalten im Straßenverkehr, verschiedene Grade des Risikobewusstseins der jungen <?page no="215"?> Fragestrategien 216 Menschen errechnet werden könnten. Alle Vorhaltungen, dass derart kleinteilige Analysen die Aussagekraft von Repräsentativumfragen weit übersteigen und dass es illusorisch ist zu erwarten, dass die Angaben der Befragten über ihren Alkoholkonsum auch nur annähernd die Realität widerspiegeln, fruchteten nichts. So wurde schließlich beschlossen, mithilfe der Secret-Ballot-Methode die Hemmschwelle für die Befragten zumindest so niedrig wie irgend möglich zu legen. Die Frage wurde ganz ans Ende des Fragebogens verschoben, noch hinter die statistischen Ermittlungen zu Alter, Geschlecht, Beruf usw., um sicherzustellen, dass eine etwaige Verstimmung, die sich aus der Frage ergeben könnte, das übrige Interview nicht belasten konnte. Fragebeispiel 50 Secret-Ballot-Frage INTERVIEWER jetzt das Ausfüllblatt vom Ende des Fragebogens abreißen und zusammen mit dem leeren Umschlag überreichen! „Es gibt noch einige Zusatzfragen, die uns für diese Studie interessieren würden. Ich möchte Ihnen dazu dieses Blatt zum Selbstausfüllen überreichen. Wenn Sie mit dem Ausfüllen fertig sind, stecken Sie das Blatt bitte in den Umschlag und verschließen ihn. Der Umschlag wird erst wieder am Institut für Demoskopie Allensbach geöffnet.“ (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5772) Zum Erstaunen der Projektleitung erwiesen sich die Befragten bei dieser Frage als überaus auskunftsfreudig. Ob es am jugendlichen Alter der Befragten lag oder an der inspirierenden Wirkung der Illustrationen (Abbildung 27), die die Allensbacher Mitarbeiterin Cathrin Schiemenz zunächst während der Fragebogenkonferenz auf einen Zettel gekritzelt hatte, um der Frage ein wenig die Schwere zu nehmen und den Eindruck eines mahnenden Untertons zu verhindern, lässt sich nicht feststellen. Jedenfalls gaben die Befragten an, erstaunlich große Mengen Alkohol zu konsumieren. Die Antworten standen in einem auffallenden Kontrast zu den Reaktionen auf direkte Fragen zu diesem Thema. <?page no="216"?> Die Überwindung von Aussagebarrieren 217 Abbildung 27 Blatt zum Selbstausfüllen Wenn Sie am Wochenende ausgehen: Wie viel Alkohol trinken Sie dann in der Regel an einem Abend? Könnten Sie das bitte grob schätzen und unten eintragen, wie viel Gläser Bier, Wein, Schnaps oder Cocktails bzw. Longdrinks Sie an einem Abend ungefähr trinken? (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5772) <?page no="217"?> Fragestrategien 218 Auch ein zweiter Bogen, bei dem nach dem Drogenkonsum im Straßenverkehr gefragt wurde, wurde ohne nennenswerten Widerstand akzeptiert. Eine beträchtliche Zahl von Befragten gab zu Protokoll, Haschisch, Marihuana und andere Drogen zu nehmen. Selbst die Zusatzzeile „Anderes bitte angeben“, die eigentlich nur der Vollständigkeit halber in den Fragebogen aufgenommen worden war, wurde von vielen eifrig ausgefüllt. Bei der Auswertung lernten die Forscher viel Unerwartetes über die Nutzung halluzinogener Pilze im Straßenverkehr. Es war offensichtlich, dass die Secret-Ballot-Methode zumindest einen erheblichen Teil des Drucks, der sonst zu sozial erwünschten Antworten geführt hätte, von den Befragten genommen hatte. Trotz solcher Erfolge sind die Möglichkeiten, Befragte mit Suggestivfragen oder einer besonderen Betonung der Diskretion der Erhebung dazu zu bewegen, Auskünfte zu geben, die sie eigentlich nicht geben möchten, letztlich eng begrenzt. Hinzu kommen viele Fragethemen, bei denen die Befragten keine sachlich richtige Antwort geben können, selbst wenn sie dies gerne täten. In solchen Fällen ist man auf indirekte Fragetechniken angewiesen. Sie werden im folgenden Kapitel behandelt. 5.5 Die Kunst der indirekten Frage Gottlieb Schnapper-Arndt (1846-1904) war einer der großen, heute zu Unrecht vergessenen Pioniere der modernen Sozialwissenschaften und ein Beispiel dafür, dass es oft Außenseiter sind, denen eine Wissenschaft die inspirierendsten Beiträge verdankt. Als Kind einer reichen Frankfurter Kaufmannsfamilie war er zeitlebens finanziell unabhängig, reiste kreuz und quer durch Europa und widmete sich nationalökonomischen Forschungen (vgl. Seger 1975). Die etablierten Forscher nahmen ihn etwas amüsiert, wenn auch durchaus mit einem gewissen Respekt zur Kenntnis (vgl. z. B. Bücher 1906, S. 690-691). Sein Einfluss auf die Grundströmungen der empirischen Sozialwissenschaften blieb aber gering (vgl. Oberschall 1997, S. 29), was bedauerlich ist, denn der modernen Sozialforschung wäre mancher Irrweg erspart geblieben, wenn man mehr auf Schnapper-Arndt gehört hätte. <?page no="218"?> Die Kunst der indirekten Frage 219 So veröffentlichte Schnapper-Arndt im Jahr 1888 eine kleine Schrift mit dem Titel „Zur Methodologie sozialer Enqueten“, die sich bis heute streckenweise erstaunlich modern liest. Dort findet sich die folgende Passage: „Für irgendeine Erscheinung, deren Umfang man ermitteln will, ist man genötigt, mehr oder minder beweisende Symptome aufzufinden (...). Die Zahl der unglücklichen Ehen festzustellen, ist nicht möglich, aber man kann die Zahl der Ehescheidungen als ein Symptom wenigstens für vergleichende Beobachtungen ansehen“ (Schnapper- Arndt 1975, S. 201). Damit ist Schnapper-Arndt der Erste, der klar das Prinzip der Indikator-Frage erkannte und beschrieb, sechs Jahre vor dem berühmten französischen Soziologen Émile Durkheim, der in seinem Buch „Regeln der soziologischen Methode“ schrieb: „In einem Zeitpunkt, da die Forschung erst beginnt und die Tatsachen noch keiner weiteren Bearbeitung unterzogen worden sind, sind nun die einzig zugänglichen Eigentümlichkeiten diejenigen, welche äußerlich genug sind, um sofort erkannt zu werden. Jene, die tiefer liegen, sind zweifellos wesentlicher; ihr Wert für die Erklärung ist höher, aber sie sind auf dieser Stufe der Wissenschaft nicht bekannt, und man darf ihnen nicht vorgreifen, außer man setzt an die Stelle der Wissenschaft eine vorgefasste Meinung. So muss also der Stoff für die grundlegende Definition unter den ersteren Eigenschaften gesucht werden“ (Durkheim 1961, S. 131). Einfacher gesagt: Wenn ein Sachverhalt nicht zuverlässig direkt beobachtet oder gemessen werden kann, muss man zur Beobachtung anderer, leichter zugänglicher Dinge übergehen, die für sich genommen nicht den Kern des Interesses bilden, von denen man aber auf das eigentlich Interessierende zurückschließen kann. Man bedient sich also einer indirekten statt einer direkten Messmethode. Sachverhalte, die man nicht direkt messen kann, gibt es in der empirischen Sozialforschung viele. Zu ihnen zählen die typischen Forschungsfragen, die mit „Was wäre wenn“ und „Warum“ beginnen. Im Kapitel über die Sprache des Fragebogens im Abschnitt über Programm- und Testfragen ist auf diesen Punkt bereits ausführlich eingegangen worden. Die geringen Fähigkeiten der meisten Menschen, sich in hypothetische Situationen hineinzuversetzen, und der Umstand, dass viele Handlungsmotive unbewusst sind, verbergen den eigentlichen Gegenstand des Interesses vor dem direkten Zugriff. Hinzu kommen <?page no="219"?> Fragestrategien 220 die im vorigen Kapitel beschriebenen Fälle der Aussagebarrieren, die immer dann auftauchen, wenn die ehrliche Antwort das Ich-Ideal der Befragten verletzen würde oder wenn nachträgliche Rationalisierungen oder die Reaktionen auf andere Arten sozialen Drucks das Antwortverhalten verzerren. Die Frage, wie man richtig „Warum? “ fragt, ist deswegen außerordentlich schwer zu beantworten. Sicher ist nur, dass die direkte Frage, warum jemand etwas gekauft, getan oder sich eine bestimmte Meinung gebildet hat, sehr häufig in die Irre führt. Dieses Problem beschäftigt die empirische Sozialwissenschaft und nicht zuletzt die Marktforschung, für die die „Warum“-Frage oft von besonderer Bedeutung ist, seit den Anfangstagen und unverändert bis heute (vgl. Lazarsfeld 1935, Tschurenev 2005). Darüber hinaus sind indirekte Fragen - man spricht auch von Indikator-Fragen - immer dann notwendig, wenn abstrakte theoretische Konzepte der Gegenstand der Untersuchung sind: Ob es um Politikverdrossenheit, Antisemitismus, gesellschaftlichen Wertewandel oder das politische Meinungsklima geht, immer ist man, um mit den Worten Schnapper-Arndts zu sprechen, darauf angewiesen, die richtigen Symptome zu identifizieren. Das Prinzip der Indikator-Frage lässt sich leicht theoretisch beschreiben, es ist aber schwer, praktische Hinweise darauf zu geben, wie man gute Indikator-Fragen entwickelt, denn es gibt dafür keine Regeln. Indikator-Fragen können die verschiedensten Formen annehmen, wobei sich vielleicht als grober Erfahrungswert festhalten lässt, dass sie meist umso effektiver sind, je weniger man ihnen den eigentlichen Zweck ansieht. Je kreativer und fantasievoller der Ansatz, desto besser. Wie gut eine Indikator-Frage den indirekt zu erfassenden Sachverhalt tatsächlich trifft, lässt sich zudem in den meisten Fällen nicht eindeutig quantifizieren. Hier liegt ein grundlegendes logisches Problem von Indikator-Fragen: Sie werden nie die Präzision erreichen können, die eine direkte Frage auf den Gebieten hat, wo sie eingesetzt werden kann. Was genau eine Indikator-Frage misst und wie genau sie es misst, wird letztlich immer eine Interpretationsfrage bleiben. Indikator- Fragen sind damit in den meisten Fällen ein sehr unscharfes Instrument, doch dafür können sie eben auch dort eingesetzt werden, wo die direkte Frage versagt. Man kann mit ihnen bis ins Unbewusste der Befragten vordringen. Doch das kann man nicht mathematisch beweisen. Man kann den Nutzen von Indikator-Fragen nur am konkreten Beispiel <?page no="220"?> Die Kunst der indirekten Frage 221 illustrieren, beispielsweise anhand einer Frageserie zu den Entscheidungskriterien beim Autokauf. In einer Repräsentativumfrage wurden alle Personen, die in den drei Jahren vor dem Interview ein Auto gekauft hatten, gefragt: „Wenn man ein Auto kauft, interessiert einen ja einiges mehr, anderes weniger. Wie war das bei Ihrem letzten Autokauf, worauf haben Sie da geachtet, was war Ihnen wichtig? “ Dazu wurde eine Liste mit verschiedenen Kaufmotiven zur Auswahl überreicht. Abbildung 28 zeigt die Ergebnisse der Frage. Abbildung 28 Direkte Frage: Entscheidungskriterien beim Autokauf Frage an Personen, die in den letzten drei Jahren ein Auto gekauft haben: „Wenn man ein Auto kauft, interessiert einen ja einiges mehr, anderes weniger. Wie war das bei Ihrem letzten Autokauf, worauf haben Sie da geachtet, was war Ihnen wichtig? “ 32 36 41 45 47 52 57 58 66 67 68 86 Innenausstattung Aussehen, Design Langlebigkeit Geräumigkeit Gute Erfahrungen mit der Marke Sicherheitsmerkmale Autotyp, Modell Ausstattung Zuverlässigkeit Unterhaltskosten Technische Daten Preis (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7058) <?page no="221"?> Fragestrategien 222 Die Antworten auf die Frage lesen sich wie eine Rangfolge der vernünftigsten denkbaren Argumente: Der Preis, technische Daten, Unterhaltskosten, Zuverlässigkeit usw. Da, wie beschrieben, die meisten Befragten sich in aller Regel bemühen, richtige Antworten zu geben, gibt es auch keinen Grund, daran zu zweifeln, dass diese Antworten auch in den meisten Fällen ehrlich gemeint sind. Man kann annehmen, dass die Befragten wirklich glaubten, diese vernünftigen Motive seien die Hauptgründe für ihre Kaufentscheidung gewesen. Und dieser Glaube ist auch nicht vollkommen falsch. Man kann aus den Antworten auf die Frage ohne Zweifel einiges über die Prioritäten beim Autokauf lernen, und deswegen sind solche direkt formulierten Listenfragen ein häufig angewandtes und sinnvolles Instrument in der Marktforschung. Und doch zeigen die Ergebnisse nicht ganz das richtige Bild und könnten damit den Betrachter, beispielsweise den Marketingchef einer Autofirma, der sich Gedanken darüber macht, mit welchen Argumenten er seine Fahrzeuge bewerben sollte, in die Irre führen. Die Antworten der Befragten auf die direkte Frage suggerieren nämlich, dass das Design eine vergleichsweise geringe Rolle bei der Kaufentscheidung gespielt habe. Gerade 36 Prozent sagten, dass ihnen dieser Faktor wichtig gewesen sei. Er steht damit auf Platz 11 in der Rangliste der scheinbar wichtigsten Kriterien. Schlechte Marktforschung würde an dieser Stelle enden und in die Empfehlung münden, der Hersteller möge vor allem auf den Preis seiner Fahrzeuge achten und darauf, dass sie den Ruf erhalten, besonders zuverlässig zu sein. Das Design sei dagegen eher nachrangig zu behandeln. Eine an die direkte Frage angehängte Indikator-Frage zeigte jedoch, dass das Design keineswegs so nachrangig war, wie es zunächst den Anschein hatte. Denjenigen Befragten, die angaben, sie hätten sich vor dem Autokauf verschiedene Modelle angeschaut - das waren natürlich die meisten -, wurde die Frage gestellt: „Und hat Ihnen eines dieser Autos auf Anhieb, schon beim ersten Anschauen, so gut gefallen, dass Sie sich sofort ganz spontan entschieden haben, oder ist Ihnen das nicht so gegangen? “ Immerhin ein Drittel der Autokäufer antworteten darauf, so sei es ihnen ergangen. Aufschlussreich sind nun die Antworten derjenigen, die bei der direkten Frage gesagt hatten, das Aussehen des Autos habe bei ihrer Kaufentscheidung keine Rolle gespielt: Sie sagten ebenso häufig wie die anderen Befragten, sie hätten sich beim <?page no="222"?> Die Kunst der indirekten Frage 223 ersten Blick auf ein Automodell spontan zum Kauf entschieden (Abbildung 29). Was aber soll diese Reaktion ausgelöst haben, wenn nicht das Aussehen und damit das Design des Fahrzeugs? Die Indikator-Frage entwertet damit nicht die direkte Frage, doch sie ergänzt sie in einem entscheidenden Punkt. Sie zeigt nicht, welchen Rangplatz das Design in der Liste der wichtigsten Kaufmotive tatsächlich einnehmen müsste, doch sie weist deutlich nach, dass es bei der Entscheidungsfindung eine wesentlich größere Rolle spielt, als es sich die Befragten selbst eingestehen wollten. Abbildung 29 Indikator zur Bedeutung des Designs für die Kaufentscheidung Frage an alle Autokäufer, die sagen, sie hätten sich vor dem Autokauf verschiedene Modelle angeschaut: „Und hat Ihnen eines dieser Autos auf Anhieb, schon beim ersten Anschauen, so gut gefallen, dass Sie sich sofort ganz spontan entschieden haben, oder ist Ihnen das nicht so gegangen? “ Befragte insgesamt % Befragte, die sagen, dass das Design beim Kauf keine Rolle gespielt habe % Auf Anhieb spontan entschieden 33 33 Ging mir nicht so 63 63 Keine Angabe 4 ___ 100 4 ___ 100 n = 460 299 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7058) Was hat das scheinbar widersprüchliche Antwortverhalten der Befragten ausgelöst? Man muss annehmen, dass die Reaktionen auf die <?page no="223"?> Fragestrategien 224 direkte Frage zum Teil auf die Vermeidung kognitiver Dissonanz zurückzuführen sind. Vermutlich passt es nicht zum Idealbild der meisten Menschen von einer angemessenen Entscheidung, ein derart teures Gebrauchsgut wie ein Auto aufgrund von Äußerlichkeiten zu kaufen. Und weil die meisten Menschen unterbewusst bestrebt sind, Unterschiede zwischen dem als richtig Empfundenen und dem tatsächlichen eigenen Handeln zu verringern (vgl. Festinger 1957), dürften viele ihre eigene Entscheidung nachträglich mit „vernünftigen“ Gründen unterfüttert haben. Die Indikator-Frage umging nun diesen Effekt, indem sie das Thema Design ansprach, ohne dass den Befragten der Konflikt zwischen der Norm und dem eigenen Verhalten bewusst wurde. Sie fragte im Gegenteil nach etwas Sympathischem: Spontaneität wird im Allgemeinen als eine positive Persönlichkeitseigenschaft angesehen. Weil man Indikator-Fragen das Befragungsziel meist weit weniger deutlich anmerkt als einfachen direkten Fragestellungen, eignen sie sich besonders gut dazu, innere Widersprüche in den Meinungen oder Verhaltensweisen der Befragten erkennbar werden zu lassen. Ob eine Indikator-Frage wirklich nützliche Erkenntnisse bringt, lässt sich oft nur durch Versuch und Irrtum feststellen. Wer eine Indikator-Frage entwickelt, muss deswegen auch dann, wenn er einige Erfahrung mit der Formulierung von Fragen hat, stets damit rechnen, dass das Instrument nicht funktioniert, dass also die gedachte Querverbindung zwischen der Frage und dem indirekt zu erforschenden Untersuchungsgegenstand nicht erkennbar wird. Die Funktionsfähigkeit einer Indikator-Frage erkennt man in der Analyse oft an ihrer Differenzierungskraft, also daran, dass mit ihrer Hilfe verschiedene Befragtengruppen voneinander getrennt werden können, die sich in ihrem Antwortverhalten bei anderen Fragen deutlich voneinander unterscheiden. Im günstigsten Fall können Indikator- Fragen eine enorme Treffsicherheit erreichen und damit weitaus kompliziertere Fragebatterien ersetzen. Der St. Galler Wirtschaftswissenschaftler Sven Reinecke berichtete im Jahr 2011 auf einer Fachtagung in Zürich von einem besonders eindrücklichen Fall: Ein großer Konsumgüterhersteller hat in seinem Produktangebot zwei Marken von Hundefutter. Mit großen und aufwendigen Marktuntersuchungen versuchte das Unternehmen jahrelang, Hundebesitzer danach einzuteilen, ob sie eher zur Zielgruppe der einen oder der anderen Marke gehörten, zu- <?page no="224"?> Die Kunst der indirekten Frage 225 nächst mit mäßigem Erfolg. Nach immer wieder neuen Anläufen und Versuchen kam man schließlich zu der Lösung, alle komplizierten Abfragen durch eine einzige einfache Frage zu ersetzen, die lautete: „Feiern Sie den Geburtstag Ihres Hundes? “ Wie durch Zauberhand trennte diese Frage die beiden Zielgruppen voneinander wie Öl von Wasser. Praktisch alle, die die Frage mit „Ja“ beantworteten, erwiesen sich als affin zu der einen höherpreisigen Marke, wer mit „Nein“ antwortete, konnte mit größter Sicherheit der anderen Marke zugeordnet werden. Dass mit einer vergleichsweise einfachen, spielerisch wirkenden Indikator-Frage sehr substanzielle gesellschaftliche Entwicklungen wenn auch nicht in jedem Detail beschrieben, so aber doch schlaglichtartig beleuchtet werden können, zeigt Fragebeispiel 51: Fragebeispiel 51 Konzentrationstest „Sie kennen sicher aus den Illustrierten dieses kleine Spiel: Man sieht zwei gleiche Bilder, aber es gibt ein paar ganz kleine Unterschiede, weil entweder ein Strich zu viel oder zu wenig gezeichnet ist. Wir möchten einmal feststellen, wie schwierig eigentlich solche Aufgaben sind. Darf ich Ihnen deshalb ein solches Blatt geben, und Sie kreisen mit dem Bleistift hier die Unterschiede ein, die Ihnen auffallen? Also dort, wo im rechten Bild etwas anders ist, machen Sie einfach einen Kreis. Sie haben eine Minute Zeit.“ (INTERVIEWER überreicht Stift und Fragebogen! INTERVIEWER lässt dem/ der Befragten genau eine Minute Zeit und lässt sich den Fragebogen wieder zurückgeben! ) (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6072) Auf den ersten Blick scheint die Frage wenig Relevanz zu haben. Ihre Aussagekraft erkennt man erst dann, wenn man erfährt, dass die Zahl derjenigen, die bei dieser Frage binnen einer Minute sechs oder mehr Fehler fanden, in den Jahren von 1981 bis 1999, als die Frage zum bisher letzten Mal gestellt wurde, von 37 auf 26 Prozent zurückgegangen ist (Noelle-Neumann/ Köcher 2002, S. 179), ein Effekt, der übri- <?page no="225"?> Fragestrategien 226 gens wahrscheinlich großenteils auf die Alterung der Gesellschaft zurückzuführen ist (vgl. Die Verschiebung der Altersschwellen 1997). Wenn aber der Anteil derer an der Bevölkerung zurückgeht, die sich wenigstens eine Minute lang so gründlich auf eine Zeichnung konzentrieren können, dass sie in ihr sechs oder mehr einfache Fehler finden, dann ist das ein Indikator für die sinkende Fähigkeit der Gesellschaft, geistige Leistungen zumindest einer bestimmten Art zu erbringen. Damit handelt es sich bei der Frage keineswegs um eine bloße Spielerei, sondern um einen Konzentrationstest, dessen Ergebnisse von erheblicher gesellschaftlicher Bedeutung sind. Abbildung 30 Bildvorlage zum Konzentrationstest (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6072) Bei vielen Indikator-Fragen handelt es sich im Kern um Fragemodelle aus der Individualpsychologie, die an die Bedingungen der Repräsentativbefragung angepasst wurden. Beispiele hierfür sind Intelligenztests oder Emotionstests (vgl. z. B. Rosenzweig 1945). Selbst klassische Verfahren der klinischen Psychologie wie der Rorschach-Test lassen sich in Repräsentativumfragen einsetzen (vgl. Ring 1992, S. 177- <?page no="226"?> Die Kunst der indirekten Frage 227 179). Dabei muss stets ein grundsätzlicher logischer Schritt vollzogen werden: Ursprünglich wurden diese Verfahren entwickelt, um die psychologischen Eigenschaften oder den psychologischen Zustand einer einzelnen Person zu bestimmen. Sie sind Instrumente der Einzelfalldiagnostik. Deswegen sind sie in aller Regel aufwendig angelegt und bestehen aus einer Vielzahl komplizierter Komponenten, langer Fragebatterien und Tests, die sich inhaltlich oft auch wiederholen, denn der Psychologe, der das Instrument anwendet, muss ja sicher sein können, dass er nicht wegen einer einzelnen möglicherweise ungewöhnlichen Reaktion seines Klienten eine Fehldiagnose stellt. Für Interviews in Repräsentativumfragen sind diese Untersuchungsmodelle viel zu belastend und komplex. Doch der Umfrageforscher hat auch nicht die Sorgen des Psychologen. Einzelne Fehldiagnosen können ihm egal sein, denn sie sind für die Befragten folgenlos und für das Umfrageergebnis irrelevant. So können die Modelle der Individualpsychologie für die Umfrageforschung radikal gekürzt und vereinfacht werden und behalten dennoch Aussagekraft, wenn sich nur mit ihrer Hilfe verschiedene Bevölkerungsgruppen voneinander unterscheiden lassen. Fragebeispiel 52 Ein Indikator für technische Intelligenz INTERVIEWER überreicht Bildblatt! „Würden Sie sich bitte einmal diese Zeichnung etwas genauer ansehen. In welcher Richtung wird sich die Kiste bewegen: aufwärts, abwärts oder überhaupt nicht? “ AUFWÄRTS................................................................... 1 ABWÄRTS ..................................................................... 2 ÜBERHAUPT NICHT .................................................... 3 UNENTSCHIEDEN / KEINE ANGABE ......................... 4 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2219 [geringfügig modifiziert]) An Fragebeispiel 52 lässt sich das Prinzip gut illustrieren. Es stammt aus einer Untersuchung über die Berufswünsche von Abiturienten (Kri- <?page no="227"?> Fragestrategien 228 tik an der Technik ... 1982) und dient als Indikator für technische Intelligenz. Aus Sicht eines Psychologen wäre die Frage - überhaupt jede einzeln gestellte Frage - als Intelligenztest vollkommen ungeeignet, denn mancher Dummkopf würde die richtige Antwort raten, mancher begabte Mensch wegen Unaufmerksamkeit versagen. Doch das ist in der Umfrageforschung nicht von Belang. Entscheidend ist allein, dass sich in der Gruppe derjenigen, die die richtige Antwort geben, mit großer Wahrscheinlichkeit wesentlich mehr technisch begabte Menschen befinden werden als in der Gruppe derer, die die falsche Antwort geben. Ob dies tatsächlich der Fall ist, zeigt sich in der Analyse darin, dass die beiden Befragtengruppen auf Fragen beispielsweise zum Informationsinteresse oder ihren Studienplänen deutlich unterschiedliche Antworten geben. Abbildung 31 Bildvorlage zum Test technischer Intelligenz Antriebsrichtung (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2219) <?page no="228"?> Die Kunst der indirekten Frage 229 Je komplexer und abstrakter ein Untersuchungsgegenstand wird, desto mehr ist man darauf angewiesen, auf Indikator-Fragen zurückzugreifen. Besonders anschauliche Beispiele hierfür finden sich in der politischen Umfrageforschung. Hier besteht eine der großen Herausforderungen, etwa im Vorfeld einer zu analysierenden Wahl, darin, das Meinungsklima zu erfassen. Der Begriff Meinungsklima wurde von dem englischen Sozialphilosophen Joseph Glanvill (1636-1680) geprägt. Das Wort beschreibt eine gesellschaftliche Grundstimmung, die den Charakter öffentlicher Diskussionen bestimmt und damit für eine bestimmte Idee oder Meinung günstig oder ungünstig sein kann - und damit auch für bestimmte Parteien oder Kandidaten. Die im Begriff enthaltene Metapher des Klimas illustriert die Idee, dass das Meinungsklima ähnlich dem Wetter allgegenwärtig ist, den Menschen jederzeit umgibt, sodass er ihm nicht entgehen kann. In der Kommunikationswissenschaft spielt der Begriff Meinungsklima in der Theorie der Schweigespirale von Elisabeth Noelle-Neumann eine zentrale Rolle, wo er fast synonym zum Begriff „öffentliche Meinung“ verwendet wird. Nach dieser Theorie versuchen die meisten Menschen, gesellschaftliche Isolation zu vermeiden, und beobachten deswegen laufend ihr Umfeld. Wer den Eindruck gewinnt, dass er mit seiner Meinung allein steht, dass die meisten Menschen gegen ihn sind, neigt dazu zu verstummen, seine Position in der Öffentlichkeit nicht mehr oder nur noch sehr zurückhaltend zu vertreten. Er reagiert damit auf den Druck des Meinungsklimas. Das lässt seine Position wiederum noch schwächer erscheinen, als sie tatsächlich ist, was den Druck auf ihre Vertreter zusätzlich erhöht und diese ebenfalls verstummen lässt. Im Extremfall kann auf diese Weise eine Meinung aus der öffentlichen Diskussion verschwinden, selbst wenn sie von einem beträchtlichen Teil der Bevölkerung geteilt wird (vgl. hierzu Noelle-Neumann 2001). Solche Vorgänge können den Verlauf von Wahlkämpfen und auch die Auskunftsbereitschaft von Befragten in Wahlumfragen erheblich beeinflussen. Sie müssen deswegen bei der Analyse politischer Umfragen berücksichtigt werden (siehe hierzu Hentschel/ Tennstädt 1985, Noelle-Neuman/ Petersen 2005, S. 290-296). Und so versucht man in der politischen Umfrageforschung seit vier Jahrzehnten mit immer wieder neuen Indikator-Fragen, diese so schwer zu beschreibende und doch <?page no="229"?> Fragestrategien 230 so wirkungsmächtige gesellschaftliche Atmosphäre zu erfassen: Die Anhänger welcher Parteien oder politischen Positionen sind selbstbewusst, wer ist dagegen eingeschüchtert? Mit welchen Meinungsäußerungen kann man sich gesellschaftlich isolieren? Welche Verhaltensweisen tragen einem Applaus, welche Spott oder gar aggressive Reaktionen ein? Dies sind die Programmfragen, die der Forschung nach dem Meinungsklima zugrunde liegen. Es lässt sich zeigen, dass ein ausgeprägtes Meinungsklima von den meisten Menschen wahrgenommen wird (Noelle-Neumann 2001, S. 27- 39), doch diese Wahrnehmung ist, wie auch die Reaktionen darauf, weitgehend unbewusst, sodass es keinen Sinn macht, direkt danach zu fragen, wie viel Prozent der Menschen wohl der einen oder anderen Meinung seien oder ob die Befragten glauben, mit der Meinung der meisten Menschen übereinzustimmen (zur Problematik solcher direkter Meinungsklimafragen siehe Roessing 2009, Bodor 2012). Aber man kann die Fähigkeit der Befragten nutzen, Dinge zu beobachten, die als Hinweis auf die Richtung und die Stärke des Meinungsklimas verstanden werden können, wie in Fragebeispiel 53. Die wenigsten Befragten dürften sich darüber im Klaren sein, dass ihre Beobachtung zur Einschätzung des Meinungsklimas dient, doch die Angaben darüber, von welcher Partei besonders viele Plakate beschmiert oder zerrissen werden, können sehr aufschlussreich sein. Sie schwanken von Wahljahr zu Wahljahr. Das Zerstören eines Plakats aber ist in diesem Zusammenhang als öffentliches Statement zu verstehen, als indirekte Drohung gegenüber den Anhängern der betreffenden Partei. Die Aussagekraft einer einzelnen solchen Meinungsklimafrage ist meistens begrenzt, doch wenn man das Thema mit mehreren Indikator- Fragen von verschiedenen Seiten gleichzeitig gleichsam einkreist und die Antworten der Befragten dann mit denen aus früheren Wahlkämpfen vergleicht, kann man einen recht zuverlässigen Eindruck von der gesellschaftlichen Atmosphäre bekommen. Wichtiger als beeindruckende Einzelergebnisse ist dabei, dass die Ergebnisse der verschiedenen Indikator-Fragen tendenziell in die gleiche Richtung zeigen. Paul Lazarsfeld hat mit gutem Grund gegenüber seinen Studenten an der Columbia-Universität in New York wiederholt betont, dass das wichtigste Kriterium für Signifikanz die Konsistenz mehrerer Ergebnisse sei (vgl. Petersen 2002, S. 168, Fußnote 14). Das gilt ganz besonders dann, <?page no="230"?> Die Kunst der indirekten Frage 231 wenn, wie dies bei Indikator-Fragen unvermeidlich ist, das Messinstrument relativ ungenau ist und seine Ergebnisse stark interpretationsbedürftig sind. Fragebeispiel 53 Meinungsklimafrage „Im Wahlkampf werden ja immer wieder Wahlplakate zerrissen oder beschmiert. Nach dem, was Sie so gesehen haben, von welcher Partei würden Sie sagen, werden vor allem Wahlplakate beschädigt? “ CDU/ CSU....................................................................... 1 SPD ................................................................................ 2 FDP ................................................................................ 3 BÜNDNIS 90 / DIE GRÜNEN ....................................... 4 DIE LINKE...................................................................... 5 NPD................................................................................ 6 ANDERE PARTEI.......................................................... 7 ALLE GLEICH................................................................ 8 WEISS NICHT, NICHT GESEHEN............................... 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 10043) Gut geeignet zur Erfassung des Meinungsklimas sind Fragen, bei denen das Prinzip der Indikator-Frage mit der Methode des projektiven Tests verbunden wird, die im kommenden Kapitel noch ausführlicher behandelt wird. Den Befragten wird dabei eine fiktive Situation vor Augen gestellt, die sie beurteilen sollen. In der Praxis sehr bewährt hat sich hier beispielsweise der sogenannte „Buhtest“, bei dem die Befragten aufgefordert werden einzuschätzen, welcher Redner bei einer Podiumsdiskussion wohl vom Publikum ausgebuht worden sei (Fragebeispiel 54). Man könnte meinen, die Frage sei zu hypothetisch, um von den Befragten akzeptiert zu werden. Schließlich war niemand von ihnen bei der in der Frage genannten Diskussion dabei. Streng genommen dürfte die einzig ehrliche Antwort nur lauten: „Ich weiß es nicht.“ Doch erstaunlicherweise weicht die Mehrheit der Befragten nicht auf diese Antwortmöglichkeit aus. Es ist aus ihrer Sicht auch nicht nötig, <?page no="231"?> Fragestrategien 232 denn in einem stark ausgeprägten Meinungsklima müssen sie die konkrete Situation nicht kennen, um dennoch eine eindeutige Einschätzung abgeben zu können. Sie wissen einfach, mit welcher Meinung man sich in der Öffentlichkeit Buhrufe einhandelt, wobei es sich in den meisten Fällen um implizites Wissen handelt. Viele Menschen, die beim Buhtest instinktiv eine eindeutige Antwort geben, würden bei der direkten Frage, mit welcher Meinung man sich wohl isolieren würde, weit weniger sicher urteilen. Das abstrakte Konzept des Meinungsklimas steht den meisten Menschen nicht klar vor Augen, und der Gedanke, dass man sich mit einer Meinung isolieren könnte, liegt vielen sogar ausgesprochen fern (vgl. Petersen 2012e). Doch die Situation mit der Podiumsdiskussion können sie sich deutlich vorstellen. Es ist ihnen klar, wer da ausgebuht wird, wenn ihnen auch nicht unbedingt klar ist, warum. Fragebeispiel 54 Der Buhtest „Ich möchte Ihnen nun einen Vorfall erzählen, der sich bei einer großen öffentlichen Diskussion über Gentechnik ereignet hat. Zwei Hauptredner waren zu hören: Der eine sprach sich dafür aus, die Gentechnik in Deutschland zu fördern, der andere sprach sich dagegen aus. Einer der beiden Redner wurde ausgebuht. Was meinen Sie, welcher von beiden wurde ausgebuht: derjenige, der für die Förderung sprach, oder derjenige, der dagegen war? “ DER DAFÜR WAR ........................................................ 1 DER DAGEGEN WAR................................................... 2 UNENTSCHIEDEN........................................................ 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 7090) Zum Schluss des Kapitels soll noch ein Fragemodell vorgestellt werden, das nicht nur zur Analyse des Meinungsklimas von Nutzen sein kann, weil es hilft, Themen zu identifizieren, die in der Öffentlichkeit stark emotionalisiert diskutiert werden, sondern das gleichzeitig darüber hinaus diejenigen in der Bevölkerung erkennbar werden lässt, die dazu neigen, aktuelle Streitthemen emotional und tendenziell irrational zu behandeln. Das Beispiel zeigt, dass viele Fragen in der Umfragefor- <?page no="232"?> Die Kunst der indirekten Frage 233 schung mehreren Zwecken gleichzeitig dienen können, und es illustriert noch einmal die Vielfalt der Formen, die Indikator-Fragen annehmen können. Es handelt sich um einen Emotionstest, der mit der Beschreibung eines Szenarios beginnt, das dem beim Buhtest ähnelt, doch in diesem Fall werden die Befragten nicht aufgefordert, die Situation als Ganzes zu beurteilen, sondern sie werden gebeten anzugeben, ob sie sich mit einer bestimmten Publikumsreaktion identifizieren (Fragebeispiel 55 und Abbildung 32): Fragebeispiel 55 Emotionstest INTERVIEWER legt Bildblatt bereit! „Ich möchte Ihnen einmal erzählen, was sich neulich bei einer Podiumsdiskussion über den Treibhauseffekt und die Klimaveränderungen ereignet hat. Zwei Experten sprachen darüber, was die neuesten Statistiken und Messungen über das Klima sagen und wie viel Schadstoffe wirklich in der Luft vorhanden sind. Plötzlich sprang ein Zuhörer auf und rief etwas in den Saal. Wenn Sie das bitte einmal lesen.“ INTERVIEWER überreicht Bildblatt. Bitte Zeit zum Lesen lassen! „Würden Sie sagen, er hat ganz recht oder nicht recht? “ HAT RECHT .................................................................. 1 HAT NICHT RECHT ...................................................... 2 UNMÖGLICH ZU SAGEN ............................................. 3 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6011) Man kann die Frage als ein wenig hinterhältig bezeichnen, denn wie viele Indikator-Fragen bringt sie innere Widersprüche bei den Befragten zum Vorschein. Auf direkte Nachfragen bekennen sich die meisten Menschen zur Rationalität. So ist beispielsweise eine Mehrheit in der Bevölkerung davon überzeugt, die meisten Lebensentscheidungen, auch Wahlentscheidungen, hauptsächlich nach Vernunft und nicht nach <?page no="233"?> Fragestrategien 234 Gefühl gefällt zu haben (Institut für Demoskopie Allensbach 2004, S. 15-16). Der Emotionstest zeigt dagegen, dass dieselben Personen aktuelle Streitthemen in einem erheblichen Maße irrational betrachten. Abbildung 32 Bildblatt zum Emotionstest „Was interessieren mich Zahlen und Statistiken in diesem Zusammenhang. Wie kann man überhaupt so kalt über ein Thema reden, bei dem es um menschliche Schicksale geht! “ (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6011) <?page no="234"?> Die Kunst der indirekten Frage 235 Die Aussage des aufspringenden Zuhörers, die die Befragten gebeten werden zu beurteilen, ist, mit kühlem Kopf betrachtet, nur als im höchsten Maße irrational zu bezeichnen, denn was wenn nicht die tatsächliche Faktenlage sollte sinnvollerweise eine Expertendiskussion zu einem Sachthema bestimmen. Doch egal ob es um Atomenergie geht, den Klimawandel, Gentechnik oder ein anderes gesellschaftliches Streitthema, stets findet sich eine ansehnliche relative, meist sogar eine absolute Mehrheit in der Bevölkerung, die die Ansicht vertritt, der empörte Zuhörer habe recht. Wie viele Modelle von Indikator-Fragen lässt sich auch der Emotionstest vielfältig variieren. Im Herbst 2011 kam bei einer Repräsentativumfrage über die Lebensängste der Bevölkerung eine leicht abgeänderte Variante der Frage zum Einsatz. Hier hieß es im einleitenden Fragetext, die Teilnehmer der Podiumsdiskussion hätten sich über gentechnisch veränderte Lebensmittel unterhalten. Experten hätten dabei die (nach derzeitigem Kenntnisstand übrigens korrekte [vgl. European Commission 2010, S. 127-177]) Ansicht vertreten, dass gentechnisch veränderte Lebensmittel für die Menschen keine Gefahr darstellten. Dem auf dem Bildblatt präsentierten Zuhörer wurde die Aussage in den Mund gelegt: „Was interessieren mich Zahlen und Statistiken in diesem Zusammenhang? Gentechnisch veränderte Lebensmittel machen mir einfach Angst! “ Dann folgte, wie in der Originalversion des Tests, die Frage: „Würden Sie dem Zuhörer zustimmen oder nicht zustimmen? “ 57 Prozent der Befragten sagten, sie stimmten dem Zwischenrufer zu, nur 19 Prozent meinten, man könne ihm nicht zustimmen (IfD- Umfrage Nr. 10079). Es war keine Sachaussage, die diese Reaktion auslöste, keine schlagende oder auch nur scheinbare Widerlegung. Dem Zwischenrufer wurde nicht etwa das Argument in den Mund gelegt, dass die Ausführungen des Wissenschaftlers auf dem Podium unglaubwürdig oder falsch seien. Im Gegenteil: Sie wurden gar nicht in Zweifel gezogen. Ihnen wurde eine ausschließlich emotionale, sachlich irrelevante Aussage entgegengesetzt: „Aber ich habe Angst.“ Dieser Satz reicht aus, um die Mehrheit der Bevölkerung auf seine Seite zu ziehen. Man kann durchaus die Ansicht vertreten, die Indikator-Frage habe die Befragten hinters Licht geführt, doch das ist in der Umfrageforschung manchmal unvermeidlich, denn es ist nicht anzunehmen, dass <?page no="235"?> Fragestrategien 236 die Bevölkerung auf offene, direkte Nachfrage ein auch nur annähernd vergleichbares Ausmaß der Irrationalität in der eigenen Meinungsbildung zu erkennen geben würde. Das Beispiel zeigt, dass bei der Entwicklung von Indikator-Fragen eine gewisse Neigung zur intellektuellen Fallenstellerei nützlich sein kann. Vor allem aber zeigt es gemeinsam mit den anderen in diesem Kapitel präsentierten Fallbeispielen, wie sehr die Entwicklung von Fragebogen, die unter die Oberfläche des unmittelbar zu Beobachtenden dringen sollen, Fantasie und Kreativität verlangt. 5.6 Projektive Verfahren Zu den vielseitigsten und wissenschaftlich fruchtbarsten Fragebogenmethoden zählen die projektiven Verfahren. Dabei handelt es sich um Fragen, bei denen die Befragten gebeten werden, sich gedanklich in eine bestimmte vorgestellte Situation hineinzuversetzen und aus dieser Situation heraus zu antworten. Auch diese Methode stammt ursprünglich aus der Individualpsychologie. In der Umfrageforschung dient sie in der Regel dazu, das assoziative Umfeld eines Untersuchungsgegenstands zu erfassen (Ring 1992, S. 167; 174). Es war ein weiterer, heute zu Unrecht fast vergessener Pionier der Sozialwissenschaften, der die Methode der projektiven Frage in die Umfrageforschung einführte: Adolf Levenstein (1870-1942) führte im Jahr 1907 ohne besondere wissenschaftliche Vorbildung eine Arbeiterumfrage durch, die die Studien der etablierten Forscher seiner Zeit weit in den Schatten stellte (vgl. Oberschall 1997, S. 159). Während sich die Honoratioren des hoch angesehenen „Vereins für Socialpolitik“ gleichzeitig unter der Leitung von Max Weber mit jahrelangen fruchtlosen Diskussionen über den Fragebogen zu einer Arbeiterumfrage aufhielten, der am Ende kaum mehr als die Soziodemografie ermittelte (vgl. Oberschall 1997, S. 201-202), schrieb Levenstein, man bekommt den Eindruck: mit leichter Hand, einen Fragebogen, der aus heutiger Sicht zwar unvermeidlich viele handwerkliche Fehler enthielt, der aber auch Frische und echte Neugierde zeigte und damit wesentlich origineller war als alles, was der „Verein für Socialpolitik“ schließlich zustandebekam. <?page no="236"?> Projektive Verfahren 237 Levenstein veröffentlichte die Ergebnisse seiner Umfrage in einem Buch mit dem Titel „Die Arbeiterfrage“ (1912), das in der Fachwelt, wenn es überhaupt beachtet wurde, oft Unmut, fast möchte man sagen: Aggressivität auslöste. Eine von Levensteins Fragen zog dabei in besonderer Weise den Hohn der Experten auf sich. Sie lautet: „Gehen Sie oft in den Wald? Was denken Sie, wenn Sie auf dem Waldboden liegen, ringsum tiefe Einsamkeit? “ Max Weber, der sonst zu den wenigen gehörte, die Levensteins Bemühungen zu würdigen wussten, nannte die Frage grotesk (zit. n. Oberschall 1997, S. 161). Und Hans Zeisel, der eigentlich einen guten Blick für sozialwissenschaftliche Innovationen hatte, nannte Levensteins Studie wegen dieser Frage ein halbes Jahrhundert später seltsam und naiv (Zeisel 1960, S. 124). Doch tatsächlich handelt es sich bei dieser Frage um den ersten in einen Fragebogen zu einer Massenbefragung eingebauten projektiven Test, möglicherweise auch um die erste Indikator-Frage in der Geschichte der Umfrageforschung, die diesen Namen verdient. Mit ihrer Hilfe konnte Levenstein ansatzweise erfassen, was den Arbeitern im Kopf herumging, wenn sie Zeit hatten, die Gedanken schweifen zu lassen - und damit indirekt die Grundstimmung in der Arbeiterschaft abseits von Gewerkschaftskundgebungen. Die allermeisten überlieferten Antworten haben einen positiven, optimistischen Grundton. Sie bestätigen keinesfalls die verbreitete Vorstellung von einer kampfbereiten, gegen soziale Ungerechtigkeit aufbegehrenden Arbeiterschaft. Mit direkten Fragen wie „Welches sind die Gedanken, mit denen Sie sich am meisten beschäftigen? “ wäre dieses Ergebnis vermutlich nicht zustande gekommen (vgl. Petersen 2012d). Projektive Tests haben in der Umfrageforschung heute eine ähnliche Funktion wie Assoziationstests, sind aber wesentlich variabler in ihrer Form und in ihren Einsatzmöglichkeiten. Sie verbinden die Vorteile qualitativer und quantitativer Untersuchungen. Zu den bekanntesten Varianten zählen mit Bildvorlagen unterstützte Satzergänzungstests, die oft als modifizierte Variante eines Dialogbildblatts gestaltet werden können, wie in Fragebeispiel 56 und Abbildung 33. Das Bildblatt ist dabei das gleiche wie bei einer normalen Dialogfrage, nur dass eine Sprechblase teilweise leer gelassen ist. Die Befragten werden aufgefordert anzugeben, was die abgebildete Person wohl sagen könnte. Dies ist die einfachste Variante des Fragemodells, es gibt aber auch Satzer- <?page no="237"?> Fragestrategien 238 gänzungstests, die Personen in einer spezifischeren Situation zeigen, etwa eine Person, die gerade etwas gekauft hat und nun von jemand anderem gefragt wird, warum, Abbildungen von Kindern, die etwas über ihre Eltern sagen, oder konkrete Szenen, bei denen die Reaktion einer abgebildeten Person eingeschätzt werden soll. Ein Beispiel hierfür ist ein Test, bei dem eine Figur gezeigt wird, die gerade angerempelt wird. Die Befragten werden gebeten, sich zu überlegen, was diese Person wohl angesichts der Rempelei sagen könnte. Die Antworten lassen sich, analog zu entsprechenden Verfahren in der Psychologie, in aggressive und nicht aggressive Äußerungen unterteilen (vgl. Ring 1992, S. 171, Noelle-Neumann/ Petersen 2005, S. 186-187). Das Grundmuster der Fragen ist aber immer dasselbe: Die Befragten ergänzen den in der Sprechblase leer gelassenen Text und offenbaren damit idealerweise Aufschlussreiches über ihre Persönlichkeitseigenschaften oder die Ausstrahlung eines zu untersuchenden Gegenstandes. Fragebeispiel 56 Satzergänzungstest INTERVIEWER überreicht Bildblatt! „Hier unterhalten sich zwei über das Wohngeld. Leider haben wir nicht ganz mitbekommen, was der zweite geantwortet hat. Was meinen Sie, was könnte er geantwortet haben? Wie geht dieser Satz wohl zu Ende? “ ICH GLAUBE, ER HAT ES NICHT BEANTRAGT, WEIL ... ........................................................................................ ........................................................................................ ........................................................................................ ........................................................................................ KEINE ANGABE ....................................................................................... 8 BEFRAGTE(R) WEISS NICHT, WAS WOHNGELD IST ........................ 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5054) <?page no="238"?> Projektive Verfahren 239 Abbildung 33 Bildvorlage zum Satzergänzungstest (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 5054 [geringfügig modifiziert]) <?page no="239"?> Fragestrategien 240 Mit den hier präsentierten Beispielen lässt sich die Vielfalt der möglichen Formen projektiver Tests nur andeuten. Als besonders fruchtbar haben sich immer wieder Fragemodelle erwiesen, die durch den vom amerikanischen Psychologen Henry Murray entwickelten thematischen Apperzeptionstest (TAT) inspiriert wurden (Murray 1943). Bei diesem Test werden den Versuchspersonen nacheinander verschiedene Bilder mit der Bitte vorgelegt, zu jeder der Vorlagen eine Geschichte zu erzählen. Wie die meisten Tests der Individualpsychologie kann auch der TAT nicht unverändert in Repräsentativumfragen aufgenommen werden, aber der Grundgedanke, zu konkreten, im Bild präsentierten Situationen Geschichten erzählen zu lassen, ist auch in der Umfrageforschung vielfältig umsetzbar. Erp Ring, der viele psychologische Verfahren an Repräsentativumfragen angepasst hat, schreibt dazu, es könne, wenn etwa Reaktionen auf einen Plakatentwurf gemessen werden sollten, „zweckmäßig sein, die Befragten nicht nur direkt nach ihren Reaktionen zu fragen (...), sondern mithilfe von Bildmaterial Beziehungen einzufangen, die sie sonst vielleicht nicht zu geben bereit sind. Es wird also zum Beispiel das Bild einer Person gezeigt, die in der Zeitung oder Illustrierten gerade ein Bild oder eine Anzeige ansieht, die auch der Befragte selbst vor sich liegen hat. Wie könnte die Person auf dem Bild in diesem Fall reagieren, was geht ihr durch den Kopf, was empfindet sie? “ (Ring 1992, S. 174). Die Bildvorlage dient damit dem Befragten nicht nur als Illustration der zu bewertenden Situation oder des zu bewertenden Gegenstandes, sondern sie gibt ihm darüber hinaus auch die Möglichkeit, sich von seiner eigenen Antwort etwas zu distanzieren, indem er sie der abgebildeten Person in den Mund legt. Erfahrungsgemäß wird es für manche Befragte durch diese Konstruktion leichter, Reaktionen und Meinungen zu Protokoll zu geben, die sie lieber nicht mir ihrer eigenen Person in Verbindung gebracht sehen möchten. Damit tragen solche projektiven Tests auch dazu bei, die Neigung zu sozial erwünschten Antworten zu verringern. Abbildung 34 zeigt das Bildblatt zu einem projektiven Test, der auf dem Grundgedanken des TAT beruht. Es stammt aus einer Marktforschungsuntersuchung zum Thema Waschmittel. Die Frage zu dem Bildblatt lautet: „Könnten Sie sich dieses Bild einmal ansehen? Da sitzt gerade eine Frau, und aus dem Radio ertönt es: ‚Für Ihre Wäsche - seit Generationen bewährt! ’ Was meinen Sie, was die Frau denkt, wenn sie <?page no="240"?> Projektive Verfahren 241 das im Radio hört, was mag ihr dabei durch den Kopf gehen? “ Ein weiteres Beispiel für einen im Prinzip gleich aufgebauten Test wurde bereits oben in diesem Band präsentiert (Fragebeispiel 11 und Abbildung 9). Abbildung 34 Bildblatt zu einem projektiven Test (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8641) Die hier präsentierten Beispiele für projektive Tests mögen ein wenig den Eindruck von Spielereien erwecken, doch das täuscht. Die Herangehensweise ermöglicht es, ein Element der qualitativen Forschung in das Umfeld von Repräsentativumfragen einzubauen. Günstigstenfalls lassen projektive Tests überraschende Dimensionen eines Themas erkennen, mit denen im Vorfeld der Untersuchung niemand gerechnet hatte. Dadurch, dass diese Fragen spontane und fantasievolle <?page no="241"?> Fragestrategien 242 Reaktionen der Befragten anregen und ihnen gleichzeitig Raum für Reaktionen geben, die nicht, wie es bei den meisten anderen Fragen notwendig ist, in ein vorgegebenes Kategorienschema passen müssen, können sie das Entdeckungspotenzial einer Untersuchung erheblich steigern. Dies ist besonders dann der Fall, wenn solche kreativen Fragemodelle mit kontrollierten Feldexperimenten verknüpft werden. Ihnen ist das folgende Kapitel gewidmet. 5.7 Feldexperimentelle Methoden Die gegabelte Befragung wurde bereits oben in den Kapiteln über die Position der Befragten im Interview und die Sprache des Fragebogens kurz vorgestellt als eine Methode zum Nachweis von Reihenfolge- und Frageformulierungseffekten. An dieser Stelle soll nun ausführlicher auf dieses experimentelle Verfahren eingegangen werden, denn es ist weit mehr als „nur“ ein Instrument der methodischen Grundlagenforschung. Auch in der angewandten Forschung, in der Soziologie, Politikwissenschaft, Kommunikationswissenschaft sowie der Markt- und Mediaforschung ermöglichen solche, in der englischen Fachsprache auch Split Ballot genannten Experimente Erkenntnisse, die mit keinem anderen methodischen Ansatz gewonnen werden können. Dass Experimente dennoch heute in der empirischen Sozialforschung meist eine eher untergeordnete Rolle spielen, hat praktische und wissenschaftshistorische Gründe: Zum einen bedeutet der Aufbau experimenteller Versuchsanordnungen im Rahmen von Repräsentativumfragen gegenüber nicht experimentell angelegten Studien einen spürbaren organisatorischen Mehraufwand. Darüber hinaus muss man annehmen, dass an dieser Stelle bis heute der Umstand nachwirkt, dass sich die sozialwissenschaftlichen Disziplinen mit Ausnahme der Psychologie nicht in der Hauptsache aus einer von naturwissenschaftlichem Denken geprägten Tradition heraus entwickelt haben, sondern - vor allem in Europa - wesentlich aus den Sozialreformbewegungen des 19. Jahrhunderts (vgl. Oberschall 1997). In der Wissenschaftsgeschichte hat sich die Entwicklung experimenteller Methoden wiederholt als entscheidend für die Entfaltung einer Disziplin erwiesen (vgl. Petersen 2002, S. 20-29). Der entscheidende <?page no="242"?> Feldexperimentelle Methoden 243 Vorzug des Experimens gegenüber anderen wissenschaftlichen Verfahren liegt dabei in seinem Nachweischarakter (vgl. Herkner 1991, S. 18, Siebel 1965, S. 178). Der Forscher ist nicht darauf angewiesen, ein empirisch beobachtetes Phänomen lediglich zu betrachten und über seine Gründe zu spekulieren, sondern er versucht, durch einen kontrollierten Eingriff empirisch Faktoren ausfindig zu machen, die das Beobachtete bedingen. Es dauerte Jahrhunderte, bis sich die experimentelle Methode in den Naturwissenschaften durchgesetzt hatte. Als im 19. Jahrhundert die ersten Versuche unternommen wurden, auch in die sich neu entfaltenden Sozialwissenschaften experimentelle Methoden einzuführen, zeigte sich, dass die Verfahren der experimentellen Physik oder Chemie nicht unverändert übernommen werden konnten, weil ihre Logik den spezifischen Eigenschaften des Untersuchungsgegenstandes nicht gerecht wurde. Ein einfaches naturwissenschaftliches Experiment lässt sich nahezu ohne besondere Vorkehrungen zur Kontrolle etwaiger Störfaktoren mit einer einfachen Vorher-Nachher-Messung durchführen (bei den komplexen Experimenten der heutigen entwickelten Naturwissenschaften ist die Lage natürlich wesentlich komplizierter, aber es geht an dieser Stelle nur um logische Grundprinzipien). Der Forscher nimmt an dem Gegenstand seiner Untersuchung eine Manipulation vor: Er lässt beispielsweise eine Kugel fallen oder tröpfelt Säure auf einen Stein. Wenn sich der Gegenstand daraufhin verändert - die Kugel verformt sich, der Stein verändert seine Farbe -, kann die Veränderung mit an Sicherheit grenzender Wahrscheinlichkeit auf den experimentellen Eingriff zurückgeführt werden, denn es ist nicht anzunehmen, dass die Kugel sich auch dann verformt hätte, wenn sie nicht fallengelassen worden wäre, oder der Stein von sich aus die Farbe geändert hätte. Beide, die Kugel und der Stein, haben einen „Normalzustand“, der sich ohne äußere Eingriffe nicht verändert, zumindest nicht spontan oder in unberechenbarer Art und Weise (vgl. Schulz 1970, S. 94). Von einem solchen prinzipiell konstanten „Normalzustand“ des Untersuchungsgegenstandes kann bei Experimenten, bei denen es um das sich stetig ändernde Verhalten von Menschen geht, keine Rede sein. Die Vorher-Nachher-Messung wird deswegen auch von den amerikanischen Psychologen Donald Campbell und Julian Stanley, die vor 50 Jahren das bis heute maßgebliche Standardwerk über Experimente in <?page no="243"?> Fragestrategien 244 der Sozialforschung veröfentlicht haben, als „vor-experimentelle Methode“ bezeichnet (Campbell/ Stanley 1963, S. 7-12), soweit es die Sozialwissenschaften betrifft. Die Sozialwissenschaften mussten also ein eigenes Experiment- Modell entwickeln, bei dem die Einflüsse unter Kontrolle gehalten werden konnten, die dazu führen, dass sich der Untersuchungsgegenstand auch ohne experimentellen Eingriff ständig ändert (zu den verschiedenen Einflüssen siehe Campbell 1957). Die Lösung des Problems bestand darin, dass man zwei (oder mehr) Personengruppen gleichzeitig parallel untersucht, eine oder mehrere Experimentalgruppen, die dem experimentellen Faktor, ggf. in verschiedenen Ausprägungen, ausgesetzt werden, und - sofern nicht allein der Unterschied der Reaktion auf zwei verschiedene Stimuli gemessen werden soll - eine Kontrollgruppe, deren Verhalten oder Meinungen gleichzeitig untersucht werden, jedoch ohne Einführung des experimentellen Faktors. Mit diesem Modell lässt sich die Wirkung des experimentellen Faktors beweiskräftig messen, ohne dass zeitabhängige Störfaktoren wirksam werden können, wenn die Experimental- und die Kontrollgruppe exakt gleich zusammengesetzt sind und beide Gruppen - mit Ausnahme der Einführung des experimentellen Stimulus - exakt gleich behandelt wurden. Wenn diese Bedingungen gegeben sind, kann in vielen Fällen sogar auf eine Vorher-Messung verzichtet werden. Sehr schnell, nämlich seit dem Ende des 19. Jahrhunderts, hat sich das Experiment in der Psychologie durchgesetzt, besonders in den den Naturwissenschaften besonders nahe stehenden Teildisziplinen der physiologischen und der Sozialpsychologie (z. B. Binet/ Henri 1894, Triplett 1898). Ganz anders war die Entwicklung in der empirischen Sozialforschung. Hier hat sich die experimentelle Methode bisher nur zögerlich durchsetzen können. Einer der Gründe dafür war, dass die in der Psychologie übliche Methode des Laborexperiments, bei der vergleichsweise wenige Versuchspersonen in einer oft klassenraumähnlichen Situation dem Stimulus ausgesetzt werden, für die Bedingungen der Repräsentativumfrage nicht geeignet war. Jene Eigenschaften des Laborexperiments, die in weiten Teilen der Psychologie in Kauf genommen werden können - Künstlichkeit der Situation, oft geringe Fallzahl, nichtrepräsentative Auswahl der Versuchspersonen -, gefährden in der empirischen Sozialforschung die Validität der Ergebnisse. Die empi- <?page no="244"?> Feldexperimentelle Methoden 245 rische Sozialforschung bedurfte deswegen eines anderen Vorgehens als die Psychologie. Eine verblüffend einfache Lösung bot schließlich die Methode des Split-Ballot-Experiments. Sie ermöglichte es, die beweiskräftige Logik des Laborexperiments mit der in der Sozialforschung unverzichtbaren quantitativen Verallgemeinerungsfähigkeit der Repräsentativumfrage zu verbinden. Das Grundprinzip des Split-Ballot-Experiments ist simpel: Im Rahmen einer standardisierten repräsentativen Umfrage wird die Stichprobe in zwei (oder mehr) jeweils gleich große Teilstichproben untergliedert. Jede dieser Teilstichproben ist gleichermaßen repräsentativ für die Grundgesamtheit. Die Personen jeder Teilstichprobe werden gleichzeitig und unter gleichen Bedingungen befragt, und zwar mit einem Fragebogen, der in beiden Gruppen gleich ist, mit Ausnahme einer oder einiger weniger bestimmter Fragen, die sich von Gruppe zu Gruppe unterscheiden und damit den experimentellen Stimulus bilden. Das Vorgehen ist so einfach - es gibt keine besonderen Vorrichtungen zur Kontrolle des Interviewvorgangs, keine besonderen Maßnahmen zur Ausschaltung von Außeneinflüssen, die Versuchspersonen werden in der Regel nur einmal befragt -, dass sich die Frage aufdrängt, ob es sich bei gegabelten Befragungen tatsächlich um „echte“ Experimente handelt. Ein Blick auf vier von Winfried Schulz in seinem Standardwerk über das sozialwissenschaftliche Experiment genannte Bedingungen (Schulz 1970, S.101), die bei einem Kontrollgruppen-Experiment erfüllt sein müssten, zeigt jedoch, dass dies tatsächlich der Fall ist: Experimental- und Kontrollgruppe sind hinsichtlich aller Faktoren gleich: Es handelt sich bei beiden Gruppen um gleichermaßen repräsentative Stichproben. Etwaige Unterschiede beschränken sich auf die statistischen Fehlertoleranzen, sind damit berechenbar und geringer als bei den meisten Laborexprimenten. Experimental- und Kontrollgruppe werden gleichzeitig und vor Anbringung des experimentellen Faktors gebildet. Der Faktor wird in allen betreffenden Gruppen gleichzeitig zur Wirkung gebracht. Die Kontrollgruppe ist gegen den Einfluss des experimentellen Faktors vollkommen abgeschirmt. Die Interviews finden jeweils unter vier Augen bzw. am Telefon statt. Weder der Interviewer noch der Befragte haben Kenntnis von den in anderen Teilstichproben verwendeten Fragebogenvarianten. Kontakte zwischen Befragten, die ver- <?page no="245"?> Fragestrategien 246 schiedenen Teilgruppen angehören, sind theoretisch denkbar, jedoch so unwahrscheinlich, dass sie vernachlässigt werden können. Alle äußeren und inneren Bedingungen des Experiments sind für Experimental- und Kontrollgruppe gleich. Beide Gruppen unterscheiden sich nur durch den experimentellen Faktor. Dies gilt nicht für jeden einzelnen Befragten, aber für alle Gruppen als Ganzes. Die Interviews finden zwar an verschiedenen Orten und mit verschiedenen Interviewern statt, auch sind mögliche störende Drittvariablen nicht ausgeschaltet, doch angesichts der Repräsentativität der Stichproben und der Vielzahl der Befragten kommen diese störenden Variablen in allen Guppen - innerhalb der statistischen Fehlertoleranzen - gleichermaßen zur Geltung. Das bedeutet, dass, wenn bei einem Split-Ballot-Experiment die Befragten der einen Teilstichprobe signifikant anders auf einen im Fragebogen untergebrachten Stimulus reagieren als die Befragten der anderen Teilstichprobe auf das an der entsprechenden Stelle angebrachte Signal, dieser Unterschied in der Reaktion zwischen den beiden Gruppen mit hoher und berechenbarer Wahrscheinlichkeit kausal auf die Variation des Stimulus im Fragebogen zurückgeführt werden kann und nicht auf eine unbekannte Drittvariable. Damit sind gegabelte Befragungen eindeutig echte, zum Kausalnachweis uneingeschränkt taugliche sozialwissenschaftliche Experimente. Es handelt sich sogar um - in naturwissenschaftlicher Terminologie gesprochen - „Doppel- Blindversuche“, denn idealerweise erfahren weder die Befragten noch die Interviewer im Verlauf der Studie, dass sie an einem Experiment teilnehmen. Dies lässt sich dadurch sicherstellen, dass man jedem Interviewer nur eine Variante des Fragebogens zuteilt. Gegabelte Befragungen lassen sich zu einer Vielzahl von Zwecken einsetzen, wobei sich grundsätzlich drei Einsatzgebiete unterscheiden lassen, nämlich erstens der Einsatz als Erkenntnisinstrument zur Beantwortung konkreter Untersuchungsaufgaben, zweitens der Einsatz zu fragebogentechnischen Zwecken in der angewandten Forschung und drittens als Methode zur methodischen Grundlagenforschung, besonders im Rahmen der Fragebogenentwicklung. Im Einzelnen lassen sich Split-Ballot-Experimente zu den folgenden Zwecken einsetzen: <?page no="246"?> Feldexperimentelle Methoden 247 Verhinderung von Reihenfolge- und Kontexteffekten. Durch einfaches Austauschen von schriftlich vorgelegten Argumenten, Antwortkategorien oder die Umgruppierung von Listen (Ring 1974) in jedem zweiten Interview lassen sich viele Effekte der Reihenfolge von Fragen oder Antwortkategorien ausgleichen, wenn auch nicht alle Arten von Kontext-Effekten (vgl. Bishop 1987, Schwarz/ Schuman 1997). Der Test von Frageformulierungen. Mit dieser Anwendungsform der Split-Ballot-Experimente beschäftigen sich die meisten der frühen Veröffentlichungen von Ergebnisen dieser Methode. Die von Donald Rugg (1941), Hadley Cantril (1940, 1944), Archibald Crossley (1941) und Elmo Roper (1940, 1941) in den 40er-Jahren entdeckten Effekte gelten zum Teil heute als Klassiker. Am bekanntesten ist wahrscheinlich Donald Ruggs Experiment, das zeigte, dass die Befragten auf die Forderung, etwas zu „verbieten“, deutlich anders reagierten als auf die inhaltlich gleichbedeutende Forderung, etwas „nicht zu erlauben“ (Rugg 1941; vgl. auch Noelle-Neumann/ Petersen 2005, S. 197). Problematisch an diesen Experimenten war, dass sich aus ihnen oft keine praktischen Schlussfolgerungen ziehen ließen, weil bei Ergebnisunterschieden zwischen verschiedenen Fragebogenvarianten nicht entschieden werden konnte, welche Fragevariante denn die valideren Ergebnisse erbrachte, also der - wie auch immer zu definierenden - Realität näher kamen. Wohl auch aus diesem Grund erlahmte in den 50er-Jahren das Interesse an dieser Art der Fragebogenexperimente. Sie gewann erst mit der zunehmenden Orienterung der Umfrageforschung an der kognitiven Psychologie ab den 70er-Jahren wieder an Bedeutung. Der Test der Stabilität von Meinungen. Bereits in den frühen Jahren der Umfrageforschung setzte sich bei den Forschern die Überzeugung durch, es gebe verschiedene Härtegrade von Meinungen (vgl. Tönnies 1922, S. 137-138; Katz 1940, Cantril 1944, S. 23-50). Später haben Hans-Jürgen Hippler und Norbert Schwarz nachgewiesen, dass bestimmte Fragebogeneffekte, darunter Effekte wie bei Ruggs klassischem „Verbieten/ Nicht erlauben“-Experiment, nur bei solchen Befragten beobachtet werden können, die an anderer Stelle im Fragebogen bekundeten, sie hätten keine ausgeprägte Meinung zum betreffenden Thema (Hippler/ Schwarz 1986). Diesen Umstand kann man sich in der praktischen Forschung zunutze machen. Bei verfestigten Meinungen bewirken selbst massive Suggestivfragen keine nennenswerten Effekte <?page no="247"?> Fragestrategien 248 im Split-Ballot-Experiment, während in frühen Stadien der Meinungsbildung oder in Umbruchzeiten bereits geringfügige Änderungen der Formulierung deutliche Effekte haben. Das Auftreten starker Fragebogeneffekte in einer sonst scheinbar stabilen Trendentwickung kann ein Frühindikator für bevorstehende Meinungsumschwünge in der Bevölkerung sein (Petersen 2002, S. 122-126). Der Einsatz von Split-Ballot-Experimenten in der methodischen Grundlagenforschung. Dieses Anwendungsgebiet der feldexperimentellen Methode ist besonders vielfältig und anspruchsvoll. Mit keinem anderen Instrument lassen sich die zahlreichen Effekte von Monotonie im Fragebogen, kognitiver Prozesse bei der Aufnahme und Interpretation von Frageformulierungen, schwankender Aufmerksamkeit, heuristischer Informationsverarbeitung, suggestiver Signale von Skalenvorgaben oder impliziter, subjektiv vom Befragten empfundener Drohungen verlässlich nachweisen (vgl. Petersen 2002, S. 151-255). Viele der auch in diesem Band an vielen Stellen beschriebenen Reaktionsmuster der Befragten sind mithilfe von Split-Ballot-Experimenten entdeckt und dokumentiert worden. Da in dem vorliegenden Band nicht die methodische Grundlagenforschung im Mittelpunkt der Betrachtung steht, sondern der Fokus auf den Methoden der angewandten empirischen Umfrageforschung liegt, sind an dieser Stelle die zwei bisher noch nicht erwähnten Anwendungsgebiete der gegabelten Befragung von besonderem Interesse: der Test verschiedener Vorlagen und Argumente und die Kombination der feldexperimentellen Methode mit der Logik der Indikator-Frage. Beide sollen im Folgenden etwas ausführlicher beschrieben werden, die Vielfalt der möglichen Formen und Einsatzmöglichkeiten der Methode lässt sich damit aber nur andeuten. Den Varianten bei der in Teilgruppen variierten Vorlagen verschiedener Texte oder Abbildungen sind praktisch keine Grenzen gesetzt mit Ausnahme derjenigen, die für Vorlagen in der Umfrageforschung allgemein gelten: Sie dürfen nicht zu komplex sein, müssen vom Befragten in kurzer Zeit erfasst werden können. Gewisse praktische Probleme ergeben sich manchmal dadurch, dass zwei Anforderungen miteinander in Konflikt stehen können: Zum einen sollte der experimentelle Stimulus möglichst nicht mehrdimensional sein, zum anderen <?page no="248"?> Feldexperimentelle Methoden 249 aber macht es in der Regel wenig Sinn, allzu künstliche oder spitzfindige Unterscheidungen zu testen: Legt man beispielsweise verschiedene Anzeigenentwürfe vor, kann man sich fragen, ob man die Farbe der Schrift, die Schriftgröße oder bestimmte Bilder experimentell manipulieren möchte. Am saubersten wäre es, alle diese Elemente getrennt voneinander zu testen, sodass man eine Vielzahl verschiedener Entwürfe ins Feld schicken müsste, bei denen jeweils nur ein Merkmal ausgetauscht wird und alle Merkmalskombinationen durchgetestet werden, also zum Beispiel: eine Variante mit großer Schrift und kleinen Fotos, eine zweite mit kleiner Schrift und kleinen Fotos, eine weitere mit kleiner Schrift und großen Fotos usw. Auf diese Weise weiß man dann hinterher genau, welche Elemente der Anzeigengestaltung welche Effekte auslösen, und doch ist das Vorgehen für die angewandte Forschung in der Regel ungeeignet, denn man würde mit großem Aufwand viele Anzeigenvarianten testen, die in der getesteten Form nie ernsthaft für eine konkrete Werbekampagne in Erwägung gezogen würden. Oft steht das werbetreibende Unternehmen eher vor der Entscheidung, welchem von drei, vier probehalber angefertigten, vollkommen unterschiedlich gestalteten Anzeigenentwürfen der Vorzug gegeben werden sollte. In einem solchen Fall sollten diese tatsächlich zur Wahl stehenden Entwürfe auch der Gegenstand des Testes sein, auch wenn man hinterher nicht genau bestimmen kann, ob nun die Schriftgestaltung oder die Farbe ausschlaggebend für das Urteil der Befragten war. Das bedeutet nicht, dass es, je nach Forschungsziel, nicht auch gelegentlich sinnvoll sein kann, die Wirkung von relativ kleinen, vielleicht sogar scheinbar nebensächlichen Einzelkomponenten einer Text- oder Bildvorlage experimentell zu testen, doch die praktische Erfahrung besagt, dass es meistens ratsam ist, sich vor Spitzfindigkeiten zu hüten. Anzeigentests sind ein vergleichsweise häufig vorkommender Typus von experimentell angelegten Umfragestudien. An ihnen lässt sich das Prinzip in seinen verschiedenen Varianten auch vergleichsweise anschaulich illustrieren. Fragebeispiel 57 zeigt einen Ausschnitt aus einer solchen Untersuchung, bei der verschiedene Anzeigenentwürfe mithilfe einer Stapel-Skala (siehe oben Abbildung 13, Nr. 1) beurteilt wurden. Verknüpft wurde der experimentelle Test in diesem Fall mit dem Ludwig-Kartenziehverfahren (Noelle-Neumann/ Petersen 2005, S. 170-171), das eine einfache und elegante Möglichkeit darstellt, die Befragten im <?page no="249"?> Fragestrategien 250 Verlauf eines Interviews zufallsgesteuert verschiedenen Experimentalgruppen zuzuordnen. Im Prinzip sollte bei der Planung eines Experiments stets versucht werden, die Gruppen bereits im Vorfeld der Untersuchung zu bilden und von vornherein mehrere Fragebogenvarianten zu erstellen, weil nur so sichergestellt ist, dass das Experiment die Anforderungen eines Doppelblind-Versuchs erfüllt. Es gibt aber Situationen, in denen ein solches Vorgehen zu aufwendig wäre, etwa wenn die Zahl der experimentell zu testenden Bild- oder Textvorlagen etwas größer ist. In einem solchen Fall kann man die Vorlagen auf Karten drucken (maximal in der Größe DIN A5, größere Formate lassen sich nicht mehr gut handhaben). Die Interviewer werden angewiesen, die Karten zu mischen und den Befragten im Interview mit der Rückseite nach oben aufgefächert zu präsentieren. Der Befragte zieht eine Karte. Da durch das Mischen der Karten jede Karte mit gleicher Wahrscheinlichkeit an jeder Stelle im Fächer stecken kann, hat auch jede Karte die gleiche Chance, vom Befragten gezogen zu werden. Man kann etwa bis zu zehn Karten auf diese Weise zur Auswahl stellen und erhält damit etwa bei einer Umfrage mit 1500 Befragten zehn repräsentative Experimentalgruppen mit jeweils rund 150 Befragten. Fragebeispiel 57 Experimenteller Anzeigentest mit Kartenziehverfahren INTERVIEWER die vier großen Anzeigen aus dem Umschlag holen und die Anzeigen verdeckt, also mit der Rückseite nach oben, aufgefächert dem/ der Befragten hinhalten, sodass er/ sie eine Anzeige ziehen kann! „Ich habe hier verschiedene Anzeigen. Würden Sie bitte eine davon ziehen? “ INTERVIEWER: Anzeige ziehen lassen und die Zahl der gezogenen Anzeige einkreisen! Die restlichen Anzeigen wieder zurück in den Umschlag stecken, sie werden in diesem Interview nicht mehr gebraucht! Gezogen wurde: / 1 / 2 / 3 / 4 / -------------------------------------------------------------------------------------------------------- <?page no="250"?> Feldexperimentelle Methoden 251 INTERVIEWER überreicht Bildblatt! „Wie gefällt Ihnen das? Sagen Sie es mir bitte nach diesem Blatt hier mit den schwarzen und weißen Kästchen. Es geht so: Das oberste weiße Kästchen würde bedeuten, das gefällt Ihnen ausgesprochen gut, und das unterste schwarze Kästchen würde bedeuten, das gefällt Ihnen ausgesprochen schlecht. Je besser es Ihnen gefällt, ein umso höheres weißes Kästchen können Sie wählen, und je weniger es Ihnen gefällt, ein umso niedrigeres schwarzes nehmen Sie.“ (Genannte Stufe einkreisen! ) / -5 / -4 / -3 / -2 / -1 / 0 / 1 / 2 / 3 / 4 / 5 / KEINE ANGABE ............................................................ 9 (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6079 [geringfügig modifiziert]) Eine besonders interessante der zahlreichen möglichen Varianten dieses Fragemodells ist der Zeitraffertest, der sich unter anderem beim Test von Wahlplakaten bewährt hat. Bei einem gewöhnlichen Anzeigentest wird das Motiv den Befragten nur einmal vorgelegt. In vielen Fällen ist das auch ausreichend, doch diese Situation ist von der Art und Weise, wie tatsächliche Wahlplakate von den Bürgern wahrgenommen werden, weit entfernt. Bei Beginn des Wahlkampfes werden die Plakate zu Tausenden aufgestellt. Für mehrere Wochen sind sie dann im Staßenbild allgegenwärtig. Die Passanten können es gar nicht vermeiden, dasselbe Motiv wieder und wieder zu betrachten. In einer solchen Situation kann sich aber die Wirkung des Plakatmotivs ändern. Ein Bild, das anfangs attraktiv erscheint, kann im Laufe der Zeit langweilig werden, während umgekehrt ein Motiv, das auf den ersten Blick nur mäßig interessant wirkt, nach und nach positiver empfunden werden kann. Im Zeitraffertest wird versucht, die Situation, in der man die zu testende Vorlage wieder und wieder zu Gesicht bekommt, zumindest ansatzweise zu simulieren. In einem längeren Interview werden den Befragten in Teilgruppen verschiedene Plakatmotive insgesamt dreimal präsentiert, einmal ganz am Anfang des Interviews mit einer Frage, wie sie in Fragebeispiel 57 wiedergegeben ist (unabhängig da- <?page no="251"?> Fragestrategien 252 von, ob die Abfrage mit oder ohne Kartenziehverfahren organisiert ist). In der Mitte des Interviews, nach mehreren Fragen zu anderen Themen, wird das Bild noch einmal und am Ende des Interviews noch ein drittes Mal vorgelegt mit Frageformulierungen, die den Unmut der Befragten angesichts der scheinbar sinnlosen Wiederholungen etwas dämpfen („Wenn man ein Bild länger betrachtet, kann sich ja mit der Zeit der Eindruck ändern. Deshalb möchte ich Sie bitten, dieses Foto jetzt noch mal nach diesen schwarzen und weißen Kästchen zu beurteilen ...“ „Wie ist nun am Ende des Interviews Ihr Eindruck von diesem Foto? Könnten Sie es bitte noch ein letztes Mal nach diesen schwarzen und weißen Kästchen einstufen? “). Man könnte meinen, ein solches Vorgehen sei doch etwas plump, doch die Resultate können sehr aufschlussreich sein. Abbildung 35 zeigt das Ergebnis eines solchen Tests von zwei verschiedenen Kandidaten-Wahlplakaten, die im Vorfeld einer Bundestagswahl getestet wurden. Eines der Plakate zeigte den Kandidaten mit ernster Miene, auf dem anderen war er lachend zu sehen. Man erkennt, dass das eine Plakat zunehmend schlechter, das andere tendenziell immer besser beurteilt wurde. Bei der ersten Vorlage schnitten beide Plakate noch ähnlich gut ab. Nach der dritten Vorlage unterschieden sich die Urteile so deutlich, dass eindeutig zu erkennen war, welcher Entwurf für den Wahlkampf besser geeignet sein würde. Als darauf hingewiesen wurde, dass es bei Feldexperimenten ratsam ist, allzu feine und spitzfindige Variationen des experimentellen Stimulus zu vermeiden, war damit nicht gemeint, dass sich die in den Teilgruppen vorgelegten Fragevarianten aufällig voneinander unterscheiden müssten. Oft kann der Austausch eines einzelnen Wortes, einer einzigen Zahl oder eines kleinen Bildelementes starke Reaktionen bei den Befragten auslösen. Der Stimulus muss also nicht groß sein, um zu wirken, er muss nur eine entscheidende Dimension des zu untersuchenden Themas betreffen. Das Grundmuster eines Experiments, bei dem der Austausch eines einzelnen Wortes große Wirkung entfaltet, zeigt ein klassisches Experiment des amerikanischen Psychologen und Marketingforschers Mason Haire aus dem Jahr 1949. Haire legte seinen Versuchspersonen in zwei Experimentalgruppen Einkaufslisten vor, die sich in nur einem Punkt unterschieden: In der einen Gruppe befand sich Nescafé auf der Liste, in der anderen Gruppe stand an der gleichen Stelle stattdessen Bohnenkaffee (Fragebeispiel 58). Die Befragten in <?page no="252"?> Feldexperimentelle Methoden 253 beiden Gruppen wurden aufgefordert, sich die Hausfrau vorzustellen, die die Lebensmittel einkaufte. Abbildung 35 Ergebnis eines Zeitraffertests: Ein Foto gewinnt, eines verliert an Zustimmung - Durchschnittswerte auf einer Skala von +5 bis -5 1,93 2,05 2,06 1,8 1,79 1,51 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 Erste Vorlage Zweite Vorlage Dritte Vorlage Ernstes Porträt Lachendes Porträt (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 2186) Das Beispiel zeigt anschaulich den Vorteil, den die experimentelle Untersuchungsanordnung vor allem dann bietet, wenn sie zusätzlich mit Indikator-Fragen kombiniert wird, hier mit einem projektiven Test: Keiner der Beteiligten (außer dem Versuchsleiter) wusste, dass der Nescafé der eigentliche Gegenstand der Untersuchung war. Bei der Hälfte der Befragten wurde er noch nicht einmal im Fragebogen er- <?page no="253"?> Fragestrategien 254 wähnt. Doch die Befragten reagierten deutlich auf das Signal. In der Gruppe, in der Nescafé auf der Liste stand, wurde die Hausfrau auffallend häufig als bequem und kopflos in der Haushaltsführung beschrieben. In der Vergleichsgruppe kamen diese Beschreibungen dagegen kaum vor (Haire 1950; vgl. auch Lane/ Watson 1975). Fragebeispiel 58 Mason Haires Marktforschungsexperiment 1949 Frage: „Lesen Sie bitte diesen Einkaufszettel. Versuchen Sie, sich in die ganze Situation hineinzudenken, bis Sie sich ziemlich deutlich die Hausfrau vorstellen können, die diese Lebensmittel einkaufte. Dann geben Sie bitte eine kurze Beschreibung dieser Hausfrau, ihrer Wesensart, ihrer Eigenschaften.“ Einkaufszettel Gruppe A 1,5 Pfund Gehacktes 2 Brote 1 Bund Karotten 2 Dosen Rumfords Backpulver 1 Dose Nescafé 2 Dosen Pfirsichkompott 5 Pfund Kartoffeln Einkaufszettel Gruppe B 1,5 Pfund Gehacktes 2 Brote 1 Bund Karotten 2 Dosen Rumfords Backpulver 1 Pfund Bohnenkaffee 2 Dosen Pfirsichkompott 5 Pfund Kartoffeln (Quelle: Haire 1950) Zahlreiche Untersuchungen in der Markt- und Sozialforschung, beispielsweise in der Medienwirkungsforschung, folgen dem gleichen Muster wie Haires Experiment und ermöglichen damit den Nachweis von Wirkungskomponenten verschiedenster Art. So konnte in einer Untersuchung über die Wirkung rhetorischer Mittel in der Medienberichterstattung gezeigt werden, dass die Hinzufügung des Wortes „umstritten“ zu einem sonst sachlich gehaltenen Zeitungsartikel über die Wirtschaftsentwicklung die Bewertung des Artikels durch die Leser stark veränderte. Obwohl das Wort an der Kernaussage des Artikels <?page no="254"?> Feldexperimentelle Methoden 255 nichts änderte und der Meldung lediglich einen negativen Beiklang hinzufügte, sank die Glaubwürdigkeit der präsentierten Aussage signifikant (Petersen 2006, S. 48-49). Und die Forderung, die „Gesellschaft durch Reformen zu verbessern“, erhält deutlich mehr Zuspruch, wenn die Formulierung durch ein einziges Wort ergänzt wird, sodass es heißt, man solle die Gesellschaft durch sinnvolle Reformen verbessern, obwohl die Ergänzung inhaltlich unsinnig ist, denn wer würde schon aus seiner Sicht sinnlosen Reformen das Wort reden (Petersen 2002, S. 241- 243)? Wie Texte lassen sich auch Bilder in potenziell wirksame Einzelbestandteile gleichsam „zerlegen“, sodass diese im Experiment getestet werden können. Beispielsweise wurde in einer Testserie zur Wirkung von Pressefotos festgestellt, wie sehr sich das Urteil über eine abgebildete Person ändert, wenn sie den Blick nach oben oder unten gerichtet hält („Plus-Gesicht“ und „Minus-Gesicht“) (Petersen 2005b), oder ob die Abbildung eines weinenden Kindes in der Berichterstattung über eine Naturkatastrophe beim Leser stärkere Emotionen auslöst, als wenn das Kind im Bild fehlt - übrigens mit dem überraschenden Ergebnis, dass das Bild des Kindes keinen messbaren Effekt auslöste (Petersen 2006). In der Marktforschung findet die Methode Anwendung, wenn es darum geht, unterschwellige, unbewusste Reaktionen auf Bildsignale nachzuweisen. So wird ein in einer Zeichnung dargestellter junger Mann von den Befragten als weit weniger sympathisch beschrieben, wenn er eine Zigarette in der Hand hält, als wenn die Zigarette im Bild fehlt (Petersen 2002, S. 147-150). Abbildung 36 zeigt die Abbildungen zu einem besonders charmanten Experiment, das einmal der Psychologe Erp Ring verwirklichte. Ring schreibt: „In der Umfrage wurde das Waschbecken in der Wohnung eines Mannes abgebildet (...), in einer Halbgruppe mit einer Flasche Mundwasser und in der anderen ohne diese Flasche. Erfragt wurde, was man mit dem Besitzer dieses Waschbeckens assoziiert. Unterschiede in den Ergebnissen auf gleiche Fragen konnten nun auf die zusätzlich in Gruppe B abgebildete Flasche zurückgeführt werden. Man erfuhr dann zum Beispiel, ob einer von beiden als gepflegter angesehen wurde usw. Hans Schneller, dem viele originelle Allensbacher Frageformulierungen zu verdanken sind, dachte sich zu diesem Bild die folgende Abschlussfrage aus: ‚Wenn dieser Mann jetzt ein Telegramm <?page no="255"?> Fragestrategien 256 bekommt, auf dem steht: Fliehe sofort, es ist alles verraten! - Was könnte der verbrochen haben? ’ Die Befragten spielten mit, und in der Gruppe mit Mundwasserflasche wurden dann mehr ‚Kavaliersdelikte’, in der anderen Gruppe mehr ‚Kapitalverbrechen’ assoziiert“ (Ring 1992, S. 152). Eine unterhaltsamere Illustration des Zusammenwirkens von Feldexperiment und Indikatorfrage wird man vermutlich kaum finden können. Abbildung 36 Bildvorlagen zu einem Experiment über das Image von Mundwasser (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 689/ I / Ring 1992, S. 152) Die bisher präsentierten Beispiele mögen ein wenig den Eindruck von Spielereien vermitteln, doch das täuscht. Mit vergleichsweise einfachen Feldexperimenten lassen sich oft Daten erheben, die eine beweiskräftigere Grundlage für weitreichende Entscheidungen sein können als manche umfangreiche nicht experimentelle Untersuchung. So sollte vor einigen Jahren in einer Marktforschungsstudie die Frage beantwortet werden, ob Hersteller von Markenartikeln in der Konsumgüterindustrie <?page no="256"?> Feldexperimentelle Methoden 257 die Position ihrer Produktmarken gegenüber den Handelsmarken der Discounter verbessern können, indem sie diese zu besonders günstigen Preisen anbieten. Direkte Fragen zu den Kaufmotiven der Verbraucher erschienen aus den bereits oben ausführlich dargelegten Gründen nicht vielversprechend. Stattdessen wurde im Interview das Bild eines Supermarktes präsentiert, bei dem Produkte und ein großes Werbeplakat im Schaufenster zu erkennen waren. (Abbildung 37). Abbildung 37 Bildblatt zur Untersuchung der Bedeutung einer Billigstrategie bei Markenartikeln (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8674) Die Gesamtstichprobe der Befragten wurde in vier repräsentative Teilgruppen untergliedert. Die erste Gruppe erhielt das Bildblatt in der <?page no="257"?> Fragestrategien 258 Variante präsentiert, die in Abbildung 37 zu sehen ist: Auf dem Plakat stand: „Hier gibt’s die Markenqualität“, dahinter waren bekannte Produktnamen wie Milka und Coca-Cola zu erkennen. In der zweiten Gruppe wurde das gleiche Bild gezeigt, nur dass auf dem Plakat stand: „Preishammer! Markenqualität zu kleinen Preisen.“ In der dritten Gruppe wurden die Markenartikel im Schaufenster durch Fantasienamen ersetzt, die den Charakter von No-Name-Produkten hatten: Aus „Milka“ wurde „Schokinchen“, aus „Coca-Cola“ „Top Cola“. Das Plakat verkündete: „Hier gibt’s die Qualität.“ Die vierte Befragtengruppe schließlich erhielt eine Variante des Supermarktes mit unbekannten Namen und dem Werbeslogan „Preishammer! Qualität zu kleinen Preisen“ vorgelegt. Die Frage, die zu diesen Bildvorlagen gestellt wurde, lautete in allen vier Gruppen: „Hier ist ein Supermarkt abgebildet. Das ist sicherlich nicht ganz leicht zu sagen, aber wenn Sie einmal nach Ihrem Gefühl gehen: Würden Sie in diesem Supermarkt gerne einkaufen oder nicht so gerne? “ „Dort würde ich gerne einkaufen“, sagten von dem Supermarkt mit den Handelsmarken und dem Plakat mit der Aufschrift „Preishammer“ 36 Prozent der Befragten. In der Gruppe, in der der Verweis auf die Preise fehlte, waren es nur 29 Prozent. Waren dagegen Markenartikel im Schaufenster abgebildet, hatte das Preisargument keinen Effekt: 42 Prozent sagten in der Gruppe, in der auf dem Plakat stand „Hier gibt’s die Markenqualität“, sie würden dort gerne einkaufen. Stand auf dem Schild zusätzlich „Preishammer“, waren es 43 Prozent. Man konnte deutlich sehen, dass der Verweis auf günstige Preise die Anziehungskraft der Marken nicht erhöhte. Mit der Nachfrage „Wenn Sie sich mal eine typische Kundin dieses Supermarkts vorstellen: Wie könnte sie sein, was könnte wohl auf sie zutreffen? “ ließ sich darüber hinaus nachweisen, dass durch eine solche Strategie sogar im Gegenteil die Attraktivität der betreffenden Markennamen vermutlich Schaden nehmen würde. Man kann vielleicht die Schlichtheit der Zeichnung, die als Grundlage für das Experiment verwendet wurde, belächeln, doch deren künstlerische Qualität ist nachrangig. Entscheidend ist, dass mithilfe dieser Vorlage die Reaktion der Befragten auf Markennamen und das Preisargument nicht erfragt werden musste, sondern im Interview herbeigeführt werden konnte. Die Kombination aus projektivem Test und Feldexperiment verhinderte, dass die Befragten ihre Einstellung zu diesem <?page no="258"?> Feldexperimentelle Methoden 259 Thema kognitiv abrufen mussten, was stets auch bedeutet, dass ihre Antworten zumindest potenziell durch Rationalisierungen und Selbsttäuschungen geprägt sind. Man kann annehmen, dass die auf diese Weise experimentell gewonnenen Daten wesentlich wirklichkeitsnäher sind als die, die aus langen Serien direkter Fragen resultieren. Der Möglichkeit, mit experimentellen Untersuchungsanlagen Entscheidungen der Befragten unter - soweit das im Rahmen von Umfragen möglich ist - realistischen Bedingungen herbeizuführen, statt sie erfragen zu müssen, bedient man sich auch beim Preisschwellentest. Oft ist es für die Anbieter von Produkten schwer einzuschätzen, welche Preisgestaltung von den Kunden als angemessen empfunden wird. Erfahrungsgemäß sinkt die Bereitschaft, ein Produkt zu kaufen, nicht kontinuierlich mit steigendem Preis, sondern es gibt psychologische Schwellen, regelrechte „Abbruchkanten“: Unterhalb eines bestimmten Werts ist die Kaufbereitschaft hoch, wird der Wert überschritten, fällt sie in sich zusammen. Die Ermittlung einer solchen Preisschwelle war vor einiger Zeit für den Hersteller eines führenden Markenprodukts aus der Konsumgüterindustrie von großer strategischer Bedeutung. Der betreffende Markt wurde beherrscht von zwei hochpreisigen Produkten, die bei den Verbrauchern ein vergleichbar hohes Ansehen genossen und die auch nahezu gleich teuer waren, das des hier erwähnten Herstellers und das des wichtigsten Wettbewerbers. Hinzu kam eine Vielzahl wesentlich preisgünstigerer Marken und Handelsmarken, die aber allesamt eine geringere Rolle im Markt spielten. Eines Tages änderte der Wettbewerber seine Preisstrategie und begann, sein Produkt zu immer niedrigeren Preisen zu verkaufen. Für den Hersteller des Markenprodukts stellte sich damit die Frage, ein wie großer Preisabstand zwischen dem eigenen Produkt und dem des Wettbewerbers von den Kunden noch akzeptiert werden würde. Die direkte Frage an die Verbraucher, welche Preisunterschiede ihnen angemessen erschienen, hätte kaum zu verlässlichen Ergebnissen geführt, zumal sich der Kunde im Supermarkt ja in der Regel auch keine Gedanken darüber macht, zu welchen verschiedenen Preisen er ein Produkt angeboten bekommen könnte. Stattdessen wurde im Experiment jeder Befragte vor eine Entscheidung gestellt, die der Situation beim Kauf nahe kam: Die Interviewer präsentierten ein Bildblatt, auf dem die beiden betreffenden Konkurrenzprodukte abgebildet waren. <?page no="259"?> Fragestrategien 260 Unter die Abbildungen wurde jeweils ein Preis gedruckt: Das Markenprodukt des Herstellers, der die Untersuchung durchführen ließ, wurde in allen Gruppen übereinstimmend mit dem (realistischen) Preis von 4,99 Euro angeboten, das Produkt des Wettbewerbers aber mit in den Teilgruppen variierenden Preisen: In der ersten Gruppe betrug der Preisabstand 50 Cent, in der zweiten einen Euro und in einer dritten Gruppe 1,50 Euro. Dazu wurde die Frage gestellt: „Wenn Sie sich zwischen diesen beiden Angeboten entscheiden müssten: Welches würden Sie dann wohl nehmen? “ Abbildung 38 zeigt das Ergebnis des Experiments. Man erkennt deutlich die „Abbruchkante“: Eine Preisdifferenz von bis zu einem Euro wurde von den Stammkunden des Markenherstellers akzeptiert. Bei einem Preisunterschied von 1,50 Euro entschied sich dagegen die Mehrheit gegen das gewohnte Produkt und für den preisgünstigeren Wettbewerber. Für den Hersteller bedeutete dies, dass er erst dann, wenn die Preisdifferenz zwischen den beiden Angeboten die Schwelle von einem Euro überschritt, unter Druck geraten würde, als Reaktion auf die aggressive Preispolitik des Wettbewerbers ebenfalls die Preise zu senken. Zum Schluss dieses Kapitels soll noch an einem Beispiel die Beweiskraft illustriert werden, die geschickt angelegte Feldexperimente entwickeln können. Es handelt sich um die Methode des Platzwechseltests. Diese Methode kommt zum Einsatz, wenn im Rahmen einer Repräsentativumfrage festgestellt werden soll, ob zwei sich ähnelnde Gegenstände oder Abbildungen von einem erheblichen Teil der Bevölkerung miteinander verwechselt werden. Eine solche Forschungsfrage lässt sich nicht beantworten, indem man den Befragten die beiden Gegenstände oder Bilder vorführt und dazu die Frage stellt: „Würden Sie das verwechseln? “ Stattdessen führt man die Verwechslung im Interview selbst herbei. Bei einer Untersuchung, die diesem Muster folgte, ging es um die Verwechslungsgefahr zweier Verpackungen für Erdnusskerne, der Verpackung der Firma Ültje, die sich zum Zeitpunkt der Untersuchung bereits seit längerer Zeit auf dem Markt befand, und eine Verpackung der Firma Bali, die erst seit kurzer Zeit angeboten wurde und die die Ültje-Verpackung in ihrem Erscheinungsbild nachzuahmen schien (vgl. Noelle-Neumann/ Schramm 1961, S. 58). In der Untersuchung wurde nun den Befragten der einen Halbgruppe zuerst eine Ültje-Verpackung <?page no="260"?> Feldexperimentelle Methoden 261 vorgelegt mit der Frage: „Hier habe ich eine Packung. Haben Sie schon einmal Erdnusskerne in dieser Verpackung gesehen oder gekauft? “ An späterer Stelle im Fragebogen wurde den Befragten dann eine Packung der Firma Bali vorgeführt und dazu die Frage gestellt: „Hier habe ich noch eine andere Packung mit Erdnusskernen. Kennen Sie diese Packung? Haben Sie schon einmal Erdnusskerne in dieser Packung gesehen oder gekauft? “ Abbildung 38 Ergebnis eines Preisschwellentests Frage: „Wenn Sie sich zwischen diesen beiden Angeboten entscheiden müssten: Welches würden Sie dann wohl nehmen? “ Angebot A: Marktführer zum Preis von 4,99 Euro Angebot B: Wettbewerber mit in Teilgruppen variierenden Preisen - Stammkunden des Marktführers - 61 62 42 27 33 47 4,49 3,99 3,49 Preis des Wettbewerbers Prozent Marktführer Wettbewerber (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 8690) <?page no="261"?> Fragestrategien 262 In der anderen Halbgruppe wurden die gleichen Fragen gestellt, nur dass dort zuerst die Bali-, dann die Ültje-Verpackung präsentiert wurde. Wenn die Befragten bei einem solchen Test beide Packungen klar auseinanderhalten können, identifizieren sie die ihnen bekannte Packung richtig, unabhängig davon, ob sie an erster oder an zweiter Stelle gezeigt wird. Wird dagegen eine Packung häufiger als bekannt eingestuft, wenn sie an erster Stelle vorgeführt wird, dann kann man daraus schließen, dass eine Verwechslungsgefahr besteht, dass ein Teil der Befragten die zuerst gezeigte Verpackung irrtümlich für die ihm bekannte gehalten hat. Abbldung 39 Platzwechseltest zur Überprüfung der Verwechslungsgefahr Fragen: „Hier ist eine Packung. Kennen Sie diese Packung? Haben Sie schon einmal Erdnusskerne in dieser Packung gesehen oder gekauft? “ „Hier habe ich noch eine andere Packung mit Erdnusskernen. Kennen Sie diese Packung? Haben Sie schon einmal Erdnusskerne in dieser Packung gesehen oder gekauft? “ Halbgruppe A: Zuerst wird die Ültje-, dann die Bali-Verpackung gezeigt. Halbgruppe B: Zuerst wird die Bali-, dann die Ültje-Verpackung gezeigt. Es erklärten als bekannt ... ... die Ültje-Verpackung, ... die Bali-Verpackung, wenn sie an erster Stelle stand 48% 36% wenn sie an zweiter Stelle stand 24% 9% (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 1059) Beim Fall der beiden Verpackungen für Erdnusskerne war eben dies der Fall (Abbildung 39). Die Nachahmer-Verpackung der Firma Bali <?page no="262"?> Feldexperimentelle Methoden 263 wurde von 24 Prozent der Befragten als bekannt eingestuft, wenn sie an erster Stelle gezeigt wurde. Wurde sie an zweiter Stelle gezeigt, sank ihr Bekanntheitsgrad auf 9 Prozent. Auffallend ist, dass auch die Ültje- Verpackung von weniger Befragten als bekannt erklärt wurde, wenn sie an zweiter Stelle stand. Dies könnte ein Indiz für das sogenannte „Bella-figura-Syndrom“ sein, den unbewussten Versuch vieler Befragter, sich selbst und dem Interviewer gegenüber einen möglichst guten Eindruck zu machen (vgl. Noelle-Neumann/ Petersen 2005, S. 518-520). Man kann vermuten, dass einige Befragte, nachdem sie irrtümlich gesagt hatten, die Bali-Verpackung sei ihnen bekannt, sich nach Vorlage der Ültje-Packung nicht mehr nachträglich korrigieren wollten. Doch was auch immer der konkrete Grund für dieses Antwortverhalten gewesen sein mag: Entscheidend war, dass die Befragten sich keine Gedanken über die Verwechslungsgefahr machen mussten. Die Fragebogenkonstruktion sorgte dafür, dass sie die Packungen während des Interviews tatsächlich verwechselten. <?page no="264"?> 265 6 Der Fragebogen entsteht 6.1 Fragebogenkonferenz Manche Innovationen entstehen durch Zufall. Als Elisabeth Noelle- Neumann im Jahr 1947 das erste deutsche Umfrageinstitut gründete, hatte sie noch nie eine solche Forschungsinstitution von innen gesehen und folglich auch keine Ahnung davon, wie man üblicherweise ein Umfrageinstitut organisierte. Sie hatte als Studentin in den 1930er- Jahren von George Gallup und seinen Massenbefragungen gehört (Noelle-Neumann 2006, S. 60-64). Ihre Doktorarbeit über die damals neue Methode wurde das erste Buch über die moderne Umfrageforschung überhaupt (Noelle 1940), doch zu einem Besuch bei Gallup in Princeton kam es damals nicht. Nach der Rückkehr nach Deutschland arbeitete sie als Journalistin, unter anderem, bis zu deren Verbot im Jahr 1943, bei der Frankfurter Zeitung. (Noelle-Neumann 2006, S. 106- 117. vgl. auch Gillessen 1986, S. 485). Als sich dann 1947 unverhofft die Gelegenheit ergab, ein eigenes Umfrageinstitut zu gründen, organisierte Elisabeth Noelle-Neumann es nach dem Vorbild der Zeitungsredaktionen, in denen sie gearbeitet hatte, vor allem der „Frankfurter Zeitung“. Deren Herzstück war die Redaktionskonferenz, in der alle Mitarbeiter morgens um einen großen Tisch herum zusammenkamen und die Themen des Tages besprachen (Gillessen 1986, S. 29-34). Und so wurde auch in Allensbach ein gesonderter Raum für eine Fragebogenkonferenz eingerichtet. Auch hier bildete ein großer Tisch den Mittelpunkt des Raumes. Mehrere Mitarbeiter wurden eingestellt - meist drei oder vier -, für die der große Tisch der ständige Arbeitsplatz wurde. Ihre Aufgabe war es, gemeinsam mit der Institutsleitung oder dem zuständigen Projektleiter und gegebenenfalls den Auftraggebern sämtliche Fragebogen des Instituts zu entwickeln. Diese Konstruktion hat sich bis heute gehalten, obwohl man bald feststellte, dass die meisten Umfrageinstitute ganz anders organisiert <?page no="265"?> Der Fragebogen entsteht 266 sind. Hier gibt es meist auf bestimmte Themen spezialisierte Projektteams. Eine gesonderte Fragebogenkonferenz existiert nicht. So blieb die Allensbacher Fragebogenkonferenz eine Besonderheit, die jedoch beibehalten wurde, weil sie sich in der Praxis außerordentlich gut bewährt hatte. Tatsächlich gibt es gute Gründe dafür, Fragebogen für die Sozialforschung von einem professionellen Team erarbeiten zu lassen, unabhängig von der konkreten organisatorischen Struktur der durchführenden Institution. Die wichtigsten sind: 1. Die unvermeidliche Beschränktheit der individuellen Perspektive. Es gibt, wie schon Nietzsche schrieb, „nur ein perspektivisches Sehen, nur ein perspektivisches ‚Erkennen’“ (Nietzsche 1968, S. 383). Jeder Mensch, sei er auch noch so sehr auf Neutralität bedacht, ist zwangsläufig in seiner subjektiven Sicht auf die in einer Umfrage zu untersuchenden Gegenstände gefangen. Diese schlägt sich in den von ihm entwickelten Fragen und Formulierungen nieder. Das kann besonders bei inhaltlich umstrittenen Untersuchungsgegenständen, wie etwa politischen Umfragen, leicht zu unerwünschten Effekten führen. Man entwickelt allein aufgrund der persönlichen Sichtweise ungewollt subtile Suggestivfragen, ohne es zu merken. Eine Formulierung, die in Richtung der eigenen Überzeugung verzerrt ist, wird meist als neutral wahrgenommen, während die Einseitigkeit sofort bemerkt wird, wenn sie der eigenen Meinung zuwiderläuft. Das Instrument Sprache ist, wie die vorherigen Kapitel gezeigt haben, außerordentlich empfindlich. Die Befragten nehmen auch leichte suggestive Tendenzen in der Formulierung sehr deutlich wahr und reagieren darauf. Es ist deswegen gut, wenn die Fragebogenkonferenz aus Personen mit unterschiedlichen Hintergründen und Überzeugungen zusammengesetzt ist. Auch regionale Sprachunterschiede sind nicht zu unterschätzen. In den Jahren nach der Deutschen Einheit wurde in Allensbach, das im äußersten Südwesten Deutschlands liegt, darauf geachtet, dass mindestens ein Mitarbeiter der Fragebogenkonferenz aus den neuen Bundesländern stammte. Die Jahrzehnte der Teilung und die Prägung in unterschiedlichen politischen und gesellschaftlichen Systemen hatten dazu geführt, dass sich die Sprachen der Ost- und Westdeutschen spürbar voneinander entfernt hatten. Formulierungen, die im Westen als ganz normale Alltagssprache empfunden wurden, konnten aus ostdeutscher Sicht deutlich wertende Untertöne enthalten und umgekehrt (vgl. <?page no="266"?> Fragebogenkonferenz 267 Tschurenev 2001). Erst in jüngster Zeit haben sich die weltanschaulichen und atmosphärischen Unterschiede zwischen Ost- und Westdeutschen deutlich abgeschliffen (vgl. Institut für Demoskopie Allensbach 2013) und mit ihnen auch die Gefahren sprachlicher Missverständnisse. 2. Der Brainstorming-Effekt. Nicht nur der Umstand, dass die Mitarbeiter in der Fragebogenkonferenz verschiedene Weltsichten in die Untersuchung einbringen, sondern auch die schlichte Tatsache, dass vier Personen mehr sehen, mehr Ideen haben als ein einzelner Forscher, schlägt sich erfahrungsgemäß in der Qualität des Fragebogens nieder. Die Arbeit am Fragebogen wird meist unterschätzt. Oft wird sie als lästiges Übel wahrgenommen, das zwischen der Forschungsidee und der angestrebten Analyse der Daten steht und das man deswegen möglichst schnell hinter sich bringt. Der niederländische Statistiker Hans Akkerboom hat diese Haltung einmal mit dem Satz zusammengefasst: „Der Fragebogen ist für die meisten offenbar eine Sache für den Samstagnachmittag“ (Noelle-Neumann/ Petersen 2005, S. 9). Nach der Lektüre des vorliegenden Buches ist dem Leser hoffentlich klar geworden, dass diese Haltung ein gefährlicher Irrtum ist. Es lässt sich kaum überzeugend abstrakt beschreiben, wie sehr ein Fragebogen von dem intensiven Austausch profitiert, der sich einstellt, wenn drei, vier, fünf professionell geschulte Personen gemeinsam an ihm arbeiten. Man muss es wahrscheinlich selbst erlebt haben. Am Anfang steht die Abstimmung über die Programmfragen, also die Forschungsfragen, die die geplante Studie beantworten soll. Sie ist meist bereits Bestandteil des Angebots an den Auftraggeber oder des Antrags zur Förderung des Projekts. Dann folgt eine gemeinsame Aufstellung von Fragen, teils direkten Fragen, teils Übersetzungen der Programmfragen, teils bereits bekannten Modellen aus früheren Studien, teils neu entwickelten Entwürfen. Die Arbeit verläuft in einem Wechselspiel: zunächst schweigende Arbeit an Texten, dann Diskussion der verschiedenen Entwürfe. In der Regel gibt es dabei große Unterschiede im Ansatz und in der Anschaulichkeit und Lebendigkeit der Sprache. Man erlebt die Qualitätssteigerung des Fragebogens unmittelbar. Darum arbeiten auch viele Auftraggeber gerne dabei mit. Hierarchien gibt es in der Fragebogenkonferenz nicht. Fast immer steht am Schluss der Beratungen eine allgemeine Übereinstimmung darüber, was die beste Lösung ist. <?page no="267"?> Der Fragebogen entsteht 268 Die Voraussetzung dafür, dass dies funktioniert, ist natürlich eine große Professionalität der Mitarbeiter. Und so müssen die Mitglieder der Fragebogenkonferenz bei allen persönlichen Unterschieden, die die Arbeit erst inspirierend machen, auch einiges gemeinsam haben: Sie brauchen gute sprachliche Fähigkeiten, eine gute Allgemeinbildung und müssen gut über die aktuellen Entwicklungen in Politik, Wirtschaft und Kultur informiert sein. Hinzu kommt die Fähigkeit zu Teamwork, Selbstkritik, Disziplin und Toleranz. Kaum etwas ist für die Fragebogenentwicklung schädlicher als ein Mitglied der Fragebogenkonferenz, das starrsinnig auf der Umsetzung seiner Ideen beharrt, nur weil es sonst das Gefühl hat, von den anderen Mitgliedern benachteiligt zu werden. 3. Die Fachkenntnisse. In diesem Buch sind zahlreiche Fragemodelle vorgestellt worden, ohne dass dabei auch nur annähernd der Anspruch auf Vollständigkeit erhoben wird: Eisbrecherfragen, Filterfragen, Spielfragen, Suggestivfragen, Indikatorfragen, Copytests, Skalen-, Bildblätter-, Listenfragen, Kartenziehverfahren und viele mehr. Es ist bereits schwierig genug, sich einen Überblick über all diese Fragetechniken und Untersuchungsmodelle zu verschaffen. Ungleich schwieriger ist es jedoch, mit diesem Methodenarsenal souverän umzugehen und zu erkennen, welche der zur Verfügung stehenden Methoden im gegebenen Fall die am besten geeignete ist. Diese Souveränität gewinnt man nur, wenn man diese Modelle immer wieder einsetzt und gleichzeitig gezwungen ist, die Entscheidung für eine bestimmte Fragetechnik in der Diskussion mit Fachkollegen zu erläutern. Man muss die Bandbreite der möglichen Fragemodelle auch dann vor Augen haben, wenn man bereits einen Entwurf entwickelt hat, der sich bei näherer Betrachtung als nicht optimal erweist (man darf ohnehin keine Angst davor haben, für den Papierkorb zu arbeiten). Viele Fragebogenentwickler - der Autor dieses Bandes eingeschlossen - neigen dazu, marottenhaft immer wieder und wieder auf dieselben Fragemodelle zurückzugreifen, die sich irgendwann einmal als nützlich erwiesen haben und an die man sich im Laufe der Zeit so sehr gewöhnt, dass man sie schließlich auch dann anwenden will, wenn sie eigentlich nicht sinnvoll sind. Wer seine Fragebogen ganz allein entwickelt, kann aus solchen Gewohnheiten nicht herausgerissen werden. In der Fragebogenkonferenz ist man dagegen gezwungen, seine Modellwahl zu begründen - und man wird recht <?page no="268"?> Fragebogenkonferenz 269 verlässlich auf seine Marotten aufmerksam gemacht, wenn sie sich einzuschleichen drohen. 6.2 Hundert Stolperfallen und der Pretest Bei der Fragebogenentwicklung lauern auf den Forscher zahllose Stolperfallen. Es gibt unzählige Möglichkeiten, bei der Formulierung von Fragen, der Konstruktion des Bogens, bei der Themenwahl oder der Auswahl der Antwortkategorien Fehler zu machen, die im ungünstigsten Fall den Ertrag auch der aufwendigsten Untersuchungen vollständig ruinieren können. Da die Befragten unter Umständen selbst auf kleinste Untertöne in der Frageformulierung oder -reihenfolge äußerst empfindlich reagieren können, ist kein Sozialforscher davor gefeit, solche Fehler zu begehen, sei er auch noch so erfahren. Die vielleicht größte Gefahr für die Forscher liegt dabei im eigenen Hochmut. Die Vorstellung, man beherrsche, nachdem man ein, zwei Dutzend Fragebogen selbst erstellt hat, das Handwerk und müsse sich um Methodenfehler keine großen Sorgen mehr machen, ist meistens eine Illusion. Trotz erheblicher Fortschritte der kognitiven Psychologie vor allem in den 90er- Jahren ist das Wissen um die Reaktionsmuster der Befragten im Interview letztlich noch immer sehr begrenzt. Auch nach 20 Jahren Erfahrung in der Umfrageforschung wird man noch immer und immer wieder vom Verhalten der Interviewten überrascht. Eine ganze Reihe von Fehlerquellen bei der Fragebogenentwicklung wurde in diesem Band bereits angesprochen: Das Setzen falscher Schlüsselbegriffe in der Frageformulierung mit der Folge, dass der Sinn der Frage nicht verstanden wird, Monotonie in Fragebogeninhalt oder Frageform, sodass die Aufmerksamkeit der Befragten schwindet, Reihenfolgeeffekte, etwa bei Listenfragen, bei denen die aufgeführten Punkte eine unterschiedliche Chance haben, ausgewählt zu werden, je nachdem, ob sie sich vorne, in der Mitte oder hinten auf der Liste befinden, oder der sehr häufig auftretende und in Einzelfällen auch stark ausfallende Recency-Effekt bei Dialogfragen, also die Tatsache, dass das an zweiter Stelle präsentierte Argument mit größerer Wahrscheinlichkeit ausgewählt wird als das erste (vgl. Petersen 2002, S. 177-192). Besonders problematisch können Kontext-Effekte sein, bei denen das Ant- <?page no="269"?> Der Fragebogen entsteht 270 wortverhalten der Befragten bei einer Frage vom Inhalt einer vorausgegangenen Frage beeinflusst wird. Dabei unterscheidet man zwischen Assimilations-Effekten und Kontrast-Effekten. Bei Assimilationseffekten gibt die beeinflussende Frage, die „Ausgangsfrage“, die Richtung vor, in der auch die beeinflusste Frage, die „Zielfrage“, beantwortet wird (Begriffe in Anlehnung an Weller 1996, S. 26), während bei Kontrasteffekten die Ausgangsfrage als Gegenpol zur Zielfrage empfunden wird. Als Ursache für das Auftreten von Kontext-Effekten gilt im Allgemeinen das sogenannte Priming. Dabei wird angenommen, dass die Befragten bei der Beantwortung der ihnen gestellten Fragen auf ihr Gedächtnis zurückgreifen, und hier vor allem auf die durch die Ausgangsfrage bereits aktivierten oder frisch aufgenommenen Gedächtnisinhalte, die deswegen besonders leicht zugänglich sind (vgl. Herkner 1991, S. 227). Mit diesem Modell werden sowohl Kontrastals auch Assimilierungs-Effekte erklärt. Ein Beispiel für Assimilierungseffekte enthält eine experimentelle Studie von Norbert Schwarz, Fritz Strack und Hans-Peter Mai (1991), bei der die eine Hälfte der Befragten zuerst gebeten wurde, auf einer elfstufigen Skala anzugeben, wie zufrieden sie mit ihrem Leben seien. In Anschluss daran sollten sie auf derselben Skala einstufen, wie zufrieden sie mit ihrer Ehe seien. In der zweiten Halbgruppe wurden die Fragen in umgekehrter Reihenfolge gestellt. Es zeigte sich, dass Befragte, die unzufrieden mit ihrer Ehe waren, auch häufiger sagten, sie seien auch mit ihrem Leben allgemein unzufrieden, wenn die allgemeinere Frage an zweiter Stelle stand. Norbert Schwarz deutet dies als Hinweis darauf, dass der Gedanke über die eigene Ehe durch die erste Frage aktiviert wurde, damit besonders leicht verfügbar war und dadurch wesentlich die Beantwortung der zweiten Frage mitbestimmte (Schwarz 1996). Eine prinzipiell ähnlich angelegte Untersuchung von Howard Schuman, Stanley Presser und Jacob Ludwig (1981) zeigte dagegen einen Kontrast-Effekt. Hier wurden den Befragten nacheinander die Fragen gestellt, ob es einer schwangeren Frau generell erlaubt sein sollte abzutreiben und ob eine Abtreibung erlaubt sein sollte, wenn sich herausstellt, dass das Kind behindert zur Welt kommen würde. Ähnlich wie bei dem Experiment von Schwarz, Strack und Mai ist der in der zweiten Frage beschriebene Fall also rein logisch eine Unterkategorie der ersten Frage. Doch so scheint sie von einer großen Zahl der Befragten nicht aufgefasst zu werden. Der Anteil der Befragten, die <?page no="270"?> Hundert Stolperfallen und der Pretest 271 sich generell dafür aussprachen, die Abtreibung zu erlauben, war signifikant geringer, wenn der allgemein gehaltenen Frage die spezifischere Frage vorausging, ob eine Abtreibung eines behinderten Kindes erlaubt sein solle. Schuman, Presser und Ludwig erklären diesen Effekt mit einem „Subtraktions-Prozess“. Dabei wird angenommen, dass die Befragten - den Regeln eines Alltagsgesprächs entsprechend - versuchen, Wiederholungen in ihren Aussagen zu vermeiden und dementsprechend auch vom Forscher erwarten, dass er nicht nacheinander zwei Fragen mit inhaltlich gleicher oder sehr ähnlicher Bedeutung stellt (vgl. Schwarz 1996, S. 71). Der „Subtraktions-Effekt“ wird dadurch erklärt, dass die Befragten annehmen, mit der an zweiter Stelle stehenden allgemein gehaltenen Frage solle ihre Meinung zur Abtreibung gemessen werden, abgesehen von dem in der vorangegangenen Frage erwähnten Spezialfall. Die Gefahr von Kontext-Effekten ist der Hauptgrund dafür, dass ein besonders wichtiger Schritt in der Fragebogenentwicklung das „Legen“ des Bogens ist. Ist einmal festgelegt, welche Fragen in einen Fragebogen aufgenommen werden sollen, werden alle diese Fragen ausgedruckt. Die Ausdrucke werden auseinandergeschnitten, sodass viele kleine Papierstreifen entstehen, auf denen jeweils eine Frage steht. Diese Streifen werden nun auf einem großen Tisch unter- und nebeneinandergelegt. Auf diese Weise erkennt man rasch, welche Fragen sich gegenseitig beeinflussen könnten und deswegen auseinandergezogen oder auf Halbgruppen verteilt werden müssen. Immer wieder werden die Streifen umsortiert, bis eine Reihenfolge gefunden ist, die von allen Beteiligten an der Fragebogenkonferenz als akzeptabel empfunden wird. Dieser Arbeitsgang lässt sich übrigens bis heute nicht digitalisieren, denn die Anschaulichkeit der auf dem Tisch ausgebreiteten Papierstreifen ist durch nichts zu ersetzen - zumindest solange noch keine bezahlbaren Tablet-Computer in der Größe von Konferenztischen auf dem Markt sind. Ein in der Praxis gefürchteter, in der wissenschaftlichen Literatur aber bisher nicht beachteter Fehler ist das versehentliche Erstellen einer - wie es am Allensbacher Institut etwas salopp heißt - Staubsauger- Kategorie. Es wurde bereits darauf hingewiesen, dass viele Befragte bei Repräsentativumfragen dazu neigen, Antwortkategorien auszuwählen, die die geringste geistige Anstrengung erfordern. Bietet man im Frage- <?page no="271"?> Der Fragebogen entsteht 272 bogen nun eine Kategorie an, die weitaus weniger Nachdenken erfordert als die anderen Antwortmöglichkeiten und die gleichzeitig inhaltlich so weit gefasst ist, dass sich die meisten Menschen guten Gewissens für sie entscheiden können, zieht diese Kategorie die Antworten an wie ein Stabsauger. Sie kann dabei im Extremfall die Befragten den anderen Antwortmöglichkeiten in einem so großen Maß entziehen, dass das ganze Umfrageergebnis unbrauchbar wird. Geschehen ist dies beispielsweise im Jahr 1999 bei einem Allensbacher Buchhandelstest. Bei dieser Untersuchung, die nach dem oben ausführlich beschriebenen Prinzip des Mystery Shoppings angelegt war, wurden die Interviewer angewiesen, Buchhandlungen in ihrer Nachbarschaft aufzusuchen, nach einem bestimmten Buch zu fragen und nach dem Verlassen des Geschäfts ihre Erfahrungen in einen Fragebogen einzutragen. Die Interviewer waren in diesem Fall also gleichzeitig die Befragten. In den Fragebogen wurden auch einige Fragen aufgenommen, bei denen der Charakter der besuchten Buchhandlung beschrieben werden sollte. Die Zahl der Verkäufer wurde ermittelt, die Zahl der Stockwerke, die Lage im Stadtzentrum oder in der Vorstadt und die Art der Buchhandlung. Bei dieser Gelegenheit sollte auch der atmosphärische Charakter der Buchhandlung erhoben werden, sofern er sich dem Besucher mitteilte, etwa ob es sich um eine konservative, sehr traditionelle oder um eine linke Buchhandlung handelte. Bei der Fragebogenentwicklung bekamen die Mitarbeiter der Fragebogenkonferenz den Eindruck, dass eine solche Einschätzung in den meisten Fällen schwierig sein dürfte und die gewählten Kategorien vermutlich nur vergleichsweise wenigen Buchhandlungen zugeordnet werden konnten. Also fügten sie der Frage, um auch die nicht eindeutig zuzuordnenden Buchhandlungen abdecken zu können, die Kategorie „Diese Buchhandlung macht auf mich eher einen modernen, aufgeschlossenen Eindruck“ hinzu. Das war ein methodischer Fehler, denn „modern und aufgeschlossen“ kann nahezu alles bedeuten - und bedeutet damit letztlich nichts. Vermutlich erleichtert, dass sie sich angesichts dieser Kategorie keine weiteren tieferen Gedanken um den Charakter der Buchhandlung mehr machen mussten, entschieden sich die den Bogen ausfüllenden Interviewer fast geschlossen für diese Antwortmöglichkeit (IfD-Umfrage Nr. 8616). Eine Frage aber, bei der alle Befragten dieselbe Antwort auswählen, ist zur Analyse unbrauchbar, und so musste bei der Auswertung der Untersu- <?page no="272"?> Hundert Stolperfallen und der Pretest 273 chung auf die Einstufung des Charakters der Buchhandlung verzichtet werden. Das große Problem der hier aufgeführten und zahlreicher weiterer Stolperfallen bei der Fragebogenentwicklung ist, dass sie sich theoretisch zwar gut beschreiben lassen, man in der Praxis aber dennoch immer wieder auf sie hereinfällt. Man entwickelt zwar im Laufe der Jahre eine Art Witterung für mögliche Interviewkomplikationen, die von einem Fragebogen ausgehen können, doch erfahrungsgemäß tauchen die größten Schwierigkeiten bei Fragen auf, bei denen man nicht damit gerechnet hat. Hier spielt auch das Problem des Instrumentenzerfalls eine bedeutende Rolle: Fragen, die jahrzehntelang problemlos immer wieder gestellt werden konnten, können plötzlich Unmut oder Unverständnis bei den Befragten auslösen, weil sich im Laufe der Zeit das Sprachverständnis geändert hat oder weil sich die gesellschaftlichen Umstände so sehr gewandelt haben, dass dieselbe Frage eine inhaltlich ganz andere Bedeutung bekommen hat. Auch bei vielfach bewährten Frageformulierungen kann man also nie ganz sicher sein, dass sie bei künftigen Studien problemlos eingesetzt werden können. Das sich wandelnde Sprachgefühl zwingt die Umfrageforschung immer wieder zu einer äußerst schwer zu entscheidenden Güterabwägung. Angesichts der Empfindlichkeit des Messinstruments sollten Trendfragen, also Fragen, die schon früher einmal gestellt worden sind und deswegen einen Zeitvergleich ermöglichen, bei der erneuten Verwendung möglichst unverändert gestellt werden, denn selbst geringe Änderungen in der Formulierung können, wie gesehen, erhebliche Unterschiede im Antwortverhalten zur Folge haben. Weigert man sich aber dogmatisch, jegliche Änderung vorzunehmen, um den Trend nicht zu gefährden, kann das Ergebnis unter Umständen noch stärker verzerrt sein, weil zwar die Formulierung identisch geblieben ist, nicht aber die ihr zugeschriebene Bedeutung, sodass die Befragten zu den verschiedenen Zeitpunkten trotz des unveränderten Wortlauts letztlich auf unterschiedliche Fragen antworten. So ist man immer wieder gezwungen, Formulierungen anzupassen und damit den Bruch in einer Trendlinie in Kauf zu nehmen. In solchen Fällen empfiehlt es sich, die experimentelle Methode zu nutzen: Bekommt man den Eindruck, dass eine seit längerer Zeit verwendete Frage einer sprachlichen Überarbeitung bedarf, stellt man die Frage in einer Halbgruppe in der alten Variante. Die <?page no="273"?> Der Fragebogen entsteht 274 andere Hälfte der Befragten bekommt die neue Formulierung präsentiert. Auf diese Weise schafft man gleichsam eine „geordnete Übergabe“: Der Unterschied im Antwortverhalten zwischen den Halbgruppen dokumentiert den Effekt der Formulierungsänderung, der sich damit bei Langzeitvergleichen über den Formulierungswechsel hinweg berücksichtigen lässt. Dennoch ziehen Änderungen in der Frageformulierung stets Komplikationen in der Analyse nach sich. In vielen Fällen ist es besser, an einer älteren Frage festzuhalten, selbst wenn sie aus heutiger Sicht nicht optimal formuliert ist. Gelegentlich gibt es allerdings auch Fälle, bei denen jeder sprachliche Anpassungsversuch von vornherein hoffnungslos ist. Ein extremes Beispiel für Instrumentenzerfall zeigte sich im Mai 2010 bei der Planung einer Repräsentativumfrage über Auslandseinsätze der Bundeswehr. Im Archiv des Allensbacher Instituts fand sich eine Trendfrage, die sich mit der Lage in Afghanistan beschäftigte. Es handelte sich um eine Dialogfrage, bei der die eine Person auf dem Bildblatt sagte: „Eigentlich ist Afghanistan doch kein Land, das uns direkt nahe steht. Und außerdem haben wir genug eigene Probleme, die wir erst einmal lösen müssen.“ Die Gegenposition lautete: „Das sehe ich anders. Gerade für ein Land wie Afghanistan, wo die Bevölkerung sich nicht selbst helfen kann, sollten wir uns einsetzen.“ Die Frage zu dem Dialog lautete: „Welcher von beiden sagt eher das, was auch Sie denken? “ Man könnte meinen, an der Frage sei nichts auszusetzen, und in der Tat könnte man sie auch heute noch vermutlich problemlos einem repräsentativen Bevölkerungsquerschnitt vorlegen. Das Problem der Frage lag lediglich darin, dass sie zuletzt im Jahr 1981 gestellt worden war (IfD-Umfrage 4004). Damals war Afghanistan aber nicht von der NATO mit Beteiligung der Bundeswehr besetzt, sondern von der Sowjetunion. Der gesamte politische Hintergrund der Frage unterschied sich im Jahr 2010 so fundamental von der Lage dreißig Jahre zuvor, dass ein Trendvergleich unmöglich gewesen wäre. Trotz identischer Formulierung handelte es sich im Jahr 2010 um eine inhaltlich ganz andere Frage als 1981. Die Vielzahl der Fehlerquellen bei der Fragebogenentwicklung macht es notwendig, dass jeder Fragebogen, bevor die eigentliche Feldarbeit beginnt, unter Feldbedingungen getestet wird. Nachdem diese Phase des Forschungsprozesses lange Zeit lang in der Literatur (in weiten Teilen der Praxis ohnehin) stark vernachlässigt worden war, <?page no="274"?> Hundert Stolperfallen und der Pretest 275 richteten einige Forscher seit Mitte der 1990er-Jahre unter dem Eindruck der Erkenntnisse der kognitiven Psychologie ihre Aufmerksamkeit verstärkt auf die Methoden, mit denen sich Fragebogenentwürfe testen lassen. So gründete sich 1997 unter dem maßgeblichen Einfluss von Experten aus den statistischen Ämtern verschiedener europäischer Länder ein informeller internationaler Fachverband, dessen Mitglieder sich unter dem Namen „Questionnaire Evaluation Standards“ (QUEST) regelmäßig über die Methoden des Pretests, wie es in der Fachsprache heißt, austauschen und versuchen, Mindeststandards auf diesem Gebiet zumindest in der amtlichen Statistik durchzusetzen (ursprünglich war als programmatischer Name für die Gruppe „Minimum Standards in Questionnaire Testing“, kurz „MIST“ vorgesehen. Die niederländischen Organisatoren waren ganz erstaunt, dass die deutschen Teilnehmer der Gründungsveranstaltung dringend von der Verwendung der Abkürzung zumindest im deutschsprachigen Raum abrieten). Im Laufe der Jahre sind in diesem Kreis die verschiedensten Testmethoden diskutiert worden: sogenannte kognitive Interviews mit Versuchspersonen, bei denen der Fragebogen Punkt für Punkt durchgegangen und der Befragte aufgefordert wird, bei jeder Frage alles auszusprechen, was ihm durch den Kopf geht (man spricht auch von der „Think-Aloud-Technik“, vgl. Sudman/ Bradburn/ Schwarz 1996, vgl. auch Willis 2004), Begutachtung durch externe Fachleute, das Auflisten von Fragemerkmalen, die auf mögliche Probleme hinweisen können (vgl. hierzu auch Oksenberg/ Cannell/ Kalton 1991), experimentelle Verfahren (Tourangeau 2004), die Anwendung statistischer Rechenmodelle (Biemer 2004, Reeve/ Mâsse 2004, Saris/ van der Veld/ Gallhofer 2004). Alle diese Verfahren mögen nützlich sein, wenn man, wie dies bei statistischen Ämtern meist der Fall ist, mehrere Monate Zeit hat, einen Fragebogen zu entwickeln, und damit auch die Möglichkeit, langwierige, sich über Wochen hinziehende Prozeduren zu planen und zu verwirklichen. In der akademischen Sozialforschung und mehr noch in der privatwirtschaftlichen Umfrageforschung sind diese Bedingungen aber nicht gegeben. Hier entsteht der Fragebogen binnen weniger Tage, im günstigsten Fall in ein paar Wochen. Da bleibt keine Zeit für lange Testreihen mit „Think-Aloud“-Interviews. Vor allem aber können alle diese Verfahren nicht das simple Probeinterview ersetzen, für das auch unter großem Zeitdruck immer Raum <?page no="275"?> Der Fragebogen entsteht 276 bleiben sollte. Der amerikanische Statistiker Gordon Willis stellte mit experimentellen Untersuchungen in den 90er-Jahren fest, dass sich mit dieser seit den Anfangstagen der Umfrageforschung angewendeten Standardmethode mehr potenzielle Fehlerquellen in der Fragebogengestaltung identifizieren ließen als mit aufwendigen „kognitiven Interviews“ (Willis 1997). Allerdings müssen dabei einige einfache Regeln beachtet werden: Erstens muss das Interview so realitätsnah wie möglich ausfallen. Die Probeinterviewer sollten sich also möglichst wie die Interviewer im Feld Gesprächspartner suchen, die ihnen persönlich nicht oder nur oberflächlich bekannt sind. Mit einer vorläufigen Version des Fragebogens führen sie dann das Interview so, als handele es sich bereits um die Feldphase, jedoch mit einer wesentlichen Abweichung: Wann immer der Befragte nicht so reagiert wie erwartet, wenn er etwa stutzt, eine Frage nicht oder offensichtlich falsch versteht, wenn er nachfragt, lacht oder sich ärgert, wenn er eine Antwort geben will, die im Bogen nicht vorgesehen ist oder gar die Antwort verweigert, trägt dies der Probeinterviewer sofort in den Bogen ein, damit der betreffende Punkt anschließend genauer betrachtet und gegebenenfalls überarbeitet werden kann. Deswegen ist es auch nötig, und dies ist die zweite wichtige Regel, dass auch die Projektleiter selbst Probeinterviews durchführen. Während der eigentlichen Feldarbeit ist es oft eher hinderlich, wenn die Interviewer über den Zweck einer Untersuchung und der Fragen Bescheid wissen. Beim Pretest ist es dagegen notwendig. In manchen Fällen kann nur der Forscher selbst erkennen, wenn eine Frage falsch verstanden wird, denn nur er weiß, was er mit ihr bezweckt hat. Bei größeren Repräsentativbefragungen sollten nach Möglichkeit auf diese Weise von den Mitarbeitern des Projektteams und anderen beteiligten Personen mindestens 15 bis 20 Probeinterviews durchgeführt werden. Möglichst unmittelbar danach folgt die Korrekturkonferenz. Erst beim gemeinsamen Betrachten der ausgefüllten und mit Kommentaren versehenen Fragebogen zeigt sich, an welchen Punkten Schwachstellen vorliegen. Manch eine Reaktion, die bei einem einzelnen Probeinterview auf ein Problem hinzuweisen schien, entpuppt sich dabei als Einzelfall. Oft jedoch sind es immer wieder die gleichen Fragen oder Antwortkategorien, bei denen die Befragten nachfragen, unwillig oder verwirrt reagieren und die deswegen überarbeitet werden müssen. <?page no="276"?> Hundert Stolperfallen und der Pretest 277 Erfahrungsgemäß bleibt kein Fragebogenentwurf nach dem Pretest gänzlich unverändert. Die Notwendigkeit von Pretests lässt sich gut am Beispiel einer Untersuchung illustrieren, bei der die Probeinterviews das Institut für Demoskopie Allensbach vor einem potenziell sehr folgenreichen Fragebogenfehler bewahrt haben. Es handelte sich um eine Studie aus dem Bereich der Umfrageforschung für die Rechtspraxis. In bestimmten Bereichen der Rechtsprechung, bei denen es nicht um Wertungen, sondern um die Feststellung von Kenntnissen oder tatsächlichen Verhaltensweisen der Bevölkerung geht, spielen Umfragegutachten eine zentrale Rolle, allem voran im gewerblichen Rechtsschutz. Hier wird mit Repräsentativumfragen beispielsweise festgestellt, ob ein Markenname im Konsumgüterbereich bei der Bevölkerung so bekannt ist, dass man von einer - im einschlägigen Recht eindeutig definiert - „berühmten Marke“ sprechen kann, ob die Verpackungsgestaltungen zweier konkurrierender Produkte miteinander verwechselt werden oder ob eine bestimmte Farbe oder Farbkombination von den Verbrauchern einem bestimmten Produkt oder einer bestimmten Firma zugeordnet wird, sodass der Firma das exklusive Recht zugesprochen werden kann, die Farben in der Produktgestaltung oder Werbung zu verwenden (vgl. Noelle-Neumann/ Schramm 1961, Zeisel/ Kaye 1997). Im vorliegenden Fall bestand die Untersuchungsaufgabe darin festzustellen, ob eine bestimmte Farbkombination bei Traktoren - grüner Lack des Fahrzeugs, gelb lackierte Felgen - als exklusives Merkmal eines bestimmten Herstellers gelten konnte. Also mussten die im Juristendeutsch sogenannten „beteiligten Verkehrskreise“ befragt werden, mit anderen Worten: Menschen, die Traktoren fahren. Von ihnen galt es zu erfahren, ob sie die Herstellermarke eines Traktors an der grüngelben Farbkombination erkannten. Das Erkennen sollte, wie dies im Alltag auch der Fall ist, gegebenenfalls spontan erfolgen, nicht als Ergebnis längeren Nachdenkens, sodass direkte Fragen nach der Bedeutung bestimmter Lackfarben ausschieden. Stattdessen wurde ein neutralisiertes Bildblatt angefertigt, eine sehr grobe, aber realistische Zeichnung eines Traktors. Sie ist in Abbildung 40 wiedergegeben. In der Originalvorlage war der Traktor natürlich in den strittigen Fragen grün und gelb dargestellt. Zu diesem Bildblatt sollte dann, ganz nach dem Prinzip des projektiven Tests, die Frage gestellt werden, ob die Befrag- <?page no="277"?> Der Fragebogen entsteht 278 ten anhand dieser Zeichnung erkennen könnten, von welchem Hersteller der abgebildete Traktor stammte. Abbildung 40 Bildblatt zur Wiedererkennung von Traktoren - erster Entwurf (Quelle: Allensbacher Archiv) Mit diesem Fragebogenentwurf wurde nun der Pretest für die geplante Untersuchung durchgeführt. Eines der Interviews fand mit dem Friedhofsgärtner einer süddeutschen Universitätsstadt statt, der zur Pflege seiner Gartenanlagen einen Rasenmäher-Traktor benutzte. Das Interview gestaltete sich etwas zäh. Der Befragte hatte dem Gespräch nur widerwillig zugestimmt und beantwortete die Fragen sichtlich lustlos. Dann kam die Frage mit dem neutralisierten Bildblatt an die Reihe, und der Befragte lebte regelrecht auf. Offensichtlich dankbar, dass sein Fachwissen gefragt war, erläuterte er dem Probeinterviewer lebhaft, <?page no="278"?> Hundert Stolperfallen und der Pretest 279 dass es ganz leicht sei, die Marke des abgebildeten Traktors zu identifizieren, denn die auf dem Bild dargestellte abgeknickte Motorhaube sei absolut unverwechselbar. Diese Reaktion stellte das Institut vor erhebliche Probleme, denn sie zeigte, dass die Frage in der geplanten Form keine validen, also im Sinne des Untersuchungsziels gültigen und damit brauchbaren Ergebnisse hervorbringen würde. Es sollte geprüft werden, ob die Befragten die Traktorenmarke an der Farbe erkannten, der Friedhofsgärtner erkannte sie aber (übrigens korrekt) anhand eines anderen Merkmals, nämlich der Form. Es bestand also die Gefahr, dass die Umfrage mit diesem Bildblatt zu falschen, viel zu hohen Wiedererkennungswerten führen würde, mit potenziell erheblichen Auswirkungen auf den Gerichtsprozess, der der Anlass zur Untersuchung war. Ohne den Pretest wäre der Fragebogenfehler nie bemerkt worden, auch nachträglich nicht, denn das Interview verlief ja reibungslos. Und er wäre auch dann nicht bemerkt worden, wenn das Probeinterview nicht von einem Forscher durchgeführt worden wäre, der den Zweck der Frage kannte und damit auch erkannte, dass der Befragte auf das falsche Signal reagierte. Einem Interviewer ohne solche Detailkenntnisse wäre das Verhalten des Befragten nicht aufgefallen. Eine nicht ganz anspruchslose Frage war nun, wie sich der Fragebogenfehler beheben ließ. Eine Änderung der Zeichnung kam nicht infrage. Da der Befragte die Traktorenmarke an der Form der Motorhaube erkannte, konnte man diese nicht einfach umzeichnen, denn auch die Abwesenheit des charakteristischen Merkmals hätte bei den Befragten zu Schlussfolgerungen führen können, zumal nicht auszuschließen war, dass der Traktor auch an der Farbe hätte erkannt werden können, wenn nicht die Aufmerksamkeit auf das auffällige Merkmal der äußeren Form gelenkt worden wäre. Dieselbe Zeichnung mit veränderter Motorhaube hätte zu Überlegungen führen können wie: „Nach der Farbe könnte es Marke X sein. Aber bei der Motorhaube - unmöglich.“ Es gab also zwei mögliche Erkennungsmerkmale, die voneinander getrennt werden mussten, denn nur eines davon, die Farbe, war von Interesse. Das war nur möglich, indem man das Merkmal, das das Untersuchungsergebnis zu verzerren drohte, unsichtbar machte, ohne dass dadurch die Anschaulichkeit der Darstellung auf dem Bildblatt und damit die Spontaneität der Reaktion litt. <?page no="279"?> Der Fragebogen entsteht 280 Die Lösung war schließlich ganz einfach, doch es dauerte bemerkenswert lange, bis die Fragebogenkonferenz sie fand: Der Traktor wurde mit Zeichnungen von Bäumen umgeben, das Fahrzeug praktisch in eine Parklandschaft eingebettet, wobei ein großer Baum wie zufällig das verräterische Element der Karosserie verdeckte (Abbildung 41). Abbildung 41 Bildblatt zur Wiedererkennung von Traktoren - zweiter Entwurf (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 1789) Das Beispiel zeigt deutlich, warum auch dann, wenn man unter Zeitdruck steht und sich seiner Sache eigentlich sicher ist, auf Pretests nicht verzichten darf: Der Fragebogenfehler lauert dort, wo man ihn nicht erwartet, und er kann - unter Umständen von allen Beteiligten unbemerkt - die ganze Untersuchung ruinieren. Es gehört etwas Selbstdisziplin dazu, auf diesem Untersuchungsschritt zu bestehen, <?page no="280"?> Hundert Stolperfallen und der Pretest 281 denn es ist verlockend, ihn auszulassen. Man spart damit Zeit und Geld, und nur selten wird bemerkt, was dabei verloren geht. Ende der 90er-Jahre fand beim Statistischen Bundesamt in Wiesbaden eine Tagung zum Thema Pretest statt, bei der Vertreter praktisch aller namhaften Umfrageinstitute Deutschlands anwesend waren. Peter Mohler, damals Leiter des „Zentrums für Umfragen, Methoden und Analysen“ (ZUMA) in Mannheim, leitete die Diskussion und fragte in die Runde, welcher der anwesenden Forscher regelmäßig Pretests durchführe. Von den ungefähr 50 Teilnehmern meldeten sich daraufhin zwei. Einem leitenden Mitarbeiter eines großen und angesehenen Instituts war dies anscheinend ein wenig unangenehm, also meldete er sich zu Wort und erklärte: „Wir bieten unseren Auftraggebern auch immer Pretests an - die werden dann aber natürlich extra berechnet.“ Dieses Verhalten ist ungefähr mit dem eines Autoherstellers vergleichbar, der seine Fahrzeuge serienmäßig ohne Rückspiegel ausliefert und diese stattdessen als aufpreispflichtige Sonderausstattung anbietet - nur dass man einem Auto auf den ersten Blick ansieht, wenn der Rückspiegel fehlt, während eine Umfrage ohne Pretest als solche in aller Regel nicht erkennbar ist. 6.3 Aspekte der formalen Fragebogengestaltung Zum Schluss dieses Bandes sollen noch einige Worte zur formalen Gestaltung von Fragebogen verloren werden, ohne dass dabei allzu sehr ins Detail gegangen wird. Wer auf diesem Gebiet praktische Anregungen sucht, dem sei das - auch sonst lesenswerte - Fragebogenbuch des Mannheimer Sozialforschers Rolf Porst empfohlen, in dem, mit einem deutlichen Schwerpunkt auf der schriftlichen Befragung, zahlreiche positive und negative Beispiele im Bild wiedergegeben und mit Kommentaren versehen sind (Porst 2008). Die erste und wichtigste Regel für die Gestaltung eines Fragebogens ist die gleiche, die auch für die Fragen selbst gilt: Er muss so einfach und damit so übersichtlich wie irgend möglich gehalten werden. Alle technischen Informationen, die für die Auswertung nicht unbedingt nötig sind, alle gestalterischen Elemente, die nicht der Übersichtlichkeit dienen, sind zu vermeiden. Wenn die Klarheit der Darstellung und die Lesbarkeit des Bogens mit ästhetischen Bedürfnissen im Konflikt ste- <?page no="281"?> Der Fragebogen entsteht 282 hen, müssen die Klarheit und Lesbarkeit Vorrang haben. Zur Umsetzung dieser nur scheinbar simplen Regel gehört beispielsweise, dass man keine übermäßig stark gestalteten Schrifttypen verwendet, außerdem keine zu kleine Schrift: bei serifenlosen Schriften wie Arial oder Helvetica nicht kleiner als 10 Punkte, bei Serifenschriften wie Times oder Garamond nicht kleiner als 12 Punkte, wobei die serifenlosen Schriften meist vorzuziehen sind, weil sie leichter zu lesen sind. Im Druck oder in der Farbgestaltung des Bildschirms bei Online- Umfragen sind eindeutige Kontraste anzustreben, Grautöne zu vermeiden. Auch mit dem Einsatz von Farben für den Bildschirmhintergrund ist vorsichtig umzugehen. Zwar gibt es Hinweise darauf, dass Startseiten von Internet-Umfragen mit einem weißen Bildschirmhintergrund etwas seltener von den Nutzern angeklickt werden als Umfragen, bei denen die Grundfarbe des Bildschirms grün, blau oder rot ist, doch die Unterschiede sind gering (Hammen 2010, S. 163). Ein farbiger Bildhintergrund mag eleganter und profesioneller wirken als ein weißer, und so mag eine dezente Hintergrundfärbung von Vorteil sein, doch auch hier gilt: Im Zweifel muss die Lesbarkeit Vorrang haben, sonst erkauft man die etwas größere Ausschöpfungsquote mit einer geringeren Antwortqualität. Nützlich ist es bei Online-Umfragen, wenn man einen Fortschrittsbalken in den Bildschirm integriert, der dem Nutzer jederzeit zeigt, einen wie großen Teil der Umfrage er bereits hinter sich gebracht hat. Experimentelle Studien weisen darauf hin, dass dieses Mittel dazu beiträgt, die Motivation der Befragten, den Fragebogen zu Ende auszufüllen, zu steigern, allerdings ist auch hier der Effekt letztlich gering (Couper/ Traugott/ Lamias 2001, S. 243-251). Gar nicht immer leicht ist es, dem Betrachter des Fragebogens, also je nach Interviewmodus dem Interviewer oder dem Befragten selbst, eindeutig zu signalisieren, wo eine Frage beginnt und wo sie aufhört. Bei gedruckten Fragebogen hat es sich in der Praxis bewährt, die Fragen optisch durch simple Striche zu trennen. Bei Online-Umfragen sollte der Umfang der Frage die Größe des Bildschirms nicht überschreiten. Fragebatterien, bei denen der Befragte den Bildschirm herunterscrollen muss, um sie vollständig zu sehen, sind unbedingt zu vermeiden. Eine besondere Bedeutung kommt der ersten Seite des Fragebogens zu. Rolf Porst weist mit Recht darauf hin, dass ein Fragebogen immer eine Titelseite hat (wenn man einmal von Telefonumfragen absieht), <?page no="282"?> Aspekte der formalen Fragebogengestaltung 283 auch dann, wenn sie gar nicht als solche geplant war (Porst 2008, S. 31). Vom äußeren Erscheinungsbild des Fragebogens hängt ab, ob sich die Zielperson entschließt, am Interview teilzunehmen oder nicht. Das gilt nicht nur für schriftliche und Online-Interviews, sondern auch für persönliche Befragungen, denn obwohl die Interviewer zur Vermeidung von Fragebogeneffekten den Befragten den Bogen eigentlich nicht zeigen sollten, lässt sich dies in der Praxis kaum vermeiden. Nicht selten wird die Zusage, sich für das Interview zur Verfügung zu stellen, davon abhängig gemacht, dass man einen Blick auf den Bogen werfen kann. Der Interviewer hat dann alle Hände voll zu tun, dafür zu sorgen, dass der Befragte nur die erste Seite betrachtet und ihm nicht gleich den ganzen Bogen aus der Hand reißt und darin herumblättert. Die Hauptfunktion der Titelseite besteht damit darin, das Vertrauen des Befragten zu wecken bzw. zu bestärken und damit die Hemmschwelle zu senken, sich an dem Interview zu beteiligen. Dazu bedarf es keines gesonderten Deckblatts, auch wenn dies bei schriftlichen Befragungen nicht unüblich ist (vgl. die Beispiele bei Porst 2008, S. 37- 44). Bei Online-Umfragen ist ein gesonderter Startbildschirm sogar die Regel. Fragebogen für schriftliche oder persönliche Umfragen können durchaus auch auf der ersten Seite schon die ersten Fragen aufführen. Es darf sich allerdings nicht um komplizierte oder gar heikle Fragen handeln, die den Befragten abschrecken könnten. Sie gehören, wie oben beschrieben, an das Ende des Interviews. In jedem Fall sollte dem eigentlichen Fragebogen aber eine kleine schriftliche Einleitung vorangestellt werden, die die wichtigsten Instruktionen zum Ausfüllen des Bogens enthält bzw. die Regeln zur Beantwortung der Fragen erläutert. Darüber hinaus ist es sinnvoll, kurze Hinweise auf den Charakter der Untersuchung hinzuzufügen, die dazu geeignet sind, etwaige Befürchtungen der Befragten, sie könnten durch die Teilnahme an der Befragung Nachteile erleiden oder sie seien zur Beantwortung der Fragen nicht kompetent genug, zu zerstreuen. Das gilt auch für Telefoninterviews, wo die betreffenden Texte gleich nach der Kontaktaufnahme vorgelesen werden. Diese einleitenden Texte sollten nicht lang sein. Zwei, drei Sätze genügen, denn mehr kann ohnehin nicht in den wenigen Sekunden überblickt werden, die über Teilnahme oder Interviewverweigerung entscheiden. Ein Einleitungstext <?page no="283"?> Der Fragebogen entsteht 284 für eine schriftliche oder Online-Umfrage kann dabei beispielsweise wie folgt lauten: Liebe Teilnehmerinnen und Teilnehmer der Untersuchung, herzlichen Dank für Ihre Bereitschaft, an dieser Umfrage teilzunehmen. Wir möchten Sie bitten, kurz diesen Fragebogen auszufüllen. Insgesamt wird Ihre Teilnahme an der Untersuchung nicht länger als 10 Minuten dauern. Es geht dabei nicht um Wissensfragen, sondern wir sind an Ihrer Meinung interessiert. (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 6273 [geringfügig modifiziert]) Wenn der Fragebogen nicht intuitiv richtig ausgefüllt werden kann, was eigentlich nicht vorkommen sollte, aber bei komplizierteren Prozeduren wie etwa semantischen Differentialen nicht immer ganz vermieden werden kann, können noch ein paar kurze Hinweise zum Ausfüllen des Bogens hinzugefügt werden. Dann folgen bei einer schriftlichen Umfrage unmittelbar darunter auf der Seite die ersten Fragen, bei einer Online-Umfrage würde unter den Text der Einleitung der Button gesetzt, der zur Seite mit der ersten Frage weiterleitet. Bei persönlichen Befragungen lässt sich der Text so formulieren, dass er formal an den Interviewer gerichtet ist. Es wird dabei einkalkuliert, dass der Befragte vor Beginn des Interviews zumindest einen Seitenblick auf den Bogen wirft. Darum enthält die Einleitung auch in erster Linie Informationen, die der Beruhigung des Befragten dienen. Die Gestaltung als Interviewer-Instruktion ist hauptsächlich ein Vorwand, um die Information unterzubringen. Die im Rahmen von Methodenseminaren am Institut für Publizistik der Universität Mainz durchgeführten persönlichen Befragungen beginnen beispielsweise mit dem folgenden Text: INTERVIEWER: Alle Fragen wörtlich vorlesen. Bitte die Zahlen neben den zutreffenden Antworten einkreisen. Alle Ergebnisse der Umfrage dienen dazu, die Meinung der Bewohner der Stadt Mainz zu erforschen. Andere Ziele, insbesondere geschäftlicher Art, werden mit der Umfrage nicht verfolgt. (Quelle: Universität Mainz, Institut für Publizistik, Umfrage Wintersemester 2010/ 2011) <?page no="284"?> Aspekte der formalen Fragebogengestaltung 285 Bei großen mündlich-persönlichen Umfragen, die mithilfe von Interviewern durchgeführt werden, die der Forschungsleiter nicht persönlich instruieren kann, kommt noch ein wichtiges weiteres Element zum Fragebogen hinzu: Das Anschreiben an die Interviewer. Diese werden bei professionellen Umfrageinstituten zwar bereits bei der Rekrutierung mithilfe von Probeinterviews sorgfältig daraufhin geprüft, ob sie in der Lage sind, die Fragebogen korrekt auszufüllen, und sie werden, wenn sie einmal ins Interviewernetz aufgenommen wurden, auch intensiv mit schriftlichem Informationsmaterial geschult (Noelle-Neumann/ Petersen 2005, S. 331-358). Dennoch ist es meist sinnvoll, oft sogar notwendig, die an der Feldarbeit Beteiligten mit einem kurzen Brief auf die Passagen im Fragebogen hinzuweisen, die besondere Aufmerksamkeit verlangen. Der folgende Text gibt ein solches Schreiben wieder, das vom Institut für Demoskopie Allensbach im Juni 2013 zusammen mit den Fragebogen an die an einer Bevölkerungsumfrage beteiligten Interviewer veschickt wurde: Liebe Mitarbeiterinnen und Mitarbeiter bei der Hauptbefragung 11010, hoffentlich haben Sie alle die Wetterextreme der letzten Wochen gut überstanden und fühlen sich bereit für die nächste Hauptbefragung. Unter anderem geht es um Gesundheitsthemen. Ein weiterer Schwerpunkt ist diesmal das Thema Europa (...). Außerdem gibt es Fragen zum Fahrradfahren und zum Thema Zeitungen und Zeitschriften. Nicht zuletzt finden Sie in dieser Umfrage aus aktuellem Anlass natürlich auch Fragen zur kommenden Bundestagswahl im September. Wir hoffen, dass wir für Sie und Ihre Befragten eine interessante Themenmischung gefunden haben, und wünschen Ihnen viel Erfolg bei der Umfrage. Nun wie immer einige Hinweise zum Fragebogen selbst: Um besondere Achtsamkeit bitten wir bei den Fragen 11 und 13: Bei Frage 11 überreichen Sie Ihren Befragten bite zunächst das gesamte weiße Kartenspiel und lassen es auf Bildblatt 3 verteilen. Welche Karte auf welches Feld gelegt wurde, tragen Sie dann bitte in der mittleren Spalte des Kastens bei Frage 12 ein. <?page no="285"?> Der Fragebogen entsteht 286 Nun legen Sie alle Karten, die auf dem untersten Feld („GANZ UNBE- KANNT“) lagen, beiseite und überreichen nacheinander die übrigen Karten. Dazu stellen Sie jeweils die Frage in der rechten Spalte des Kastens und tragen die Antworten auf den gepunkteten Linien ein. Falls Karte 2 bei Frage 11 auf einem der oberen beiden Felder lag, überreichen Sie diese bitte bei Frage 13* erneut und stellen die dazugehörige Frage. (Quelle: Allensbacher Archiv, IfD-Umfrage Nr. 11010 [geringfügig gekürzt und modifiziert]) Es folgten in dem Anschreiben noch einige wenige Hinweise zu anderen Fragen und praktische Instruktionen über Rücksendetermine und Honorare. Die Ausführungen zu den Fragen 11 und 13 in dem Anschreiben erscheinen auf den ersten Blick überflüssig, denn selbstverständlich enthält der Fragebogen noch einmal alle nötigen Instruktionen an der Stelle, an der sie gebraucht werden. Doch der Brief weist die Interviewer darauf hin, dass der Fragebogen eine vergleichsweise komplizierte „Kasten“-Ermittlung enthält, die man sich besser etwas genauer angesehen haben sollte, bevor man mit dem Interview beginnt und dann womöglich an der betreffenden Stelle ins Stocken gerät, weil man sich erst einmal mit den Details der Prozedur vertraut machen muss. Darüber hinaus bieten die Hinweise auf das Themenspektrum am Anfang des Briefes den Interviewern die Möglichkeit, die oft gestellte Frage „Worum geht es denn bei der Umfrage? “ zu beantworten, ohne dass sie den Fragebogen Punkt für Punkt im Vorfeld durchschauen müssen. Neben den Fragen und Antwortmöglichkeiten muss der Fragebogen selbstverständlich auch die Codeziffern enthalten, die schließlich in den Computer eingegeben werden müssen und mit deren Hilfe sich die Antworten erst zählen lassen, wenn die Eingabe nicht, wie bei computergestützten Telefoninterviews, direkt in den Computer erfolgt. Das gilt auch für schriftliche Umfragen, bei denen die Befragten eigentlich nur Kästchen ankreuzen müssen. Denn wenn die Auswertung der Fragebogen nicht vollautomatisch mithilfe von Scannern stattfindet, was meist wegen des Programmieraufwandes aufwendiger ist als die Eingabe per Hand, ist es ein umständlicher und fehleranfälliger Arbeitsschritt, die Codes nachträglich mithilfe einer Schablone oder einer Liste zuzuord- <?page no="286"?> Aspekte der formalen Fragebogengestaltung 287 nen. Es hat sich in der Praxis als unproblematisch erwiesen, die Codes direkt neben die Kästchen zum Selbstausfüllen zu drucken. Darüber hinaus sollte der Fragebogen zwei weitere kleine technische Informationen enthalten, die leicht vergessen werden. Zum einen sollte jeder Bogen eine individuelle Nummer zugeordnet bekommen, die bei der Auswertung mitverschlüsselt wird. Die Nummerierung kann bei kleineren Untersuchungen auch nachträglich erfolgen, beispielsweise indem man die Nummern einfach per Hand auf die Bogen schreibt. Entscheidend ist nur, dass jeder Bogen identifiziert werden kann. Normalerweise wird man die Nummern gleich zu Beginn oben auf dem Fragebogen eintragen. Die Nummerierung der Fragebogen erleichtert es nicht nur, die Feldarbeit unter Kontrolle zu halten, sondern sie kann unter Umständen auch nachträglich zusätzliche Analysen ermöglichen, an die bei der Planung der Untersuchung nicht gedacht wurde: Im Sommer 2013 wurde das Institut für Demoskopie Allensbach beauftragt, eine kleine schriftliche Umfrage unter Schülern an sieben verschiedenen Gymnasien in Süddeutschland durchzuführen. Ursprünglich war nur eine gemeinsame Auswertung aller Fragebogen beabsichtigt, sodass die Information, an welcher der sieben Schulen ein Interview stattfand, im Fragebogen nicht miterhoben wurde. Während die Interviews bereits stattfanden, bat der Auftraggeber darum, nun doch eine Auswertung getrennt nach den beteiligten Schulen vorzunehmen. Da sich rekonstruieren ließ, welche Fragebogennummern welchen Schulen zugeteilt worden waren, ließ sich die Auswertung verwirklichen, obwohl die betreffende Frage im Bogen fehlte. Das zweite technische Detail, das im Fragebogen von vornherein mit berücksichtigt werden sollte, ist die Information, ob es sich bei einer Frage um eine Trendfrage handelt, also um die Wiederholung einer Frage, die schon früher einmal gestellt worden ist. Am Institut für Demoskopie Allensbach geschieht dies einfach dadurch, dass Trendfragen am linken Rand, neben der Fragennummer, mit dem Buchstaben „T“ gekennzeichnet werden. Fragen, die mit früheren Formulierungen zwar nicht identisch sind, aber inhaltlich gleichbedeutend oder sprachlich nur geringfügig verändert, sodass auch sie einen Zeitvergleich ermöglichen, erhalten ein klein geschriebens „t“. Diese Informationen sind für die Archivierung der Daten und damit für die Trendpflege von großer Bedeutung. Umfragedaten gewinnen enorm an Aussagekraft, wenn sie <?page no="287"?> Der Fragebogen entsteht 288 sich auf Trendfragen stützen können. Deswegen ist jedem, der häufiger Befragungen durchführt, dringend zu raten, von Anfang an eine Datenbank einzurichten, mit deren Hilfe man bereits früher gestellte Fragen wiederfinden kann, samt der Information, wann bzw. im Rahmen welcher Untersuchung sie gestellt wurden (deswegen empfiehlt es sich übrigens, auch den jeweiligen Umfragen eine eigene Nummer zu geben, die ebenfalls in die Datenbank eingetragen wird). Verzichtet man auf diesen Schritt der Archivierung, verliert man schon nach wenigen verwirklichten Umfragen den Überblick darüber, welche Fragen man schon einmal gestellt hat und welche nicht. Man findet die Trendfragen bei der Fragebogenentwicklung nicht mehr, mit der Folge, dass man immer wieder neue, ähnliche Fragen erfindet, die einen sauberen Zeitvergleich unmöglich machen. Und wenn man eine solche Datenbank anlegt, aber auf die Markierung der Trendfragen im Fragebogen verzichtet, erschwert man demjenigen, der das Archiv pflegt und auf diese Weise erst den Zugang zu den früheren Ergebnissen ermöglicht, sehr die Arbeit. Damit steigt das Risiko, dass er Trendfragen übersieht, dies wiederum bedeutet, dass die Angaben über die im Zeitverlauf identisch gestellten Fragen unvollständig oder zumindest unübersichtlich werden, weil zusammengehörige Informationen in der Datenbank nicht zusammengeführt werden. Es lohnt sich also, bei der Fragebogenentwicklung von vornherein nicht nur an den Frageinhalt und die Auswertungswünsche zu denken, sondern auch an die Anforderungen der Archivierung. <?page no="288"?> 289 Nachwort Wahrscheinlich wird der eine oder andere Leser dieses Buch enttäuscht aus der Hand legen, weil es nicht das ist, was es auf den ersten Blick zu sein scheint: ein klassisches Lehrbuch. Es enthält keine klaren, eindeutigen Anweisungen, wie ein Fragebogen im Einzelnen zu erstellen ist. Keine Feingliederung ermöglicht das Nachschlagen wie in einem Lexikon, keine Kurzzusammenfassungen am Ende der Kapitel machen eine Überprüfung des zuvor Gelernten möglich. Es gibt keine „Kochrezepte“: Für die Formulierung einer Faktfrage zu einem heiklen Thema nehme man erstens, zweitens, drittens ... Doch ein Fragebogenbuch, das seinem Thema auch nur einigermaßen gerecht werden soll, kann keine „Kochrezepte“ enthalten. Die Annahme, man könne die Entwicklung von Fragebogen nach festen Regeln erlernen wie das Brezelbacken, beruht auf einem Missverständnis. Natürlich gibt es bei der Fragebogenentwicklung auch handwerkliche Aspekte, weswegen sich immerhin einige wenige Grundprinzipien beschreiben lassen, die in diesem Band auch zur Sprache kommen. Doch in der Hauptsache ist die Fragebogenentwicklung eine kreative Tätigkeit. Anscheinend ist die Vorstellung weit verbreitet, das Wichtigste bei der Planung einer Befragung sei die Kenntnis von Testtheorie und Skalenlogik sowie ein geschlossenes gesellschaftstheoretisches Konzept, das mit der Befragung getestet werden soll. Wahrscheinlich ist diese Vorstellung der Hauptgrund dafür, dass viele Fragebogen so einfallslos bleiben und damit fast zwangsläufig auch keine überraschenden und erhellenden Erkenntnisse erzeugen. Das im Buch beschriebene Beispiel des Soziologie-Professors, der zwar die kompliziertesten gesellschaftlichen Theorien entwickeln konnte, aber nicht auf die Idee kam, ein einziges Interview selbst durchzuführen, um zu prüfen, ob sein Fragebogen überhaupt irgendeinen Bezug zur Wirklichkeit hat, ist leider kein Einzelfall. <?page no="289"?> Nachwort 290 Ohne Zweifel sind Kenntnisse auf den Gebieten der Skalenlogik und der Testtheorie wichtig, und ein klares theoretisches Konzept zu haben, ist eigentlich immer von Nutzen - zumindest dann, wenn es realistisch und nicht banal ist und wenn es nicht die Flexibilität des eigenen Denkens behindert. Doch es ist ein Irrtum zu glauben, dass dies die wichtigsten Dinge seien, die über die Qualität eines Fragebogens und damit der gesamten Befragung entscheiden. Das wirklich Wichtigste bei der Fragebogenentwicklung ist zuhören. Zuhören bei den Gesprächen der Sitznachbarn in der S-Bahn, bei der Unterhaltung der Kunden mit der Bedienung im Bäckerladen, bei den politischen Diskussionen auf Familienfeiern, bei Straßeninterviews mit Passanten im Fernsehen, bei - zugegebenermaßen meist schwer erträglichen - Radiosendungen, in denen der Moderator die Hörer auffordert, anzurufen und ihre Meinung zu sagen. Zuhören. Immer und immer wieder richtig zuhören. Nur dann bekommt man ein Gespür für gesellschaftliche Zusammenhänge, nur dann kann man Gesellschaftstheorien entwickeln, die wirklichkeitsnah sind und die es sich wirklich lohnt zu testen. Ein Meister des Zuhörens und damit ein Vorbild für Sozialwissenschaftler war der große Pionier der Journalismusforschung W. Phillips Davison (1918-2012), dem die Kommunikationswissenschaft mit der Theorie des „Third-Person Effect“ einen ihrer wenigen echten Erkenntnisfortschritte verdankt. Man muss annehmen, dass Davisons großer Erfolg in der Wissenschaft vor allem auf seiner Fähigkeit beruhte, Menschen ruhig und gut zu beobachten und nachzuempfinden, was sie bewegte. Davison wäre nie auf den Gedanken gekommen, ein rein intellektuelles, abstraktes theoretisches Konstrukt zu entwerfen. Die These vom „Third-Person Effect“ ist keine jener überkomplizierten und gleichzeitig blutleeren Theorien, von denen es in den Sozialwissenschaften so viele gibt, sondern eine aus dem wirklichen Leben geschöpfte einfache Erkenntnis. Es lohnt sich, den Originalartikel „The Third-Person Effect in Communication“ zu lesen, erschienen 1983 in der Fachzeitschrift „Public Opinion Quarterly“. Der Artikel würde heute mit an Sicherheit grenzender Wahrscheinlichkeit am Peer-Review-Prozess der Zeitschrift scheitern und zugunsten eines langweiligen Beitrags verworfen werden, der besser die akademischen Konventionen erfüllt. Davison beschrieb einfach, was ihm am Verhalten anderer Menschen <?page no="290"?> Nachwort 291 aufgefallen war. Der Text hat anekdotischen Charakter, zitiert wenig „relevante Literatur“ (was immer das sein mag), enthält wenig und zudem wenig valide Daten und schon gar keine komplizierten multivariaten Analysen. Stattdessen enthält er etwas viel Wertvolleres, nämlich eine gute Idee. Und gute Ideen bekommt man nicht beim Exerzieren intellektueller Fingerübungen am Schreibtisch, sondern nur, wenn man gründlich, unvoreingenommen und mit echtem Interesse beobachtet. Das gilt sowohl für Ideen zu sozialwissenschaftlichen Theorien als auch - damit verbunden - für Ideen zu guten Frageformulierungen. Man kann kein allgemein gültiges Kochrezept zur Entwicklung von Fragebogen schreiben, weil die besten Fragen nicht nach einem festen Konzept am Schreibtisch entstehen. Stattdessen drängen sie sich demjenigen, der laufend und sorgsam die Gesellschaft beobachtet und den Menschen zuhört, geradezu auf. Wenn eine Frage wirklich gut ist, sind Überlegungen zur Skalenlogik oder zu den mathematischen Analysemöglichkeiten nachrangig. Stehen sie im Mittelpunkt der Überlegungen, blockieren sie die Beobachtungsgabe und die Fantasie. Wer an die Fragebogenentwicklung herangeht mit einer Überlegung wie: „Ich will eine Ethnozentrismus-Skala entwickeln“ oder „Ich will Daten haben, mit denen ich ein Pfadmodell rechnen kann“, hat schon halb verloren. Skalen und Analysen sind Mittel zum Zweck, nicht der Zweck selbst. Am Anfang guter Fragen steht eine gute inhaltliche Idee. Ein Buch wie dieses kann nur Vorschläge machen, in welche konkrete Form eine solche Idee dann gegossen werden kann. Es kann die Bandbreite der Möglichkeiten andeuten, mit vielen Beispielen aus der Praxis vorführen, wie Fragen zu verschiedenen Themen aussehen können. Damit kann es günstigstenfalls vielleicht das Aufkommen der einen oder anderen guten Idee befördern, denn lebendige Vorstellungen von den Umsetzungsmöglichkeiten helfen manchmal auch, Gedanken zu strukturieren, die sonst vage und damit schwer greifbar geblieben wären. Dieses Buch erhebt keinerlei Anspruch auf Vollständigkeit, nicht, soweit es die beschriebenen Methoden betrifft, und schon gar nicht in bezug auf die zitierte Literatur. Es ist auch nicht konsequent systematisch angelegt. Es soll nicht schulen, sondern anregen. Es ist - hoffentlich - eher mit einem Versandhauskatalog für Kleidung als mit einem Schnittmusterbogen zu vergleichen. Schnittmuster regen die Fantasie nicht an. <?page no="292"?> 293 Literatur Zu den im Text enthaltenen Hinweisen auf Umfragen des Instituts für Demoskopie Allensbach („Allensbacher Archiv, IfD-Umfrage Nr ...“) gibt es keine gesonderten Literaturangaben. Die Angaben im Text sind vollständig, die betreffenden Fragebogen können bei Bedarf im Allensbacher Archiv eingesehen werden. Ackermann, Ulrike (Hrsg.) (2012): Freiheitsindex Deutschland 2011 des John Stuart Mill Instituts für Freiheitsforschung. Frankfurt: Humanities Online Antholz, Birger (2005): Zur Treffsicherheit von Wachstumsprognosen. Prognostizierte und tatsächliche Wachstumsraten des Bruttoinlandsprodukts Deutschlands 1950-2004. Münster: EHA-Verlag Aquilino, William S., Leonard A. LoSciuto (1990): Effects of Interview Mode on Self-reported Drug Use. In: Public Opinion Quarterly 54, S. 362-395 Atteslander, Peter (1984): Methoden der empirischen Sozialforschung. Berlin/ New York: de Gruyter, 5. Auflage Auer, Maria (1981): The Stapel Scale. A Versatile Instrument of Survey Research. Vortrag, gehalten auf der Jahrestagung der World Association for Public Opinion Research (WAPOR), 23. August 1981, in Amsterdam Behnke, Joachim, Nina Baur, Nathalie Behnke (2006): Empirische Methoden der Politikwissenschaft. Paderborn: Schöningh Belson, William A. (1960): Volunteer Bias in Test-Room Groups. In: Public Opinion Quarterly 24, S. 115-126 Benson, Lawrence E. (1941): Studies in Secret-ballot Technique. In: Public Opinion Quarterly 5, S. 79-82 Bergkvist, Lars, John R. Rossiter (2007): The Predictive Validity of Multiple-Item Veersus Single-Item Measures of the Same Constructs. In: Journal of Marketing Research 44, 2007, S. 175-184 Biemer, Paul (2004): Modeling Measurement Error to Identify Flawed Interviews. In: Stanley Presser (u. a.) (Hrsg.): Methods for Testing and Evaluationg Survey Questionnaires. Hoboken: Wiley, S. 225-246 <?page no="293"?> Literatur 294 Binet, A., V. Henri (1894): De la suggestibilité naturelle chez les enfants. In: Revue Philosophique 38, S. 337-347 Binswanger, Mathias (u. a.) (2010): Zufrieden trotz sinkenden materiellen Wohlstands. Memorandum der Arbeitsgruppe „Zufriedenheit“ des Ameranger Disputs der Ernst Freiberger Stiftung. Amerang o. V. Bishop, George F. (1987): Context Effects on Self-Perceptions of Interest in Government and Public Affairs. In: Hans-J. Hippler, Norbert Schwarz, Seymour Sudman (Hrsg.): Social Information Processing and Survey Methodology. New York: Springer, S. 179-199 Bishop, George F., Bonnie S. Fisher (1995): „Secret Ballots“ and Selfreports in an Exit-poll Experiment. In: Public Opinion Quarterly 59, S. 568-588 Bodor, Tamás (2012): The Issue of Timing and Opinion Congruity in Spiral of Silence Research: Why Does Research Suggest Limited Support for the Theory? In: International Journal of Public Opinion Research 24, S. 269-286 Bradburn, Norman M., Seymour Sudman (1979): Improving Interview Method and Questionnaire Design. Response Effects to Threatening Questions in Survey Research. San Francisco u. a.: Jossey-Bass Brosius, Hans-Bernd (1995): Alltagsrationalität in der Nachrichtenrezeption. Ein Modell zur Wahrnehmung und Verarbeitung von Nachrichteninhalten. Opladen: Westdeutscher Verlag Browne, Dik (1986): Hägar der Schreckliche. Auf geht’s! München: Goldmann Bruttel, Oliver (2013): Bevölkerungsstimmung als Indikator für Wirtschaftswachstum. In: Wirtschaftsdienst 93, S. 390-395 Bücher, Karl (1906): Handelsbudgets oder Wirtschaftsrechnungen. In: Zeitschrift für die gesamte Staatswissenschaft 62, S. 686-700 Busch Zetterberg, Karin, Hans Zetterberg (2002): Has Methodology Sophistication Been Lost od Gained? Election Polling in the 1970s by Sifo Sweden. Vortrag, gehalten auf dem Seminar „Quality Criteria in Survey Research“ der World Association for Public Opinion Research (WAPOR), Cadenabbia, 27.-29. Juni 2002 Buser, Remo (1973): Ausdruckspsychologe. Problemgeschichte, Methodik und Systematik der Ausdruckswissenschaft. München/ Basel: Ernst Reinhard Campbell, Donald T. (1957): Factors Relevant to the Validity of Experiments in Social Settings. In: Psychological Bulletin 54, S. 297-312 Campbell, Donald T., Julian C. Stanley (1963): Experimental and Quasiexperimental Designs für Research. Boston: Houghton Mifflin <?page no="294"?> Literatur 295 Cantril Hadley (1940): Experiments in the Wording of Questions. In: Public Opinion Quarterly 4, S. 330-332 Cantril, Hadley (1944): Gauging Public Opinion. Port Washington/ London: Kennikat Press Cantril, Hadley, F. P. Kilpatrick (1960): Self-Anchoring Scaling. A Measure of Individuals’ Unique Reality World. In: Journal of Individual Psychology 16, S. 158-170 Connelly, Nancy A., Tommy L. Brown, Daniel J. Decker (2003): Factors Affecting Response Rates to Natural Resource-focused Mail Surveys: Empirical Evidence of Declining Rates over Time. In: Society and Natural Resources 16, S. 541-549 Converse, Jean M. (1987): Survey Research in the United States. Roots and Emergence 1890-1960. Berkeley: University of California Press Couper, Mick P., Michael W. Traugott, Mark J. Lamias (2001): Web Survey Design and Administration. In: Public Opinion Quarterly 65, S. 230-253 Crossley, Achibald M. (1941): Methods Tested During 1940 Campaign I. In: Public Opinion Quarterly 5, S. 83-86 Csikszentmihalyi, Mihaly (1992): Flow. Das Geheimnis des Glücks. Stuttgart: Klett-Cotta Daiber, Achim, Werner Hemsing (2005): Online Conjoint: Eine bewährte Methode im neuen Gewand. In: Planung & Analyse 1/ 2005, S. 47-52 Davison, W. Phillips (1983): The Third-Person Effect in Communication. In: Public Opinion Quarterly 47, S. 1-15 Descartes, René (1995): Abhandlung über die Methode des richtigen Vernunftgebrauchs. Stuttgart: Reclam Diekmann, Andreas (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt Die Verschiebung der Altersschwellen (1997). In: Elisabeth Noelle- Neumann, Renate Köcher (Hrsg.): Allensbacher Jahrbuch der Demoskopie 1993-1997. Demoskopische Entdeckungen. München/ Allensbach: Saur/ Verlag für Demoskopie, S. 179-185 Dillman, Don A., Nicholas L. Parsons (2008): Self-Administered Paper Questionnaires. In: Wolfgang Donsbach, Michael W. Traugott (Hrsg.): The SAGE Handbook of Public Opinion Research. Los Angeles: Sage, S. 262-270 Dodd, Stuart C. (1946): Toward World Surveying. In: Public Opinion Quarterly 10, S. 470-483 Donsbach, Wolfgang (1991): Medienwirkung troz Selektion. Einflussfaktoren auf die Zuwendung zu Zeitungsinhalten. Köln: Böhlau <?page no="295"?> Literatur 296 Donsbach, Wolfgang, Olaf Jandura, Thomas Petersen (2005): Methoden des Projekts. In: Elisabeth Noelle-Neumann, Wolfgang Donsbach, Hans Mathias Kepplinger: Wählerstimmungen in der Mediendemokratie. Analysen auf Basis des Bundestagswahlkampfs 2002. Freiburg: Alber 2005, S. 208-230 Douglas, Mary (1991): Wie Institutionen denken. Frankfurt am Main: Suhrkamp Durkheim, Émile (1961): Regeln der soziologischen Methode. Neuwied: Luchterhand Eberhard, Fritz (1962): Der Rundfunkhörer und sein Programm. Berlin: Colloquium Verlag Eichhorn, Wolfgang, Kurt Watzka (1993): Die Messung. In: Thomas Knieper (Hrsg.): Statistik. Eine Einführung für Kommunikationsberufe. München: Ölschläger, S. 75-102 Eisinger, Robert, Thomas Petersen (2009): What About the Visuals? A Cross-National Study on Politicians’ Photographs and Their Effects on Public Opinion. Vortrag, gehalten auf der Jahrestagung der Amrican Association of Public Opinion Research (AAPOR), 14.-17. Mai 2009 in Hollywood (Florida) Ekman, Paul (1982): Emotion in the Human Face. Cambridge: Cambridge University Press Ekman, Paul, Wallace V. Friesen (1978): The Facial Action Coding System (FACS). A Technique for the Measurement of Facial Acion. Palo Alto: Consulting Psychologists Press European Commission, Directorate-General for Research and Innovation, Biotechnology, Agriculture, Food (2010) (Hrsg.): A Decade of EU-funded GMO Research (2001-2010). Luxemburg: Publications Office of the European Union Falbe, Jürgen, Manfred Regnitz (Hrsg.) (1989-1993): Römpp Chemie Lexikon. Stuttgart/ New York: Thieme, 9. Auflage Faulbaum, Frank, Peter Prüfer, Margrit Rexroth (2009): Was ist eine gute Frage? Die systematische Evaluation der Fragenqualität. Wiesbaden: Verlag für Sozialwissenschaften Festinger, Leon (1957): A Theory of Cognitive Dissonance. Stanford: University Press Fields, James M., Howard Schuman (1976): Public Beliefs About the Beliefs of the Public. In: Public Opinion Quarterly 40, S. 427-448 Flick, Uwe (1995): Qualitative Forschung. Theorie, Methoden, Anwendung in Psychologie und Sozialwissenschaften. Reinbek: Rowohlt Frankovic, Kathleen A. (2012): Straw Polls in the U. S.: Measuring Public Opinion 100 Years Ago. In: Hannes Haas, Hynek Jerabek, Tho- <?page no="296"?> Literatur 297 mas Petersen (Hrsg.): The Early Days of Survey Research and Their Importance Today. Wien: Braumüller, S. 66-84 Frey, James H., Gerhard Kunz, Günther Lüschen (1990): Telefonumfragen in der Sozialforschung. Methoden, Techniken, Befragungspraxis. Opladen: Westdeutscher Verlag Frey, Siegfried (1999): Die Macht des Bildes. Der Einfluss der nonverbalen Kommunikation auf Kultur und Politik. Bern: Hans Huber Friedrichs, Jürgen (1985): Methoden empirischer Sozialforschung. Opladen: Westdeutscher Verlag, 13. Auflage Gallup, George H. (1928): An Objective Method for Determining Reader Interest in the Content of a Newspaper. Diss. Iowa City Geiger, Gunnar (2008): Die Ergebnisqualität von Testkunden aus unterschiedlichen soziodemographischen Gruppen beim Mystery Shopping. Diss. Flensburg Geise, Stephanie, Peter Schumacher (2011): Eyetracking. In: Thomas Petersen, Clemens Schwender (Hrsg.): Die Entschlüsselung der Bilder. Methoden zur Erforschung visueller Kommunikation. Köln: Halem, S. 349-371 Gillessen, Günther (1986): Auf verlorenem Posten. Die Frankfurter Zeitung im Dritten Reich. Berlin: Siedler Görtler, Edmund, Doris Rosenkranz (2006): Mitarbeiter- und Kundenbefragung. Methoden und praktische Umsetzung. München: Hanser Grimm, Jacob, Wilhelm Grimm (Hrsg.) (1878): Deutsches Wörterbuch Bd. 4, Abt. 1. Leipzig: Hirzel. Ndr. München: dtv 1984 Gustafsson, Anders, Andreas Herrmann, Frank Huber (2007): Conjoint Analysis as an Instrument of Market Research Practice. in: Anders Gustavson, Andreas Herrmann, Frank Huber (Hrsg.): Conjoint Measurement. Methods and Applications. Berlin: Springer, S. 3-30 Haas, Alexander (2002): Analyse von Verkaufssituationen mit Mystery Shopping. In: Jahrbuch der Absatz- und Verbrauchsforschung 48, S. 277-294 Haire, Mason (1950): Projective Techniques in Marketing Research. In: Journal of Marketing 14, S. 649-656 Hallemann, Michael (1990): Peinlichkeit: ein Ansatz zur Operationalisierung von Isolationsfurcht im sozialpsychologischen Konzept öffentlicher Meinung. Diss. Mainz Hammen, Kerstin (2010): Design-Effekte bei Online-Befragungen. In: Nikolaus Jackob, Thomas Zerback, Olaf Jandura, Marcus Maurer (Hrsg.): Das Internet als Forschungsinstrument und -gegenstand in der Kommunikationswissenschaft. Köln: Halem, S. 152-177 <?page no="297"?> Literatur 298 Heerwegh, Dirk (2005): Effects of Personal Salutations in E-mail Invitations to Participate in a Web Survey. In: Public Opinion Quarterly 69, S. 588-598 Hentschel, Hartmut, Friedrich Tennstädt (1985): Election Forecasts. Problems and Solutions. Revised Manuscript of a Paper, presented at the Conference on „Opinion Polls and Election Forecasts“ - Held by the Centro de Investigaciones Sociológicas (CIS and the Universidad Internacional Menendez Pelayo (UIMP), Sevilla Herbers, Martin (2011): Comicanalyse: Bilder, Wörter und Sequenzen. In: Thomas Petersen, Clemens Schwender (Hrsg.): Die Entschlüselung der Bilder. Methoden zur Erforschung visueller Kommunikation. Köln: Halem, S. 72-86 Herkner, Werner (1991): Lehrbuch Sozialpsychologie. Bern: Hans Huber, 5. Auflage Herzog, A. Regula, Jerald G. Bachmann (1981): Effects of Questionnaire Langth on Response Quality. In: Public Opinion Quarterly 45, S. 549-559 Hippler, Hans-J., Norbert Schwarz (1986): Not Forbidding Isn’t Allowing: The Cognitive Basis of the Forbid-Allow Asymmetry. In: Public Opinion Quarterly 50, S. 87-96 Hofstätter, Peter (1962): Faktorenanalyse. In: René König (Hrsg.): Handbuch der empirischen Sozialforschung Bd. 1. Stuttgart: Enke, S. 384-414 Holbrook, Allyson L., Jon A. Krosnick (1999): Response Order Effects in Telephone Interviews: The Impact of Liguistic Strukture, ans Respondent Ability, Motivation, and Tast Difficulty. Vortrag, gehalten auf der Jahrestagung der American Association of Public Opinion Research (AAPOR), 13.-16. Mai 1999 Holbrook, Allyson L. (u. a.) (2000): Violating Conversational Conventions Disrupts Cognitive Processing of Attitude Queations. In: Journal of Experimental Social Psychology 36, S. 465-494 Hüttner, Manfred, Ulf Schwarting (2002): Grundzüge der Marktforschung. München: Oldenbourg Im Kopf (1965): In: Der Spiegel Nr. 35/ 1965, S. 40-41 Institut für Demoskopie Allensbach (2004): „Kopfentscheidungen“, „Bauchentscheidungen“ und das Ideal der Rationalität. Ergebnisse einer Repräsentativumfrage zur Emotionalität von Entscheidungsprozessen im Auftrag der Berthold-Leibinger-Stiftung. Allensbacher Archiv, IfD-Bericht Nr. 6639 Institut für Demoskopie Allensbach (2013): Die gegenseitige Wahrnehmung Ost- und Westdeutscher und das Image ostdeutscher Hoch- <?page no="298"?> Literatur 299 schulen bei Abiturienten, Studenten und Absolventen aus Westdeutschland. Ergebnisse einer Grundlagenstudie im Auftrag der Hochschulinitiative Neue Bundesländer. Allensbacher Archiv, IfD- Bericht Nr. 7834 Jacob, Rüdiger, Willy H. Eirmbter (2000): Allgemeine Bevölkerungsumfragen. Einführung in die Methoden der Umfrageforschung mit Hilfen zur Erstellung von Fragebögen. München: Oldenbourg Jandura, Olaf, Hans-Bernd Brosius (2010): The Influence of Response Sets on the Results and Quality of Multivariate Analyses. Vortrag, gehalten auf der Jahrestagung der World Association for Public Opinion Research (WAPOR), 12. Mai 2010 in Chicago Kallus, K. Wolfgang (2010): Erstellung von Fragebogen. Wien: Facultas.wuv. Kant, Immanuel (1867): Kritik der reinen Vernunft (Immanuel Kants sämmtliche Werke Bd. 3). Leipzig: Leopold Voss Katz, Daniel (1940): Three Criteria: Knowledge, Conviction, and Significance. In: Public Opinion Quarterly 4, S. 277-284 Katz, Daniel (1944): The Measurement of Intensity. In: Hadley Cantril: Gauging Public Opinion. Port Washington: Kennikat Press, S. 51-65 Kepplinger, Hans Mathias (2009): Wirkung der Massenmedien. In: Elisabeth Noelle-Neumann, Winfried Schulz, Jürgen Wilke (Hrsg.): Fischer Lexikon Publizistik Massenkommunikation. Frankfurt: Fischer 2009, S. 651-702 Kiesler, Sara, Lee S. Sproull (1986): Response Effects in the Electronic Survey. In: Public Opinion Quarterly 50, S. 402-413 Klammer, Bernd (2005): Empirische Sozialforschung. Eine Einführung für Kommunikationswissenschaftler und Journalisten. Konstanz: UVK Klatzky, Roberta L. (1980): Human Memory. Structures and Processes. San Francisco: Freeman Knudsen, Dean D., Hallowell Pope, Donald P. Irish (1967): Response Differences to Questions on Sexual Standards: An Interviewquestionnaire Comparison. In: Public Opinion Quarterly 31, S. 290- 297 Knutsen, Oddbjørn (1998): Europeans Move toward the Center: A Comparative Study of Left-Right Self-Placement in Western Europe. In: International Journal of Public Opinion Research 10, S. 292-316 Koschnick, Wolfgang J. (2003): FOCUS-Lexikon Werbeplanung - Mediaplanung - Marktforschung - Kommunikationsforschung - Mediaforschung. Bd. 1. München: FOCUS Magazin Verlag, S. 970-999 <?page no="299"?> Literatur 300 Kritik an der Technik und die Zukunft einer Industrienation. Demoskopische Nachwuchsanalyse für Ingenieurberufe, vorgelegt vom Institut für Demoskopie Allensbach (1982). Villingen-Schwenningen: Neckar-Verlag Kromrey, Helmut (2000): Empirische Sozialforschung. Modelle und Methoden der Datenerhebung und Datenauswertung. Opladen: Leske + Budrich, 5. Auflage Krosnick, Jon (1992): The Impact of Cognitive Sophistication and Attitude Importance on Response-Order and Question-Order Effects. In Norbert Schwarz, Seymour Sudman (Hrsg.): Context Effects in Social and Psychological Research. New York: Springer, S. 203-218 Krosnick, Jon, Duane F. Alwin (1987): An Evaluation of a Cognitive Theory of Response-Order Effects in Survey Measurement. In: Public Opinion Quartrly 51, S. 201-219 Krosnick, Jon, Fan Li, Darrin R. Lehman (1990): Conversational Conventions. Order of Information Acquisition, and the Effect of Base Rates and Individuating Information on Social Judgement. In: Journal of Personality and Social Psychology 59, S. 1140-1152 Krysan, Maria (1998): Privacy and the Expression of White Racial Attitudes: A Comparison across Three Contexts. In: Public Opinion Quarterly 62, S. 506-544 Kühlhorn, Eckart (u. a.) (2000): Can the Great Errors of Surveys Measuring Alcohol Consumption Be Corrected? Vorrtrag, gehalten auf der Jahrestagung der World Association for Public Opinion Research (WAPOR) in Portland, Oregon, USA, am 18. Mai 2000. http: / / zetterberg.org. Zuletzt aufgerufen am 25. April 2012 Lamnek, Siegfried (2010): Qualitative Sozialforschung. Weinheim: Beltz, 5. Auflage Lane, George S., Gayne L. Watson (1975): A Canadian Replication of Mason Haire’s ‚Shopping list’ Study. In: Journal of the Academy of Marketing Science 3, S. 48-59 Lasswell, Harold D. (1965): Das Qualitative und das Quantitative in politik- und rechtswissenschaftlichen Untersuchungen. In: Ernst Topitsch (Hrsg.): Logik der Sozialwissenschaften. Köln/ Berlin: Kiepenheuer & Witsch, S. 464-476 Lazarsfeld, Paul F. (1935): The Art of Asking Why - Three Principles Underlying the Formulation of Questionnaires. In: National Marketing Review 1, S. 32-43 Levenstein, Adolf (1912): Die Arbeiterfrage. München: Reinhardt Löblich, Maria, Sonja Pfaff-Rüdiger (2008): Die empirischsozialwissenschaftliche Wende und die Veränderung der For- <?page no="300"?> Literatur 301 schungspraxis in der Zeitungs- und Publizistikwissenschaft. Vortrag, gehalten auf der Jahrestagung der Deutschen Gesellschaft für Publizistik- und Kommunikationswissenschaft (DGPuK) am 30. 4.-2. 5. 2008 Mark, Desmond (Hrsg.) (1996): Paul Lazarsfelds Wiener RAVAG-Studie 1932. Wien: Guthmann-Peterson Meier, Isabelle (2008): „Ich habe täglich Interviews fälschen müssen.“ In: Ktipp 9 vom 5. Mai 2008. http: / / www.ktipp.ch/ themen/ beitrag/ 1031959. Zuletzt aufgerufen am 23. April 2012 Merkel, Angela (2002): Die Mitte ist rechts von links. In: Frankfurter Allgemeine Zeitung vom 18. Februar 2002. http: / / fazarchiv.faz.net/ ? q=%22mitte+ist+rechts+von+links%22&dosearch=new#hitlist. Zuletzt aufgerufen am 2. August 2012 Meyen, Michael (2004): Mediennutzung, Mediaforschung, Medienfunktionen, Nutzungsmuster. Konstanz: UVK Miller, George A. (1951): Language and Communication. New York: McGraw-Hill Murray, Henry A. (1943): Thematic Apperception Test. Cambridge: Harvard University Press Niedermann, Anne (1996): Lexikalisches Stichwort zur Theorie der öffentlichen Meinung. In: Elisabeth Noelle-Neumann: Öffentliche Meinung. Die Entdeckung der Schweigespirale. Frankfurt am Main: Ullstein 1996, S. 343-372 Nitzsche, Friedrich (1968): Zur Genealogie der Moral. Eine Streitschrift. In: Friedrich Nietzsche: Werke. Kritische Gesamtausgabe, Bd. VI, 2. Berlin: de Gruyter 1968, S. 259-430 Noelle, Elisabeth (1940): Meinungs- und Massenforschung in U. S. A. Umfragen über Politik und Presse. Frankfurt am Main: Diesterweg Noelle, Elisabeth (1963): Umfragen in der Massengesellschaft. Einführung in die Methoden der Demoskopie. Reinbek: Rowohlt Noelle-Neumann, Elisabeth (1965): Die Rolle des Experiments in der Publizistikwissenschaft. In: Publizistik 10, S. 239-250 Noelle-Neumann, Elisabeth (1970): Wanted: Rules for Wording Structured Questionnaires. In: Public Opinion Quarterly 34, S. 192-201 Noelle-Neumann, Elisabeth (1989): The Public as Prophet. Findings from Continuous Survey Research and their Importance for Early Diagnosis of Economic Growth. In: International Journal of Public Opinion Research 1, S. 136-150 Noelle-Neumann, Elisabeth (1992): Adenauer in der öffentlichen Meinung. In: Haus der Geschichte der Bundesrepublik Deutschland <?page no="301"?> Literatur 302 (Hrsg.): Nach-Denken über Konrad Adenauer und seine Politik. Bonn: Bouvier, S. 94-100 Noelle-Neumann, Elisabeth (2001): Die Schweigespirale. Öffentliche Meinung - unsere soziale Haut. München: Langen Müller Noelle-Neumann, Elisabeth (2002): Die Identifizierung der Meinungsführer. In: Elisabeth Noelle-Neumann: Die soziale Natur des Menschen. Freiburg: Alber 2002, S. 94-130 Noelle-Neumann, Elisabeth (2006): Die Erinnerungen. München: Herbig Noelle-Neumann, Elisabeth, Carl Schramm (1961): Umfrageforschung in der Rechtspraxis. Weinheim: Verlag Chemie Noelle-Neumann, Elisabeth, Renate Köcher (Hrsg.) (2002): Allensbacher Jahrbuch der Demoskopie 1998-2002. Balkon des Jahrhunderts. München/ Allensbach: Saur/ Verlag für Demoskopie Noelle-Neumann, Elisabeth, Thomas Petersen (2000): Das halbe Instrument, die halbe Reaktion. Zum Vergleich von Telefon- und Face-to- Face-Umfragen. In: Volker Hüfken (Hrsg.): Methoden in Telefonumfragen. Opladen: Westdeutscher Verlag, S. 183-200 Noelle-Neumann, Elisabeth, Thomas Petersen (2005): Alle, nicht jeder. Einführung in die Methoden der Demoskopie. Berlin/ Heidelberg: Springer, 4 Auflage Noelle-Neumann, Elisabeth, Thomas Petersen (2009): Methoden der Publizistik- und Kommunikationswissenschaft. In: Elisabeth Noelle- Neumann, Winfried Schulz, Jürgen Wilke (Hrsg.): Fischer Lexikon Publizistik Massenkommunikation. Frankfurt/ Main: Fischer, 5. Auflage, S. 291-328 Oberschall, Anthony (1997): Empirische Sozialforschung in Deutschland 1848-1914. Freiburg: Alber Oksenberg, Lois, Charles Cannell, Graham Kalton (1991): New Strategies for Pretesting Survey Questions. In: Journal of Official Statistics 7, S. 349-365 Patterson, Thomas E. (1994): Out of Order. New York: Vintage Books Payne, Stanley L. (1951): The Art of Asking Questions. Princeton: University Press Petersen, Thomas (2000): Keine Alternativen: Telefon- und Face-to- Face-Umfragen In: Statistisches Bundesamt (Hrsg.): Neue Erhebungsinstrumente und Methodeneffekte. Stuttgart: Metzler-Poeschel, S. 22-41 Petersen, Thomas (2002): Das Feldexperiment in der Umfrageforschung. Frankfurt/ Main: Campus Petersen, Thomas (2005a): The Year of the Flood: The “Strength-of- Personality Scale” and the 2002 German Federal Elections. In: <?page no="302"?> Literatur 303 Public Opinion Pros, November 2005. http: / / www.publicopinion pros.norc.org/ features/ 2005/ nov/ petersen.asp. Zuletzt aufgerufen am 1. August 2012 Petersen, Thomas (2005b): Testing Visual Signals in Representative Surveys. In: International Journal of Public Opinion Research 17, S. 456-472 Petersen, Thomas (2006): Lasswells Frage und Hovlands Problem. Feldexperimente zur Wirkung potenziell emotionalisierender Bildelemente in der Medienberichterstattung. In: Publizistik 51, S. 39-51 Petersen, Thomas (2007): National Representative Report: Germany. In: WAPOR Newsletter 1/ 2007, S. 5-6 Petersen, Thomas (2011): The „Easterlin Paradox“ - A Spurious Correlation? Vortrag, gehalten auf der Jahrestagung der World Association for Public Opinion Research (WAPOR) am 12.-15. Mai 2011 in Phoenix Petersen, Thomas (2012a): Gute Nachbarn. In: Berliner Republik 1/ 2012, S. 38-41 Petersen, Thomas (2012b): „Wer sagt Ihnen, dass die Journalisten nicht Recht haben? “ Empirische Befunde über das Verhältnis von Wissenschaft und Medien sowie zur Risikowahrnehmung der Bevölkerung. In: atw 57, S. 380-386 Petersen, Thomas (2012c): Die öffentliche Meinung. In: Werner Weidenfeld, Wolfgang Wessels (Hrsg.): Jahrbuch der Europäischen Integration 2012. Badan-Baden: Nomos, S. 369-378 Petersen, Thomas (2012d): The Art of Discovering Something Simple and New. The Role of Outsiders in the History of Social Research. In: Hannes Haas, Hynek Jerabek, Thomas Petrsen (Hrsg.): The Early Days of Survey Research and Thei Importance Today. Wien: Braumüller, S. 213-230 Petersen, Thomas (2012e): The Enduring Appeal of an Unwieldy Theory. In: International Journal of Public Opinion Research 24, S. 263- 268 Petersen, Thomas, Tilman Mayer (2005): Der Wert der Freiheit. Deutschland vor einem neuen Wertewandel? Freiburg: Herder Peterson, Lloyd R., Margaret Jean Peterson (1959): Short-term Retention of Individual Verbal Items. In: Journal of Experimental Psychology 58, S. 193-198 Poincaré, Henri (1958): The Value of Science. New York: Dover Porst, Rolf (2008): Der Fragebogen. Ein Arbeitsbuch. Wiesbaden: VS Verlag für Sozialwissenschaften <?page no="303"?> Literatur 304 Reeve, Bryce B., Louise C. Mâsse (2004): Item Response Theory Modeling for Questionnaire Evaluation. In: Stanley Presser (u. a.) (Hrsg.): Methods for Testing and Evaluationg Survey Questionnaires. Hoboken: Wiley, S. 247-273 Ring, Erp (1974): Wie man bei Listenfragen Einflüsse der Reihenfolge ausschalten kann. In: Psychologie und Praxis 18, S. 105-113 Ring, Erp (1975): Eine Fehlerquelle bei Bildern als Testvorlage. In: Zeitschrift für experimentelle und angewandte Psychologie 12, S. 89-93 Ring, Erp (1976): Questionnaire Monotony Endangers the Comparability of Results. It Should Be Avoided. Vortrag, gehalten auf dem Jahreskongress der ESOMAR/ WAPOR in Venedig, 5.-9. September 1976 Ring, Erp (1990): Zeitempfinden als Maßstab für Engagement. In: Planung & Analyse 10, S. 357-366 Ring, Erp (1992): Signale der Gesellschaft. Psychologische Diagnostik in der Umfrageforschung. Göttingen: Verlag für angewandte Psychologie Roessing, Thomas (2009): Öffentliche Meinung - die Erforschung der Schweigespirale. Baden-Baden: Nomos Roper, Elmo (1941): Checks to Increase Polling Accuracy. In: Public Opinion Quarterly 5, S. 87-90 Rosenzweig, Saul (1945): The Picture-Association Method and Its Implication in a Study of Reactions to Frustration. In: Journal of Personality 14, S. 2-23 Rossiter, John R. (2011): Measurement for the Social Sciences: The C- OAR-SE Methods and Why It Must Replace Psychometrics. New York: Springer Roth, Dieter (1998): Empirische Wahlforschung. Ursprung, Theorien, Instrumente und Methoden. Opladen: Leske + Budrich Rugg, Donald (1941): Experiments in Wording Questions: II. In: Public Opinion Quarterly,5, S. 91-92 Russell, Bertrand (1984): Theory of Knowledge. The 1913 Manuscript (The Collected Papers of Bertrand Russell Bd. 7). London: Unwin Saris, Willem E., William van der Veld, Irmtraud Gallhofer (2004): Development and Improvement of Questionnaires Using Predictions of Reliability and Validity. In: Stanley Presser (u. a.) (Hrsg.): Methods for Testing and Evaluationg Survey Questionnaires. Hoboken: Wiley, S. 275-297 Scheuch, Erwin K. (1996): Die Notwendigkeit von Pretests zur Vorbereitung statistischer Erhebungen. In: Statistisches Bundesamt (Hrsg.): Pretest und Weiterentwicklung von Fragebogen (Schriften- <?page no="304"?> Literatur 305 reihe Spektrum Bundesstatistik Bd. 9). Stuttgart: Metzler-Poeschel, S. 16-27 Schiller, Friedrich (1904): Über die ästhetische Erziehung des Menschen in einer Reihe von Briefen. In: Friedrich Schiller: Sämtliche Werke. Säkular-Ausgabe Bd. 12: Philosophische Schriften. Stuttgart/ Berlin: Cotta 1904, S. 3-120 Schnapper-Arndt, Gottlieb (1975): Zur Methodologie sozialer Enqueten. Mit besonderem Hinblick auf die neuerlichen Erhebungen über den Wucher auf dem Lande. In: Gottlieb Schnapper-Arndt: Hoher Taunus. Eine sozialstatistische Untersuchung in fünf Dorfgemeinden. Allensbach/ Bonn: Verlag für Demoskopie, S. 195-223 Schneller, Johannes (1997): AWA-Fragebogen und Interviewklima. In: Institut für Demoskopie Allensbach (Hrsg.): AWA ’97. Allensbacher Marktanalyse, Werbeträgeranalyse. Berichtsband IV: Zusatzinformation Medien, Dokumentation. Allensbach o. V., S. 37-52 Schopenhauer, Arthur (1983): Eristische Dialektik oder die Kunst, Recht zu behalten in 38 Kunstgriffen dargestellt. Zürich: Haffmanns Schulz, Rüdiger, Johannes Schneller (2009): Mediaforschung. In: Elisabeth Noelle-Neumann, Winfried Schulz, Jürgen Wilke (Hrsg.): Fischer Lexikon Publizistik Massenkommunikation. Frankfurt am Main: Fischer, S. 201-234 Schulz, Winfried (1970): Kausalität und Experiment in den Sozialwissenschaften. Methodologie und Forschungstechnik. Mainz: von Hase und Koehler Schulz, Winfried (2009): Inhaltsanalyse. In: Elisabeth Noelle-Neumann, Winfried Schulz, Jürgen Wilke (Hrsg.): Fischer Lexikon Publizistik Massenkommunikation. Frankfurt/ Main: Fischer, 5. Auflage, S. 43-64 Schuman, Howard, Stanley Presser (1981): Questions and Answers in Attitude Surveys. Experiments on Form, Wording, and Context. New York u. a.: Sage Schuman, Howard, Stanley Presser, Jacob Ludwig (1981): Context Effects on Survey Responses to Questions About Abortion. In: Public Opinion Quarterly 45, S. 216-223 Schwab, Frank, Dagmar Unz (2011): Untersuchung der mimischen Kommunikation: Das Facial Action Codung System als Forschungmethode. In: Thomas Ptersen, Clemens Schwender (Hrsg.): Die Entschlüsselung der Bilder. Methoden zur Erforschung visueller Kommunikation. Köln: Halem, S. 223-245 Schwarz, Monika (1992): Einführung in die kognitive Linguistik. Tübingen: Francke <?page no="305"?> Literatur 306 Schwarz, Norbert (u. a.) (1985): Response Scales: Effects of Category Range on Reported Behavior and Comparative Judgements. In: Public Opinion Quarterly 49, S. 388-395 Schwarz, Norbert (u. a.) (1991): Rating Scales. Numeric Values May Change the Meaning of Scale Labels. In: Public Opinion Quarterly 55, S. 570-582 Schwarz, Norbert, Fritz Strack, Hans-Peter Mai (1991): Assimilation and Contrast Effects in Part-Whole Question Sequences: A Conversational Logic Analysis. In: Public Opinion Quarterly 55, S. 570-582 Schwarz, Norbert (1996): Cognition and Communication. Judgmental Biases, Research Methods, and the Logic of Conversation. Mahwah: Lawrence Erlbaum Schwarz, Norbert, Howard Schuman (1997): Political Knowledge, Attribution, and Inferred Interest in Politics: The Operation of Buffer Items. In: International Journal of Public Opinion Research 9, S. 191- 195 Schwarzenauer, Wilhelm (o. J. [ca. 1960]): Die „hohe Kunst“ des Interviewens (Broschüre). Allensbach: Institut für Demoskopie Schwender, Clemens (2011): Auswahltests: Card-Sorting und die Q-Sort- Methode. In: Thomas Petersen, Clemens Schwender (Hrsg.): Die Entschlüsselung der Bilder. Methoden zur Erforschung visueller Kommunikation. Köln: Halem, S. 323-333 Schwenkmezger, Peter, Volker Hodapp, Charles Spielberger (1992): Das State-Trait-Aergerausdrucks-Inventar (STAXI): Handbuch. Bern: Hans Huber Seger, Imogen (1975): Vorwort zur dritten Auflage. In: Gottlieb Schnapper-Arndt: Hoher Taunus. Eine sozialstatistische Untersuchung in fünf Dorfgemeinden. Allensbach/ Bonn: Verlag für Demoskopie, S. VII-XXXIV Shamir, Jacob (1993): Pluralistic Ignorance Revisited: Perceptions of Opinion Distributions in Israel. In: International Journal of Public Opinion Research, 5, S. 22-39 Siebel, Wigand (1965): Die Logik des Experiments in den Sozialwissenschaften. Berlin: Duncker & Humblot Smith, Tom W. (1987): The Art of Asking Questions 1936-1985. In: Public Opinion Quarterly 51, S. 549-559 Stroebe, Wolfgang (1980): Grundlagen der Sozialpsychologie I. Stuttgart: Klett-Cotta Sudman, Seymour, Norman M. Bradburn, Norbert Schwarz (1996): Thinking About Answers. The Application of Cognitive Processes to Survey Methodology. San Francisco: Jossey-Bass <?page no="306"?> Literatur 307 Taddicken, Monika (2009): Methodeneffekte von Web-Befragungen: Soziale Erwünschtheit vs. Soziale Entkontextualisierung. In: Martin Weichbold, Johann Bacher, Christof Wolf (Hrsg.): Umfrageforschung. Herausforderungen und Grenzen. Wiesbaden: Verlag für Sozialwissenschaften, S. 85-104 Tscheulin, Dieter K., Bernd Helmig (Hrsg.) (2004): Gabler Lexikon Marktforschung. Wiesbaden: Gabler Tschurenev, Eva-Maria (2001): Ostdeutscher Sprachgebrauch. Was jeder kennt, muss noch einmal betont werden: Über Eigenheit und Eigenständigkeit. In: Frankfurter Allgemeine Zeitung vom 2. Februar 2001, S. 46. Tschurenev, Eva-Maria (2005): Warum kaufen Sie das Produkt X nicht? Zur Bedeutung von Fragetechniken in der Marktforschung. In: SMS- Jahrbuch 2005, Marketing- und Sozialforschung. Cham: SMS- Verband Schweizerischer Marketing- und Sozialforscher, S. 41-44 Tennstädt, Friedrich (1984): Effects of Differing Methods on the Level of Magazine Readership Figures. In: Harry Henry (Hrsg.): Readership Research: Montreal 1983. Proceedings of the Second International Symposium. Amsterdam: Elsevier, S. 229-241 Tennstädt, Friedrich (1993): Warum Allensbach keine Daten fusioniert. Vortrag, gehalten auf der AWA ’93-Präsentation in Hamburg am 27. Juli 1993 Tönnies, Ferdinand (1922): Kritik der öffentlichen Meinung. Berlin: Springer Tourangeau, Roger (2004): Experimental Design Considerations for Testing and Evaluationg Questionnaires. In: Stanley Presser (u. a.) (Hrsg.): Methods for Testing and Evaluationg Survey Questionnaires. Hoboken: Wiley, S. 209-224 Triplett, Norman (1898): The Dynamogenic Factors in Pace Making and Competition. In: American Journal of Psychology 9, S. 507-533 Tversky, Amos, Daniel Kahnemann (1973): Availability. A Heuristic for Judging Frequency and Probability. In: Cognitive Psychology 5, S. 207-232 Tversky, Amos, Daniel Kahnemann (1986): Rational Choice and the Framing of Decisions. In: Journal of Business 59, S. 251-278 Vehovar, Vasja, Katja Lozar Manfreda, Gasper Koren (2008): Internet Surveys. In: Wolfgang Donsbach, Michael W. Traugott (Hrsg.): The SAGE Handbook of Public Opinion Research. Los Angeles: Sage, S. 271-283 <?page no="307"?> Literatur 308 Wagner, Michael, Andreas Motel (1997): Die Qualität der Einkommensmessung bei alten Menschen. In: Kölner Zeitschrift für Soziologie und Sozialpsychologie, 48, S. 493-512 WAPOR (2011) (Hrsg.): WAPOR Code of Ethics. http: / / wapor.unl.edu/ wapor-code-of-ethics/ . Zuletzt aufgerufen am 28. August 2012 von Webel, Diana, Hans Mathias Kepplinger, Marcus Maurer (1999): Der Wahlkampf der SPD. In: Elisabeth Noelle-Neumann, Hans Mathias Kepplinger, Wolfgang Donsbach (Hrsg.): Kampa. Meinungsklima und Medienwirkung im Bundestagswahlkampf 1998. Freiburg: Alber 1999, S. 13-39 Weimann, Gabriel (1994): The Influentials: People Who Influence People. New York: State University of New York Press Weisberg, Herbert F., Jon A. Krosnick, Bruce D. Bowen (1996): An Introduction to Survey Research, Polling, and Data Analysis. Thousand Oaks: Sage Weller, Ingeborg (1996): Kontexteffekte in Eurobarometer-Umfragen. Theoretische Implikationen und praktische Bedeutung. Münster: Waxmann Willis, Gordin (1997): A Comparison of Alternate Survey Pretesting Techniques. In: Statistiska centralbyran (SCB) (Hrsg.): Proceedings. Minimum Standards in Questionnaire Testing. Workshop 19-21 October 1997. Örebro: SCB, S. 78-80 Willis, Gordon (2004): Cognitive Interviewing Revisited: A Useful Technique, in Theory? In: Stanley Presser (u. a.) (Hrsg.): Methods for Testing and Evaluationg Survey Questionnaires. Hoboken: Wiley, S. 23-43 Worcester, Robert M., Roger Mortimore (1999): Explaining Labour’s Landslide. London: Politico’s Zeisel, Hans (1960): Zur Geschichte der Soziographie. In: Marie Jahoda, Paul F. Lazarsfeld, Hans Teisel: Die Arbeitslosen von Marienthal. Ein soziographischer Versuch mit einem Anhang zur Geschichte der Soziographie. Allensbach: Verlag für Demoskopie, S. 101-138 Zeisel, Hans (1970): Die Sprache der Zahlen. Köln/ Berlin: Kiepenheuer & Witsch Zeisel, Hans, David Kaye (1997): Prove it with Figures. Empirical Methods in Law and Litigation. New York: Springer Zerback, Thomas (u. a.) (2008): Zehn Jahre Sozialforschung mit dem Internet - eine Analyse zur Nutzung von Online-Befragungen in den Sozialwissenschaften. In: Nikolaus Jackob, Harald Schoen, Thomas Zerback (Hrsg.): Sozialforschung im Internet. Methodologie <?page no="308"?> Literatur 309 und Praxis der Online-Befragung. Wiesbaden: Verlag für Sozialwissenschaften, S. 15-31 Zetterberg, Hans (2008): The Start of Modern Public Opinion Research. In: Wolfgang Donsbach, Michael W. Traugott (Hrsg.): The SAGE Handbook of Public Opinion Research. Los Angeles: Sage, S. 104- 112 <?page no="309"?> 310 Verzeichnis der Abbildungen 1 Auszug aus einem Gesprächsleitfaden ........................................ 29 2 Die Wahrnehmung verschiedener Gesprächsbestandteile ....... 42 3 Der Unterschied zwischen „sachlich richtigen“ und „gefühlt richtigen“ Fragetexten...................................................... 46 4 Die lenkende Wirkung der „Mediensprache“ ............................. 57 5a Schematischer Aufbau eines Mehrthemen-Fragebogens I ........ 65 5b Schematischer Aufbau eines Mehrthemen-Fragebogens II....... 66 6 Auswirkungen der Monotonie von Fragebogen auf die Validität der Ergebnisse.................................................................. 73 7 Der taube Interviewer .................................................................... 76 8 Gestützte und ungestützte Erinnerung ...................................... 104 9 Bildvorlage zu Fragebeispiel 11 (Plakattest)............................. 106 10 Balancierte und unbalancierte Formulierung ........................... 112 11 Listenvorlage zu Fragebeispiel 22 (Mediennutzung) ............... 126 12 Bildblatt zu Fragebeispiel 27 (Leiter-Skala)............................... 137 13 Beispiele für Skalen-Bildblätter................................................... 141 14 Bildblatt zu Fragebeispiel 30 (Lineal) ........................................ 145 15 Vorlage zum Verteilen und Kartenbeispiele zu Fragebeispiel 31 ............................................................................ 149 16 Bildvorlage zu Fragebeispiel 32 (semantisches Differential) .................................................................................... 152 17 „Unentschieden“ ist Teil der Information .................................. 156 18 Man kann Befragte kaum zu einer Entscheidung zwingen.... 159 19 Effekt des Hinweises auf die Ausweichkategorie im Fragetext ................................................................................... 161 20 Merkblatt zur Einstufung in die sozialen Schichten................. 166 21 Dialogbildblatt zu Fragebeispiel Nr. 39 ..................................... 182 22 Vorlage eines Konzepts für Studiengebühren .......................... 185 23 Bildblatt und Kartenspiel (Auswahl) zu Fragebeispiel 41 (Waschmittelregal) ........................................................................ 191 <?page no="310"?> Verzeichnis der Abbildungen 311 24 Bildblatt und Karten zur Frage nach gesundem Essen ........... 195 25 Neutralisierte Bildvorlage............................................................. 207 26 Bildblatt zu Fragebeispiel 47 mit eingezeichnetem Muster zur Auswertung (Geografietest).................................................. 209 27 Blatt zum Selbstausfüllen ............................................................. 217 28 Direkte Frage: Entscheidungskriterien beim Autokauf ........... 221 29 Indikator zur Bedeutung des Designs für die Kaufentscheidung.......................................................................... 223 30 Bildvorlage zum Konzentrationstest........................................... 226 31 Bildvorlage zum Test technischer Intelligenz........................... 228 32 Bildblatt zum Emotionstest .......................................................... 234 33 Bildvorlage zum Satzergänzungstest .......................................... 239 34 Bildblatt zu einem projektiven Test ........................................... 241 35 Ergebnis eines Zeitraffertests: Ein Foto gewinnt, eines verliert an Zustimmung...................................................... 253 36 Bildvorlagen zu einem Experiment über das Image von Mundwasser ........................................................................... 256 37 Bildblatt zur Untersuchung einer Billigstrategie bei Markenartikeln ........................................................................ 257 38 Ergebnis eines Preisschwellentests............................................. 261 39 Platzwechseltest zur Überprüfung der Verwechslungsgefahr.................................................................... 262 40 Bildblatt zur Wiedererkennung von Traktoren erster Entwurf ................................................................................ 278 41 Bildblatt zur Wiedererkennung von Traktoren zweiter Entwurf ............................................................................. 280 <?page no="311"?> 312 Verzeichnis der Fragebeispiele 1 (Umsetzung des Konzepts Aktualität von Klassenkampf-Vorstellungen)........................................................ 59 2 (Frage ohne Einleitungssatz) ......................................................... 61 3 (Frage mit Einleitungssatz) ............................................................ 61 4 Der „taube Interviewer“: Auszug aus dem STAXI- Fragebogen ...................................................................................... 78 5 Eisbrecherfrage ................................................................................ 92 6 Eisbrecherfrage „Hoffnungen und Befürchtungen“ ................... 93 7 Schlussfrage am Ende eines Interviews mit politischen Themen............................................................................................. 94 8 „Spielerische“ Schlussfrage ............................................................ 94 9 Informelle Filterfrage ...................................................................... 98 10 Interviewer-Einstufung und Zweiteilung des Interviews .......... 99 11 Offene Frage zur Ermittlung spontaner Reaktionen auf ein Plakatmotiv ....................................................................... 105 12 Beispiel für eine Frage zur Feldverschlüsselung...................... 108 13 Beispiel für eine ungenügend präzise Frageformulierung ..... 115 14 Richtige Lösung: Der Bezugspunkt ist geklärt.......................... 116 15 Verletzung des Prinzips der Eindimensionalität ....................... 116 16 Zwei Fragen in einer .................................................................... 117 17 Lösung: Aus einer Frage werden zwei (I)................................. 118 18 Lösung: Aus einer Frage werden zwei (II)................................ 119 19 Frage zum Erfolg im Leben: Erster Entwurf.............................. 120 20 Frage zum Erfolg im Leben: Zweiter Entwurf .......................... 121 21 Frage zum Erfolg im Leben: Endgültige Fassung..................... 123 22 Listenfrage ...................................................................................... 125 23 „Listenfrage“ am Telefon: Die Items werden einzeln vorgelesen ...................................................................................... 130 24 „Kasten“ .......................................................................................... 132 25 Frage auf nominalem Messniveau .............................................. 134 26 Frage auf ordinalem Messniveau ................................................ 135 <?page no="312"?> Verzeichnis der Fragebeispiele 313 27 Frage auf (annähernd) Intervall-Niveau .................................... 136 28 Frage zu Skala Nr. 2 in Abbildung 13 (perspektivische Leiter) .............................................................................................. 142 29 Frage zu Skala 4 in Abbildung 13 (laufende Männchen) ....... 143 30 Die Schätzung von Prozentwerten ............................................. 144 31 Ein Ersatz für Likert-Skalen: Kartenspiel mit Verteilvorgang................................................................................ 148 32 Anleitung zum semantischen Differential ................................. 151 33 Interviewer-Beobachtungen ........................................................ 164 34 Kauftest zum Thema Modelleisenbahnen ................................. 169 35 Sprachliche Konkretisierung einer liberalen Grundhaltung ... 173 36 Leistungs- oder Gleichheitsprinzip? Die zwei Sekretärinnen ................................................................................. 174 37 Gestützte Assoziationen ............................................................... 176 38 Offener Assoziationstest ............................................................... 177 39 Beispiel für eine Dialogfrage....................................................... 181 40 Schriftliche Vorlage eines komplexen Konzeptes.................... 184 41 Das Kartenziehverfahren ersetzt komplizierte und belastende Sortiervorgänge ......................................................... 190 42 Bildung von Prioritäten durch „Gewichte“................................ 194 43 Ermittlung des „weitesten Leserkreises“ einer Wochenzeitschrift.......................................................................... 198 44 Ermittlung des „Lesers pro Nummer“......................................... 200 45 Allgemein gehaltene Ermittlung von Leseinteressen ............... 202 46 Copytest .......................................................................................... 203 47 Gestützter Geografietest mit Landkarte ..................................... 208 48 Suggestivfrage zur Ermunterung bei „sozial unerwünschtem“ Verhalten ......................................................... 212 49 Suggestivfrage, kombiniert mit suggestiver Gestaltung der Antwortkategorien ................................................................. 213 50 Secret-Ballot-Frage ........................................................................ 216 51 Konzentrationstest......................................................................... 225 52 Ein Indikator für technische Intelligenz .................................... 227 53 Meinungsklimafrage...................................................................... 231 54 Der Buhtest .................................................................................... 232 55 Emotionstest................................................................................... 233 56 Satzergänzungstest ........................................................................ 238 <?page no="313"?> Verzeichnis der Fragebeispiele 314 57 Experimenteller Anzeigentest mit Kartenziehverfahren .......... 250 58 Mason Haires Marktforschungsexperiment 1949 ..................... 254 <?page no="314"?> 315 Index abhängige Variable, 89, 90 Abkürzungsstrategien, 39, 42, 113 Ablenkung, 69 Ablenkungsfrage, 67, 95 Adenauer, Konrad, 62, 162 Akkerboom, Hans, 267 Aktivierung der Befragten, 82 Alkoholkonsum, 38, 71, 211, 215 Allensbacher Markt- und Werbeträger-Analyse (AWA), 84, 85 Alltagssprache, 45, 57, 61, 123, 171, 266 Amtssprache, 45 Analyse und Synthese, 25 Analysefrage, 88, 89, 91, 127 Analysegruppen, 91 Anonymitätsgebot, 168 Anschreiben an die Interviewer, 285 Antwortbereitschaft, 18, 82 Anzeigentest, 249, 250, 251 Archivierung, 288 Assimilations-Effekt, 270 Assoziationsprofil, 11, 153, 175 Assoziationstest, 11, 175, 177, 178, 237 assoziatives Lernen, 56, 197 Audio-Elemente, 205 Aufmerksamkeit, 17, 67, 69, 70, 71, 73, 81, 95, 180 Augenbewegungen, 204 Ausdruckstest, 163 Ausgleichsfrage, 97 Aussagebarrieren, 38, 72, 209, 215, 220 Ausweichkategorie, 154, 160, 161, 162 Autoritäten, 80 balancierte Frageformulierung, 110, 112 Ballonfrage, 183 Begleitschreiben, 96 Bildhintergrund, 282 Bildsignale, 255 Bildvorlage, 139 biografische Fragetechniken, 201 bipolare Skala, 147 Bradburn, Norman, 37 Brainstorming-Effekt, 267 Brosius, Hans-Bernd, 74 Buhtest, 231, 232, 233 Buser, Remo, 24 Campbell, Donald, 243 Cantril, Hadley, 9, 37, 111, 140, 147, 148, 247 captive audience, 43 Card Sorting, 188 Clusteranalyse, 75 Codeziffern, 286 Columbia-Universität, 230 <?page no="315"?> Index 316 computergestützte Umfragen, 99 Conjoint-Messung, 187, 188 Copytest, 201, 203, 204, 205, 268 Cronbachs Alpha, 79 Crossley, Archibald, 111, 247 Csikszentmihalyi, Mihaly, 81 Datenfusion, 84 Datenniveaus, 133, 135, 136, 138 Davison, W. Phillips, 290 DemoSCOPE, 35 Demoskopie, 88 Denkfaulheit, 165 Descartes, René, 195 Dialogfrage, 180, 181, 183, 237, 269, 274 Differenzierungskraft, 74, 167, 224 Dillman, Don, 82 direkte Frage, 220, 222, 223, 224, 259 Dodd, Stuart, 88 Doppel-Blindversuch, 246, 250 Douglas, Mary, 38 Dramaturgie des Fragebogens, 17, 63, 87 Drogenkonsum, 215, 218 Dummytest, 205 Durkheim, Émile, 11, 219 Eindimensionalität, 110, 116, 183 Einfachantwort, 128 Einfachheit, 56 Einleitungsfloskel, 54, 60, 93, 95, 212 Einleitungstext, 283 Einstellungsfrage, 87 Einzelfalldiagnose, 78 Eisbrecherfrage, 69, 91, 92, 93, 94, 95, 268 Ekman, Paul, 163 Emotionstest, 233, 234, 235 Entdeckungspotenzial, 242 ergebnisorientierte Forschung, 210 Erinnerungsstützen, 208 erkenntnisorientierte Forschung, 210 Experimentalgruppe, 244, 245, 246, 250, 252 Exploration, 104 Eyetracking, 204 Fachsprache, 59, 62, 110, 168 Facial Action Coding System, 164 Faktfrage, 87, 88, 289 Faktorenanalyse, 19, 75, 137, 138, 139 Fehldiagnose, 227 Fehlertoleranzen, 245, 246 Feldarbeit, 13, 16, 27, 34, 37, 193, 274, 276, 285, 287 Feldexperiment, 40, 41, 161, 176, 242, 248, 252, 256, 258 Feldverschlüsselung, 107, 108, 109, 165, 208 Festigkeit von Meinungen, 157 Festinger, Leon, 212 Filterfrage, 69, 96, 97, 98, 122, 268 formale Klassifizierungen, 87 Fortschrittsbalken, 83 Fragebogeneffekte, 37, 283 Fragebogenexperiment, 9, 247 Fragebogenkonferenz, 120, 216, 265, 266, 267, 268, 271, 272, 280 <?page no="316"?> Index 317 Fragebogenlänge, 81 Frame, 47, 102 Frankfurter Zeitung, 265 Fremdwörter, 56, 96 Frey, Siegfried, 150 Friesen, Wallace, 163 funktionale Fragen, 91 Gallup, George, 9, 111, 201, 265 gegabelte Befragung, 41, 242, 245, 246 Geisteswissenschaften, 23 Geografietest, 208 geschlossene Frage, 100, 101, 105, 106, 111, 124, 175 Gesprächsleitfaden, 27, 28, 29 gestützte Ermittlung, 102, 196, 201 Glanvill, Joseph, 229 Glücksempfinden, 81 Grimm, Jacob und Wilhelm, 171 Gruppenpersönlichkeit, 23 Haire, Mason, 252, 254 Halbgruppen, 70 Haumann, Wilhelm, 89 heikle Ermittlungen, 71, 215 Herauslösung von Begriffen, 177 Heuristiken, 42, 45, 113, 248 Hippler, Hans-Jürgen, 247 Höflichkeit, 54, 60 hypothetische Situation, 51 Ich-Ideal, 50, 212, 220 Indikator, 11 Indikator-Frage, 95, 219, 220, 222, 223, 224, 225, 226, 229, 230, 231, 233, 235, 236, 237, 248, 253, 256 indirekte Frage, 218, 220 Individualdiagnostik, 11, 80 Individualpsychologie, 52, 181, 226, 236, 240 informelle Frage, 97 Inhaltsanalyse, 205 Institut für Demoskopie Allensbach, 9, 15, 21, 35, 51, 58, 74, 107, 146, 162, 192, 210, 216, 234, 267, 277, 285, 287 Institut für Publizistik der Universität Mainz, 9, 284 Instrumentenzerfall, 273, 274 Intelligenztest, 228 Intensiv-Interviews, 27, 28 Intervallskala, 135, 136 Interviewabbruch, 55, 83 Interviewer, 17, 33, 35, 37, 76, 81, 84, 98, 163, 180 Intervieweranweisung, 96, 97 Interviewerbeobachtung, 162, 163, 164, 166, 167 Interviewer-Einstufung, 98, 99 Interviewer-Instruktion, 284 Interviewlänge, 83 Interviewprozess, 18, 33, 85 Item-Liste, 74, 80, 138, 139, 163 Jackob, Nikolaus, 205 Jandura, Olaf, 74 Ja-Nein-Frage, 111, 124, 133, 134 Jargon, 56, 59, 110, 186 Kartenspiel mit Verteilvorgang, 147 Kartenspielfrage, 70, 83, 127, 131, 147 <?page no="317"?> Index 318 Kartenziehverfahren, 190, 249, 250, 252, 268 Kasten-Frage, 131, 132, 133, 169, 198, 200, 286 Kategorienschema, 106, 107, 242 Kaufbereitschaft, 259 Kaufmotive, 257 Kauftest, 169 Kausalnachweis, 246 Klarheit, 23 kognitive Dissonanz, 39, 50, 212, 224 kognitive Interviews, 276 kognitive Psychologie, 12, 37, 40, 247, 269, 275 kognitive Belastung, 47 Kommunikationswissenschaft, 19, 229, 242, 290 Konkretisierung, 171, 172, 173, 174, 198 Konsistenz, 230 Kontext-Effekte, 70, 71, 214, 247, 269, 270, 271 Kontrast-Effekt, 270 Kontrollgruppe, 244, 245, 246 Konzentration, 17 Konzentrationstest, 225, 226 Krosnick, Jon, 63, 64 Laborexperiment, 19, 43, 96, 150, 151, 244, 245 Laborforschung, 77, 80, 188, 204 Labortest, 187 Lazarsfeld, Paul, 201, 230 Legen des Fragebogens, 271 Lesefrequenzen, 199 Leser pro Nummer (LpN), 199, 200 Leserschaftsforschung, 196 Leserzahlen, 89 Levenstein, Adolf, 236, 237 Likert, Rensis, 138 Likert-Skala, 72, 74, 138, 139, 147, 148 Linguistik, 40 Links-Rechts-Skala, 146 Listenfrage, 69, 125, 127, 128, 129, 130, 131, 133, 179, 222, 268, 269 Looking-glass Perception, 31 Ludwig, Jacob, 270 Ludwig-Kartenziehverfahren, 249 Mai, Hans-Peter, 270 Marktforschung, 23, 31, 34, 72, 101, 168, 187, 206, 210, 220, 222, 255, 256 Markt-Media-Studien, 84, 91 Maßband, 146 Mead, George Herbert, 39 Media-Analyse (MA), 84 Mediaforschung, 85 Medieninhaltsanalyse, 19 Mediensprache, 56, 57 Medienwirkungsforschung, 254 Mehrfachantworten, 117, 128 Mehrfachauswahl, 124, 128 Mehrthemenumfrage, 98, 162 Meinungsfrage, 133, 145, 155 Meinungsklima, 118, 220, 229, 230, 231, 232 Meinungsklimafrage, 230, 231 Merkmalsbereich, 23 Messniveaus, 134, 135, 136 metrisches Datenniveau, 136 Miller, George A., 40 Missing Value, 160 Misstrauen der Befragten, 55, 71 <?page no="318"?> Index 319 Mittelposition, 74, 157 Mittelpunkt einer Skala, 146 Mohler, Peter, 281 Monolog, 184, 185, 186 Monotonie, 34, 54, 64, 72, 73, 75, 80, 129, 137, 147, 248, 269 moralische Widerstandskraft, 33 Motivfrage, 87, 88 Multiple-Choice-Format, 103 multivariate Analysen, 31, 75, 137 Murray, Henry, 240 Mystery Shopping, 168, 272 Nachfragen, 44 Naturgesetze, 24 Naturwissenschaften, 20, 24, 243 neutralisierte Bildvorlage, 206, 207 Nietzsche, Friedrich, 266 Noelle-Neumann, Elisabeth, 9, 10, 11, 12, 33, 125, 229, 265 nominales Datenniveau, 133, 134 Nonsens-Frage, 211 Nonsens-Grenze, 211 Normalzustand, 243 Nullpunkt, 136 Nummerierung der Fragebogen, 287 offene Frage, 100, 101, 102, 103, 104, 105, 106, 107, 109, 175, 176, 196, 208 öffentliche Meinung, 12, 118, 229 Online-Umfrage, 33, 38, 60, 82, 97, 127, 133, 139, 147, 205, 282, 283, 284 optische Elemente, 205 optische Skala, 136 ordinales Datenniveau, 134, 135 Paarvergleich, 187 Payne, Stanley, 9 persönliche Befragung, 38, 60, 83, 97, 103, 124, 127, 129, 139, 140, 147, 162, 180, 205, 284, 285 Philosophie, 25 Physik, 24 Platon, 68 Platzwechseltest, 260, 262 Polaritätenprofil, 11, 32 Politikwissenschaft, 18, 242 Porst, Rolf, 281, 282 Preisschwellentest, 259, 261 Presser, Stanley, 154, 161, 270 Pretest, 193, 269, 276, 277, 278, 279, 281 primacy effect, 153 Priming, 270 Prioritätenentscheidung, 192, 193, 194 Probeinterviews, 193, 275, 276, 277, 285 Programmfrage, 10, 11, 26, 27, 49, 50, 51, 53, 230, 267 projektiver Test, 181, 186, 231, 237, 240, 241, 253, 258, 277 Psychologie des Interviews, 18, 30, 31 psychologischer Druck, 18, 212 Public Opinion Quarterly, 9, 290 Pufferfrage, 70, 95 Q-Sort, 188 <?page no="319"?> Index 320 qualitative Forschung, 20, 27, 52, 53, 241 quantitative Forschung, 20, 53, 80, 181, 188 Rangfolgen, Rangreihen, 32, 188, 189 rationales Datenniveau, 136 Rationalisierung, 18, 50, 189, 220, 259 Recency-Effekt, 269 Regieanweisung, 30, 67, 96, 193 Regressionsanalyse, 137 Reihenfolgeeffekte, 242, 247, 269 Reinecke, Sven, 224 Repräsentativität, 246 Response Sets, 74, 75 Ring, Erp, 73, 167, 179, 240, 255 Roper, Elmo, 111, 247 Rorschach-Test, 226 Rossiter, John D., 79 Rückübersetzung, 11 Rugg, Donald, 37, 111, 247 Rundfunkhörerforschung, 201 Satzergänzungstest, 237, 238, 239 Schema-Theorie, 47 Scheuch, Erwin, 58 Schiemenz, Cathrin, 216 Schiller, Friedrich, 25 Schlüsselbegriffe, 44, 45 Schlussfrage, 93, 94, 95 Schnapper-Arndt, Gottlieb, 218, 219 Schneller, Hans, 5, 255 Schopenhauer Arthur, 80, 213 schriftliche Befragung, 60, 82, 85, 97, 127, 139, 147, 150, 205, 286 Schrifttypen, 282 Schulz, Winfried, 245 Schuman, Howard, 154, 161, 270 Schwarz, Norbert, 37, 40, 212, 214, 247, 270 Schwarzenauer, Wilhelm, 21 Schweigespirale, 10, 229 Secret Ballot, 71, 215, 216, 218 Selbsttäuschung, 18, 50, 259 selbstverankernde Skala, 147, 148, 150 semantisches Differential, 150, 151, 153 single source, 84 Skala der Persönlichkeitsstärke, 139 Skalen, 26, 32, 35, 63, 64, 79, 133, 135, 137, 138, 140, 141, 146, 147, 157, 268, 291 Skalenlogik, 31, 289, 290, 291 Skalenvorlage, 140, 143, 144, 146, 148, 157 sokratisches Gespräch, 68 Sonntagsfrage, 89, 128 Soundbites, 179 soziale Erwünschtheit, 37, 38, 39, 50, 211, 215, 240 soziale Konditionierung, 56 soziale Kontrolle, 39 soziale Schicht, 71, 165, 166, 167 sozialoptische Täuschung, 118 Sozialpsychologie, 244 Soziologie, 18, 37, 138, 242, 289 Spannungsbogen, 68, 81, 82 <?page no="320"?> Index 321 Spielfrage, 69, 70, 82, 83, 95, 268 Split-Ballot-Experiment, 41, 242, 245, 246, 247, 248 Standardisierung, 17, 18, 21, 27, 97, 100, 101, 133 Stanley, Julian, 243 Stapel, Jan, 140 Stapel-Skala, 140, 142, 249 Startbildschirm, 283 State-Trait-Ärger- Ausdrucksinventar (STAXI), 77 statistische Ermittlungen, 55, 71, 93, 216 Staubsauger-Kategorie, 271 Steuerungselemente, 91 Steuerungsfrage, 67, 69 Stichprobenmethode, 12 Stichprobenstatistik, 9, 31 Stimmung, 17 Strack, Fritz, 270 Subtraktions-Effekt, 271 Sudman, Seymour, 37 Suggestivfrage, 114, 210, 211, 212, 213, 218, 247, 266, 268 symbolischer Interaktionismus, 39 Tagesverlaufskurven, 201 taktische Frage, 67 tauber Interviewer, 75, 76, 77, 80, 139 teilnehmende Beobachtung, 163 Telefonlabor, 35 Telefonumfrage, 35, 38, 60, 82, 83, 97, 129, 130, 139, 140, 157, 180, 282 Testfrage, 11, 27, 49, 50, 51, 52, 53 thematischer Apperzeptionstest (TAT), 240 Themenwechsel, 49, 82, 83, 95 Thermometer-Skala, 140, 147 Think-Aloud-Technik, 53, 275 Titelkarten, 198, 200 Titelseite, 282, 283 Trainingsfrage, 95, 96 Trendfrage, 273, 287, 288 Trendpflege, 287 Trendvergleich, 111 Trialog, 183 Überforderung, 74 Umfrageforschung für die Rechtspraxis, 206, 277 unabhängige Variable, 89, 90, 91 unbalancierte Frage, 111, 112 Unentschieden-Antworten, 144, 154, 155, 156, 157, 160, 162 ungestützte Erinnerung, 102 unipolare Skala, 147 Universität Mainz, 54, 125, 131, 158 Unterbrechung, 85 Ursache-Wirkung-Annahme, 90 Validität, 39, 47, 56, 73, 75, 79, 137, 138, 206, 244 Verallgemeinerbarkeit, 21, 27, 43, 109, 175 Verbalskala, 72, 135 Verein für Socialpolitik, 236 Verhaltensfrage, 87, 88, 133 Verschlüsselung, 33, 106, 107, 109, 208 Verständlichkeit, 56 Verwechslungsgefahr, 260, 262, 263 Videoelemente, 205 <?page no="321"?> Index 322 Vorher-Nachher-Messung, 243 Wahlforschung, 128, 215 Wahrscheinlichkeitsrechnung, 20 Warum-Frage, 49, 220 Was-Wäre-Wenn-Frage, 49 Weaver, Warren, 24 Weber, Max, 236, 237 weitester Leserkreis (WLK), 198, 199 Werbefernsehen, 41 Widersprüche im Antwortverhalten, 68, 224 Wiedererkennen, 206 Willis, Gordon, 276 Wirtschaftswissenschaften, 77, 138 Wissensfrage, 51, 58, 87, 88, 103, 145, 284 Worcester, Robert M., 87 World Association for Public Opinion Research (WAPOR), 74, 168 Würden-Sie-Wenn-Frage, 49 Zeisel, Hans, 101, 237 Zeitraffertest, 251, 253 Zentrum für Umfragen, Methoden und Analysen (ZUMA), 281 Zerback, Thomas, 205 Zerlegung, 24, 178 Zetterberg, Hans, 38, 205, 211 Zielfrage, 89, 90 Zwei-Speicher-Modell, 179