eBooks

Wirtschaftsstatistik: 77 Aufgaben, die Bachelorstudierende beherrschen müssen

0423
2018
978-3-8385-4912-5
978-3-8252-4912-0
UTB 
Jutta Arrenberg

Das Must-have für angehende BWLer und VWLer Die Leser dieses Buches bewahren in der Statistikprüfung einen kühlen Kopf: Jutta Arrenberg stellt 77 Klausuraufgaben mit Lösungen vor. Auf häufig gemachte Fehler weist sie explizit hin, ebenso auf die aufzuwendende Zeit und den Schwierigkeitsgrad pro Aufgabe. Zudem verrät sie, wie sich Studierende richtig auf die Prüfung vorbereiten und gibt Tipps für die Klausur. Die wichtigsten Formeln finden sich am Ende des Buches.

<?page no="2"?> Jutta Arrenberg Wirtschaftsstatistik 77 Aufgaben, die Bachelorstudierende beherrschen müssen UVK Verlagsgesellschaft mbH Konstanz mit UVK/ Lucius München <?page no="4"?> Jutta Arrenberg ist Professorin für Wirtschafts- und Finanzmathematik sowie Wirtschaftsstatistik an der TH Köln. Online-Angebote oder elektronische Ausgaben sind erhältlich unter www.utb-shop.de. Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.ddb.de> abrufbar. Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. © UVK Verlagsgesellschaft mbH, Konstanz und München 2018 Lektorat: Rainer Berger, München Einbandgestaltung: Atelier Reichert, Stuttgart Einbandmotivund Piktogramme im Buch: © yuoak, iStock Druck und Bindung: CPI, Clausen & Boss , Leck UVK Verlagsgesellschaft mbH Schützenstr. 24 · 78462 Konstanz Tel. 07531-9053-0 · Fax 07531-9053-98 www.uvk.de UTB-Nr. 4912 ISBN 978-3-8252- 4912-0 <?page no="5"?> Vorwort Dieses Buch ist ein Lotse durch unterschiedliche Aufgaben aus Statistik-Klausuren. Es erklärt, wie aus der Fragestellung einer Klausuraufgabe, die Anweisung - also was zu rechnen ist - zu erkennen ist. Außerdem weist das Buch auf häufige Fehler in Klausuren hin. Und zu jedem Thema gibt es Tipps, die aus meinen Antworten zu Fragen während meiner Statistik-Vorlesungen zusammengestellt sind. Das Buch richtet sich an Studierende, die schon die Vorlesungen zur Statistik besucht haben oder sich autodidaktisch Statistik angeeignet haben und jetzt kurz vor der Klausur stehen. Als Klausurvorbereitung habe ich 77 typische Aufgaben herausgesucht, die auf meiner 20-jährigen Tätigkeit als Professorin an der Technischen Hochschule Köln beruhen. Zu jeder Aufgabe wird der Schwierigkeitsgrad in den drei Stufen einfach, mittelschwer, schwer angegeben und es wird die Zeit vorgegeben, die in der Klausur zur Bearbeitung der Aufgabe zur Verfügung steht. Das Besondere an diesem Übungsbuch ist die ausführliche Darstellung der Musterlösungen. Besonderen Wert habe ich auf die Struktur der Lösungswege gelegt. Viele Aufgaben lassen sich zwar mit gesundem Menschenverstand lösen, ohne die dahinter liegende Theorie zu kennen. Jedoch benötigt ein weit größerer Teil der Studierenden eine strukturierte Handlungsanweisung für eine Lösung. Außerdem habe ich zu einigen Aufgaben gleich mehrere Lösungswege aufgeschrieben, damit möglichst viele Studierende die Lösung verstehen und somit die Klausur bestehen. Ich wünsche den Leserinnen und Lesern dieses Buches viel Erfolg für die Statistik- Klausur! Köln, im Februar 2018 Jutta Arrenberg v <?page no="7"?> Inhaltsverzeichnis 1 Wichtiges vorab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Wieso Statistik? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Bearbeitungshinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Vor der Klausur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Während der Klausur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.5 Nach der Klausur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.6 Checkliste zur Klausur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Skalierung von Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.1 Diskrete Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Stetige Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3 Kennzahlen aus Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1 Einzeldaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.2 Tabellierte Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.3 Klassierte Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.4 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4 Rechnen mit Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . 21 4.1 Zwei Ereignisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 4.2 Drei oder mehr Ereignisse . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.3 Laplace-Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.4 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.1 Stochastische Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.2 Verteilung der Summe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 28 6 Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6.1 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6.2 Umkehrregression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 34 7 Indexrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 7.1 Tabelle mit Werten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 7.2 Tabelle mit Raten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 7.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 42 vii <?page no="8"?> viii Inhaltsverzeichnis 8 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 8.1 Exakte Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 8.2 Approximative Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 8.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 50 9 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 9.1 Exakte Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 9.2 Approximative Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 9.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 57 10 Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 10.1 Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 10.2 Anteilswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 10.3 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 63 11 Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 11.1 Gaußtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 11.2 t -Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 11.3 Chi-Quadrat-Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . 67 11.4 Chi-Quadrat-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . 68 11.5 Häufige Fehler in Klausuren . . . . . . . . . . . . . . . . . . . . . . . . . . 68 12 Gemischte Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Lösungen Lösungen zu Kapitel 2: Skalierung . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Lösungen zu Kapitel 3: Kennzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten . . . . . . . . . . . . . 101 Lösungen zu Kapitel 5: Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . 109 Lösungen zu Kapitel 6: Lineare Regression . . . . . . . . . . . . . . . . . . . . . . 111 Lösungen zu Kapitel 7: Indexrechnung . . . . . . . . . . . . . . . . . . . . . . . . 117 Lösungen zu Kapitel 8: Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . 123 Lösungen zu Kapitel 9: Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . 133 Lösungen zu Kapitel 10: Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . 141 Lösungen zu Kapitel 11: Statistische Tests . . . . . . . . . . . . . . . . . . . . . 147 Lösungen zu Kapitel 12: Gemischte Aufgaben . . . . . . . . . . . . . . . . . . . . 155 Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 Tipp- und Wissen-Verzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 <?page no="9"?> Abkürzungs- und Symbolverzeichnis Abkürzungen BV Binomialverteilung d. h. das heißt GE Geldeinheit H. Häufigkeit Häufigk. Häufigkeit hypergeom. hypergeometrische Verteilung KI Konfidenzintervall kum. kumuliert ME Mengeneinheit NV Normalverteilung rel. relativ stoch. stochastisch unabh. unabhängig Wkt. Wahrscheinlichkeit z. B. zum Beispiel ZGWS Zentraler Grenzwertsatz Symbole X statistische Variable oder Zufallsvariable x Realisation von X x 1 , x 2 , . . . , x n Stichprobe aus X vom Umfang n bzw. Urliste bzw. Einzeldaten bzw. univariater Datensatz x 1 , x 2 , . . . , x m tabellierte Daten i Nummerierung der tabellierten Werte; i = 1 , 2 , . . . , m n i absolute Häufigkeit des tabellierten Wertes x i n i n = f ( x i ) = f i relative Häufigkeit des tabellierten Wertes x i F ( x i ) kumulierte relative Häufigkeit des tabellierten Wertes x i x ∗ 1 , x ∗ 2 , . . . , x ∗ k Klassenobergrenzen eines klassierten Datensatzes ix <?page no="10"?> x Abkürzungs- und Symbolverzeichnis j Einfallsklasse bzw. Nummerierung der Klassen eines klassierten Datensatzes; j = 1, 2, . . . , k n j absolute Häufigkeit der Werte in der j -ten Klasse eines klassierten Datensatzes n j n relative Häufigkeit der Werte in der j -ten Klasse eines klassierten Datensatzes F ( x ∗ j ) kumulierte relative Häufigkeit an der Klassenobergrenze x ∗ j eines klassierten Datensatzes b j Breite der j -ten Klasse eines klassierten Datensatzes x ′ j Klassenmitte der j -ten Klasse eines klassierten Datensatzes x p p · 100 -Prozentpunkt x arithmetisches Mittel s 2 x = s 2 empirische Varianz s x = s empirische Standardabweichung v x = v Variationskoeffizient x min kleinster Wert der Stichprobe x 1 , x 2 , . . . , x n x max größter Wert der Stichprobe x 1 , x 2 , . . . , x n ( x 1 , y 1 ) , ( x 2 , y 2 ) . . . , ( x n , y n ) bivariater Datensatz vom Umfang n n i j absolute Häufigkeit der Wertekombination ( X = x i und Y = y j ) s x y empirische Kovarianz r x y = r empirischer Korrelationskoeffizient von Bravais-Pearson a 1 + b 1 · x Regressionsgerade der Regression von Y auf X a 2 + b 2 · y Regressionsgerade der Regression von X auf Y B empirisches Bestimmtheitsmaß p 0 i Preis für eine ME des Guts i im Basisjahr null p t i Preis für eine ME des Guts i im Berichtsjahr t q 0 i Menge des Guts i im Basisjahr null q t i Menge des Guts i im Berichtsjahr t P P a 0 t = P P a Preisindex von Paasche mit dem Basisjahr null und dem Berichtsjahr t P La 0 t = P La Preisindex von Laspeyres mit dem Basisjahr null und dem Berichtsjahr t Q P a 0 t = Q P a Mengenindex von Paasche mit dem Basisjahr null und dem Berichtsjahr t Q La 0 t = Q La Mengenindex von Laspeyres mit dem Basisjahr null und dem Berichtsjahr t W 0 t = W Wertindex mit dem Basisjahr null und dem Berichtsjahr t <?page no="11"?> Abkürzungs- und Symbolverzeichnis xi S Ergebnismenge eines Zufallsexperiments A Ereignis A Komplementärereignis A ∩ B Durchschnitt der beiden Ereignisse A, B A ∪ B Vereinigung der beiden Ereignisse A, B A \ B Differenz des Ereignisses A ohne das Ereignis B P ( A ) Wahrscheinlichkeit für das Eintreten des Ereignisses A P ( A | B ) bedingte Wahrscheinlichkeit für das Ereignis A , wenn das Ereignis B schon eingetreten ist ( n k ) Binomialkoeffizient F empirische oder theoretische Verteilungsfunktion E [ X ] = μ Erwartungswert der Zufallsvariablen X V ar [ X ] = σ 2 theoretische Varianz der Zufallsvariablen X σ theoretische Standardabweichung p Anteilswert in der Grundgesamtheit B( n ; p ) Binomialverteilung mit den Parametern n und p H( N ; M ; n ) hypergeometrische Verteilung mit den Parametern N, M und n N( μ ; σ 2 ) Normalverteilung mit den Parametern μ und σ 2 N( μ ; σ ) Normalverteilung mit den Parametern μ und σ F U Verteilungsfunktion der Standard-Normalverteilung u p p · 100 -Prozentpunkt der Standard-Normalverteilung 1 − α Konfidenzniveau ̂ p Anteilswert in einer Stichprobe ε halbe Breite eines Konfidenzintervalls H 0 Nullhypothese eines Tests H 1 Gegenhypothese eines Tests Fehler 1. Art irrtümliche Ablehnung der Nullhypothese α theoretisches Signifikanzniveau eines Tests, obere Grenze für die Wahrscheinlichkeit des Fehlers 1. Art p -Wert kleinst-möglicher Wert für α , damit der Test zum Niveau α die Nullhypothese noch ablehnt χ 2 Chi-Quadrat <?page no="12"?> xii Abkürzungs- und Symbolverzeichnis Emoticons Lösungen Schwierigkeitsgrad/ Bearbeitungszeit Häufig gemachte Fehler Tipp Wissenswertes/ Hintergrundwissen Checkliste Formeln Literatur <?page no="13"?> Kapitel 1: Wichtiges vorab Es gibt viele Gründe, Statistik zu lernen. Die meisten Studierenden lernen Statistik, weil das so in ihrem Studienverlaufsplan steht. Dabei verkennen sie die Bedeutung dieses Fachgebiets, denn im Berufsleben ist Statistik unverzichtbar. In letzter Zeit mehren sich deswegen die Fälle von Studierenden fachfremder Fakultäten, die freiwillig ohne Anrechnung auf ihre Kreditpunkte die Statistik-Klausur mitschreiben, um in einem geplanten Masterstudium besser vorbereitet zu sein, als ihre Heim- Fakultät dies ermöglicht. Auch im Privatleben hat die Statistik Einzug gehalten: im Mutterpass beispielsweise ist für den Vergleich der Entwicklung eines Kindes das zweifache zentrale Schwankungsintervall von gesund verlaufenen Schwangerschaften eingetragen, Schwellenwerte bei Blutuntersuchungen basieren ebenfalls auf Werten des zweifachen zentralen Schwankungsintervalls von gesunden Probanden, Deutung von Heilungschancen bei bestimmten Erkrankungen (diese werden ohne Statistik-Kenntnisse häufig falsch interpretiert), um nur einige Beispiele zu nennen. 1.1 Wieso Statistik? Statistik ist unverzichtbar in den Wirtschaftswissenschaften. Am häufigsten kommt die Statistik zur Anwendung, wenn erhobene Daten ausgewertet werden sollen. Aufgrund der fortschreitenden Digitalisierung fällt zunehmend sehr umfangreiches Datenmaterial an, aus dem Erkenntnisse und Entscheidungen abgeleitet werden sollen. Hierzu sind geeignete Auswertungsmethoden, die von der Statistik bereit gestellt werden, erforderlich. 1 <?page no="14"?> 2 Kapitel 1: Wichtiges vorab Neben der Berechnung von Kennzahlen aus erhobenen Daten sind in der Statistik Prognosewerte von großer Bedeutung. Um die Güte/ Präzision solcher Prognosewerte angeben zu können, wird die Wahrscheinlichkeitsrechnung herangezogen. Kaum eine Abschlussarbeit im Fachgebiet Wirtschaftswissenschaften kommt ohne statistische Auswertungen aus. Erst dann wird den Studierenden die Wichtigkeit des Faches Statistik bewusst. Spätestens im Berufsleben wird klar, in welcher Breite das Fach Statistik Einzug gehalten hat ins Berufsleben: Korrelationsberechnung im Personalwesen (Krankheitstage, offene Stellen, Überstunden etc.), Risikomaße im Finanzwesen (Erwartungswerte, Value at Risk, Volatilität etc.), durchschnittliche jährliche prozentuale Veränderungen (geometrisches Mittel), Sensitivitätsanalysen (bedingte Wahrscheinlichkeiten). Was auch immer Ihr Grund ist, Statistik zu lernen, die nachfolgenden Kapitel sollen Sie dabei unterstützen, die Klausur mit einer guten Note abzuschließen. 1.2 Bearbeitungshinweise Oft berichten Studierende, sie hätten alle Klausuraufgaben lösen können und seien nur deshalb durch die Klausur gefallen, weil sie für die Bearbeitung der Aufgaben mehr Zeit als vorgesehen benötigt hätten. Um diese Fehleinschätzung zu vermeiden und damit einem Nicht-Bestehen vorzubeugen, ist in diesem Buch bei jeder Aufgabe die jeweilige maximale Bearbeitungszeit vorgegeben. Stoppen Sie deshalb pro Aufgabe Ihre Bearbeitungszeit. Es reicht nicht, die Aufgaben lösen zu können, sondern eine Aufgabe muss binnen der Zeitvorgabe gelöst werden können. Der Schwierigkeitsgrad einer Aufgabe wird in den drei Stufen (einfach, mittelschwer, schwer) vorgegeben. Diese Angaben sollen beim Lernen ein Feedback darstellen, wie weit oder wie nah diese Aufgabe am Lernziel liegt. Ein Prüfling ist in der Klausur häufig aufgeregt, sodass das Üben gerade von schweren Aufgaben sehr wichtig ist. Ist eine Teilaufgabe alphabetisch nummeriert mit [a], [b], [c] usw., so ist die Reihenfolge der Bearbeitung der Aufgabe beliebig. Ist hingegen eine Teilaufgabe mit den Ziffern [1], [2], [3] usw. nummeriert, so muss diese Aufgabe auch genau in dieser Reihenfolge bearbeitet werden. Das Üben für eine Statistik-Klausur sollte idealerweise in zwei Schritten vollzogen werden: Im ersten Schritt werden Aufgaben zu bestimmten Themen geübt, wobei die Überschriften des Themas dem Lernenden bekannt sind. Diese Aufgaben finden Sie im Kapitel 2 bis Kapitel 11. Im zweiten Schritt werden Aufgaben ohne Kenntnis der Einordnung des Themas, also ohne Überschriften, geübt. Diese Aufgaben finden Sie im Kapitel 12. <?page no="15"?> 1.3. Vor der Klausur 3 Formel-Navigator Eine umfassende Formelsammlung befindet sich am Ende des Buches ab der Seite 175. Die Formeln sind nummeriert. Die ausführlichen Lösungen zu den einzelnen Aufgaben beginnen ab der Seite 87. Zum besseren Verständnis dieser Musterlösungen wurde bei jedem Lösungsweg die zugehörige Nummer der Formel aus der Formelsammlung angegeben. 1.3 Vor der Klausur Ein Zeitplan, wann was gelernt wird, ist für eine gute Klausur-Vorbereitung unerlässlich. Außerdem verschafft solch ein Zeitplan Zuversicht, die Klausur auch mit einer guten Note zu bestehen. Zur Erstellung des Zeitplans schreiben Sie sich bitte alle klausurrelevanten Themen auf. Anschließend verteilen Sie die Themen gleichmäßig auf die verbleibenden Tage bis zur Klausur. Für das Fach Statistik muss in zwei Stufen geübt werden. In der ersten Stufe wird das Verständnis für die Formeln aus der Formelsammlung geübt. Dazu werden in die Formeln Zahlen eingesetzt und die Rechnungen werden in den Taschenrechner eingetippt. Wird der Umgang mit den Formeln sicher beherrscht, folgt in einer zweiten Stufe das Erkennen, was überhaupt gerechnet werden soll. Dieses Erkennen ist in der Statistik schwieriger als das Rechnen. Nichts beruhigt vor der Klausur die Nerven so gut wie das Erfolgserlebnis, Aufgaben lösen zu können. Am Abend vor der Klausur legen Sie bitte sämtliche Utensilien für die morgige Klausur griffbereit hin: erlaubte Hilfsmittel wie z. B. Taschenrechner, Schreibmaterial mit Ersatzstift (kein Bleistift), Stifte in bunten Farben zum Markieren (bitte kein Rot), ggf. eine Uhr (Vorsicht: Mobiltelefone sind in Klausuren nicht zugelassen, sie gelten als Täuschungsversuch). Falls erlaubt, so nehmen Sie sich etwas zu trinken mit, am besten Wasser oder Tee. Und falls die Klausur lang ist, nehmen Sie sich auch etwas zu essen mit. Kaugummi und Nüsse sind sehr gut, weil sie die Durchblutung des Gehirns fördern. 1.4 Während der Klausur Als erstes tragen Sie bitte Ihren Namen auf das Deckblatt der Klausur in das dafür vorgesehene Namensfeld ein. Lesen Sie eine Aufgabe vor der Bearbeitung einmal komplett durch und achten dabei präzise darauf, was genau gefragt ist. Für richtige Antworten auf Fragen, die gar nicht gestellt wurden, gibt es keine Punkte. <?page no="16"?> 4 Kapitel 1: Wichtiges vorab Versuchen Sie, in der Klausur möglichst viele Aufgaben zu bearbeiten. Suchen Sie niemals einen Rechenfehler, wenn Ergebnisse Ihnen nicht sinnvoll erscheinen, da Rechenfehler einen geringeren Punktabzug bedeuten als fehlende bearbeitete Aufgaben. (Häufiger Fehler in der Klausur ist, dass eine Zahl aus der Aufgabenstellung falsch abgeschrieben wird. Diesen Fehler finden Sie während der Klausur nicht.) Markieren Sie wichtige Informationen farblich. Als Buchstaben für Ereignisse wählen Sie die Anfangsbuchstaben der Ereignisse. Schreiben Sie Tabellen bitte nicht ab (das kostet zu viel Zeit), sondern ergänzen Sie die Tabellen in der Aufgabenstellung. Meistens lassen die Prüfer (w,m) in Tabellen genügend Platz für weitere Spalten oder für die letzte Zeile. Fehlen Ihnen zum Weiterrechnen Zwischenergebnisse, so nehmen Sie einen Wert an, den Sie für geeignet halten. Notieren Sie das in Ihrer Klausur „Annahme: Der Wert beträgt . . . “. Rechnen Sie anschließend mit diesem angenommenen Wert weiter, um den Prüfern zu zeigen, dass Sie das Verfahren beherrschen und um ggf. Folgepunkte zu erhalten. Denken Sie an Antwortsätze, wenn die Aufgabe als Frage formuliert ist. Ein kurzer Antwortsatz lautet z. B.: „Der gesuchte Wert beträgt . . . .“ Kontrollieren Sie in der Klausur niemals Ihre Ergebnisse, indem Sie eine Probe rechnen. Es sei denn, Sie haben schon alle Aufgaben gelöst. Hintergrund ist, dass sich einige Prüflinge erst bei der Probe verrechnen und dann richtige Ergebnisse durchstreichen. Manche Prüflinge geraten in Unruhe, wenn der Sitznachbar laut aufseufzt oder permanent mit den Füßen scharrt. (So ist häufig zu beobachten, dass beim Abbruch einer Klausur Sitznachbarn ebenfalls die Klausur abbrechen.) Versuchen Sie deshalb, die Ruhe zu bewahren. Sie haben jetzt keine andere Chance, außer dass Sie alles, was Sie können, aufschreiben. Und versuchen Sie dabei, eine Atmosphäre der Ruhe um sich zu erzeugen, ignorieren Sie die Geräusche Ihrer Sitznachbarn. 1.5 Nach der Klausur Ist eine Klausur erst einmal abgegeben, so haben Sie keinen Einfluss mehr auf die Note. Eine Krankmeldung nach Abgabe der Klausur sieht die Prüfungsordnung nicht vor. Das bedeutet, sobald Sie sich während des Schreibens einer Klausur krank fühlen, sollten Sie die Klausur abbrechen und noch am Klausurtag ein ärztliches Attest einholen und dem Prüfungsamt zukommen lassen, damit dieser Versuch, die Klausur mitzuschreiben, ggf. annulliert wird. Tauschen Sie sich nach der Klausur mit anderen Prüflingen über die Ergebnisse der Aufgaben aus. Das beruhigt und schweißt zusammen. <?page no="17"?> 1.6. Checkliste zur Klausur 5 1.6 Checkliste zur Klausur In der nachfolgenden Liste sind einige Punkte zusammengefasst, die zum Bestehen einer Klausur sehr hilfreich sind: Checkliste: Daran sollten Sie unbedingt denken! Studierendenausweis mit Lichtbild mitnehmen. Uhr mitnehmen (Mobiltelefone zu Hause oder im Schließfach der Hochschule oder ausgeschaltet in Ihrer Aktentasche deponieren). Zugelassene Hilfsmittel wie z. B. Taschenrechner mitnehmen. Schreibutensilien plus Ersatzstift mitnehmen. Ggf. Trinken und Essen mitnehmen. Versuchen Sie in der Klausur ruhig zu bleiben unabhängig vom Verhalten Ihres Sitznachbarn. Lesen Sie eine Aufgabe vor der Bearbeitung einmal vollständig durch. Bearbeiten Sie so viele Aufgaben wie eben möglich. Suchen Sie keine Rechenfehler in der Klausur. Rechnen Sie niemals eine Probe in der Klausur. Erweitern Sie Tabellen im Aufgabentext, anstatt die Tabellen erneut abzuschreiben. Eine als Frage formulierte Aufgabe erfordert für die volle Punktzahl einen Antwortsatz. <?page no="19"?> Kapitel 2: Skalierung von Variablen Das sollten Sie wissen! Es werden im Wesentlichen drei Skalierungen einer statistischen Variablen unterschieden: nominal, ordinal und metrisch. Eine diskrete statistische Variable kann gemäß einer dieser drei Skalierungen skaliert sein. Eine stetige statistische Variable ist metrisch skaliert. Werden jedoch die Beobachtungen x 1 , x 2 , . . . , x n einer stetigen Variablen (z. B. „Einkommen“) klassiert, so ist die transformierte Variable („Einkommensklasse“), die lediglich die Klassennummer j angibt, ordinal skaliert. 2.1 Diskrete Variablen Aufgabe 2.1 Schwierigkeit: einfach Zeit: 4 Minuten Ein Unternehmen hat die monatlichen Bruttogehälter in EUR in einem Produktionsbereich mit 200 Beschäftigten untersucht. Die Auswertung der Unterlagen der Buchhaltung lieferte die folgenden Werte: 7 <?page no="20"?> 8 Kapitel 2: Skalierung von Variablen Klassen-Nr. Bruttomonatsgehalt Anzahl über . . . bis maximal . . . Beschäftige (in EUR) 1 500 bis 1 500 40 2 1 500 bis 2 500 64 3 2 500 bis 3 500 80 4 3 500 bis 4 500 12 5 4 500 bis 5 500 4 Summe 200 Welche Skalierung weist die statistische Variable „monatliches Bruttogehaltsklasse eines Beschäftigten“ auf? Ist die Variable stetig oder diskret? 2.2 Stetige Variablen Aufgabe 2.2 Schwierigkeit: einfach Zeit: 4 Minuten Im Rahmen einer Befragung von 100 Studierenden wurde die wöchentliche Nachbereitungszeit in Stunden für die Vorlesungen Volkswirtschaftslehre und Statistik erfasst. Anschließend wurden die Daten klassiert. Die Ergebnisse der Befragung sind der folgenden Tabelle zu entnehmen: Wöchentliche Nachbereitungszeit in Stunden Volkswirtschaftslehre (Anzahl Studierende) Statistik (Anzahl Studierende) 0 bis unter 0,5 20 18 0,5 bis unter 1,5 25 32 1,5 bis unter 2,5 25 20 2,5 bis unter 4 15 20 4 und länger 15 10 Welche Skalierung weist die Variable X = „wöchentliche Nachbereitungszeit in Stunden“ auf? Ist diese Variable diskret oder stetig? <?page no="21"?> 2.3. Häufige Fehler in Klausuren 9 2.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Wird eine metrisch skalierte Variable durch Klassierungen transformiert, so ist die transformierte Variable ordinal skaliert und diskret. Dies wird in einer Klausur schnell übersehen. Studierenden ist häufig die Bedeutung von Skalierung und Typ einer Variablen nicht bewusst. Die beiden Kriterien Skalierung und Typ sind jedoch ausschlaggebend dafür, welche statistischen Methoden benutzt werden dürfen. <?page no="23"?> Kapitel 3: Kennzahlen aus Daten Das sollten Sie wissen! Kennzahlen aus Daten sind Anteilswerte, Prozentpunkte sowie empirische Lage- und Streuungsparameter. Die Berechnung dieser empirischen Kennzahlen orientiert sich daran, in welcher der drei Formen die Daten vorliegen: Einzeldaten/ Urliste tabellierte Daten klassierte Daten 3.1 Einzeldaten Aufgabe 3.1 Schwierigkeit: einfach Zeit: 8 Minuten Für eine Studentin sind im Sommersemester 2008 folgende Ausgaben (in Euro) für Fachbücher angefallen: März April Mai Juni Juli 50 60 40 30 20 [a] Wie viel Euro wurden durchschnittlich pro Monat für Bücher ausgegeben? [b] Um wie viel Prozent sind die Bücherausgaben von März bis Juli 11 <?page no="24"?> 12 Kapitel 3: Kennzahlen aus Daten [1] insgesamt gesunken? [2] durchschnittlich pro Monat gesunken? [c] Berechnen Sie die Höhe der Schwankungen der Ausgaben anhand [1] der Spannweite. [2] der Standardabweichung. Aufgabe 3.2 Schwierigkeit: einfach Zeit: 10 Minuten Bei einer Preiserhebung in sechs Einzelhandelsgeschäften werden für zwei Güter A und B folgende Preise in e pro Stück festgestellt: Preis für Gut A ( e / Stück) Preis für Gut B ( e / Stück) 5,50 22,20 5,50 20,80 6,90 22,90 5,40 20,40 5,20 25,00 6,00 21,00 [a] Berechnen Sie für jedes Gut den durchschnittlichen Preis aus den einzelnen Preisangaben. [b] Bei welchem Gut fallen die Preisschwankungen zwischen den Einzelhandelsgeschäften geringer aus? Beantworten Sie diese Frage durch Berechnung einer geeigneten, aussagekräftigen statistischen Maßzahl und begründen Sie Ihre Wahl. Aufgabe 3.3 Schwierigkeit: schwer Zeit: 5 Minuten Eine Testfahrerin soll eine Teststrecke einmal befahren und dabei die Durchschnittsgeschwindigkeit 60 km/ h erzielen. Auf der ersten Hälfte der Strecke erreicht die Testfahrerin die Durchschnittsgeschwindigkeit von 30 km/ h. Ist es jetzt noch möglich, nach Befahren der zweiten Hälfte auf die gewünschte Durchschnittsgeschwindigkeit von 60 km/ h zu kommen? Falls ja, mit welcher Geschwindigkeit müsste die Testfahrerin dann die zweite Hälfte befahren? <?page no="25"?> 3.2. Tabellierte Daten 13 3.2 Tabellierte Daten Aufgabe 3.4 Schwierigkeit: mittelschwer Zeit: 8 Minuten Das Prüfungsamt einer Hochschule veröffentlichte die Ergebnisse zweier Diplomprüfungen: Note (verbal und als Ziffer) Erste Diplomprüfung (Anzahl) Zweite Diplomprüfung (Anzahl) Sehr gut (1) 10 55 Gut (2) 20 35 Befriedigend (3) 30 15 Ausreichend (4) 25 40 Nicht bestanden (5) 15 55 Zusammen 100 200 [a] Bei welcher der beiden Diplomprüfungen war das Notenniveau besser? Begründen Sie Ihre Antwort durch Berechnung und Interpretation einer geeigneten statistischen Maßzahl! [b] Welche Note der ersten Diplomprüfung wird von 60 % aller Prüflinge mindestens erreicht? [c] Bei welcher der beiden Diplomprüfungen waren die Notenunterschiede größer? Begründen Sie Ihre Antwort durch Berechnung und Interpretation einer geeigneten statistischen Maßzahl! Aufgabe 3.5 Schwierigkeit: mittelschwer Zeit: 10 Minuten Ergebnisse der Klausuren „VWL-Teilprüfung I“ und „VWL-Teilprüfung II“ am Fachbereich Wirtschaft einer Hochschule: <?page no="26"?> 14 Kapitel 3: Kennzahlen aus Daten Note Differen- Anzahl der Anteil der zierte Prüfungs- Prüfungs- Note teilnehmer teilnehmer (in % ) Teilprüf.I Teilprüf.II Teilprüf.I Teilprüf.II Sehr gut 1,0 1,3 3 8 3 0 2 5 2 0 1,7 9 2 6 1 Gut 2,0 17 8 11 6 2,3 14 11 9 8 Befriedigend 2,7 3,0 3,3 16 14 10 15 20 10 10 9 6 11 14 7 Ausreichend 3,7 4,0 16 17 20 22 10 11 14 16 Nicht bestanden 5,0 31 30 20 21 ∑ 155 141 ≈ 100 100 [a] Welche statistischen Maßzahlen sind dazu geeignet, um das Leistungsniveau in beiden Klausuren miteinander zu vergleichen? Nennen Sie eine solche Maßzahl. [b] In welcher der beiden Klausuren waren die Leistungsunterschiede, gemessen an den Noten(unterschieden), größer? Kennzeichnen und vergleichen Sie die Leistungsunterschiede in beiden Klausuren durch Berechnung und Interpretation einer geeigneten statistischen Maßzahl. Begründen Sie dabei die Auswahl der Maßzahl. [c] Sie haben zur Lösung der Teil-Aufgabe [a] für beide Klausuren eine statistische Maßzahl vorgeschlagen, die das Leistungsniveau kennzeichnet. Wovon hängt die Aussagekraft einer solchen Maßzahl zur Kennzeichnung des Leistungsniveaus ab? Begründen Sie bitte Ihre Antwort. 3.3 Klassierte Daten Aufgabe 3.6 Schwierigkeit: mittelschwer Zeit: 15 Minuten Von je 1 000 Rentnerinnen bzw. Rentnern bekommen in Deutschland eine monatliche Rente (Quelle: VDR, Stand Ende 2002): <?page no="27"?> 3.3. Klassierte Daten 15 von Frauen Männer unter 150 Euro 112 45 150 bis unter 300 187 44 300 bis unter 450 131 42 450 bis unter 600 162 52 600 bis unter 750 196 78 750 bis unter 900 112 113 900 bis unter 1 200 77 299 1 200 bis unter 1 500 20 226 1 500 Euro und mehr 3 101 [a] Vergleichen Sie das Rentenniveau von Rentnerinnen und Rentnern anhand einer statistischen Maßzahl. Welches Geschlecht bezieht die höhere Rente? [b] Vergleichen Sie die Rentenunterschiede bei den Männern mit den Rentenunterschieden bei den Frauen. Bei welchem Geschlecht sind die Unterschiede stärker? [c] Welche Rentenhöhe wird von 90 % aller Rentnerinnen nicht überschritten? Aufgabe 3.7 Schwierigkeit: mittelschwer Zeit: 15 Minuten Laut dem Statistischen Bundesamt in Wiesbaden beträgt das monatliche Gesamteinkommen (Stand 2012) von Alleinstehenden (Angaben in Prozent): Klasse Frauen Männer unter 750 e 15 10 750 - 1 000 21 13 1 000 - 1 250 20 16 1 250 - 1 500 15 18 1 500 - 1 750 10 14 1 750 - 2 000 7 9 2 000 - 3 000 10 13 3 000 - 4 000 1 4 4 000 e und höher 1 3 [a] [1] Berechnen Sie das mediane Einkommen der alleinstehenden Frauen. [2] Berechnen Sie das mediane Einkommen der alleinstehenden Männer. [3] Um wie viel Prozent ist das mediane Einkommen der Männer höher? [b] Wie viel Prozent der alleinstehenden Frauen haben ein monatliches Einkommen über 2 500 e ? <?page no="28"?> 16 Kapitel 3: Kennzahlen aus Daten [c] Wie viel Prozent der alleinstehenden Männer haben ein monatliches Einkommen unter 1 600 e ? [d] Wie viel Prozent der alleinstehenden Frauen haben ein monatliches Einkommen von mindestens 2 000 e ? Aufgabe 3.8 Schwierigkeit: mittelschwer Zeit: 15 Minuten Bei einer Umfrage unter 5 000 US-Bürgern bzgl. ihres Fernsehkonsums (in Stunden pro Woche) und ihres Rentnerstatus (nein, ja) ergaben sich folgende Daten (Angaben in Prozent): TV-Konsum Rentner Stunden/ Woche nein ja von 0 bis 17 29,6 37,6 über 17 bis 21 35,7 30,6 über 21 bis 36 34,7 31,8 [a] Welche der beiden Gruppen (Rentner, Nicht-Rentner) sieht länger fern? [b] Wie viel Prozent der Nicht-Rentner sieht über 28 Stunden pro Woche fern? [c] Welcher TV-Konsum (in Stunden pro Woche) wird von 25 % aller Rentner überschritten? [d] Wie stark schwankt der TV-Konsum von Rentnern gemessen mit der Standardabweichung? [e] Wie viel Prozent der Rentner konsumieren höchstens 21 Stunden TV pro Woche? Aufgabe 3.9 Schwierigkeit: mittelschwer Zeit: 8 Minuten Die Altersverteilung in einer Kleinstadt mit 32 900 Einwohnern sieht wie folgt aus: Alter Einwohner in Jahren weiblich männlich 0 bis 11 1 400 1 500 über 11 bis 18 2 900 3 100 über 18 bis 25 4 400 4 600 über 25 8 000 7 000 <?page no="29"?> 3.3. Klassierte Daten 17 Der Raucher-Anteil nach Geschlecht getrennt beträgt in den verschiedenen Altersklassen: Alter Raucher in Jahren weiblich männlich über 11 bis 18 12 % 14 % über 18 bis 25 37 % 36 % über 25 28 % 33 % [a] Wie viel Prozent der über 11-jährigen weiblichen Einwohner rauchen? [b] Wie viel Prozent der über 11-jährigen Einwohner rauchen? [c] Wie viel Prozent der Raucher (über 11 Jahre) sind weiblich? Aufgabe 3.10 Schwierigkeit: mittelschwer Zeit: 8 Minuten In einem Flughafen wurde an einem Tag die Wartezeit (in Minuten) der Fluggäste vor der Gepäckaufgabe gemessen. In der nachfolgenden Tabelle wurde festgehalten, wie hoch der Anteil der wartenden Fluggäste war: Wartezeit (in Min) Anteil 0 bis 10 10 % über 10 bis 20 70 % über 20 bis 60 20 % [a] Wie hoch ist in etwa der Anteil der Fluggäste, die mehr als 30 Minuten warten müssen? [b] Wie lange muss im Durchschnitt ein Fluggast warten, bis er sein Gepäck aufgeben kann? [c] Wie hoch ist die mediane Wartezeit eines Fluggastes? [d] Sind die durchschnittliche und die mediane Wartezeit eines Fluggastes unterschiedlich groß? Falls ja, wieso unterscheiden sich diese beiden Kennzahlen? <?page no="30"?> 18 Kapitel 3: Kennzahlen aus Daten 3.4 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! In der Klausur gibt es bei der Berechnung von Kennzahlen drei Fehlerschwerpunkte. Erstens wird bei klassierten Daten die Einfallsklasse j nicht korrekt erkannt. Zweitens wird nicht der richtige Lageparameter berechnet wird, wenn nach einem Durchschnittswert gefragt ist. Und drittens gibt es Unsicherheiten beim Einsetzen von Zahlen in die Formeln, falls der Stichprobenumfang n unbekannt ist. Um Anteilswerte oder Prozentpunkte berechnen zu können, müssen zunächst die kumulierten relativen Häufigkeiten berechnet werden ganz gleich, ob die Daten als Einzeldaten, tabellierte Daten oder klassierte Daten vorliegen. Tipp! Korrekte Einfallsklasse bei klassierten Daten: Für Anteilswerte F ( x ) (Formel 1) ist die Klasse j genau dann die korrekte Einfallsklasse, wenn x zwischen der Klassenuntergrenze x ∗ j −1 und der Klassenobergrenze x ∗ j liegt. Für Prozentpunkte x p (Formel 2) ist diejenige Klasse die korrekte Einfallsklasse j , deren kumulierte relative Häufigkeit entweder genau so groß ist wie p (wie z. B. in Aufgabe 3.6 [c]) oder erstmals größer ist als p (wie z. B. in Aufgabe 3.7 [a]). An empirischen Lageparametern kennen wir das arithmetische Mittel, das geometrische Mittel, das harmonische Mittel sowie den Modus und den Median. Tipp! Richtiger Lageparameter: Ist nach einem Durchschnittswert gefragt, so wird unterschieden, ob es sich um eine durchschnittliche Wachstumsangabe in Prozent handelt oder nicht. Ist nach einem durchschnittlichen Wachstum in Prozent pro Jahr gefragt, so muss das geometrische Mittel (Formel 8) aus den Faktoren berechnet werden wie z. B. in Aufgabe 7.1 [c] oder in Aufgabe 7.5 [b]. Ist nach dem Durchschnittswert einer Beziehungszahl (Quotient zweier Maßeinheiten) wie z. B. Durchschnittsgeschwindigkeit (km/ h) gefragt, so wird häufig <?page no="31"?> 3.4. Häufige Fehler in Klausuren 19 ein harmonisches Mittel (Formel 9) berechnet. Um bei der Berechnung der durchschnittlichen Beziehungszahl Fehler zu vermeiden, sollte hier nicht die Formel 9 für das harmonische Mittel benutzt werden. Stattdessen sollte mit dem Quotienten der beiden Anzahlen gerechnet werden wie z. B. in Aufgabe 3.3. Ist hingegen nach einem Durchschnittswert in Gramm oder Euro usw. gefragt, so muss das arithmetische Mittel (Formel 5 bzw. 6 bzw. 7)) berechnet werden. Ist nach einem medianen Wert gefragt, so wird der 50 %-Punkt (Formel 2) berechnet, also der Wert, der von 50 % aller Befragten nicht überschritten wird. Ist danach gefragt, welcher Beobachtungswert in der Stichprobe am häufigsten vorkommt, so ist der Modus (Formel 4) zu berechnen. Der Modus muss nicht eindeutig sein. Tipp! Stichprobenumfang unbekannt: Ist der Stichprobenumfang n unbekannt, d. h. liegen keine absoluten Häufigkeiten vor, so können ersatzweise mit n = 100 die Prozentzahlen als absolute Werte betrachtet werden wie z.B. in Aufgabe 3.8 [a]. <?page no="33"?> Kapitel 4: Rechnen mit Wahrscheinlichkeiten Das sollten Sie wissen! Die Lösungswege zur Berechnung von Wahrscheinlichkeiten von Ereignissen unterscheiden sich zum einen dadurch, wie viele Ereignisse vorliegen und ob einige Ereignisse eine Zerlegung darstellen. Oder ob es sich um eine Laplace-Wahrscheinlichkeit handelt. Für zwei Ereignisse A , B kann immer eine Arbeitstabelle aufgestellt werden. Für drei Ereignisse A , B , C , die keine Zerlegung darstellen, kann immer ein Venndiagramm gezeichnet werden. Für drei oder mehr Ereignisse, die eine Zerlegung darstellen, kann eine Arbeitstabelle aufgestellt werden. Laplace-Wahrscheinlichkeiten werden mit einer der vier Abzählformeln 23, 24, 25, 26 aus dem Formelteil am Ende des Buches bestimmt. 4.1 Zwei Ereignisse Aufgabe 4.1 Schwierigkeit: schwer Zeit: 8 Minuten Bei einer Sicherheitskontrolle am Flughafen wird etwa bei jedem fünfzigsten Handgepäckstück Alarm ausgelöst, dass sich ein verbotener Gegenstand in diesem Gepäckstück befindet. Bei den Gepäckstücken, die einwandfrei sind, wird etwa bei jedem hundertsten 21 <?page no="34"?> 22 Kapitel 4: Rechnen mit Wahrscheinlichkeiten Gepäckstück trotzdem ein Alarm ausgelöst. Bei den Gepäckstücken, die verbotene Gegenstände enthalten, passiert etwa jedes fünfundzwanzigste Gepäckstück ohne Alarm die Sicherheitskontrollen. Bei einem Gepäckstück wurde Alarm ausgelöst. Wie hoch ist die Wahrscheinlichkeit, dass es tatsächlich verbotene Gegenstände enthält? Aufgabe 4.2 Schwierigkeit: schwer Zeit: 8 Minuten Autofarbe der 2003 in Deutschland zugelassenen Pkw (Quelle: ADACmotorwelt 3/ 2004): Farbe silber/ grau schwarz blau grün rot weiß sonstige Anteil 44 , 9 % 22 , 6 % 18 , 6 % 5 , 0 % 4 , 6 % 2 , 4 % 1 , 9 % [a] Wie viel Prozent der 2003 zugelassenen Pkw waren entweder silber/ grau oder schwarz oder blau? [b] Ein Pkw wurde 2003 zugelassen und hat einen Unfall verursacht. Wie groß muss für diesen Pkw die Wahrscheinlichkeit sein, dass er schwarz lackiert ist, damit für die 2003 zugelassenen Pkw die Ereignisse: A = Pkw-Farbe ist schwarz B = Pkw verursacht einen Unfall stochastisch unabhängig sind? Aufgabe 4.3 Schwierigkeit: schwer Zeit: 10 Minuten Auf einer Feier soll eine Verlosung stattfinden. Dazu wurden 50 Lose mit den Nummern 1,2,3, . . . ,50 beschriftet und verkauft. Es ist vorgesehen, aus diesen 50 Losen einen Hauptgewinn und zwei Trostpreise zu ziehen. Frau Z. hat genau ein Los gekauft. Bei der Ziehung der Lose stehen zwei alternative Verfahren zur Debatte. <?page no="35"?> 4.2. Drei oder mehr Ereignisse 23 [1] Verfahren 1: Zuerst wird aus den 50 Losen die Losnummer des Hauptgewinns gezogen. Anschließend werden aus den restlichen 49 Losen nacheinander die beiden Trostpreise gezogen. [a] Wie groß ist die Wahrscheinlichkeit, dass Frau Z. den Hauptgewinn erhält? [b] Wie groß ist die Wahrscheinlichkeit, dass Frau Z. einen Trostpreis erhält? [2] Verfahren 2: Zuerst werden nacheinander die zwei Trostpreise gezogen. Anschließend wird aus den restlichen 48 Losen der Hauptgewinn gezogen. [a] Ändert sich jetzt im Vergleich zu Verfahren 1 die Wahrscheinlichkeit dafür, dass Frau Z. den Hauptgewinn erhält? Berechnen Sie die Wahrscheinlichkeit. [b] Und ändert sich jetzt im Vergleich zu Verfahren 1 die Wahrscheinlichkeit dafür, dass Frau Z. einen Trostpreis erhält? Berechnen Sie die Wahrscheinlichkeit. Aufgabe 4.4 Schwierigkeit: schwer Zeit: 15 Minuten Der Anteil der TBC-Kranken in der Bevölkerung beträgt 0,2 %. Durch Röntgen-Tests werden 90 % aller untersuchten TBC-Kranken entdeckt, während 5 % der TBC-freien Personen irrtümlich als TBC-verdächtig klassifiziert werden. Eine Person wird aufgrund eines Röntgen-Tests als TBC-verdächtig eingestuft. Wie groß ist die Wahrscheinlichkeit, dass sie tatsächlich TBC-krank ist? 4.2 Drei oder mehr Ereignisse Aufgabe 4.5 Schwierigkeit: schwer Zeit: 15 Minuten Im Jahr 2007 kamen 74 % aller Hochschulabsolventen von einer Uni, 25 % von einer FH und 1 % von einer Berufsakademie. Unterstellen Sie für diese Absolventen folgende Daten (Zahlen sind angelehnt an eine Umfrage der DIHK): Rund 54 % der eingestellten Hochschulabsolventen kamen von einer Uni, 37 % von einer FH und 9 % von einer Berufsakademie. Gehen Sie davon aus, dass insgesamt 10 % aller Hochschulabsolventen im Jahr 2007 eingestellt wurden. [a] Wie viel Prozent der Uni-Absolventen wurden eingestellt? <?page no="36"?> 24 Kapitel 4: Rechnen mit Wahrscheinlichkeiten [b] Wie viel Prozent der FH-Absolventen wurden eingestellt? [c] Wie viel Prozent der Berufsakademie-Absolventen wurden eingestellt? Aufgabe 4.6 Schwierigkeit: schwer Zeit: 15 Minuten „Die Älteren lieben neue Autos“ (Quelle: Aral-Marktforschung, KBA). Fast zwei Drittel der sogenannten Generation 60 plus, genau 63 Prozent, besitzen einen Neuwagen. Auf die Frage „Haben Sie Ihr Auto neu oder gebraucht gekauft? “ antworteten im März 2006 bei einer Umfrage in Deutschland die Fahrzeughalter wie folgt: Alter Gebrauchtwagen Vorführwagen Neuwagen Fahrzeughalter 18 - 29 73 % 14 % 13 % 10 % 30 - 39 44 % 19 % 37 % 20 % 40 - 49 44 % 17 % 39 % 26 % 50 - 59 36 % 15 % 49 % 20 % 60 plus 23 % 14 % 63 % 24 % [a] Wie viel Prozent der Halter eines Neuwagens sind [1] mindestens 60 Jahre alt? [2] 18 bis 29 Jahre alt? [3] 30 bis 59 Jahre alt? [b] Sind die Ereignisse „zufällig befragter Fahrzeughalter kaufte einen Neuwagen“ und „zufällig befragter Fahrzeughalter ist mindestens 60 Jahre alt“ stochastisch unabhängig? Aufgabe 4.7 Schwierigkeit: schwer Zeit: 15 Minuten Ein Unternehmen beschäftigt die drei Arbeiter A, B, C . Eine Prämie in Höhe von 1 000 GE soll unter den drei Arbeitern A , B und C leistungsbezogen aufgeteilt werden. Von der Produktionsmenge wurden 10 % aller Produktionsstücke von den Arbeitern A und B bearbeitet. 2 % aller Produktionsstücke von allen drei Arbeitern bearbeitet. 33 % aller Produktionsstücke nur von Arbeiter A bearbeitet. <?page no="37"?> 4.3. Laplace-Wahrscheinlichkeiten 25 22 % aller Produktionsstücke nur von Arbeiter B bearbeitet. 25 % aller Produktionsstücke nur von Arbeiter C bearbeitet. 5 % aller Produktionsstücke von den Arbeitern B und C bearbeitet. 9 % aller Produktionsstücke von den Arbeitern A und C bearbeitet. Wie lässt sich die Prämie unter den drei Arbeitern leistungsbezogen aufteilen? 4.3 Laplace-Wahrscheinlichkeiten Aufgabe 4.8 Schwierigkeit: schwer Zeit: 15 Minuten Wie hoch ist in einer Gruppe mit 23 Personen die Wahrscheinlichkeit, dass [a] alle an verschiedenen Tagen Geburtstag haben? [b] mindestens zwei Personen am selben Tag Geburtstag haben? 4.4 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Der klassische Fehler beim Rechnen mit Wahrscheinlichkeiten ist die Verwechslung der bedingten Wahrscheinlichkeit P ( A | B ) mit der Wahrscheinlichkeit vom Durchschnitt P ( A ∩ B ) . Insb. wenn Deutsch nicht die Muttersprache ist, fällt es Studierenden häufig schwer, diese beiden Wahrscheinlichkeiten sicher auseinander zu halten. Tipp! Um die Verwechslung der beiden Wahrscheinlichkeiten P ( A | B ) und P ( A ∩ B ) zu vermeiden, wollen wir uns hier einige übliche sprachliche Formulierungen zusammenfassend anschauen. Nehmen wir dazu an, A bezeichnet das Ereignis, dass eine zufällig aus der Grundgesamtheit ausgewählte Person ein Auto besitzt und B bezeichnet den Besitz eines Bootes. Dann kann nach P ( A | B ) wie folgt gefragt werden: Jemand besitzt ein Boot. Wie groß ist die Wahrscheinlichkeit, dass er auch ein Auto besitzt? <?page no="38"?> 26 Kapitel 4: Rechnen mit Wahrscheinlichkeiten Wie hoch ist unter den Bootsbesitzern der Anteil der Autobesitzer? Wie hoch ist die Wahrscheinlichkeit, dass jemand, der ein Boot besitzt, auch ein Auto besitzt? Hingegen kann nach P ( A ∩ B ) wie folgt gefragt werden: Wie hoch ist der Anteil der Personen in der Grundgesamtheit, die sowohl ein Auto als auch ein Boot besitzen? Wie groß ist die Wahrscheinlichkeit, dass jemand sowohl ein Auto als auch ein Boot besitzt? Wie viel Prozent aller Personen aus der Grundgesamtheit sind Bootsbesitzer, die auch ein Auto besitzen? Wie viel Prozent aller Personen aus der Grundgesamtheit sind Autobesitzer, die auch ein Boot besitzen? Fehler, die Sie vermeiden sollten! Ein weiterer häufiger Fehler ist, dass zwar eine bedingte Wahrscheinlichkeit P ( A | B ) erkannt wird, jedoch die Bedingung B mit dem Ereignis A vertauscht wird. Tipp! Die fehlerhafte Vertauschung von Ereignis und Bedingung kann durch eine Überschlagsrechnung vermieden werden. Für z. B. die obigen Ereignisse A = Auto, B = Boot ist in der Grundgesamtheit Deutschland die Wahrscheinlichkeit P ( A | B ) sehr hoch, da fast jeder Bootsbesitzer auch ein Auto besitzt allein schon deshalb, um zu seinem Anlegeplatz zu gelangen. Hingegen ist die Wahrscheinlichkeit P ( B | A ) sehr klein, da selbst unter den Autobesitzern der Anteil der Bootsbesitzer sehr gering ist. <?page no="39"?> Kapitel 5: Zufallsvariablen Tipp! Bei der Berechnung von Wahrscheinlichkeiten dafür, dass der Wert einer Zufallsvariablen in einem bestimmten Bereich liegt, z. B. X = 4 , kann wahlweise auch mit Buchstaben für Ereignisse, z. B. A = { X = 4} , gerechnet werden. 5.1 Stochastische Unabhängigkeit Aufgabe 5.1 Schwierigkeit: schwer Zeit: 15 Minuten Sind beim zweimaligen Würfeln die beiden Zufallsvariablen X = „Minimum der beiden Augenzahlen“ und Y = „Maximum der beiden Augenzahlen“ stochastisch unabhängig? 27 <?page no="40"?> 28 Kapitel 5: Zufallsvariablen 5.2 Verteilung der Summe Aufgabe 5.2 Schwierigkeit: schwer Zeit: 15 Minuten Zwei Autovermieter Budget Car und Hertz teilen sich einen gemeinsamen Parkplatz zur Rückgabe ihrer Mietwagen. Der Parkplatz verfügt über sieben Stellplätze. Bei Budget Car geschieht die Rückgabe gemäß der folgenden Verteilung: zurück- 0 1 2 3 4 gegebene Autos Wkt. 0,1 0,4 0,3 0,1 0,1 Bei Hertz geschieht die Rückgabe gemäß der folgenden Verteilung: zurück- 0 1 2 3 4 5 gegebene Autos Wkt. 0,1 0,2 0,3 0,1 0,2 0,1 Die Rückgabe bei Budget und Hertz geschieht stochastisch unabhängig voneinander. Wie groß ist die Wahrscheinlichkeit, dass [a] genau sieben Mietwagen zurückgegeben werden? [b] die Stellplätze auf dem Parkplatz nicht ausreichen? [c] dass die Stellplätze auf dem Parkplatz ausreichen? 5.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Bei der Berechnung der gemeinsamen Verteilung zweier Zufallsvariablen X, Y treten häufig deshalb Fehler auf, weil nicht klar ist, was ein Minimum oder ein Maximum oder die Summe zweier Zahlen ist. <?page no="41"?> 5.3. Häufige Fehler in Klausuren 29 Tipp! Das Minimum zweier Geldbeträge ist der kleinere Betrag der beiden Beträge z. B. min {5 , 10} = 5 . Sind beide Geldbeträge gleich hoch, so ist das Minimum einer der beiden Beträge z. B. min {5 , 5} = 5 . Das Maximum zweier Geldbeträge ist der größere Betrag der beiden Beträge z. B. max {5 , 10} = 10 . Sind beide Geldbeträge gleich hoch, so ist das Maximum einer der beiden Beträge z. B. max {5 , 5} = 5 . Für die Summe zweier Geldbeträge werden die beiden Beträge addiert z. B. X = 5 , Y = 10 ergibt X + Y = 15 . <?page no="43"?> Kapitel 6: Lineare Regression Das sollten Sie wissen! Die Formelsammlung hält zwei Formeln für eine Regressionsgerade bereit: y = a 1 + b 1 · x (Formel 52) und x = a 2 + b 2 · y (Formel 55). Mit der Regressionsgeraden y = a 1 + b 1 · x wird aufgrund eines unabhängigen x - Wertes ein von x abhängiger Prognosewert y berechnet. Diese Regression wird auch als Regression von Y auf X bezeichnet, weil der y -Wert auf dem x -Wert basiert. Hingegen wird mit der Regressionsgeraden x = a 2 + b 2 · y aufgrund eines unabhängigen y -Wertes ein von y abhängiger Prognosewert x berechnet. Diese Regression wird auch als Umkehrregression von X auf Y bezeichnet, weil umgekehrt der x -Wert auf dem y -Wert basiert. 6.1 Regression Aufgabe 6.1 Schwierigkeit: mittelschwer Zeit: 15 Minuten In einer Abteilung eines Unternehmens betragen in den ersten vier Wochen des Jahres 2014 die Anzahl der offenen Stellen und die geleisteten Überstunden: 31 <?page no="44"?> 32 Kapitel 6: Lineare Regression Woche Anzahl offener Stellen Überstunden 1 1 37 2 0 5 3 2 50 4 4 168 [a] Erklären Sie in einer Regression die geleisteten Überstunden durch die Anzahl offener Stellen. Mit wie vielen Überstunden ist dann zu rechnen, wenn in der ersten Februarwoche von 2014 drei Stellen offen sind? [b] Interpretieren Sie den Wert der Steigung der Regressionsgeraden unter Teilaufgabe [a]. [c] Ist der unter Teilaufgabe [a] berechnete Prognosewert aus statistischer Sicht verlässlich? Aufgabe 6.2 Schwierigkeit: mittelschwer Zeit: 15 Minuten Es wird vermutet, dass die Auslieferungszeit (in Minuten) eines Lieferantenfahrers linear abhängt von der Anzahl der zu beliefernden Kunden. An den vergangenen vier Tagen ergaben sich folgende Werte: Tag Auslieferungszeit Kunden 1 250 12 2 500 24 3 750 39 4 720 38 [a] Wie lautet die lineare Regressionsgerade? [b] Interpretieren Sie den Wert der Steigung der Regressionsgeraden. [c] Mit welcher Auslieferungszeit ist gemäß der Regressionsgeraden zu rechnen, wenn 20 Kunden beliefert werden sollen? [d] Ist der unter Teilaufgabe [c] berechnete Prognosewert aus statistischer Sicht verlässlich? <?page no="45"?> 6.2. Umkehrregression 33 6.2 Umkehrregression Aufgabe 6.3 Schwierigkeit: mittelschwer Zeit: 15 Minuten Zwischen dem Verkaufspreis (in Cent pro Stück) und dem Absatz (in ME pro Woche) von Teepackungen wird ein linearer Zusammenhang vermutet. Die Preise und die Absatzmengen der letzten vier Wochen lauten wie folgt: Preis Absatz 139 60 199 30 149 50 169 40 [a] In der kommenden Woche soll ein Absatz von 45 ME erzielt werden. Welcher Preis ist dazu gemäß einem linearen Regressionsmodell anzusetzen? [b] [1] Welcher Absatz ist bei einem Preis von 179 Cent pro Packung zu erwarten? [2] Um wie viele ME sinkt der Absatz bei einer Preiserhöhung um einem Cent? Hinweis: Ziehen Sie für Ihre Berechnungen ein lineares Regressionsmodell heran. [c] Berechnen Sie die Korrelation zwischen Preis und Absatz. Interpretieren Sie das Vorzeichen und die Stärke der Korrelation. [d] Wie verlässlich ist der Prognosewert [1] unter Teilaufgabe [a]? (Begründung! ) [2] unter Teilaufgabe [b]? (Begründung! ) Das sollten Sie wissen! Eine lineare Regression wird in der Literatur auch als Methode der kleinsten Quadrate bezeichnet. <?page no="46"?> 34 Kapitel 6: Lineare Regression Aufgabe 6.4 Schwierigkeit: mittelschwer Zeit: 15 Minuten Ein PC-Händler verzeichnet in Abhängigkeit vom Verkaufspreis folgenden Absatz an PCs in den letzten fünf Verkaufsperioden: Absatz in ME Preis in GE pro ME 20 2 22 1,9 16 2,2 18 2,1 25 1,8 [a] Welcher Absatz ist gemäß der Methode der kleinsten Quadrate zu erwarten, wenn ein Preis von 1,6 GE pro ME für die kommende Verkaufsperiode angesetzt wird? [b] Welcher Verkaufspreis ist gemäß der Methode der kleinsten Quadrate anzunehmen, damit der Absatz in der kommenden Verkaufsperiode 24 ME beträgt? [c] Wie verlässlich sind die Berechnungen unter Teilaufgabe [a] und unter Teilaufgabe [b]? (Begründung! ) 6.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! In der Klausur gibt es zwei häufige Fehler bei Aufgaben zur linearen Regression. Erstens wird der Stichprobenumfang n nicht korrekt erkannt. Und zweitens herrscht Unklarheit darüber, welche der beiden Variablen die unabhängige Variable ist und welche Variable die abhängige Variable ist. Tipp! Zum Stichprobenumfang: Für eine Regressionsaufgabe werden die Werte von genau zwei statistischen Variablen X und Y pro Befragten benötigt z. B. „Körpergröße“ und „Körpergewicht“. Der Stichprobenumfang n ist dann die Anzahl der Befragten. <?page no="47"?> 6.3. Häufige Fehler in Klausuren 35 Tipp! Bei der zweiten Fehlerquelle, dem Erkennen der unabhängigen und der abhängigen Variablen, gibt es auch manchmal bei Ökonomen unterschiedliche Meinungen. Soll in der Klausur mithilfe der Methode der kleinsten Quadrate ein Prognosewert berechnet werden, z. B. mit welchem Gewicht zu rechnen ist, wenn ein Mensch 170 cm groß ist, so ist der bekannte Werte 170 der Wert der unabhängigen Variablen. Und der Prognosewert lautet: a 1 + b 1 · 170 , falls die Körpergröße mit X bezeichnet wurde, oder a 2 + b 2 · 170 , falls die Körpergröße mit Y bezeichnet wurde. <?page no="49"?> Kapitel 7: Indexrechnung Das sollten Sie wissen! Bei der Berechnung von Indizes gibt es zwei unterschiedliche Lösungswege. Welcher der beiden Lösungswege genutzt wird, hängt davon ab, wie die Daten vorgegeben sind: Zum einen können die Daten mit absoluten Werten bzw. Indexwerten vorliegen. Zum anderen können lediglich die Raten der Veränderungen gegenüber dem Vorjahr bekannt sein, es sind also insb. die absoluten Werte unbekannt. 7.1 Tabelle mit Werten Aufgabe 7.1 Schwierigkeit: mittelschwer Zeit: 15 Minuten In der folgenden Tabelle ist der Verbraucherpreisindex für Nordrhein-Westfalen auf verschiedenen Basisjahren angegeben: 37 <?page no="50"?> 38 Kapitel 7: Indexrechnung Jahr Verbraucherpreisindex Basisjahr 2005 Basisjahr 2000 Basisjahr 1995 1999 105,2 2000 100,0 106,9 2001 102,0 2002 103,3 2003 104,5 2004 106,1 2005 100,0 107,6 2006 101,4 2007 103,7 [a] Berechnen Sie eine von 1999 bis 2007 durchgehende Indexreihe, die 2000 als Basisjahr hat. [b] Wie hoch ist die Preissteigerung (Inflationsrate) insgesamt in Prozent in der Zeit von 1999 bis 2007? [c] Wie hoch ist die durchschnittliche jährliche Preissteigerung (Inflationsrate) in Prozent in der Zeit von 1999 bis 2007? [d] Wie hoch war der Kaufkraftverlust insgesamt in der Zeit von 1999 bis 2007? [e] Im Jahr 2005 betrugen die privaten Konsumausgaben in NRW insgesamt 307 669 Mio. Euro, im Jahr 2006 betrugen die privaten Konsumausgaben in NRW insgesamt 314 118 Mio. Euro. Berechnen Sie die reale Zunahme der Konsumausgaben in Prozent von 2005 auf 2006. Aufgabe 7.2 Schwierigkeit: mittelschwer Zeit: 15 Minuten Für ein Land liegen folgende Daten über das Bruttoinlandsprodukt (BIP) in Mrd. Geldeinheiten vor: Jahr In Preisen von 2002 In jeweiligen Preisen 2002 2 000 2 000 2003 2 070 2 132,1 2004 2 105 2 189,2 2005 2 120 2 247,2 2006 2 180 2 376,2 [a] Um wie viel Prozent ist das BIP im Zeitraum von 2002 bis 2006 im Durchschnitt pro Jahr nominal gewachsen? <?page no="51"?> 7.1. Tabelle mit Werten 39 [b] Berechnen Sie für jedes Jahr den Mengenindex mit 2002 als dem Basisjahr. [1] Handelt es sich hierbei um einen Laspeyres- oder um einen Paasche-Mengenindex? Begründen Sie kurz Ihr Ergebnis. [2] Um wie viel Prozent ist das BIP im Zeitraum von 2002 bis 2006 im Durchschnitt pro Jahr real gewachsen? [c] Berechnen Sie für jedes Jahr den Preisindex mit 2002 als dem Basisjahr. [1] Handelt es sich hierbei um einen Laspeyres- oder um einen Paasche-Preisindex? Begründen Sie kurz Ihr Ergebnis. [2] Wie hoch ist die durchschnittliche jährliche Inflationsrate im Zeitraum 2002 bis 2006? Aufgabe 7.3 Schwierigkeit: mittelschwer Zeit: 15 Minuten Das Statistische Bundesamt in Wiesbaden veröffentlicht in regelmäßigen Abständen den Verbraucherpreisindex. Für die Jahre 1998 bis 2002 ergeben sich folgende Werte: Jahr Verbraucherpreisindex (2000 = 100) 1998 98,0 1999 98,6 2000 100,0 2001 102,0 2002 103,4 [a] Um wie viel Prozent sind die Verbraucherpreise zwischen 1998 und 2002 gestiegen? [b] Um wie viel Prozent sind die Verbraucherpreise zwischen 1998 und 2002 durchschnittlich pro Jahr gestiegen? [c] Wie hoch ist der Kaufkraftverlust im Zeitraum 1998 bis 2002? [d] Welche Werte nimmt der Verbraucherpreisindex für die Jahre 1999 bis 2002 an, wenn man als Basisjahr das Jahr 1998 wählt? <?page no="52"?> 40 Kapitel 7: Indexrechnung Aufgabe 7.4 Schwierigkeit: mittelschwer Zeit: 15 Minuten In der nachfolgenden Tabelle ist der Preisindex für die Lebenshaltung der privaten Haushalte nach Bedarfsgruppen im Jahr 1999 (Basisjahr 1995=100) angegeben (Quelle: Statistisches Jahrbuch 2001): Bedarfsgruppe Gewicht (in % ) Index Nahrungsmittel, alk.f.Getränke 13,126 101,7 Alk. Getränke,Tabakwaren 4,167 106,0 Kleidung, Schuhe 6,876 101,8 Wohnungsmieten, Energie 27,477 107,4 Einrichtungsgegenstände 7,056 102,1 Gesundheitspflege 3,439 110,6 Verkehr 13,882 107,6 Nachrichtenübermittlung 2,266 88,2 Freizeit, Unterhaltung 10,357 103,4 Bildungswesen 0,651 117,5 Gaststättendienstleistungen 4,608 104,9 Andere Waren und Dienstl. 6,095 104,5 Insgesamt 100 104,9 [a] Welcher Preisindex wurde für die einzelnen Bedarfsgruppen berechnet? Und welche Gestalt hatte die zugehörige Formel zur Berechnung? [b] Um wie viel Prozent ist in Deutschland im Zeitraum von 1995 bis 1999 der Preisindex für die Lebenshaltung der privaten Haushalte gestiegen? [c] Wie hoch war im Zeitraum von 1995 bis 1999 die durchschnittliche jährliche Inflationsrate? [d] Um wie viel Prozent ist in Deutschland im Zeitraum von 1995 bis 1999 der Preisindex für die Lebenshaltung der privaten Haushalte ohne die Ausgaben für Gesundheitspflege gestiegen? <?page no="53"?> 7.2. Tabelle mit Raten 41 7.2 Tabelle mit Raten Aufgabe 7.5 Schwierigkeit: mittelschwer Zeit: 10 Minuten In der nachfolgenden Tabelle sind für die Hauspreise in Deutschland die Veränderungen in Prozent gegenüber dem Vorjahr (Quelle: OECD) angegeben: Jahr Prozent 2004 −1 , 9 2005 −2 , 0 2006 0 2007 +1 , 0 2008 +0 , 6 2009 +0 , 5 2010 +2 , 6 2011 +5 , 4 Um wie viel Prozent sind die Hauspreise [a] im Zeitraum 2003 bis 2011 insgesamt gestiegen? [b] im Zeitraum 2003 bis 2011 durchschnittlich pro Jahr gestiegen? [c] im Zeitraum 2006 bis 2011 durchschnittlich pro Jahr real gestiegen, wenn in diesem Zeitraum die Inflationsrate 9,5 % insgesamt betrug? Aufgabe 7.6 Schwierigkeit: leicht Zeit: 10 Minuten Die Süddeutsche Zeitung veröffentlichte am 11.11.2010 folgende Zahlen für die deutsche Wirtschaft (Schätzung für 2010, Prognose für 2011): Jahr BIP Veränderung gegenüber Vorjahr in % Staatl. Defizit/ Überschuss in % des BIP 2008 +1 , 0 +0 , 1 2009 −4 , 7 −3 , 0 2010 +3 , 7 −3 , 7 2011 +2 , 2 −2 , 4 <?page no="54"?> 42 Kapitel 7: Indexrechnung [a] Um wie viel Prozent wird sich das BIP voraussichtlich im Zeitraum vom 01.01.2008 bis 31.12.2011 insgesamt verändern? [b] Um wie viel Prozent wird sich das BIP voraussichtlich im Zeitraum vom 01.01.2008 bis 31.12.2011 durchschnittlich pro Jahr verändern? [c] Ende 2009 betrug der Wert des BIP 2 404,4 Mrd. Euro. Wie hoch (in Mrd. Euro) ist voraussichtlich das BIP Ende 2011? [d] Ende 2009 betrug der Wert des BIP 2 404,4 Mrd. Euro. Wie hoch (in Mrd. Euro) war im selben Jahr das staatliche Defizit? [e] Die Inflationsrate für das Jahr 2010 betrug etwa 1,1 %. Um wie viel Prozent ist im Jahr 2010 das BIP real gestiegen? 7.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Als häufige Fehler bei der Indexrechnung sind mir drei Fehler bekannt. Erstens ist der Unterschied zwischen einer Rate der Veränderung und einem Faktor der Veränderung häufig nicht klar. Diese Unterscheidung ist aber unentbehrlich für Aufgaben zur Indexrechnung. Tipp! Beträgt z. B. der Preis für einen Pullover 200 Euro. Und steigt der Preis für den Pullover von 200 Euro auf 240 Euro, so beträgt der Faktor der Veränderung: Faktor = 240 200 = 1 , 2 Und die Rate der Veränderung beträgt: Rate = Faktor minus 1 = 1 , 2 − 1 = 0 , 2 = 20 % Interpretation: Der Preis ist um 20 % auf das 1,2-Fache gestiegen. Sinkt hingegen der Preis von 200 Euro auf 180 Euro, so beträgt der Faktor der Veränderung: Faktor = 180 200 = 0 , 9 Und die Rate der Veränderung beträgt: Rate = Faktor minus 1 = 0 , 9 − 1 = −0 , 1 = −10 % Interpretation: Der Preis ist um 10 % auf das 0,9-Fache gesunken. <?page no="55"?> 7.3. Häufige Fehler in Klausuren 43 Verändert sich der Preis von 200 Euro nicht, so beträgt der Faktor der Veränderung: Faktor = 200 200 = 1 Und die Rate der Veränderung beträgt: Rate = Faktor minus 1 = 1 − 1 = 0 = 0 % Interpretation: Der Preis hat sich nicht verändert. Fehler, die Sie vermeiden sollten! Zweitens wird bei der Frage nach der durchschnittlichen Veränderung in Prozent fälschlicherweise das arithmetische Mittel aus den Raten berechnet. Hier muss jedoch das geometrische (Formel 8) Mittel aus den Faktoren berechnet werden wie z. B. in Aufgabe 7.5. Fehler, die Sie vermeiden sollten! Drittens ist häufig nicht klar, wie viele Veränderungen es gibt, also wie groß n in der Formel 8 für das geometrische Mittel ist. Tipp! Als Regel für n aus Formel 8 gilt: Sind die Werte angegeben, so ist n = Anzahl der Werte minus 1 wie z. B. in Aufgabe 7.3. Sind die Raten angegeben, so ist n = Anzahl der Raten wie z. B. in Aufgabe 7.5. Sind jedoch nur der Anfangswert im Basisjahr und der Endwert im Berichtsjahr angegeben, so ist n = Berichtsjahr minus Basisjahr wie z. B. in Aufgabe 7.4. <?page no="57"?> Kapitel 8: Binomialverteilung Das sollten Sie wissen! Bei der Berechnung von Wahrscheinlichkeiten für eine Binomialverteilung werden drei Situationen unterschieden: Es liegt exakt eine Binomialverteilung vor. Es liegt exakt eine hypergeometrische Verteilung vor, jedoch beträgt der Auswahlsatz höchstens fünf Prozent, sodass eine Approximation der hypergeometrischen Verteilung durch eine Binomialverteilung noch genügend genaue Ergebnisse bringt. Es liegt exakt eine Binomialverteilung vor, jedoch ist der Parameter n „sehr groß“, sodass eine Approximation der Binomialverteilung durch eine Normalverteilung noch genügend genaue Ergebnisse bringt. 8.1 Exakte Verteilung Aufgabe 8.1 Schwierigkeit: mittelschwer Zeit: 8 Minuten Ein börsengehandeltes Wertpapier hat am 30. September 2002 einen Kurs von 100 e . Binnen eines Monats bleibt der Kurs konstant mit der Wahrscheinlichkeit null. Binnen eines Monats steigt der Kurs mit der Wahrscheinlichkeit 0,4 anhand des Vervielfachungsfaktors 1,25 auf 125 e . Binnen eines Monats fällt der Kurs und mit der Wahrscheinlichkeit 0,6 anhand des Faktors 1 1 , 25 = 0 , 80 auf 80 e . 45 <?page no="58"?> 46 Kapitel 8: Binomialverteilung Daraus folgt unter anderen auch, dass der Kurs nach zwei Monaten, in denen zuerst eine Kurssteigerung erfolgt und anschließend ein Kursrückgang (oder auch in umgekehrter Reihenfolge), wieder genau den Ausgangswert 100 e aufweist ( 100 e · 1 , 25 · 0 , 80 = 100 e und 100 e · 0 , 80 · 1 , 25 = 100 e ). Die Anzahl der Aufwärtsbewegungen des Kurses binnen n Monaten kann als binomialverteilt angesehen werden. [a] Wie viele Aufwärtsbewegungen des Kurses sind im Zeitraum vom 1. Oktober 2002 bis 28. Februar 2003 zu erwarten? [b] Wie groß ist die Wahrscheinlichkeit, dass der Kurs vom 1. Oktober 2002 bis zum 31. März 2003 nur Aufwärtsbewegungen macht? [c] Wie groß ist die Wahrscheinlichkeit, dass der Kurs des Wertpapiers nach vier Monaten (gerechnet vom 1. Oktober 2002 an) wieder den Ausgangswert 100 e hat? Aufgabe 8.2 Schwierigkeit: mittelschwer Zeit: 10 Minuten Für eine Verkehrsüberwachung sind insgesamt zehn Rechner eingesetzt. Jeder dieser Rechner hat pro Tag eine Ausfallwahrscheinlichkeit von 3 % . Insgesamt müssen mindestens acht Rechner laufen, damit die Anlage arbeiten kann. Die Anzahl der Rechner, die pro Tag ausfallen, kann als binomialverteilt angesehen werden. [a] Wie groß ist die Wahrscheinlichkeit dafür, dass an einem Tag kein Rechner ausfällt? [b] Wie groß ist die Wahrscheinlichkeit dafür, dass an einem Tag genau zwei Rechner ausfallen? [c] Wie groß ist die Wahrscheinlichkeit dafür, dass an einem Tag die Anlage ausfällt? [d] An wie vielen Tagen im Jahr muss damit gerechnet werden, dass die Anlage ausfällt? Aufgabe 8.3 Schwierigkeit: mittelschwer Zeit: 10 Minuten Bei einer Produktion entstehen 1 , 5 % Ausschuss. Sie kaufen aus dieser Produktion eine Lieferung von 20 Produktionsstücken. [a] Mit welcher Anzahl von Ausschussstücken müssen Sie rechnen? <?page no="59"?> 8.2. Approximative Verteilung 47 [b] Wie groß ist die Wahrscheinlichkeit, genau drei Ausschussstücke in der Lieferung zu erhalten? [c] Wie groß ist die Wahrscheinlichkeit, höchstens drei Ausschussstücke in der Lieferung zu erhalten? [d] Wie groß ist die Wahrscheinlichkeit, nur Qualitätsstücke in der Lieferung zu erhalten? 8.2 Approximative Verteilung Aufgabe 8.4 Schwierigkeit: mittelschwer Zeit: 10 Minuten Eine Großhändlerin kauft aus einer Lieferung von 1 000 Kisten Apfelsinen, von denen 112 Kisten überreife Ware enthält, fünfzig Kisten. Die überreifen Früchte sind nur noch zum Auspressen geeignet. [a] Wie groß ist die Wahrscheinlichkeit, dass die Großhändlerin keine Kiste mit überreifen Früchten erwirbt? [b] Wie groß ist die Wahrscheinlichkeit, dass die Großhändlerin mindestens eine Kiste mit überreifen Früchten erwirbt? [c] Mit welcher Anzahl Kisten mit überreifen Früchten muss die Großhändlerin im Mittel rechnen? Aufgabe 8.5 Schwierigkeit: schwer Zeit: 12 Minuten In Deutschland beantragen etwa sechs von 500 erwerbstätigen Vätern mit Kindern unter drei Jahren Elternzeit. Ein Unternehmen beschäftigt [a] zehn Väter mit Kindern unter drei Jahren. Mit welcher Anzahl von Vätern mit Kindern unter drei Jahren, die Elternzeit beantragen, muss das Unternehmen rechnen? [b] 20 Väter mit Kindern unter drei Jahren. Wie groß ist die Wahrscheinlichkeit, dass höchstens ein Vater mit Kindern unter drei Jahren Elternzeit beantragt? [c] 900 Väter mit Kindern unter drei Jahren. Mit welcher Mindestanzahl von Vätern mit Kindern unter drei Jahren, die Elternzeit beantragen, muss das Unternehmen mit einer Wahrscheinlichkeit von 95 % rechnen? <?page no="60"?> 48 Kapitel 8: Binomialverteilung Aufgabe 8.6 Schwierigkeit: schwer Zeit: 15 Minuten Ein Versicherungsunternehmen, das Kosten bei einem Reiserücktritt erstattet, weiß aus Erfahrung, dass etwa 12 % der abgeschlossenen Verträge einen Reiserücktritt anzeigen. Nehmen Sie an, dass Reiserücktritte stochastisch unabhängig voneinander auftreten. [a] Pro Tag bestehen etwa zehn Verträge. [1] Wie hoch ist die erwartete Anzahl von Reiserücktritten pro Tag? [2] Wie hoch ist die Wahrscheinlichkeit, dass an einem Tag kein Reiserücktritt angezeigt wird? [3] Wie hoch ist die Wahrscheinlichkeit, dass an einem Tag mehr als zwei Verträge einen Reiserücktritt anzeigen? [b] Pro Jahr bestehen etwa 320 Verträge. [1] Wie hoch ist die erwartete Anzahl von Reiserücktritten pro Jahr? [2] Berechnen Sie die Standardabweichung der Zufallsvariablen X = Anzahl der Reiserücktritte pro Jahr. [3] Über welcher Mindestanzahl liegt mit der Wahrscheinlichkeit von 90 % die Anzahl der Reiserücktritte pro Jahr? Aufgabe 8.7 Schwierigkeit: schwer Zeit: 12 Minuten In einem Land wird im Mittel eine von fünf Steuererklärungen falsch abgegeben. Ob eine Steuererklärung richtig ist, geschieht stochastisch unabhängig von der Richtigkeit einer anderen Steuererklärung. Pro nicht korrekt ausgefüllter Steuererklärung fallen der Finanzbehörde zwei Geldeinheiten an Zusatzkosten an. [a] Mit welchen Zusatzkosten ist bei der Überprüfung von 500 Steuererklärungen zu rechnen? [b] Wie groß ist die Wahrscheinlichkeit, dass sich unter zwanzig geprüften Steuererklärungen genau vier falsch ausgefüllte Erklärungen befinden? [c] Mit wie hohen Zusatzkosten ist bei einer Überprüfung von 10 000 Steuerklärungen mit der Wahrscheinlichkeit von 95 % höchstens zu rechnen? <?page no="61"?> 8.2. Approximative Verteilung 49 Aufgabe 8.8 Schwierigkeit: schwer Zeit: 15 Minuten Täglich geht auf der Linie Hamburg - New York ein Nonstop-Flug. Die Wahrscheinlichkeit, dass ein Flug verspätet ist, liegt bei 12 %. [a] Nehmen Sie an, dass die Anzahl der verspäteten Flüge pro Woche auf dieser Linie binomialverteilt ist. Wie groß ist die Wahrscheinlichkeit, dass in einer Woche [1] alle Flüge auf dieser Linie pünktlich sind? [2] mehr als drei Flüge auf dieser Linie verspätet sind? [3] genau fünf Flüge auf dieser Linie pünktlich sind? [b] Nehmen Sie an, dass die Anzahl der verspäteten Flüge für die kommenden 150 Tage auf dieser Linie binomialverteilt ist. [1] Wie groß ist die Wahrscheinlichkeit, dass die Anzahl der verspäteten Flüge auf dieser Linie binnen der kommenden 150 Tage genau achtzehn beträgt? höchstens achtzehn beträgt? [2] Mit wie vielen verspäteten Flügen auf dieser Linie ist binnen der kommenden 150 Tage mit einer Wahrscheinlichkeit von 90 % mindestens zu rechnen? Aufgabe 8.9 Schwierigkeit: schwer Zeit: 15 Minuten Nach Erhalt des Katalogs geben 61 % aller Versandhauskunden auch eine Bestellung auf. [a] Wie groß ist die Wahrscheinlichkeit, dass von zehn Kunden mehr als sechs Kunden eine Bestellung aufgeben? [b] Wie groß ist annähernd die Wahrscheinlichkeit, dass von einhundert Kunden mehr als sechzig Kunden eine Bestellung aufgeben? [c] Wie groß ist annähernd die Wahrscheinlichkeit, dass von tausend Kunden mehr als sechshundert Kunden eine Bestellung aufgeben? [d] Die Wahrscheinlichkeiten unter den Teilaufgaben [a], [b] und [c] werden immer größer. Geben Sie dazu eine Begründung an. <?page no="62"?> 50 Kapitel 8: Binomialverteilung Aufgabe 8.10 Schwierigkeit: mittelschwer Zeit: 10 Minuten In einem Briefzentrum werden die Sendungen automatisiert sortiert. Eine Kodiermaschine liest die Anschriften und ordnet die Sendungen den jeweiligen Postleitzahlen zu. Mit einer Wahrscheinlichkeit von 2 % vertauscht die Kodiermaschine den Empfänger mit dem Absender, so dass die Sendung ihren Empfänger nicht erreicht, sondern zurück zum Absender geschickt wird. Ferner geschieht das Vertauschen von Empfänger und Absender der Sendungen stochastisch unabhängig voneinander. [a] Sie haben zehn Briefe versehen mit Empfänger und Absender verschickt. Wie groß ist die Wahrscheinlichkeit, dass bei höchstens zwei Ihrer Briefe von der Kodiermaschine Empfänger und Absender vertauscht werden? [b] Ein Unternehmen hat 1 200 Sendungen versehen mit Empfänger und Absender verschickt. Wie groß ist annähernd die Wahrscheinlichkeit, dass bei höchstens vierzehn dieser Briefe von der Kodiermaschine Empfänger und Absender vertauscht werden? 8.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Die Binomialverteilung kann in der Aufgabenstellung einer Klausuraufgabe vorgegeben sein, aber manchmal muss sie auch vom Studierenden selbständig erkannt werden. Ein häufiges Problem ist dann, dass nicht klar ist, woran zu erkennen ist, dass eine Binomialverteilung vorliegt. Tipp! Eine Binomialverteilung lässt sich an den drei Kriterien Ja/ Nein-Variablen, n Wiederholungen, stochastische Unabhängigkeit erkennen: Die Zufallsvariable muss die Summe von sogenannten Ja/ Nein-Variablen sein, also z. B. ja, Produktionsstück ist Ausschuss oder nein, ist kein Ausschuss. Oder Person ist größer als 170 cm oder nicht. Oder die Haarfarbe ist blond oder nicht blond. (Jede Zufallsvariable kann zu einer Ja/ Nein-Variablen transformiert werden.) Ein sicherer Hinweis darauf, dass eine Ja/ Nein-Variable vorliegt, ist die Tatsache, dass die Interview-Frage so formuliert werden kann (aber nicht muss! ), <?page no="63"?> 8.3. Häufige Fehler in Klausuren 51 dass der Befragte mit Ja oder Nein antworten kann: Ist das Produktionsstück Ausschuss? Sind Sie über 170 cm groß? Sind Sie blond? Ein weiteres Indiz für eine Binomialverteilung ist, dass es mehrere Wiederholungen eines Zufallsexperiments gibt. Die Anzahl der Wiederholungen wird in der Formelsammlung mit n bezeichnet. Es wird also nicht die Qualität eines Produktionsstücks betrachtet, sondern gleich eine ganze Lieferung von mehreren Produktionsstücken. Und es wird nicht die Körpergröße bzw. Haarfarbe einer Person betrachtet, sondern zugleich von mehreren Personen. Des Weiteren müssen die Wiederholungen des Zufallsexperiments stochastisch unabhängig voneinander sein. Wurde die stochastische Unabhängigkeit in der Aufgabenstellung nicht genannt, so muss der Studierende (w,m) sie selbständig erkennen. Stochastische Unabhängigkeit bedeutet für z. B. zwei Wiederholungen des Zufallsexperiments, dass die Qualität des zweiten Produktionsstücks nicht abhängt von der Qualität des ersten Produktionsstücks. Oder die Körpergröße der zweiten Person nicht abhängt von der Körpergröße der ersten Person. Ebenso dass die Haarfarben zweier zufällig ausgewählter Personen nicht voneinander abhängen. Eine Binomialverteilung als Approximation einer hypergeometrischen Verteilung lässt sich daran erkennen, dass die Gesamtanzahl N der Elemente in der Grundgesamtheit bekannt ist (wie z. B. in Aufgabe 8.4). Und aus der Grundgesamtheit werden n Elemente ohne Zurücklegen herausgezogen, z. B. gibt es N = 1 000 Produktionsstücke, aus denen n = 20 Stücke gekauft werden. Faustregel für die Approximation ist, dass der Auswahlsatz n N in Formel 75 höchstens 5 % beträgt. Fehler, die Sie vermeiden sollten! Ein weiteres Problem bei Binomialverteilungs-Aufgaben ist ein Wechsel in der Aufgabenstellung von z. B. der Anzahl der Ausschussstücke zu der Anzahl der Qualitätsstücke (wie in Aufgabe 8.3). Tipp! Um beim Wechsel der Betrachtung von Ereignis A zu Ereignis A Fehler zu vermeiden, sollte immer aufgeschrieben werden, was gezählt wird, also z. B. ob X = „Anzahl der Ausschussstücke“ oder X = „Anzahl der Qualitätsstücke“ in der Lieferung von n Produktionsstücken bezeichnet. Ist X = „Anzahl der Ausschussstücke“ in einer Lieferung von n = 10 Produktionsstücken und ist nach der Wahrscheinlichkeit gefragt, dass sich genau sieben Qualitätsstücke in der Lieferung befinden, <?page no="64"?> 52 Kapitel 8: Binomialverteilung so ist die Wahrscheinlichkeit P ( X = 3) zu berechnen. Möglich wäre jetzt auch ein Wechsel der Bezeichnung der Zufallsvariablen, was ich aber aus Sicht eines Prüfers, der schon etliche Klausuren korrigiert hat, nicht empfehlen kann. Fehler, die Sie vermeiden sollten! Schwierigkeiten gibt es ebenfalls, wenn eine Binomialverteilung durch eine Normalverteilung approximiert wird. Tipp! Die Approximation einer BV durch eine NV aufgrund des Zentralen Grenzwertsatzes ist zulässig, wenn die Faustregel np ≥ 10 und n (1 − p ) ≥ 10 erfüllt ist. Hintergrund für diese Approximation ist der Zentrale Grenzwertsatz. Er gilt für beliebige Verteilungen, insb. also auch für eine Binomialverteilung. Da die Binomialverteilung in der Praxis sehr häufig vorkommt, gibt es jedoch eine abweichende präzisere Näherungsformel Formel 70 exklusiv für eine Binomialverteilung. Diese spezielle Näherungsformel Formel 70 enthält den sogenannten NV-Korrekturterm 0,5. Statt P ( X 1 + . . . X n ≤ x ) wie üblich mit F U ( x − nE [ X ] √ n Var [ X ] ) zu approximieren, wird diese Wahrscheinlichkeit bei Vorliegen einer Binomialverteilung mit F U ( x + 0 , 5 − nE [ X ] √ n Var [ X ] ) angenähert (wie z. B. in Aufgabe 8.5). <?page no="65"?> Kapitel 9: Normalverteilung Das sollten Sie wissen! Eine Normalverteilung ist ein Modell für eine Verteilung. Mit exakten Wahrscheinlichkeiten gemäß einer Normalverteilung wird gerechnet, wenn in der Aufgabenstellung eine Normalverteilung vorgegeben ist. Liegt hingegen in der Aufgabenstellung eine beliebige Verteilung vor und sind die Voraussetzungen des Zentralen Grenzwertsatzes erfüllt, so wird approximativ mit einer Normalverteilung gerechnet. Ist die in der Aufgabenstellung vorgegebene Verteilung eine Binomialverteilung, so gibt es eine spezielle Approximation durch den Zentralen Grenzwertsatz wie z. B. in Aufgabe 8.5. 9.1 Exakte Verteilung Aufgabe 9.1 Schwierigkeit: mittelschwer Zeit: 8 Minuten Auf einem Flughafen kann die Wartezeit zwischen zwei Anschlussflügen als normalverteilt mit dem Erwartungswert 120 Minuten und der Standardabweichung 60 Minuten angesehen werden. 53 <?page no="66"?> 54 Kapitel 9: Normalverteilung [a] Wie groß ist der Anteil der Anschlussflüge [1] mit höchstens 55 Minuten zum Umsteigen? [2] die genau 55 Minuten zum Umsteigen haben? [3] die mehr als 90 Minuten zum Umsteigen haben? [b] Mit welcher Umsteigezeit muss mit einer Wahrscheinlichkeit von 95 % mindestens gerechnet werden? Aufgabe 9.2 Schwierigkeit: schwer Zeit: 15 Minuten Nehmen Sie an, dass die tägliche Auslieferungszeit (in Stunden) eines Paketboten normalverteilt ist mit dem Erwartungswert acht Stunden und der Standardabweichung zwei Stunden. [a] Wie groß ist die Wahrscheinlichkeit, dass der Paketbote [1] höchstens sieben Stunden an einem Tag unterwegs ist? [2] genau acht Stunden am Tag unterwegs ist? [3] über acht Stunden unterwegs ist? [4] zwischen sechs und zehn Stunden unterwegs ist? [b] Mit welcher Auslieferungszeit pro Tag ist mit einer Wahrscheinlichkeit von 95 % mindestens zu rechnen? [c] Nehmen Sie an, dass die täglichen Auslieferungszeiten stochastisch unabhängig voneinander sind. Wie groß ist dann die Wahrscheinlichkeit, dass ein Paketbote [1] an zwei Arbeitstagen hintereinander mindestens einmal höchstens sieben Stunden unterwegs ist? [2] in einer Woche mit sechs Arbeitstagen nur an einem Tag höchstens sieben Stunden unterwegs ist? Aufgabe 9.3 Schwierigkeit: schwer Zeit: 15 Minuten Die Funktionsdauer (gemessen in Stunden) einer Taschenlampe mit einem Satz Batterien sei normalverteilt. <?page no="67"?> 9.1. Exakte Verteilung 55 [a] Der Erwartungswert der Funktionsdauer (gemessen in Stunden) einer Taschenlampe vom Typ X beträgt 240 Stunden und die Standardabweichung beträgt 20 Stunden. [1] Wie groß ist die Wahrscheinlichkeit, dass die Funktionsdauer einer solchen Taschenlampe mehr als 250 Stunden beträgt? [2] Welche Funktionsdauer einer solchen Taschenlampe wird mit einer Wahrscheinlichkeit von 97,5 % nicht überschritten? [3] Bestimmen Sie die Ober- und die Untergrenze des zweifachen zentralen Schwankungsintervalls [ μ − 2 · σ ; μ + 2 · σ ] . [4] Berechnen Sie das zentrale Schwankungsintervall [ μ − c · σ ; μ + c · σ ] , innerhalb dessen die Funktionsdauer einer solchen Taschenlampe mit einer Wahrscheinlichkeit von 90 % liegt. [b] Der Erwartungswert der Funktionsdauer (gemessen in Stunden) einer Taschenlampe vom Typ Y beträgt 200 Stunden. Ferner ist bekannt, dass 2,5 % dieser Taschenlampen eine Funktionsdauer von höchstens 180,4 Stunden besitzen. Bestimmen Sie die theoretische Standardabweichung der Funktionsdauer einer solchen Taschenlampe vom Typ Y. Aufgabe 9.4 Schwierigkeit: schwer Zeit: 12 Minuten Die Anzahl der Pkw auf einer Kreuzung an einem Wochenende sei normalverteilt mit dem Erwartungswert 10 000 Pkw und der Standardabweichung 2 000 Pkw. [a] Wie groß ist die Wahrscheinlichkeit, dass am kommenden Wochenende die Anzahl der Pkw auf dieser Kreuzung unter 11 000 Pkw liegt? [b] Nehmen Sie an, dass die Anzahlen der Pkw auf dieser Kreuzung an verschiedenen Wochenenden stochastisch unabhängig voneinander sind. Wie groß ist die Wahrscheinlichkeit, dass [1] an den nächsten beiden Wochenenden genau einmal die Anzahl der Pkw auf dieser Kreuzung unter 11 000 liegt? [2] an den nächsten sechs Wochenenden genau zweimal die Anzahl der Pkw auf dieser Kreuzung unter 11 000 liegt? <?page no="68"?> 56 Kapitel 9: Normalverteilung 9.2 Approximative Verteilung Aufgabe 9.5 Schwierigkeit: schwer Zeit: 15 Minuten Ein Reiseveranstalter bietet für eine Flusskreuzfahrt drei unterschiedliche Tickets an. Der Gewinn des Reiseveranstalters hängt unter anderem von der Ticketart ab. Folgende Anteile sind aus Erfahrung bekannt: 50 % der Gäste sind Frühbucher. Der Gewinn pro Frühbucher beträgt 5 GE. 30 % der Gäste zahlen den Normalpreis, der einen Gewinn von 10 GE pro verkauftem Ticket bringt. Der Rest der Gäste erhält ein ermäßigtes Ticket, das einen Gewinn von 2 GE pro verkauftem Ticket bringt. [a] Betrachten Sie die Zufallsvariable X = „Gewinn (in GE) pro Ticket“. [1] Berechnen Sie den erwarteten Gewinn pro Ticket. [2] Berechnen Sie die Varianz von X . [b] Wie hoch ist näherungsweise die Wahrscheinlichkeit, dass bei 400 Gästen der Gesamtgewinn über 2 400 GE liegt? [c] Welcher Gewinn wird näherungsweise bei 400 Gästen mit der Wahrscheinlichkeit von 95 % überschritten? Aufgabe 9.6 Schwierigkeit: schwer Zeit: 15 Minuten Eine Telefongesellschaft möchte eine Werbekampagne starten, um 10 000 neue Kunden zu gewinnen. Das Unternehmen teilt seine Kunden in A-, B- und C-Kunden ein. Bei den Neukunden geht das Unternehmen von folgenden Daten aus: A-Kunde, durchschnittlicher Umsatz von 100 e pro Monat je A-Kunde, insgesamt 22 % des neuen Kundenstamms werden A-Kunden sein B-Kunde, durchschnittlicher Umsatz von 50 e pro Monat je B-Kunde, insgesamt 58 % des neuen Kundenstamms werden B-Kunden sein C-Kunde, durchschnittlicher Umsatz von 10 e pro Monat je C-Kunde, insgesamt 20 % des neuen Kundenstamms werden C-Kunden sein <?page no="69"?> 9.3. Häufige Fehler in Klausuren 57 [a] Mit welchen Mehreinnahmen ist bei 10 000 Neukunden zu rechnen? [b] Mit welcher Wahrscheinlichkeit betragen die Mehreinnahmen durch 10 000 Neukunden mehr als 527 000 e ? [c] Welche Mehreinnahmen werden bei der Neugewinnung von 10 000 Kunden mit der Wahrscheinlichkeit von 5 % nicht überschritten? 9.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Bei der Berechnung von oberen Prozentpunkten x mit p = P ( X > x ) gibt es in der Klausur oft abenteuerliche Umformungen. Tipp! Bei der Berechnung von oberen Prozentpunkten x mit p = P ( X > x ) wird wie folgt vorgegangen: [1] Zunächst wird die Wahrscheinlichkeit vom Gegenereignis betrachtet: 1 − p = P ( X ≤ x ) . [2] Danach wird der (1 − p ) -Prozentpunkt u 1− p der Standard-Normalverteilung aus der NV-Tabelle auf den Seiten 190 und 191 abgelesen. [3] Mit der Standardisierung gemäß Formel 79 ergibt sich dann: u 1− p = x − μ σ . [4] Somit beträgt der obere Prozentpunkt: x = μ + u 1− p · σ (wie z. B. der obere 5 %-Punkt in Aufgabe 9.1). Fehler, die Sie vermeiden sollten! Das Vorliegen einer Normalverteilung ist in Klausuren entweder vorgegeben oder es muss vom Prüfling eigenständig erkannt werden, dass eine Normalverteilung aufgrund des Zentralen Grenzwertsatzes zutrifft, was oft schwierig ist. Tipp! Entscheidend für eine NV-Approximation sind neben den Voraussetzungen des Zentralen Grenzwertsatzes folgende Kriterien: <?page no="70"?> 58 Kapitel 9: Normalverteilung Es sind mindestens n = 30 Zufallsvariablen X 1 , X 2 , . . . X n vorhanden, die alle dieselbe Verteilung haben. Erwartungswert μ und theoretische Varianz σ 2 einer jeden dieser n Zufallsvariablen lassen sich berechnen oder sind sogar vorgegeben. Die Wahrscheinlichkeit, die berechnet werden soll, ist die Wahrscheinlichkeit eines Ereignisses über entweder die Summe (Formel 81) oder den Durchschnitt (Formel 82) der n Zufallsvariablen. Summen-Beispiel: Die Gesamtsumme der Spenden von n Personen beträgt mindestens 10 000 Euro. Durchschnitt-Beispiel: Die Spende pro Person beträgt bei n Personen höchstens 1 000 Euro. Ein Sonderfall des Zentralen Grenzwertsatzes bildet die Approximation einer Binomialverteilung. Exklusiv für eine Binomialverteilung gibt es die spezielle Formel 70 für die Approximation durch eine Normalverteilung gemäß dem Zentralen Grenzwertsatz. <?page no="71"?> Kapitel 10: Konfidenzintervalle Das sollten Sie wissen! Die Formelsammlung hält Berechnungen für ein Konfidenzintervall für einen Erwartungswert (Formeln 83 und 85) und für ein Konfidenzintervall für einen Anteilswert (Formeln 87 und 88) bereit. Darauf aufbauend unterscheiden sich auch die Berechnungen für einen Mindeststichprobenumfang je nachdem, welches der beiden Konfidenzintervalle berechnet werden soll. 10.1 Erwartungswert Aufgabe 10.1 Schwierigkeit: mittelschwer Zeit: 8 Minuten Ein Marktforschungsinstitut soll Aufschluss darüber geben, wie viel Geld für Urlaubsreisen ausgegeben wird. Dazu möchte das Institut ein 0,95-Konfidenzintervall für die mittlere Höhe der Ausgaben für Urlaubsreisen berechnen. Bei einer Umfrage: „Wie viel Euro planen Sie für Ihre nächste Urlaubsreise auszugeben? “ erhielt das Institut 100 Antworten. Es ergaben sich folgende Daten x 1 , . . . x 100 : 59 <?page no="72"?> 60 Kapitel 10: Konfidenzintervalle i x i ( x i − x ) 2 1 300 239 121 2 600 35 721 ... ... ... 100 800 121 ∑ 78 900 9 137 900 [a] Berechnen Sie aus den Daten das gesuchte Konfidenzintervall. [b] Interpretieren Sie das berechnete Konfidenzintervall. Aufgabe 10.2 Schwierigkeit: mittelschwer Zeit: 8 Minuten Die Fakultät einer Hochschule möchte den Zeitaufwand (gemessen in Stunden pro Woche) für Nebenbeschäftigungen ihrer 2 221 Studierenden ermitteln. [a] In einer früheren Umfrage zum gleichen Thema betrug der durchschnittliche Zeitaufwand pro Woche eines Studierenden zwölf Stunden und die Standardabweichung in der Stichprobe betrug 1,2 Stunden. Wie viele Studierende sind mindestens zu befragen, damit das gesuchte 0,95-Konfidenzintervall höchstens die Breite von 0 , 4 hat, d. h. nur um ±0 , 2 Stunden vom wahren mittleren Zeitaufwand aller 2 221 Studierenden abweicht? [b] Bei einer Umfrage von 150 Studierenden ergab sich ein durchschnittlicher Zeitaufwand von 12,5 Stunden pro Woche, und die Standardabweichung in der Stichprobe betrug zwei Stunden. Berechnen Sie ein 0 , 95 -Konfidenzintervall für den mittleren Zeitaufwand eines Studierenden. [c] Wieso kann es passieren, dass die Breite des unter Teilaufgabe [b] berechneten Konfidenzintervalls größer ist als die unter Teilaufgabe [a] geforderte Breite von 0,4 Stunden? Aufgabe 10.3 Schwierigkeit: schwer Zeit: 5 Minuten Sie haben für einen Datensatz das arithmetische Mittel x und die Standardabweichung s x berechnet, um ein Konfidenzintervall für μ bestimmen zu können. <?page no="73"?> 10.1. Erwartungswert 61 [a] Für welches der beiden Konfidenzniveaus 1 − α = 0 , 95 1 − α = 0 , 99 ist das Konfidenzintervall schmaler? (Begründung! ) [b] Sie berechnen aus den erhobenen Daten ein 0,95-Konfidenzintervall für μ . Das berechnete 0,95-Konfidenzintervall ist Ihnen zu breit. Sie möchten ein schmaleres 0,95- Konfidenzintervall. Müssen Sie dazu den Stichprobenumfang vergrößern oder verkleinern? (Begründung! ) Aufgabe 10.4 Schwierigkeit: leicht Zeit: 5 Minuten Das mittlere Einkommen (gemessen in Euro) von 10 000 Ärzten soll geschätzt werden. Zu diesem Zweck wird eine Zufallsstichprobe von 100 Ärzten gezogen, die ein jährliches Durchschnittseinkommen von 80 000 Euro bei einer empirischen Standardabweichung von 7 500 Euro ergibt. [a] Berechnen Sie für das unbekannte mittlere Einkommen aller Ärzte ein 95 % -Konfidenzintervall. [b] Bitte interpretieren Sie anschließend Ihr Ergebnis zu Teilaufgabe [a] in Worten: Was bedeutet es inhaltlich? Aufgabe 10.5 Schwierigkeit: leicht Zeit: 8 Minuten Die Wartezeit (in Sekunden) eines Kunden in einer Telefonzentrale eines Versandhauses kann als normalverteilt angesehen werden mit den Parametern μ und σ . Um Aufschluss über die mittlere Wartezeit eines Kunden zu erhalten, wurden bei vierzig Anrufern die Wartezeiten erfasst. Aus den Daten ergaben sich folgende Werte: Arithmetisches Mittel x = 20 Sekunden Standardabweichung s x = 6 , 40 Sekunden [a] Berechnen Sie aufgrund der Daten ein 0,95-Konfidenzintervall für die mittlere Wartezeit eines Kunden. <?page no="74"?> 62 Kapitel 10: Konfidenzintervalle [b] Interpretieren Sie anschließend das Intervall, das Sie als Ergebnis zur Teilaufgabe [a] ausgerechnet haben. [c] Nach wie vor soll s x = 6 , 40 gelten. Es soll nun aber ein weiteres 0,95-Konfidenzintervall für μ berechnet werden, das nur noch die Breite von zwei Sekunden haben soll (anders ausgedrückt: Das neue Konfidenzintervall soll um höchstens eine Sekunde vom wahren Wert abweichen). Bei wie vielen Kunden ist dann die Wartezeit zu erfragen? 10.2 Anteilswert Aufgabe 10.6 Schwierigkeit: mittelschwer Zeit: 8 Minuten Seit Sommer 2013 hat Facebook die automatische Erfassung von Nutzerzahlen unterbunden. Deshalb soll anhand eines 0,96-Konfidenzintervalls der Anteil der Facebook- Nutzer in der BRD geschätzt werden. [a] Im Sommer 2013 betrug der Anteil der Facebook-Nutzer unter den über 13-Jährigen in der BRD etwa 34 %. Wie viele über 13 Jahre alten Einwohner in der BRD sind zu befragen, damit das gesuchte Konfidenzintervall um höchstens drei Prozentpunkte vom wahren Wert abweicht? [b] Von 1 200 befragten über 13-Jährigen gaben 421 Befragte an, Facebook zu nutzen. [1] Berechnen Sie anhand der Stichprobe das gesuchte Konfidenzintervall. [2] Interpretieren Sie das berechnete Konfidenzintervall. Aufgabe 10.7 Schwierigkeit: mittelschwer Zeit: 8 Minuten In einer Stadt mit 100 000 Einwohnern soll der Anteil der Raucher an der Gesamtbevölkerung geschätzt werden. Das Gesundheitsamt der Stadt verlangt, dass die durchzuführende Studie zu Ergebnissen kommt, die mit einer Wahrscheinlichkeit von 95 % zutreffen. Bei einer Umfrage unter 897 Einwohnern befanden sich genau 269 Raucher. Schätzen Sie anhand der Umfrage den Anteil der Raucher in der Stadt, wenn die oben genannte Anforderung erfüllt werden soll. Und interpretieren Sie Ihr Ergebnis. <?page no="75"?> 10.3. Häufige Fehler in Klausuren 63 Aufgabe 10.8 Schwierigkeit: schwer Zeit: 8 Minuten Eine Unternehmung führt für ihr Produkt A eine Kundenanalyse durch. Dabei interessiert u.a., wie hoch der Anteil der „treuen“ Kunden ist, d. h. derjenigen Kunden, die das Produkt A seit mindestens zehn Jahren kaufen. [a] Es soll ein 0,95-Konfidenzintervall für den Anteil der treuen Kunden berechnet werden. Wie viele Kunden sind zu befragen, damit der Anteil der treuen Kunden in der Stichprobe höchstens um drei Prozentpunkte vom Anteil der treuen Kunden in der Grundgesamtheit abweicht? [b] Insgesamt wurden 1 246 Kunden befragt, seit wie vielen Jahren sie schon das Produkt A kaufen: Jahre Anzahl der Kunden noch kein Jahr 641 1 bis unter 5 Jahre 367 5 bis unter 10 Jahre 128 10 bis unter 12 Jahre 87 12 Jahre oder länger 23 ∑ 1 246 Berechnen Sie anhand der Stichprobe ein 0,95-Konfidenzintervall für den Anteil der treuen Kunden in der Grundgesamtheit. [c] Interpretieren Sie das erhaltene Intervall unter Teilaufgabe [b]. 10.3 Häufige Fehler in Klausuren Fehler, die Sie vermeiden sollten! Ein häufiger Fehler in Klausuren ist die Verwechslung der beiden Konfidenzintervalle für p und für μ . Tipp! Die Verwechslung der beiden Konfidenzintervalle für μ und p lässt sich vermeiden, wenn Folgendes beachtet wird: <?page no="76"?> 64 Kapitel 10: Konfidenzintervalle Es ist ein Konfidenzintervall für p (Formeln 87 und 88) zu berechnen, wenn die Frage für die Stichprobe so gestellt werden kann (aber nicht muss), dass der Befragte mit Ja oder Nein antworten kann. Zum Beispiel: „Kennen Sie das Produkt A ? “ Oder: „Liegt Ihr Nettogehalt über 2 000 Euro im Monat? “ (Hier könnte die Frage auch lauten: „Wie hoch ist Ihr Nettogehalt“. Dann müsste anschließend in der Stichprobe abgezählt werden, wie viele Befragte ein Nettogehalt über 2 000 Euro haben.) Es ist ein Konfidenzintervall für μ (Formeln 83 und 85) zu berechnen, wenn der Befragte mit einer Zahlenangabe antworten muss. Zum Beispiel: „Wie hoch ist Ihr Einkommen? “ Oder: „Wie oft haben Sie in diesem Monat Produkt A gekauft? “ Fehler, die Sie vermeiden sollten! Ist des Weiteren das Konfidenzniveau 1 − α nicht mit einem der drei üblichen Werte 0,90 bzw. 0,95 bzw. 0,99 vorgegeben, sondern beträgt z. B. das Konfidenzniveau 1 − α = 0 , 96 wie in Aufgabe 10.6, so fällt es einigen Studierenden schwer, den zugehörigen Prozentpunkt u 1− α 2 der Standard-Normalverteilung zu bestimmen. Tipp! Für das Konfidenzniveau 1 − α = 0 , 96 wird für die Bestimmung des (1 − α 2 ) -Prozentpunkts der Standard-Normalverteilung wie folgt vorgegangen: [1] Zunächst wird die Differenz zwischen 1 und 0,96 berechnet, sie beträgt 1−0 , 96 = 0 , 04 . [2] Anschließend wird die Hälfte dieser Differenz von 1 subtrahiert, also 1 − 0 , 04 2 = 1 − 0 , 02 = 0 , 98 . [3] Der gesuchte Prozentpunkt u 1− α 2 ist der 98 %-Punkt. Gemäß der NV-Tabelle auf der Seite 191 beträgt der Prozentpunkt 2,0537. <?page no="77"?> Kapitel 11: Statistische Tests Das sollten Sie wissen! Die Formelsammlung ab Seite 175 enthält vier statistische Tests: Gaußtest (Formel 91) t -Test (Formel 92) χ 2 -Unabhängigkeitstest (Formeln 93 und 94) χ 2 -Anpassungstest (Formel 95) 11.1 Gaußtest Aufgabe 11.1 Schwierigkeit: schwer Zeit: 12 Minuten Gehen Frauen heutzutage länger zur Schule als ihre Mütter? Um diese Frage zu beantworten, wurden 722 US-Amerikanerinnen befragt. Es ergaben sich folgende arithmetischen Mittel: Schuldauer (in Jahren) Tochter Mutter 13,04 10,53 Nehmen Sie an, dass die Differenz „Schuldauer der Tochter minus Schuldauer ihrer Mutter“ (gemessen in Jahren) normalverteilt ist mit der Standardabweichung σ = 3 , 37 Jahre. 65 <?page no="78"?> 66 Kapitel 11: Statistische Tests [1] Prüfen Sie mit einem Test zum Niveau α = 0 , 05 , ob es signifikante Unterschiede in den mittleren Schuldauern von Töchtern und ihren Müttern gibt. [2] Falls Sie unter Teilaufgabe [1] einen signifikanten Unterschied aufgedeckt haben, so prüfen Sie mit einem einseitigen Test zum Niveau α = 0 , 05 , welche der beiden Gruppen Töchter oder Mütter im Mittel länger zur Schule geht. 11.2 t -Test Aufgabe 11.2 Schwierigkeit: schwer Zeit: 20 Minuten Haben heutzutage Paare weniger Kinder als es in ihren Ursprungsfamilien gab? Um diese Frage zu beantworten, wurden 31 Personen befragt. Es ergaben sich folgende Werte: Nr. Anzahl Nr. Anzahl Geschwister Kinder Geschwister Kinder 1 0 2 16 5 2 2 1 1 17 3 1 3 1 1 18 5 2 4 1 0 19 11 2 5 3 0 20 4 1 6 6 5 21 1 1 7 6 3 22 6 0 8 6 4 23 3 0 9 6 3 24 6 3 10 0 2 25 5 1 11 5 0 26 6 0 12 1 5 27 3 3 13 0 0 28 4 0 14 1 1 29 0 2 15 6 1 30 0 2 31 6 1 [1] Prüfen Sie mit einem Test, ob sich die Kinderanzahlen von heute und früher signifikant unterscheiden. [2] Falls Sie unter Teilaufgabe [1] einen signifikanten Unterschied aufgedeckt haben, so prüfen Sie mit einem einseitigen Test, ob Paare heutzutage signifikant weniger Kinder im Vergleich zu ihren Ursprungsfamilien haben. [3] Wie viele Kinder gibt es heutzutage signifikant weniger? <?page no="79"?> 11.3. Chi-Quadrat-Unabhängigkeitstest 67 11.3 Chi-Quadrat-Unabhängigkeitstest Aufgabe 11.3 Schwierigkeit: schwer Zeit: 15 Minuten Streben Frauen und Männer in die gleichen Berufe? Überprüfen Sie mit einem geeigneten Test zum Niveau 0,05, ob der Ausbildungsbereich und das Geschlecht eines Auszubildenden stochastisch unabhängig sind. Eine Umfrage unter den Auszubildenden in einer Stadt ergab folgende Werte: Ausbildungsbereich Frauen Männer Industrie und Handel 60 40 Handwerk 20 80 öffentlicher Dienst 40 60 Gehen Sie wie folgt vor: [1] Wie heißt der Test? [2] Wie lautet die Nullhypothese des Tests? [3] Überprüfen Sie, ob die Faustregel des Tests erfüllt ist. [4] Berechnen Sie den empirischen Wert der Teststatistik. [5] Wie lautet die Testentscheidung aufgrund der obigen Stichprobe? (Begründung! ) Interpretieren Sie in knappen Worten das Ergebnis. Aufgabe 11.4 Schwierigkeit: schwer Zeit: 20 Minuten In Deutschland stehen stillenden berufstätigen Müttern während der Arbeitszeit Stillzeiten zu, die nicht nachgearbeitet werden dürfen. Überprüfen Sie mit einem geeigneten Test, ob Stillbereitschaft und Berufstätigkeit stochastisch unabhängig sind. Eine Umfrage unter Müttern von sechs Monate alten Kindern, ob sie stillen und ob sie berufstätig sind, ergab folgende Daten: Berufstätig Stillen nein ja nein 40 80 ja 70 10 <?page no="80"?> 68 Kapitel 11: Statistische Tests Gehen Sie wie folgt vor: [1] Wie heißt der Test? [2] Wie lautet die Nullhypothese des Tests? [3] Überprüfen Sie, ob die Faustregel des Tests erfüllt ist. [4] Berechnen Sie den empirischen Wert der Teststatistik. [5] Wie lautet die Testentscheidung aufgrund der obigen Stichprobe? (Begründung! ) Interpretieren Sie in knappen Worten das Ergebnis. 11.4 Chi-Quadrat-Anpassungstest Aufgabe 11.5 Schwierigkeit: schwer Zeit: 15 Minuten Eine Reifenwerkstatt möchte untersuchen, ob die Anzahl der Reparaturen an jedem der fünf Wochentage Mo, Di, Mi, Do, Fr in etwa gleich hoch ist. Überprüfen Sie mit einem geeigneten Test zum Niveau 0,05, ob die fünf Reparatur-Wochentage gleich wahrscheinlich sind. In der letzten Woche wurden an den einzelnen Wochentagen so viele Reparaturen durchgeführt: Wochentag Mo Di Mi Do Fr Anzahl Reparaturen 30 40 40 60 30 Gehen Sie wie folgt vor: [1] Wie heißt der Test? [2] Wie lautet die Nullhypothese des Tests? [3] Überprüfen Sie, ob die Faustregel des Tests erfüllt ist. [4] Berechnen Sie den empirischen Wert der Teststatistik. [5] Wie lautet die Testentscheidung aufgrund der obigen Stichprobe? (Begründung! ) Interpretieren Sie in knappen Worten das Ergebnis. 11.5 Häufige Fehler in Klausuren Dass in einer Klausuraufgabe nach einem statistischen Test gefragt ist, wird von den Studierenden erfreulich gut erkannt. (Die Fragestellung, einen Test zum Niveau α = 0 , 05 durchzuführen, lässt sich auch schwer verstecken.) <?page no="81"?> 11.5. Häufige Fehler in Klausuren 69 Fehler, die Sie vermeiden sollten! Der Fehler, der dann aber manchmal auftritt, ist, dass ein anderer als der geforderte Test durchgeführt wird. (Dieser Fehler wird in der Literatur scherzhaft als Fehler dritter Art bezeichnet.) Tipp! Um sich gegen die Verwechslung von statistischen Tests abzusichern, muss der Name eines statistischen Tests zugleich mit der Nullhypothese dieses Tests assoziiert werden: Gaußtest mit H 0 : „Der Erwartungswert ist soundso groß.“ (Hier muss die theoretische Varianz σ 2 der Normalverteilung bekannt sein! ) t -Test mit H 0 : „Der Erwartungswert ist soundso groß.“ χ 2 -Unabhängigkeitstest mit H 0 : „Zwei Variablen sind stochastisch unabhängig.“ χ 2 -Anpassungstest mit H 0 : „Eine Variable hat eine bestimmte Verteilung“, die durch die I Einzelwahrscheinlichkeiten p 1 , p 2 , . . . , p I vollständig festgelegt ist. Fehler, die Sie vermeiden sollten! Probleme gibt es immer wieder bei der Testentscheidung. Hierzu müssen zwei Zahlen der Größe nach miteinander verglichen werden. Tipp! Die Nullhypothese eines statistischen Tests zum Niveau 0,05 wird genau dann abgelehnt, wenn entweder der p -Wert gleich wie oder kleiner als 0 , 05 ist (Gaußtest und t -Test) oder wenn der empirische Wert der Teststatistik gleich wie oder größer als der obere 5 % -Punkt der χ 2 -Verteilung ist. ( χ 2 -Unabhängigkeitstest und χ 2 - Anpassungstest) <?page no="83"?> Kapitel 12: Gemischte Aufgaben Tipp! Entgegen dem ersten Eindruck von Statistik ist für Studierende nicht das Einsetzen von Zahlen in eine Formel das Problem, sondern das Erkennen, welche der Formeln zutrifft. Wenn Sie das Einsetzen von Zahlen in die Formeln zur Statistik beherrschen, sollten Sie jetzt in diesem Kapitel üben zu erkennen, was in einer Aufgabe zu rechnen ist. Aufgabe 12.1 Schwierigkeit: schwer Zeit: 20 Minuten [a] Mit Hilfe eines linearen Regressionsmodells soll der Jahresumsatz eines Handelsvertreters aufgrund seiner Berufserfahrung (in Jahren) vorhergesagt werden. Dazu stehen folgende Daten von fünf Handelsvertretern zur Verfügung: Berufserfahrung Umsatz in Jahren in 1 000 Euro 1 80 3 97 6 103 10 119 11 117 71 <?page no="84"?> 72 Kapitel 12: Gemischte Aufgaben [1] Mit welchem Jahresumsatz eines Handelsvertreters mit neun Jahren Berufserfahrung ist zu rechnen? [2] Interpretieren Sie die Steigung der Regressionsgeraden unter Teilaufgabe [a][1]. [3] Ist der in Teilaufgabe [a][1] vorhergesagte Wert aus statistischer Sicht zuverlässig? (Begründung! ) [b] Betrachten Sie die beiden Ereignisse “Berufserfahrung liegt über fünf Jahre“ und “Jahresumsatz liegt über dem Durchschnitt“. In einem Land haben 20 % aller Handelsvertreter einen überdurchschnittlichen Jahresumsatz. Darüber hinaus haben 75 % aller Handelsvertreter mit nicht überdurchschnittlichem Jahresumsatz höchstens fünf Jahre Berufserfahrung. Außerdem haben 50 % aller Handelsvertreter mit überdurchschnittlichem Jahresumsatz über fünf Jahre Berufserfahrung. [1] Wie viel Prozent aller Handelsvertreter haben sowohl über fünf Jahre Berufserfahrung als auch einen überdurchschnittlichen Jahresumsatz? [2] Wie viel Prozent aller Handelsvertreter haben über fünf Jahre Berufserfahrung? Aufgabe 12.2 Schwierigkeit: schwer Zeit: 20 Minuten Ein Bauunternehmen unterteilt seine Projekte in eine Entwurfs- und eine Konstruktionsphase. Die Wahrscheinlichkeit, dass die Entwurfsphase eines Projekts in der veranschlagten Zeit fertiggestellt wird, beläuft sich auf 60 %. Die Wahrscheinlichkeit, dass die Konstruktionsphase eines Projekts in der geplanten Zeit fertiggestellt wird, gegeben dass die Entwurfsphase in der Zeit fertig geworden ist, beläuft sich auf 70 %. Die Wahrscheinlichkeit, dass bei einem Projekt sowohl die Entwurfsals auch die Konstruktionsphase nicht in der Zeit fertiggestellt werden, beläuft sich auf 20 %. [a] Bestimmen Sie die Wahrscheinlichkeit, dass bei einem zufällig ausgewählten Projekt: [1] die Entwurfsphase zwar in der Zeit, aber die Konstruktionsphase nicht in der Zeit fertiggestellt werden. [2] die Konstruktion in der Zeit fertiggestellt wird. [3] die Entwurfsphase nicht in der veranschlagten Zeit fertiggestellt wird, gegeben dass die Konstruktionsphase in der Zeit fertiggestellt wurde. [b] Sind die Ereignisse „Fertigstellung der Entwurfsphase in der veranschlagten Zeit“ und „Fertigstellung der Konstruktionsphase in der veranschlagten Zeit“ stochastisch unabhängig? <?page no="85"?> Kapitel 12: Gemischte Aufgaben 73 [c] Die theoretische Verteilungsfunktion für die Dauer X (in Monaten) der Konstruktionsphase der Projekte ist in der folgenden Tabelle dargestellt: x =Dauer in Monaten Verteilungsfunktion P ( X ≤ x ) 6 0,1 7 0,5 8 0,7 9 0,8 10 1,0 Bestimmen Sie Erwartungswert und Standardabweichung der Konstruktionsphase und interpretieren Sie die Ergebnisse. Aufgabe 12.3 Schwierigkeit: schwer Zeit: 20 Minuten Betrachten Sie die Veränderung in Prozent der Arbeitslosenquote gegenüber der Vorwoche in einem Land. [a] In der nachfolgenden Tabelle sind die ersten sieben Veränderungen der Quote gegenüber der Vorwoche eines Jahres angegeben: Kalenderwoche 1 2 3 4 5 6 7 Veränderung + 12 % + 13 % −12 % + 11 % −10 % + 20 % −10 % Um wie viel Prozent hat sich die Arbeitslosenquote im Zeitraum 4. Kalenderwoche bis 7. Kalenderwoche durchschnittlich pro Woche verändert? [b] Gesucht ist ein 0,94-Konfidenzintervall für den Anteil der Wochen, in denen die Arbeitslosenquote gesunken ist. In den letzten zwei Jahren betrug die wöchentliche Veränderung (in %) der Quote gegenüber der Vorwoche: <?page no="86"?> 74 Kapitel 12: Gemischte Aufgaben Veränderung (in %) 14 −19 −8 −16 34 14 14 −13 14 10 5 8 2 −8 9 14 14 2 −7 7 −8 7 −1 −11 3 17 −11 3 8 5 4 1 17 −10 −5 22 20 5 4 17 8 4 3 4 −17 −5 18 10 16 7 7 −4 −3 3 16 −4 −5 9 12 3 5 4 −2 −6 3 −1 −13 6 9 2 22 1 6 16 9 12 −10 18 −4 5 7 1 8 5 −8 4 7 −3 5 2 7 8 12 16 6 −7 3 −4 −8 1 4 20 11 −5 Berechnen Sie aus der Stichprobe mit n = 104 Wochen das gesuchte Konfidenzintervall und interpretieren Sie das Intervall. [c] Nehmen Sie an, dass für das kommende Quartal die Anzahl der Wochen, in denen die Arbeitslosenquote sinkt, binomialverteilt ist mit p = 0 , 25 und n = 13 Wochen. [1] An wie vielen Wochen ist zu erwarten, dass die Quote sinkt? [2] Wie groß ist die Wahrscheinlichkeit, dass es im kommenden Quartal genau sechsmal zu einer Senkung der wöchentlichen Quote kommt? Aufgabe 12.4 Schwierigkeit: schwer Zeit: 20 Minuten Ein Handy- und PC-Hersteller verfügt über ein exklusives Filialnetz von 900 Filialen. Der Gewinn (in GE) der Filialen ist in der folgenden Tabelle nach Klassen dargestellt: Nr. Gewinn Anzahl der Filialen 1 0 bis 250 000 300 2 über 250 000 bis 500 000 400 3 über 500 000 bis 750 000 150 4 über 750 000 bis 1 000 000 50 [a] Ermitteln Sie, welcher Gewinn von 60 % der Filialen nicht überschritten wurde. [b] Berechnen Sie das arithmetische Mittel und den Median des Gewinns und interpretieren Sie die Ergebnisse. [c] Berechnen Sie die Standardabweichung des Gewinns und interpretieren Sie diese. [d] In der Filiale mit dem größten Gewinn wird die Wahrscheinlichkeit, dass ein Kunde ein Handy kauft, mit 25 % beziffert. Die Wahrscheinlichkeit, dass ein Kunde einen PC <?page no="87"?> Kapitel 12: Gemischte Aufgaben 75 kauft, wird mit 15 % angegeben. Die Wahrscheinlichkeit, dass ein Kunde sowohl ein Handy als auch einen PC kauft, liegt bei 3,75 %. [1] Bestimmen Sie die Wahrscheinlichkeit des Ereignisses „Ein Kunde kauft nichts.“ [2] Bestimmen Sie die Wahrscheinlichkeit des Ereignisses „Ein Kunde kauft mindestens eines der beiden Produkte.“ [3] Prüfen Sie, ob der Kauf eines Handys und der Kauf eines PC stochastisch unabhängig voneinander sind. Aufgabe 12.5 Schwierigkeit: schwer Zeit: 20 Minuten Ein Pharmaunternehmen möchte die Effizienz der eigenen Forschungsaktivität evaluieren. Das Unternehmen möchte dabei die Kosten für Forschung und Entwicklung (F&E- Ausgaben) dem Nutzen der Ausgaben gegenüberstellen. Der Nutzen der Ausgaben soll über die in einem Jahr zugelassenen Patente gemessen werden. Eine Übersicht der F&E- Ausgaben sowie der zugelassenen Patente der letzten fünf Jahre ist in der folgenden Tabelle dargestellt: Jahr F&E-Ausgaben Angemeldete (in Mio. Euro) Patente 2011 100 5 2012 120 4 2013 160 7 2014 140 7 2015 190 9 [a] Bestimmen Sie Durchschnittswert und Median sowie Standardabweichung der F&E- Ausgaben und interpretieren Sie die berechneten Werte. [b] Quantifizieren Sie die Stärke des linearen Zusammenhangs zwischen F&E-Ausgaben und Patentanmeldungen durch ein geeignetes Maß und interpretieren Sie die von Ihnen ermittelte Maßzahl. [c] Bestimmen Sie mit Hilfe der Methode der kleinsten Quadrate, wie viele Patentanmeldungen zu erwarten sind, wenn das Unternehmen 154 Mio. Euro für F&E ausgibt. Erläutern Sie, ob der erwartete Wert zuverlässig ist. [d] Bestimmen Sie anhand der Regressionsgeraden, wie viele Patentanmeldungen weniger zu erwarten sind, wenn die F&E-Ausgaben [1] um eine Mio. Euro gesenkt werden. [2] um 20 Mio. Euro gesenkt werden. <?page no="88"?> 76 Kapitel 12: Gemischte Aufgaben Aufgabe 12.6 Schwierigkeit: schwer Zeit: 20 Minuten In der PISA-Studie erzielten 15-jährige Schüler (w,m) in Deutschland folgende Punkte in den beiden Kompetenzen Mathematik und Naturwissenschaften: Jahr Mathematik Naturwissenschaften 2000 490 487 2003 503 502 2006 504 516 2009 513 520 [a] Wie hoch ist die durchschnittliche jährliche Steigerung (in Prozent) der Punkte der Mathematik-Kompetenz in dem Zeitraum 2000 bis 2009? [b] [1] Mit welcher Punktzahl in Naturwissenschaften ist gemäß der Methode der kleinsten Quadrate beim nächsten Pisa-Test zu rechnen, wenn die Mathematik-Kompetenz 500 Punkte betragen würde? [2] Ist der unter Teilaufgabe [b] [1] ermittelte Prognosewert als verlässlich anzusehen? (Begründung! ) Aufgabe 12.7 Schwierigkeit: schwer Zeit: 20 Minuten [a] Bei dreißig Nonstop-Flügen von Hamburg nach New York wurde die reine Flugzeit X (in Stunden) pro Flug gemessen. Es ergaben sich die folgenden Daten: i x i x i − x ( x i − x ) 2 1 8,84 + 0,22 0,0483 2 8,51 −0 , 11 0,0119 ... ... ... ... 30 8,16 −0 , 47 0,2187 ∑ 258,70 0 8,4413 [1] Berechnen Sie ein 0,95-Konfidenzintervall für die erwartete Flugzeit auf dieser Strecke. [2] Interpretieren Sie das unter Teilaufgabe [a][1] erhaltene Konfidenzintervall. <?page no="89"?> Kapitel 12: Gemischte Aufgaben 77 [b] Die reine Flugzeit (in Stunden) pro Flug von Hamburg nach New York kann als normalverteilte Zufallsvariable aufgefasst werden mit dem Erwartungswert 8,5 Stunden und der Standardabweichung von 0,5 Stunden. [1] Mit welcher Flugzeit ist mit einer Wahrscheinlichkeit von 95 % mindestens zu rechnen? [2] Wie groß ist die Wahrscheinlichkeit, dass die Flugzeit eines Fluges genau 8,5 Stunden beträgt? [3] In welchem zentralen Intervall liegen 95 % aller Flugzeiten auf dieser Strecke? Aufgabe 12.8 Schwierigkeit: schwer Zeit: 20 Minuten [a] Bei einer Umfrage unter FH-Studierenden ergaben sich die folgenden Anreisezeiten (in Min) zur FH: von . . . bis unter . . . Anzahl 0 - 20 50 20 - 60 150 60 - 120 50 [1] Wie hoch ist die durchschnittliche Anreisezeit eines FH-Studierenden? [2] Berechnen Sie eine statistische Maßzahl für die Schwankungen des Datensatzes. [3] Wie viel Prozent der FH-Studierenden benötigen mehr als 30 Minuten für ihren Anreiseweg? [b] Unterstellen Sie, dass die Anreisezeit (in Min) eines FH-Studierenden normalverteilt ist mit dem Erwartungswert von 40 Minuten und der Standardabweichung von 20 Minuten. [1] Wie groß ist die Wahrscheinlichkeit, dass die Anreisezeit eines FH-Studierenden genau 30 Minuten beträgt? [2] Welche Anreisezeit wird von 95 % aller FH-Studierenden nicht überschritten? <?page no="90"?> 78 Kapitel 12: Gemischte Aufgaben Aufgabe 12.9 Schwierigkeit: schwer Zeit: 15 Minuten Die zurückgelegte Kilometerleistung pro Tankfüllung eines Golf GTD sei normalverteilt. [a] Ein Fahrzeuginhaber möchte für seinen Golf GTD den Anteil aller Tankfüllungen schätzen, mit denen die zurückgelegte Kilometerleistung pro Tankfüllung unter 900 km liegt. Für die letzten 100 Tankfüllungen ergaben sich die folgenden Werte: zurückgelegte km Anzahl der Tankfüllungen bis 600 2 über 600 bis 800 8 über 800 bis 900 23 über 900 bis 1 000 61 über 1 000 bis 1 200 5 über 1 200 1 Berechnen und interpretieren Sie anhand der Stichprobe ein 0,95-Konfidenzintervall für den Anteil aller Tankfüllungen, mit denen die zurückgelegte Kilometerleistung unter 900 km liegen wird. [b] Nehmen Sie an, dass die Zufallsvariable „zurückgelegte Kilometerleistung pro Tankfüllung“ den Erwartungswert 1 000 km und die Standardabweichung 250 km hat. Wie groß ist die Wahrscheinlichkeit, dass die nächste Tankfüllung für [1] höchstens 1 000 km reicht? [2] genau 1 000 km reicht? [3] über 800, jedoch höchstens 1 100 km reicht? Aufgabe 12.10 Schwierigkeit: schwer Zeit: 20 Minuten Die monatlichen Handygebühren X (in Euro) eines Mobilfunknutzers sind normalverteilt. [a] Es soll der Anteil der Intensivnutzer, das sind Personen, bei denen über 50 Euro pro Monat an Handygebühren anfallen, geschätzt werden. Wie viele Mobilfunknutzer sind mindestens zu befragen, damit ein 0,95 Konfidenzintervall für den Anteil der Intensivnutzer höchstens die Breite von sechs Prozentpunkten hat? <?page no="91"?> Kapitel 12: Gemischte Aufgaben 79 [b] Eine Stichprobe unter 1 287 Mobilfunknutzern ergab folgende Werte: i x i ( x i − x ) 2 1 41,37 2,17 2 44,56 21,68 ... ... ... 1 287 41,36 2,13 ∑ 51 351,44 31 449,98 Berechnen und interpretieren Sie anhand der Stichprobe ein 0,95-Konfidenzintervall für die mittlere Höhe der Handygebühren eines Mobilfunknutzers. [c] Nehmen Sie an, dass die zugrunde liegende Normalverteilung den Erwartungswert 40 Euro und die Standardabweichung fünf Euro hat. Wie hoch ist der Anteil der Mobilfunknutzer, die über 30 Euro, jedoch höchstens 42 Euro pro Monat für Handygebühren ausgeben? Aufgabe 12.11 Schwierigkeit: schwer Zeit: 20 Minuten Die Anzahl der Tage, die ein Kunde auf einen Neuwagen wartet, kann als normalverteilt angesehen werden mit dem Erwartungswert einundzwanzig Tage und der Standardabweichung zehn Tage. [a] Wie groß ist die Wahrscheinlichkeit, dass ein Kunde [1] höchstens einundzwanzig Tage auf seinen Neuwagen warten muss? [2] genau einundzwanzig Tage auf seinen Neuwagen warten muss? [3] zwischen zwanzig und dreißig Tagen auf seinen Neuwagen warten muss? [b] Mit welcher Wartezeit auf den Neuwagen muss ein Kunde mit der Wahrscheinlichkeit von [1] 90 % mindestens rechnen? [2] 95 % höchstens rechnen? [c] Eine Autofirma möchte den Anteil der Kunden, die länger als achtundzwanzig Tage auf einen Neuwagen warten müssen, mit Hilfe eines 99 %-Konfidenzintervalls schätzen. In einer Umfrage stellt sich heraus, dass von 250 Käufern eines Neuwagens insgesamt 147 länger als achtundzwanzig Tage auf einen Neuwagen warten mussten. Berechnen Sie aus den Daten das 99 %-Konfidenzintervall. <?page no="92"?> 80 Kapitel 12: Gemischte Aufgaben Aufgabe 12.12 Schwierigkeit: schwer Zeit: 15 Minuten Ein Unternehmen hat eine weitere Abfüllmaschine für Gewürzpackungen angeschafft. Das Unternehmen möchte wissen, ob die neue Maschine im Mittel die Füllmenge von 12 g pro Packung einhält. Aus den Aufzeichnungen der letzten Jahre der übrigen Maschinen ist bekannt, dass die Standardabweichung s alt = 1 , 4 g beträgt. [a] Wie viele Packungen muss das Unternehmen nachwiegen, damit das approximative 0 , 99 -Konfidenzintervall für die mittlere Füllmenge die Breite 0 , 5 g hat? [b] Eine Beobachtung von 210 Packungen ergab eine durchschnittliche Füllmenge von 12,3 g pro Packung. Die Standardabweichung betrug 1 , 2 g. Wie lautet das approximative 0 , 99 -Konfidenzintervall für die mittlere Füllmenge einer Packung? [c] Gehen Sie im Folgenden davon aus, dass die tatsächliche Füllmenge (in g) einer Packung normalverteilt mit μ = 12 , 3 und σ = 1 , 2 ist. Welches Gewicht wird von 99,8 % aller Packungen überschritten? Aufgabe 12.13 Schwierigkeit: schwer Zeit: 20 Minuten [a] Bei einer Kundenanalyse wurden zwanzig Kunden befragt, seit wie vielen Jahren sie das Produkt A kaufen. Getrennt nach Geschlecht ergaben sich folgende Daten: Frauen: 2 , 2 , 2 , 2 , 3 , 7 , 7 , 8 , 9 , 11 Männer: 4 , 5 , 5 , 5 , 5 , 5 , 5 , 5 , 5 , 6 Berechnen und interpretieren Sie bitte für beide Datensätze getrennt die folgenden Kennzahlen: [1] arithmetisches Mittel [2] Modus [3] Median [4] Standardabweichung <?page no="93"?> Kapitel 12: Gemischte Aufgaben 81 [b] Unterstellen Sie eine Normalverteilung für die Produkttreue (in Jahren) einer Kundin. Der Erwartungswert sei 5,3 Jahre, die Standardabweichung sei 3,3 Jahre. [1] Seit mindestens wie vielen Jahren kaufen 75 % aller Kundinnen das Produkt? [2] Seit höchstens wie vielen Jahren kaufen 75 % aller Kundinnen das Produkt? Aufgabe 12.14 Schwierigkeit: schwer Zeit: 20 Minuten In der nachfolgenden Tabelle sind die Jahresendwerte des Dax 30 und das Wachstum (in %) des BIP gegenüber dem Vorjahr (Quelle: Bundesbank) festgehalten ( ∗ Prognose ): Jahr BIP Dax 30 2010 + 4,1 6 914 2011 + 3,6 5 898 2012 + 0,4 7 612 2013 + 0,1 9 552 2014 ∗ + 1,4 9 866 [a] Wie hoch ist die durchschnittliche jährliche Steigerung (in %) des Dax 30 im Zeitraum 31.12.2010 bis 31.12.2014? [b] Berechnen Sie die Korrelation zwischen der BIP-Rate und dem Dax 30. [1] Welche Stärke hat die Korrelation? [2] Welches Vorzeichen hat die Korrelation? [3] Interpretieren Sie die Korrelation inhaltlich. [c] Die Prognose des DIW für das Wachstum des BIP im Jahr 2015 beträgt 1,4 %. Mit welchem Dax 30 Index wäre dann am 31.12.2015 gemäß einer linearen Regression auf das BIP zu rechnen? Und ist der berechnete Prognosewert ein inter- oder extrapolierter Wert? (Begründung! ) [d] Die Prognose vom 28. Dezember 2014 für den Dax 30 am 31.12.2015 beträgt laut Handelsblatt 9 960. Mit welcher Veränderung des BIPs ist dann im Jahr 2015 gemäß einer linearen Regression auf den Dax 30 zu rechnen? Und ist der berechnete Prognosewert ein inter- oder extrapolierter Wert? (Begründung! ) <?page no="94"?> 82 Kapitel 12: Gemischte Aufgaben Aufgabe 12.15 Schwierigkeit: schwer Zeit: 30 Minuten [a] Von den Kölnern gehen zum Rosenmontagszug 41 % der 0 bis 12-Jährigen 72 % der 13 bis 18-Jährigen 68 % der 19 bis 50-Jährigen 54 % der über 50-Jährigen In Köln sind 10 % der Einwohner zwischen 0 und 12 Jahre alt 6 % der Einwohner zwischen 13 und 18 Jahre alt 50 % der Einwohner zwischen 19 und 50 Jahre alt 34 % der Einwohner über 50 Jahre alt Wie hoch ist unter den Kölner Besuchern des Rosenmontagszugs der Anteil der [1] 0 bis 12-Jährigen? [2] 13 bis 18-Jährigen? [3] 19 bis 50-Jährigen? [4] über 50-Jährigen? [b] Zum Zug gehen 60,78 % aller Kölner, davon sind 6,75 % Kinder 7,11 % Jugendliche 55,94 % Erwachsene bis 50 Jahre 30,21 % Erwachsene über 50 Jahre Die Bevölkerung in Köln hat die folgende Altersstruktur: 10 % sind Kinder 6 % sind Jugendliche 50 % sind 19 - 50-Jährige 34 % sind über 50 Jahre alt Wie viel Prozent der Kölner [1] Kinder gehen zum Zug? [2] Jugendlichen gehen zum Zug? <?page no="95"?> Kapitel 12: Gemischte Aufgaben 83 [3] 19 - 50-Jährigen gehen zum Zug? [4] über 50-Jährigen gehen zum Zug? Aufgabe 12.16 Schwierigkeit: schwer Zeit: 25 Minuten Verspätet sich ein Zug über 60 Minuten, so zahlt eine Eisenbahngesellschaft einem Fahrgast eine Entschädigung in Höhe von 20 e . Ist der Zug sogar mehr als 90 Minuten verspätet, so beträgt die Entschädigung pro Fahrgast 30 e . Pünktlich oder unter 60 Minuten verspätet sind 91 , 5 % aller Züge. Zwischen 60 und 90 Minuten verspätet sind 8 % aller Züge, über 90 Minuten verspätet sind 0 , 5 % aller Züge. Die Entschädigung wird nur aufgrund eines Antrages ausgezahlt. Ist ein Zug verspätet, so rechnet die Eisenbahngesellschaft mit 40 Anträgen pro Zug. [a] Mit welcher Entschädigungshöhe pro Zugfahrt muss die Eisenbahngesellschaft rechnen? [b] Berechnen Sie die Varianz der Variablen „Höhe der Entschädigungszahlungen (in e ) der Eisenbahngesellschaft pro Zugfahrt“. [c] Wie groß ist annähernd die Wahrscheinlichkeit, dass bei 100 Zugfahrten höchstens 12 000 e als Entschädigung zu zahlen sind (bzw. dass bei 100 Zugfahrten die durchschnittliche Entschädigungshöhe höchstens 120 e beträgt)? [d] Mit welcher ungefähren Entschädigungshöhe muss die Eisenbahngesellschaft bei 100 Zugfahrten mit einer Wahrscheinlichkeit von 0,90 mindestens rechnen? <?page no="97"?> Lösungen Lösungen <?page no="99"?> Lösungen Lösungen zu Kapitel 2: Skalierung Tipp! Zur Orientierung, welche Skalierung vorliegt, soll das folgende Entscheidungsdiagramm helfen: Skalierung von X = ? Werte von X lassen sich ordnen? nominal Abstand zwischen zwei Werten von X messbar? ordinal metrisch nein ja nein ja 2.1 Die Variable X = „monatliches Bruttogehaltsklasse eines Beschäftigten“ hat fünf Klassen: 1=„500 bis 1 500 EUR“, 2=„über 1 500 bis 2 500 EUR“, 3=„über 2 500 bis 3 500 EUR“, 4=„über 3 500 bis 4 500 EUR“, 5=„über 4 500 bis 5 500 EUR“. 87 <?page no="100"?> 88 Lösungen zu Kapitel 2: Skalierung Somit kann X genau fünf verschiedene Werte annehmen und ist somit eine diskrete und ordinal skalierte Variable. Ordinal skaliert deshalb, weil für z. B. die beiden Werte x 1 = 2 und x 2 = 4 gilt, dass der Beschäftigte mit der Bruttogehaltsklasse x 1 ein geringeres Bruttogehalt hat als der Beschäftigte mit der Bruttogehaltsklasse x 2 , jedoch nicht klar ist, um wie viel EUR das Bruttogehalt kleiner ist. 2.2 X = „wöchentliche Nachbereitungszeit (in h) eines Studierenden für VWL“ ist stetig und metrisch skaliert. Die klassierte Variable Y = „ Klasse der wöchentlichen Nachbereitungszeit (in h) eines Studierenden für VWL“ ist diskret und ordinal skaliert, da Y nur die fünf Werte: 1=„0 bis unter 0,5“, 2=„0,5 bis unter 1,5“, 3=„1,5 bis unter 2,5“, 4=„2,5 bis unter 4,0“, 5=„4,0 oder länger “ annehmen kann. Ordinal skaliert deshalb, weil für z. B. die beiden Werte x 1 = 2 und x 2 = 3 gilt, dass der Studierende mit der Nachbereitungszeit-Klasse x 1 eine kürzere Nachbereitungszeit hat als der Studierende mit der Nachbereitungszeit-Klasse x 2 , jedoch nicht klar ist, um wie viele Stunden die Nachbereitungszeit kürzer ist. <?page no="101"?> Lösungen Lösungen zu Kapitel 3: Kennzahlen Tipp! Zur Orientierung, welcher empirische Lageparameter zu berechnen ist, soll das folgende Entscheidungsdiagramm helfen: empirischer Lageparameter=? durchschnittlicher Wert häufigster Wert medianer Wert in e , GE kg, m etc. in % in km h etc. Modus 50 %-Punkt arithmetisches Mittel Veränderung über einen Zeitraum Quotient zweier Maße geometrisches Mittel ggf. harmonisches Mittel, besser über Definition des Quotienten 89 <?page no="102"?> 90 Lösungen zu Kapitel 3: Kennzahlen 3.1 [a] x =? Formel-Navigator Verwenden Sie hier Formel 5. x = 1 5 · [50 + 60 + 40 + 30 + 20] = 40 d. h. pro Monat wurden durchschnittlich 40 Euro für Bücher ausgegeben. [b] [1] W =? Formel-Navigator Verwenden Sie hier Formel 61. 20 50 = 0 , 4 = Faktor Rate = Faktor − 1 = 0 , 4 − 1 = −0 , 6 ̂ = −60 % [2] x G =? Formel-Navigator Verwenden Sie hier Formel 8. 4 √ 0 , 40 = 0 , 7952707 = Faktor Rate = 0 , 7952707 − 1 = −0 , 2047293 ̂ = −20 , 47293 % d. h. in den Monaten März bis Juli (einschließlich) sind die Bücherausgaben um 60 % insgesamt gesunken, pro Monat durchschnittlich um 20,5 % gefallen. [c] [1] x max − x min =? Formel-Navigator Verwenden Sie hier Formel 10. 60 − 20 = 40 d. h. die Spannweite beträgt 40 Euro. [2] s =? Formel-Navigator Verwenden Sie hier Formel 12 und Formel 18. s 2 = 1 5 [ (50 − 40) 2 + (60 − 40) 2 + (40 − 40) 2 + (30 − 40) 2 + (20 − 40) 2 ] = 1 000 5 = 200 s = √ 200 = 14 , 14 d. h. die Standardabweichung beträgt 14,14 Euro. <?page no="103"?> Lösungen zu Kapitel 3: Kennzahlen 91 Lösungen 3.2 [a] x =? Formel-Navigator Verwenden Sie hier Formel 5. x A = 34 , 5 6 = 5 , 75 x B = 132 , 3 6 = 22 , 05 [b] Da die einzelnen arithmetischen Mittel weit auseinander liegen, sollte hier der Variationskoeffizient (Formel 19) oder der relative Quartilsabstand (Formel 20) berechnet werden. Nr. Gut A Gut B i x i x 2 i x i x 2 i 1 5,50 30,25 22,20 492,84 2 5,50 30,25 20,80 432,64 3 6,90 47,61 22,90 524,41 4 5,40 29,16 20,40 416,16 5 5,20 27,04 25,00 625,00 6 6,00 36,00 21,00 441,00 ∑ 34,50 200,31 132,30 2 932,05 s 2 A = 1 6 · ∑ x 2 i − 5 , 75 2 = 200 , 31 6 − 33 , 0625 = 0 , 3225 s 2 B = 1 6 · ∑ x 2 i − 22 , 05 2 = 2 932 , 05 6 − 486 , 02025 = 2 , 4725 v A = s A x A = √ 0 , 3225 5 , 75 = 0 , 0988 v B = s B x B = √ 2 , 4725 22 , 05 = 0 , 0713 d. h. gemessen mit dem Variationskoeffizienten schwanken die Preise von Gut B weniger als die Preise von Gut A. 3.3 Durchschnittsgeschwindigkeit = Strecke in km Zeit in h 1. Lösungsweg: Wir nehmen an, dass die Strecke 60 km lang ist. Dann hat die Testfahrerin für die erste Hälfte der Strecke bereits die gesamte Zeit von einer Stunde verbraucht, um auf die Durchschnittsgeschwindigkeit von 60 km/ h zu kommen. Sie müsste also die zweite Hälfte der Strecke in null Stunden befahren, also unendlich schnell fahren, was nicht möglich ist. <?page no="104"?> 92 Lösungen zu Kapitel 3: Kennzahlen 2. Lösungsweg: Annahme: Strecke = 60 km 1/ 2 Strecke = 30 km, für die erste Hälfte wird also eine Stunde Fahrtdauer benötigt. Gesucht ist x = Fahrtdauer (in h) für die 2. Hälfte der Strecke. Somit haben wir die Gleichung: Strecke in km Zeit in h = 60 = 30 + 30 1 + x = 60 1 + x ⇔ x = 0 Stunden 3. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 9. Gesucht: x = Durchschnittsgeschwindigkeit für die 2. Hälfte der Strecke harmonisches Mittel = 60 = 2 1 30 + 1 x ⇔ 1 30 + 1 x = 2 60 ⇔ 1 x = 0 ⇔ x = ∞ km/ h Das sollten Sie wissen! Sind die Daten nicht klassiert, so lässt sich ein gesuchter Prozentpunkt x p wie folgt direkt aus den kumulierten relativen Häufigkeiten ablesen: Kommt die Prozentzahl p bei den kumulierten relativen Häufigkeiten als Wert nicht vor, so ist derjenige x -Wert der gesuchte Prozentpunkt x p , bei dem die kumulierte relative Häufigkeit erstmals größer ist als p (wie z. B. in Aufgabe 3.4 [a] und [c]). Kommt die Prozentzahl p bei den kumulierten relativen Häufigkeiten als Wert vor, so ist der x -Wert in der betreffenden Zeile der gesuchte Prozentpunkt x p (wie z. B. in Aufgabe 3.4 [b]). 3.4 X = Note der ersten Diplomprüfung Y = Note der zweiten Diplomprüfung Note X Y rel. Häufigk. kum. Häufigk. rel. Häufigk. kum. Häufigk. 1 0,10 0,10 0,275 0,275 2 0,20 0,30 0,175 0,450 3 0,30 0,60 0,075 0,525 4 0,25 0,85 0,200 0,725 5 0,15 1,00 0,275 1,000 Bei einer Note handelt es sich um ein ordinales Merkmal. [a] 50 % -Punkt =? x 0 , 50 ≈ 3 und y 0 , 50 ≈ 3 d. h. gemessen am Median war das Notenniveau bei beiden Prüfungen etwa gleich. <?page no="105"?> Lösungen zu Kapitel 3: Kennzahlen 93 Lösungen [b] x 0 , 60 = 3 d. h. 60 % aller Prüflinge haben die Note befriedigend oder eine bessere Note erzielt. [c] Quartilsabstand (Formel 11) x 0 , 75 ≈ 4 und x 0 , 25 ≈ 2 ⇒ x 0 , 75 − x 0 , 25 ≈ 4 − 2 = 2 y 0 , 75 ≈ 5 und y 0 , 25 ≈ 1 ⇒ y 0 , 75 − y 0 , 25 ≈ 5 − 1 = 4 d. h. die gemessen am Quartilsabstand waren die Notenunterschiede bei der zweiten Prüfung größer als bei der ersten Prüfung. 3.5 X = Noten der Teilprüfung I Y = Noten der Teilprüfung II Note kumulierte relative Häufigkeit X Y 1,0 0,02 0,02 1,3 0,07 0,02 1,7 0,13 0,03 2,0 0,24 0,09 2,3 0,33 0,17 2,7 0,43 0,28 3,0 0,52 0,42 3,3 0,58 0,49 3,7 0,68 0,63 4,0 0,79 0,79 5,0 0,99 1,00 [a] Da es sich bei Noten um ordinal skalierte Daten handelt, können zum Vergleich des Niveaus sowohl der Modus als auch der Median berechnet werden. Die Mediane sind folgende Werte: x 0 , 50 ≈ 3 , 0 y 0 , 50 ≈ 3 , 7 d. h. Das Noten-Niveau war in der Teilprüfung I besser. [b] Noten sind ordinal skalierte Daten. Da sowohl die X -Daten als auch die Y -Daten identisch kodiert sind, kann zum Vergleich der Unterschiede ausnahmsweise der Quartilsabstand (Formel 11) berechnet werden. x 0 , 25 ≈ 2 , 3 x 0 , 75 ≈ 4 , 0 Also beträgt der Quartilsabstand x 0 , 75 − x 0 , 25 = 1 , 7 y 0 , 25 ≈ 2 , 7 y 0 , 75 ≈ 4 , 0 Also beträgt der Quartilsabstand y 0 , 75 − y 0 , 25 = 1 , 3 d. h. gemessen am Quartilsabstand waren die Leistungsunterschiede in der Teilprüfung II etwas geringer. <?page no="106"?> 94 Lösungen zu Kapitel 3: Kennzahlen [c] Der Quartilsabstand der Werte im Datensatz Teilprüfung II ist geringer. Hier liegen also die einzelnen Werte des Datensatzes konzentrierter um den Median. Das sollten Sie wissen! Die Vorgehensweise zur Berechnung von Prozentpunkten x p aus klassierten Daten hängt davon ab, ob p bei den kumulierten relativen Häufigkeiten als Wert vorkommt oder nicht: Der Prozentpunkt x p wird mit der Formel 2 bestimmt, falls p bei den kumulierten relativen Häufigkeiten als Wert nicht vorkommt (wie z. B. in Aufgabe 3.6 [a]). Der Prozentpunkt x p lässt sich direkt aus der Arbeitstabelle ablesen, falls p bei den kumulierten relativen Häufigkeiten als Wert vorkommt. Dann ist x p die Klassenobergrenze dieser Einfallsklasse (wie z. B. in Aufgabe 3.6 [c]). 3.6 X = Rentenhöhe (in Euro) einer Frau Y = Rentenhöhe (in Euro) eines Mannes von Frauen Männer F Frauen F Männer unter 150 Euro 112 45 0,112 0,045 150 bis unter 300 187 44 0,299 0,089 300 bis unter 450 131 42 0,430 0,131 450 bis unter 600 162 52 0,592 0,183 600 bis unter 750 196 78 0,788 0,261 750 bis unter 900 112 113 0,900 0,374 900 bis unter 1 200 77 299 0,977 0,673 1 200 bis unter 1 500 20 226 0,997 0,899 1 500 Euro und mehr 3 101 1,000 1,000 [a] 50 %-Punkt =? Formel-Navigator Verwenden Sie hier Formel 2. x 0 , 50 ≈ 450 + 150 · 0 , 50 − 0 , 430 0 , 162 = 514 , 82 y 0 , 50 ≈ 900 + 300 · 0 , 50 − 0 , 374 0 , 299 = 1 026 , 42 d. h. etwa 50 % aller Rentnerinnen bezieht höchstens ca. 515 Euro monatliche Rente, während etwa 50 % aller Rentner mindestens ca. 1 026 Euro monatliche Rente beziehen. Das Rentenniveau ist bei den Männern etwa doppelt so hoch. <?page no="107"?> Lösungen zu Kapitel 3: Kennzahlen 95 Lösungen [b] relativer Quartilsabstand = ? Formel-Navigator Verwenden Sie hier Formel 2 und Formel 20. x 0 , 25 ≈ 150 + 150 · 0 , 25 − 0 , 112 0 , 187 = 260 , 70 x 0 , 75 ≈ 600 + 150 · 0 , 75 − 0 , 592 0 , 196 = 720 , 92 Relativer Quartilsabstand: x 0 , 75 − x 0 , 25 x 0 , 50 ≈ 720 , 92 − 260 , 70 514 , 82 = 0 , 8939 d. h. die relative Streuung der Rentenhöhe der Frauen beträgt etwa 0,90; d. h. gemessen mit dem relativen Quartilsabstand beträgt die Streuung der Rentenhöhe der Frauen etwa 90 %. y 0 , 25 ≈ 600 + 150 · 0 , 25 − 0 , 183 0 , 078 = 728 , 85 y 0 , 75 ≈ 1 200 + 300 · 0 , 75 − 0 , 673 0 , 226 = 1 302 , 21 Relativer Quartilsabstand: y 0 , 75 − y 0 , 25 y 0 , 50 ≈ 1 302 , 21 − 728 , 85 1 026 , 42 = 0 , 5586 d. h. die relative Streuung der Rentenhöhe der Männer beträgt etwa 0,56. Die Unterschiede der einzelnen Rentenhöhen sind bei den Frauen stärker. [c] x 0 , 90 =? Dieser Prozentpunkt lässt sich direkt aus den kumulierten relativen Häufigkeiten ablesen. x 0 , 90 = 900 d. h. 90 % aller Rentnerinnen beziehen höchstens 900 Euro Rente. Das sollten Sie wissen! Die Vorgehensweise zur Berechnung von Anteilswerten F ( x ) bei klassierten Daten hängt davon ab, ob x eine Klassenobergrenze ist oder nicht: Der Anteilswert F ( x ) wird mit Hilfe der Formel 1 bestimmt, falls x keine Klassenobergrenze ist (wie z. B. in Aufgabe 3.7 [c]). Der Anteilswert F ( x ) lässt sich aus den kumulierten relativen Häufigkeiten direkt ablesen, falls x eine Klassenobergrenze ist (wie z. B. in Aufgabe 3.7 [d]). <?page no="108"?> 96 Lösungen zu Kapitel 3: Kennzahlen 3.7 X = Einkommen einer Frau Y = Einkommen eines Mannes Klasse n X j / n F X n Y j / n F Y < 750 0,15 0,15 0,10 0,10 750 - 1 000 0,21 0,36 0,13 0,23 1 000 - 1 250 0,20 0,56 0,16 0,39 1 250 - 1 500 0,15 0,71 0,18 0,57 1 500 - 1 750 0,10 0,81 0,14 0,71 1 750 - 2 000 0,07 0,88 0,09 0,80 2 000 - 3 000 0,10 0,98 0,13 0,93 3 000 - 4 000 0,01 0,99 0,04 0,97 ≥ 4 000 0,01 1,00 0,03 1,00 [a] [1] 50 %-Punkt = ? Formel-Navigator Verwenden Sie hier Formel 2. Einfallsklasse = 3. Klasse x 0 , 50 ≈ 1 000 + 0 , 50 − 0 , 36 0 , 20 · 250 = 1 175 [2] y 0 , 50 ≈ 1 250 + 0 , 50 − 0 , 39 0 , 18 · 250 = 1 402 , 78 [3] 1 402 , 78 1 175 = 1 , 19 d. h. die Männer haben ein um etwa 19 % höheres medianes Einkommen als die Frauen. [b] 1. Lösungsweg: 5 + 1 + 1 100 = 0 , 07 = 7 % 2. Lösungsweg: F X (2 500) ≈ 0 , 88 + 0 , 10 1 000 · (2 500 − 2 000) = 0 , 93 mit Formel 1 100 % − 93 % = 7 % d. h. etwa 7 % aller Frauen haben ein Einkommen über 2 500 e . [c] F Y (1 600) =? Formel-Navigator Verwenden Sie hier Formel 1. <?page no="109"?> Lösungen zu Kapitel 3: Kennzahlen 97 Lösungen F Y (1 600) ≈ 0 , 57 + 0 , 14 250 · (1 600 − 1 500) = 0 , 61 d. h. etwa 61 % aller Männer haben ein Einkommen unter 1 600 e . [d] Direkt aus der Tabelle ohne Formel 1 ergibt sich: F X (2 000) ≈ 0 , 88 100 % − 88 % = 12 % d. h. etwa 12 % der alleinstehenden Frauen haben ein Einkommen von mindestens 2 000 e . Tipp! Ist der Stichprobenumfang n in den beiden Formeln 7 und 16 zur Berechnung des arithmetischen Mittels bzw. der Varianz aus klassierten Daten unbekannt, so kann ersatzweise mit n = 100 gerechnet werden. Die absoluten Häufigkeiten n j sind dann die relativen Häufigkeiten in Prozent (wie z. B. in Aufgabe 3.8 [a]). 3.8 X = TV-Konsum in Stunden pro Woche eines Nicht-Rentners Y = TV-Konsum in Stunden pro Woche eines Rentners Klasse n X j / n n Y j / n F X F Y b j x ′ j n X j / n b j n Y j / n b j von 0 bis 17 0,296 0,376 0,296 0,376 17 8,5 0,0174 0,0221 über 17 bis 21 0,357 0,306 0,653 0,682 4 19 0,0893 0,0765 über 21 bis 36 0,347 0,318 1,000 1,000 15 28,5 0,0231 0,0212 ∑ 1 1 [a] 1. Lösungsweg: (Formel 7) x ≈ 8 , 5 · 0 , 296 + 19 · 0 , 357 + 28 , 5 · 0 , 347 = 19 , 1885 y ≈ 8 , 5 · 0 , 376 + 19 · 0 , 306 + 28 , 5 · 0 , 318 = 18 , 073 d. h. gemessen mit dem arithmetischen Mittel ist der TV-Konsum von Rentnern geringer. 2. Lösungsweg: (Formel 7) Mit der Annahme, dass n = 100 beträgt: x ≈ 1 100 [8 , 5 · 29 , 6 + 19 · 35 , 7 + 28 , 5 · 34 , 7] = 19 , 1885 y ≈ 1 100 [8 , 5 · 37 , 6 + 19 · 30 , 6 + 28 , 5 · 31 , 8] = 18 , 073 3. Lösungsweg: (Formel 2) x 0 , 50 ≈ 17 + 0 , 5 − 0 , 296 0 , 357 · 4 = 19 , 28571 <?page no="110"?> 98 Lösungen zu Kapitel 3: Kennzahlen y 0 , 50 ≈ 17 + 0 , 5 − 0 , 376 0 , 306 · 4 = 18 , 62092 d. h. gemessen mit dem Median ist der TV-Konsum von Rentnern geringer. 4. Lösungsweg: (Formel 4) x Modus = y Modus = 19 d. h. gemessen mit dem Modus gibt es keine Unterschiede in der Länge des TV- Konsums von Rentnern und Nicht-Rentnern. [b] F X (28) =? Formel-Navigator Verwenden Sie hier Formel 1. F X (28) ≈ 0 , 653 + 0 , 347 15 · (28 − 21) = 0 , 8149333 ≈ 0 , 815 d. h. etwa 18,5 % aller Befragten, die keine Rentner sind, sehen über 28 Stunden pro Woche fern. [c] y 0 , 75 =? Formel-Navigator Verwenden Sie hier Formel 2. y 0 , 75 ≈ 21 + 0 , 75 − 0 , 682 0 , 318 · 15 = 24 , 20755 d. h. etwa 25 % aller Rentner sehen pro Woche mehr als 24 Stunden fern. [d] s =? Formel-Navigator Verwenden Sie hier Formel 16 und Formel 18. s 2 Y ≈ (8 , 5−18 , 073) 2 ·0 , 376+(19−18 , 073) 2 ·0 , 306+(28 , 5−18 , 073) 2 ·0 , 318 = 69 , 29417 s Y ≈ √ 69 , 29417 = 8 , 324312 d. h. gemessen mit der Standardabweichung schwankt der TV-Konsum von Rentnern um etwa acht Stunden. [e] 0 , 376 + 0 , 306 = 0 , 682 d. h. 68,2 % der Rentner schauen höchstens 21 Stunden pro Woche TV. <?page no="111"?> Lösungen zu Kapitel 3: Kennzahlen 99 Lösungen 3.9 Alter Raucher Einwohner in Jahren weiblich männlich weiblich männlich über 11 bis 18 348 434 2 900 3 100 über 18 bis 25 1 628 1 656 4 400 4 600 über 25 2 240 2 310 8 000 7 000 ∑ 4 216 4 400 15 300 14 700 [a] 4 216 15 300 = 0 , 2756 = 28 % d. h. 28 % aller weiblichen Einwohner über 11 Jahre rauchen. [b] 4 216 + 4 400 15 300 + 14 700 = 8 616 30 000 = 0 , 2872 = 29 % d. h. 29 % aller Einwohner über 11 Jahre rauchen. [c] 4 216 4 216 + 4 400 = 0 , 4893 = 49 % d. h. 49 % aller Raucher (über 11 Jahre) sind weiblich. 3.10 X = Wartezeit eines Fluggastes in Minuten x ∗ j −1 < x ≤ x ∗ j n j / n x ′ j b j F 0 - 10 0,1 5 10 0,1 10 - 20 0,7 15 10 0,8 20 - 60 0,2 40 40 1,0 [a] 1 − F (30) =? Formel-Navigator Verwenden Sie hier Formel 1. F (30) ≈ 0 , 8 + 0 , 2 40 · (30 − 20) = 0 , 85 100 % − 85 % = 15 % d. h. ca. 15 % der Fluggäste müssen länger als 30 Minuten warten. <?page no="112"?> 100 Lösungen zu Kapitel 3: Kennzahlen [b] x =? Formel-Navigator Verwenden Sie hier Formel 7. x ≈ 5 · 0 , 1 + 15 · 0 , 7 + 40 · 0 , 2 = 19 d. h. im Durchschnitt beträgt die Wartezeit eines Fluggastes etwa 19 Minuten. [c] x 0 , 50 =? Formel-Navigator Verwenden Sie hier Formel 2. x 0 , 50 ≈ 10 + 0 , 5 − 0 , 1 0 , 7 · 10 = 15 , 71429 d. h. die mediane Wartezeit eines Fluggastes beträgt etwa 16 Minuten. [d] Nur für symmetrische Verteilungen sind die beiden Kennzahlen identisch. Da in diesem Datensatz die Fluggäste eher länger als kürzer warten, handelt es sich hier um eine schiefe, insb. nicht symmetrische Verteilung. Deshalb sind die beiden Kennzahlen unterschiedlich groß. <?page no="113"?> Lösungen Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten Tipp! Das Rechnen mit Wahrscheinlichkeiten wird von den Studierenden als schwierigstes Kapitel der Grundlagen der Statistik empfunden. Hilfreich in einer solchen Situation ist es, wenn die Ereignisse mit „naheliegenden“ Buchstaben z. B. A = „Ausschuss“ oder G = „Gewinn“ usw. bezeichnet werden. Naheliegend sind dabei z. B. die Anfangsbuchstaben der Ereignisse. Dann ist der Wiedererkennungswert hoch. (Schwieriger und damit zeitlich aufwändiger ist es, wenn z. B. bei einer Zerlegung die Ereignisse mit B 1 , B 2 , . . . B 5 bezeichnet werden.) Das sollten Sie wissen! Liegen genau zwei Ereignisse A, B vor, so kann für die Berechnung der Wahrscheinlichkeiten aller Durchschnitte A ∩ B , A ∩ B , A ∩ B , A ∩ B eine Arbeitstabelle aufgestellt werden (wie z. B. in Aufgabe 4.1). 4.1 A = „bei zufällig ausgewähltem Gepäckstück wird Alarm ausgelöst“ E = „zufällig ausgewähltes Gepäckstück ist einwandfrei“ Gesucht: P ( E | A ) =? Gegeben sind folgende Wahrscheinlichkeiten: 0 , 02 = P ( A ) 0 , 01 = P ( A | E ) 0 , 04 = P ( A | E ) ⇒ P ( A | E ) = 1 − 0 , 04 = 0 , 96 Um eine Arbeitstabelle aufstellen zu können, wird zunächst P ( E ) berechnet. Formel-Navigator Verwenden Sie hier Formel 34. P ( A ) = P ( A ∩ E ) + P ( A ∩ E ) = P ( A | E ) · P ( E ) + P ( A | E ) · (1 − P ( E )) ⇔ 0 , 02 = 0 , 01 · P ( E ) + 0 , 96 · (1 − P ( E )) ⇔ 0 , 02 = 0 , 01 · P ( E ) + 0 , 96 − 0 , 96 · P ( E ) = 0 , 96 − 0 , 95 · P ( E ) ⇔ P ( E ) = 0 , 94 0 , 95 = 0 , 9894737 101 <?page no="114"?> 102 Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten Für die Arbeitstabelle wird anschließend P ( A ∩ E ) berechnet. Formel-Navigator Verwenden Sie hier Formel 34. P ( A ∩ E ) = P ( A | E ) · P ( E ) = 0 , 01 · 0 , 9894737 = 0 , 0099 Arbeitstabelle: A A ∑ E 0,0099 0,9796 0,9895 E 0,0101 0,0004 0,0105 ∑ 0,02 0,98 1 Formel-Navigator Verwenden Sie hier Formel 33. P ( E | A ) = P ( A ∩ E ) P ( A ) = 0 , 0101 0 , 02 = 0 , 505 d. h. die Wahrscheinlichkeit beträgt 50,5 %. 4.2 [a] 44 , 9 + 22 , 6 + 18 , 6 = 86 , 1 d. h. der Anteil beträgt 86 , 1 % . [b] Gemäß der Tabelle in der Aufgabenstellung beträgt P ( A ) = 0 , 226 . Also muss P ( A | B ) ebenfalls 0,226 betragen, damit A, B stochastisch unabhängig sind. 4.3 G = Frau Z. erhält den Hauptgewinn T = Frau Z. erhält einen der beiden Trostpreise Formel-Navigator Verwenden Sie hier Formel 30. [1] Verfahren 1 [a] P ( G ) = 1 50 [b] P ( T ) = 49 50 · 1 49 + 49 50 · 48 49 · 1 48 = 1 25 <?page no="115"?> Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten 103 Lösungen [2] Verfahren 2 [a] P ( G ) = 49 50 · 48 49 · 1 48 = 1 50 [b] P ( T ) = 1 50 + 49 50 · 1 49 = 1 25 d. h. die Wahrscheinlichkeiten für Gewinn und für einen Trostpreis sind in beiden Verfahren gleich groß. Das sollten Sie wissen! Gemäß den allgemeinen Regeln nach A. Kolmogorov (Formel 29) dürfen die Wahrscheinlichkeiten zweier Ereignisse addiert werden, wenn die beiden Ereignisse disjunkt sind (wie z. B. für P ( A ) in Aufgabe 4.1 und für P ( T ) in Aufgabe 4.4). 4.4 K = TBC-krank T = TBC-Röntgen-Test positiv Gegeben sind folgende Wahrscheinlichkeiten: 0 , 002 = P ( K ) 0 , 90 = P ( T | K ) 0 , 05 = P ( T | K ) Gesucht ist: P ( K | T ) = ? Zunächst wird mit der Überlegung T = ( K ∩ T ) ∪ ( K ∩ T ) die Wahrscheinlichkeit P ( T ) berechnet. Formel-Navigator Verwenden Sie hier Formel 33 und Formel 34. P ( K ∩ T ) = P ( T | K ) · P ( K ) = 0 , 90 · 0 , 002 = 0 , 0018 P ( K ∩ T ) = P ( T | K ) · P ( K ) = 0 , 05 · 0 , 998 = 0 , 0499 P ( T ) = 0 , 0018 + 0 , 0499 = 0 , 0517 Formel-Navigator Verwenden Sie hier Formel 34. P ( K | T ) = 0 , 0018 0 , 0517 = 0 , 0348 d. h. die Wahrscheinlichkeit beträgt 3,48 %. Das sollten Sie wissen! Liegen mehr als zwei Ereignisse vor, so kann ebenfalls eine Arbeitstabelle aufgestellt werden, falls die Ereignisse eine Zerlegung darstellen wie z. B. in Aufgabe 4.5 die drei Ereignisse Uni , F H , B . <?page no="116"?> 104 Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten 4.5 Uni = zufällig ausgewählter Hochschulabsolvent kommt von einer Uni F H = zufällig ausgewählter Hochschulabsolvent kommt von einer Fachhochschule B = zufällig ausgewählter Hochschulabsolvent kommt von einer Berufsakademie Gegeben sind folgende Anteile: P ( E ) = 0 , 1 Formel-Navigator Verwenden Sie hier Formel 34. 0 , 74 = P ( Uni ) und 0 , 54 = P ( Uni | E ) ⇒ P ( E ∩ Uni ) = 0 , 54 · 0 , 1 = 0 , 054 0 , 25 = P ( F H ) und 0 , 37 = P ( F H | E ) ⇒ P ( E ∩ F H ) = 0 , 37 · 0 , 1 = 0 , 037 0 , 01 = P ( B ) und 0 , 09 = P ( B | E ) ⇒ P ( E ∩ B ) = 0 , 09 · 0 , 1 = 0 , 009 Da die drei Ereignisse Uni , F H, B eine Zerlegung darstellen, kann für die Berechnung der Wahrscheinlichkeiten der Durchschnitte eine Arbeitstabelle aufgestellt werden. Arbeitstabelle: Uni F H B ∑ E 0,054 0,037 0,009 0,100 E ∑ 0,74 0,25 0,01 1 Formel-Navigator Verwenden Sie hier Formel 33. [a] P ( E | Uni ) = 0 , 054 0 , 74 = 0 , 0729 [b] P ( E | F H ) = 0 , 037 0 , 25 = 0 , 148 [c] P ( E | B ) = 0 , 009 0 , 01 = 0 , 90 d. h. von den Uni-Absolventen wurden 7,3 % eingestellt, von den FH-Absolventen 14,8 % und von den Absolventen einer Berufsakademie 90 %. 4.6 N = Neuwagen A 1 = 18 bis 29 Jahre und P ( N | A 1 ) = 0 , 13 und P ( A 1 ) = 0 , 10 A 2 = 30 bis 39 Jahre und P ( N | A 2 ) = 0 , 37 und P ( A 2 ) = 0 , 20 A 3 = 40 bis 49 Jahre und P ( N | A 3 ) = 0 , 39 und P ( A 3 ) = 0 , 26 A 4 = 50 bis 59 Jahre und P ( N | A 4 ) = 0 , 49 und P ( A 4 ) = 0 , 20 A 5 = 60 Jahre oder älter und P ( N | A 5 ) = 0 , 63 und P ( A 5 ) = 0 , 24 <?page no="117"?> Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten 105 Lösungen Daraus ergeben sich mit der Formel 34 folgende Anteile: P ( N ∩ A 1 ) = 0 , 13 · 0 , 10 = 0 , 0130 P ( N ∩ A 2 ) = 0 , 37 · 0 , 20 = 0 , 0740 P ( N ∩ A 3 ) = 0 , 39 · 0 , 26 = 0 , 1014 P ( N ∩ A 4 ) = 0 , 49 · 0 , 20 = 0 , 0980 P ( N ∩ A 5 ) = 0 , 63 · 0 , 24 = 0 , 1512 Die fünf Ereignisse A 1 , A 2 , A 3 , A 4 , A 5 stellen eine Zerlegung dar. A 1 A 2 A 3 A 4 A 5 ∑ N 0,0130 0,0740 0,1014 0,0980 0,1512 0,4376 N ∑ 0,10 0,20 0,26 0,20 0,24 1 [a] [1] P ( A 5 | N ) =? Formel-Navigator Verwenden Sie hier Formel 33. P ( A 5 | N ) = P ( A 5 ∩ N ) P ( N ) = 0 , 1512 0 , 4376 = 0 , 3455 d. h. 35 % der Halter eines Neuwagens sind mindestens 60 Jahre alt. [2] P ( A 1 | N ) =? Formel-Navigator Verwenden Sie hier Formel 33. P ( A 1 | N ) = P ( A 1 ∩ N ) P ( N ) = 0 , 0130 0 , 4376 = 0 , 0297 d. h. 3 % der Halter eines Neuwagens sind 18 bis 29 Jahre alt. [3] 1. Lösungsweg: 1 − 0 , 0297 − 0 , 3455 = 0 , 6248 d. h. 63 % der Halter eines Neuwagens sind 30 bis 59 Jahre alt. 2. Lösungsweg P ( A 2 ∪ A 3 ∪ A 4 | N ) = 0 , 0740 + 0 , 1014 + 0 , 0980 0 , 4376 = 0 , 6247715 [b] P ( N | A 5 ) = P ( N )? Formel-Navigator Verwenden Sie hier Formel 35. P ( N | A 5 ) = 0 , 63 = 0 , 4376 = P ( N ) d. h. die Ereignisse A 5 und N sind nicht stochastisch unabhängig. d. h. die Ereignisse A 5 und N sind stochastisch abhängig. <?page no="118"?> 106 Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten Das sollten Sie wissen! Liegen drei Ereignisse vor, die jedoch keine Zerlegung darstellen, so kann für die Berechnung der Wahrscheinlichkeiten aller Durchschnitte ein Venndiagramm aufgestellt werden (wie z. B. für die drei Ereignisse A , B , C in Aufgabe 4.7). 4.7 A = zufällig ausgewähltes Produktionsstück wird von Arbeiter A bearbeitet B = zufällig ausgewähltes Produktionsstück wird von Arbeiter B bearbeitet C = zufällig ausgewähltes Produktionsstück wird von Arbeiter C bearbeitet Da die drei Ereignisse A, B, C keine Zerlegung darstellen, kann für die Berechnung der Wahrscheinlichkeiten der Durchschnitte keine Arbeitstabelle aufgestellt werden. Stattdessen wird ein Venndiagramm erstellt. Venndiagramm A B C 0,33 0,08 0,25 0,22 0,02 0,07 0,03 50 % aller Stücke wurden von A bearbeitet 35 % aller Stücke werden von B bearbeitet 37 % aller Stücke werden von C bearbeitet. 50 + 35 + 37 = 122 d. h. Arbeiter A bekommt 1 000 · 50 122 = 410 GE, Arbeiter B bekommt 1 000 · 35 122 = 287 GE, Arbeiter C bekommt 1 000 · 37 122 = 303 GE. Das sollten Sie wissen! Um Laplace-Wahrscheinlichkeiten berechnen zu können, muss die Bestimmung des Stichprobenraums S im Urnenmodell so gestaltet werden, dass jedes Ergebnis aus S die gleiche Chance hat. Tipp! Bei Abzähl-Aufgaben, die gemäß einem Ziehen von k Kugeln aus n Kugeln in einem Urnenmodell gelöst werden, ist es häufig für das Verständnis sehr hilfreich, erst einmal mit einem kleineren k als vorgegeben zu arbeiten (wie z. B. in Aufgabe 4.8). <?page no="119"?> Lösungen zu Kapitel 4: Rechnen mit Wahrscheinlichkeiten 107 Lösungen 4.8 Vorüberlegung: Statt k = 23 Personen betrachten wir zunächst nur k = 2 Personen P 1 und P 2 . Dann gibt es für die Geburtstage dieser zwei Personen insgesamt S = 365 · 365 = 365 2 verschiedene Möglichkeiten. Jede dieser Möglichkeiten hat die gleiche Chance 1 365 2 . So beträgt z. B. die Wahrscheinlichkeit, dass beide Personen am 30.03. Geburtstag haben 1 365 2 . Und die Wahrscheinlichkeit, dass die Geburtstage der beiden Personen der 30.03. und der 31.03. sind, beträgt 2 365 2 , da entweder P 1 am 30.03. und P 2 am 31.03. Geburtstag haben, oder P 1 am 31.03. und P 2 am 30.03. Würde die Reihenfolge der Geburtstage vernachlässigt, so hätten im Urnenmodell nicht mehr alle Ergebnisse die gleiche Chance. Nach dieser Vorüberlegung arbeiten wir jetzt mit k = 23 Personen, wie es in der Aufgabenstellung vorgegeben ist. A = alle haben an verschiedenen Tagen Geburtstag Zunächst berechnen wir, wie viele verschiedene Möglichkeiten es für die 23 Geburtstage in der Gruppe insgesamt gibt, wenn jede dieser verschiedenen Möglichkeiten die gleiche Chance haben soll. Im Urnenmodell entspricht das dem Ziehen von k = 23 Kugeln aus n = 365 Kugeln und zwar mit Zurücklegen und mit Berücksichtigung der Reihenfolge. Gemäß Formel 24 ergibt sich: S = n k = 365 23 [a] Die Anzahl der verschiedenen Möglichkeiten für A berechnen wir über ein geeignetes Urnenmodell. Die Anzahl A ergibt sich, wenn k = 23 Kugeln aus einer Urne mit n = 365 Kugeln gezogen werden und zwar ohne Zurücklegen und mit Berücksichtigung der Reihenfolge. Gemäß Formel 23 ergibt sich: A = n ! ( n − k )! = 365! (365 − 23)! = 365! 342! Mit Formel 30 ergibt sich die Wahrscheinlichkeit gemäß Laplace: P ( A ) = A S = 365! / 342! 365 23 = 0 , 4927028 d. h. die Wahrscheinlichkeit liegt bei knapp 50 %. [b] P ( A ) = 1 − P ( A ) = 1 − 0 , 4927028 ≈ 0 , 5 d. h. die Wahrscheinlichkeit beträgt etwa 50 %. <?page no="121"?> Lösungen Lösungen zu Kapitel 5: Zufallsvariablen Das sollten Sie wissen! Damit für zwei diskrete Zufallsvariablen X, Y stochastische Unabhängigkeit vorliegt, muss für alle möglichen ( x , y ) -Kombinationen gelten: P ( X = x , Y = y ) = P ( X = x ) · P ( Y = y ) Für eine stochastische Unabhängigkeit sind also alle ( x , y ) -Kombinationen zu überprüfen (wie z. B. in Aufgabe 5.2). Hingegen reicht es für die stochastische Abhängigkeit zweier diskreter Zufallsvariablen X, Y , lediglich eine ( x , y ) -Kombination zu finden mit der Eigenschaft: P ( X = x , Y = y ) = P ( X = x ) · P ( Y = y ) (wie z. B. in Aufgabe 5.1) 5.1 P ( X = 3 , Y = 1) ? = P ( X = 3) · P ( Y = 1) Formel-Navigator Verwenden Sie hier Formel 41. Das Minimum der beiden Augenzahlen beträgt genau dann drei, d h. { X = 3} , wenn eine der folgenden sieben Kombinationen gewürfelt wird: (3 , 1) , (3 , 4) , (3 , 5) , (3 , 6) , (4 , 3) , (5 , 3) , (6 , 3) Da jede dieser Kombinationen die gleich Chance 1 36 hat, gilt nach Formel 30: P ( X = 3) = 7 36 Das Maximum der beiden Augenzahlen beträgt genau dann eins, d h. { Y = 1} , wenn die Kombinationen (1,1) gewürfelt wird. Da diese Kombinationen die Chance 1 36 hat, gilt nach Formel 30: P ( Y = 1) = 1 36 Ein unmögliches Ereignis ist es, wenn die kleinere der beiden Augenzahlen drei betragen soll und gleichzeitig die größere der beiden Augenzahlen eins betragen soll. Somit haben wir: P ( X = 3 ∩ Y = 1) = 0 = 7 36 · 1 36 = P ( X = 3) · P ( Y = 1) 109 <?page no="122"?> 110 Lösungen zu Kapitel 5: Zufallsvariablen Es gibt somit mindestens eine ( x , y ) -Kombination, für die gilt: P ( X = x ∩ Y = y ) = P ( X = x ) · P ( Y = y ) d. h. X, Y sind nicht stochastisch unabhängig. 5.2 X = Anzahl der zurückgegebenen Mietwagen von Budget Y = Anzahl der zurückgegebenen Mietwagen von Hertz Formel-Navigator Verwenden Sie hier Formel 41. [a] P ( X + Y = 7) = = P ( X = 2 ∩ Y = 5) + P ( X = 3 ∩ Y = 4) + P ( X = 4 ∩ Y = 3) = = P ( X = 2) · P ( Y = 5) + P ( X = 3) · P ( Y = 4) + P ( X = 4) · P ( Y = 3) = = 0 , 3 · 0 , 1 + 0 , 1 · 0 , 2 + 0 , 1 · 0 , 1 = 0 , 06 d. h. die Wahrscheinlichkeit beträgt 6 %. [b] P ( X + Y ≥ 8) = P ( X + Y = 8) + P ( X + Y = 9) P ( X + Y = 8) = 0 , 1 · 0 , 1 + 0 , 1 · 0 , 2 = 0 , 03 P ( X + Y = 9) = P ( X = 4) · P ( Y = 5) = 0 , 1 · 0 , 1 = 0 , 01 ⇒ P ( X + Y ≥ 8) = 0 , 03 + 0 , 01 = 0 , 04 d. h. die Wahrscheinlichkeit beträgt 4 %. [c] P ( X + Y ≤ 7) = 1 − P ( X + Y > 7) = 1 − 0 , 04 = 0 , 96 d. h. die Wahrscheinlichkeit beträgt 96 %. <?page no="123"?> Lösungen Lösungen zu Kapitel 6: Lineare Regression Das sollten Sie wissen! Der Korrelationskoeffizient r und die Steigungen b 1 , b 2 der beiden Regressionsgeraden haben stets dasselbe Vorzeichen. Tipp! Ein einfacher Lösungsweg zur Berechnung der Korrelation lautet wie folgt: [1] Zunächst werden die Steigungen b 1 und b 2 der beiden Regressionsgeraden berechnet. Dabei sind die beiden Zähler aus Formel 53 und Formel 56 identisch. [2] Anschließend wird mit der Formel 60 das Bestimmtheitsmaß berechnet. [3] Sind sowohl b 1 als auch b 2 positiv, so ist der Korrelationskoeffizient die Wurzel aus dem Bestimmtheitsmaß. Sind hingegen sowohl b 1 als auch b 2 negativ, so muss für die Korrelation die Wurzel aus dem Bestimmtheitsmaß noch mit (−1) multipliziert werden. Unterscheiden sich bei Ihrer Berechnung die Vorzeichen von b 1 und b 2 , so haben Sie sich verrechnet. Das sollten Sie wissen! Die Interpretation der Steigung b 1 lautet wie folgt: Wird der x -Wert um eine Einheit erhöht, so steigt der y -Wert um b 1 Einheiten. Analog lautet die Interpretation der Steigung b 2 : Wird der y -Wert um eine Einheit erhöht, so steigt der x -Wert um b 2 Einheiten. 6.1 X = Anzahl offener Stellen Y = geleistete Überstunden i x i y i x i · y i x 2 i y 2 i 1 1 37 37 1 1 369 2 0 5 0 0 25 3 2 50 100 4 2 500 4 4 168 672 16 28 224 ∑ 7 260 809 21 32 118 111 <?page no="124"?> 112 Lösungen zu Kapitel 6: Lineare Regression [a] a 1 + b 1 · 3 =? Formel-Navigator Verwenden Sie hier Formel 53 und Formel 54. b 1 = 4 · 809 − 7 · 260 4 · 21 − 7 2 = 1 416 35 = 40 , 46 a 1 = 260 − 40 , 46 · 7 4 = −5 , 81 a 1 + b 1 · 3 = 115 , 57 d. h. es ist mit etwa 116 Überstunden zu rechnen. [b] b 1 = 40 , 46 d. h. für jede weitere offene Stelle sind etwa 40 Überstunden pro Woche mehr zu leisten. [c] r =? Formel-Navigator Verwenden Sie hier Formel 56. b 2 = 1 416 4 · 32 118 − 260 2 = 1 416 60 872 = 0 , 02 Formel-Navigator Verwenden Sie hier Formel 60. r = √ b 1 · b 2 ≈ 0 , 9 Da 3 ∈ [ x min ; x max ] = [0; 4] liegt, ist 115,57 ein interpolierter Wert. Da die Korrelation mit r ≈ 0 , 9 stark ist, ist somit aus statistischer Sicht auf den interpolierten Wert 115,57 Verlass. 6.2 X = Anzahl der Kunden Y = Auslieferungszeit (in Min) i x i y i x i · y i x 2 i y 2 i 1 12 250 2 4 500 3 39 750 n = 4 38 720 ∑ 113 2 220 71 610 3 685 1 393 400 <?page no="125"?> Lösungen zu Kapitel 6: Lineare Regression 113 Lösungen [a] b 1 = 4 · 71 610 − 113 · 2 220 4 · 3 685 − 113 2 = 35 580 1 971 = 18 , 05175 mit Formel 53 a 1 = 2 220 − b 1 · 113 4 = 45 , 03805 mit Formel 54 d. h. die Regressionsgerade lautet f ( x ) = a 1 + b 1 · x = 45 , 03805 + 18 , 05175 x . [b] b 1 = 18 , 05175 ; d. h. ist ein Kunde mehr zu beliefern, so steigt die Auslieferungszeit um etwa 18 Minuten. [c] a 1 + b 1 · 20 = 406 , 0731 d. h. es ist mit einer Auslieferungszeit von etwa 406 Minuten zu rechnen. [d] Der Prognosewert 406 ist ein interpolierter Wert, da 20 ∈ [12; 39] liegt. b 2 = 35 580 4 · 1 393 400 − 2 220 2 = 35 580 645 200 = 0 , 05514569 mit Formel 56 r = √ b 1 · b 2 = 0 , 9977356 mit Formel 60 d. h. bei der Prognose handelt es sich um einen interpolierten Wert bei gleichzeitig starker Korrelation, insofern ist der Prognosewert 406 Min als zuverlässig anzusehen. Das sollten Sie wissen! Die Berechnung von Prognosewerten anhand einer linearen Regressionsgeraden orientiert sich daran, welcher der beiden Werte x oder y vorgegeben ist: Ist der x -Wert bekannt, so lautet der Prognosewert a 1 + b 1 · x . Ist der y -Wert bekannt, so lautet der Prognosewert a 2 + b 2 · y . 6.3 X = Absatzmenge Y = Preis y i x i x i · y i x 2 i y 2 i 139 60 199 30 149 50 169 40 656 180 28 520 8 600 109 684 [a] a 1 + b 1 · 45 =? Formel-Navigator Verwenden Sie hier Formel 53 und Formel 54. b 1 = 4 · 28 520 − 180 · 656 4 · 8 600 − 180 2 = −4 000 2 000 = −2 a 1 = 656 − (−2) · 180 4 = 254 <?page no="126"?> 114 Lösungen zu Kapitel 6: Lineare Regression 254 − 2 · 45 = 164 d. h. es ist ein Preis von 164 Cent anzusetzen. [b] [1] a 2 + b 2 · 179 =? Formel-Navigator Verwenden Sie hier Formel 56 und Formel 57. b 2 = −4 000 4 · 109 684 − 656 2 = −0 , 4761905 a 2 = 180 − (−0 , 4761905) · 656 4 = 123 , 09524 123 , 09524 − 0 , 4761905 · 179 = 37 , 85714 ≈ 38 d. h. es ist mit einem Absatz von 38 ME zu rechnen. [2] b 2 = −0 , 4761905 ≈ −0 , 5 d. h. steigt der Preis um einen Cent, so sinkt der Absatz um etwa 0,5 ME. [c] r =? Formel-Navigator Verwenden Sie hier Formel 60. r = − √ (−2) · (−0 , 4761905) = −0 , 9759 d. h. es besteht ein starker negativer linearer Zusammenhang zwischen Preis und Absatz. [d] [1] 45 ∈ [30; 60] ; d. h. 164 ist ein interpolierter Wert, auf den bei gleichzeitig starker Korrelation Verlass ist. [2] 179 ∈ [139; 199] ; d. h. 38 ist ein interpolierter Wert, auf den bei gleichzeitig starker Korrelation Verlass ist. 6.4 X = Preis Y = Absatzmenge i x i y i x i · y i x 2 i y 2 i 1 2 20 2 1,9 22 3 2,2 16 4 2,1 18 5 1,8 25 ∑ 10 101 199,8 20,1 2 089 <?page no="127"?> Lösungen zu Kapitel 6: Lineare Regression 115 Lösungen [a] Gesucht: a 1 + b 1 · 1 , 6 =? Formel-Navigator Verwenden Sie hier Formel 53 und Formel 54. b 1 = 5 · 199 , 8 − 101 · 10 5 · 20 , 1 − 10 · 10 = − 11 0 , 5 = −22 a 1 = 101 − (−22) · 10 5 = 64 , 2 64 , 2 − 22 · 1 , 6 = 29 , 0 d. h. es ist mit einem Absatz von etwa 29 ME zu rechnen. [b] Gesucht: a 2 + b 2 · 24 =? Formel-Navigator Verwenden Sie hier Formel 56 und Formel 57. b 2 = −11 5 · 2 089 − 101 · 101 = − 11 244 = −0 , 045 a 2 = 10 − (−0 , 045) · 101 5 = 2 , 91 2 , 91 − 0 , 045 · 24 = 1 , 83 d. h. es ist ein Preis von etwa 1,83 GE anzusetzen. [c] r =? Formel-Navigator Verwenden Sie hier Formel 60. B = b 1 · b 2 = (−22) · (−0 , 045) = 0 , 99 r = − √ B = − √ 0 , 99 = −0 , 995 d. h. es liegt eine starke negative Korrelation vor. Auf den Prognosewert unter Teilaufgabe [a] ist wenig Verlass, da es sich wegen 1,6 / ∈ [ x min ; x max ] = [1 , 8; 2 , 2] um eine Extrapolation handelt. Auf den Prognosewert unter Teilaufgabe [b] ist Verlass, da es sich wegen 24 ∈ [ y min ; y max ] = [16; 25] um eine Interpolation handelt und da die Korrelation stark ist. <?page no="129"?> Lösungen Lösungen zu Kapitel 7: Indexrechnung Das sollten Sie wissen! Der Lösungsweg zur Berechnung eines durchschnittlichen jährlichen Wachstums (in Prozent) mit Hilfe des geometrischen Mittels (Formel 8) hängt davon ab, ob (Index-)- Werte oder Raten angegeben sind: Sind die beiden (Index-)Werte vom Basisjahr und vom Berichtsjahr angegeben, so wird das durchschnittliche jährliche Wachstum (in %) wie folgt berechnet: Berichtsjahr minus Basisjahr √ Wert vom Berichtsjahr Wert vom Basisjahr Sind n jährliche (Index-)Werte angegeben, so beträgt das durchschnittliche jährliche Wachstum (in %): n −1 √ n -ter Wert 1. Wert Sind n aufeinanderfolgende Jahresraten angegeben, so beträgt das durchschnittliche jährliche Wachstum (in %): n √ 1. Faktor · . . . · n -ter Faktor 7.1 [a] Verknüpfung der Indizes: Jahr Index 1999 100 106 , 9 · 105 , 2 = 98 , 4 2000 100,0 2001 102,0 2002 103,3 2003 104,5 2004 106,1 2005 107,6 2006 107 , 6 100 · 101 , 4 = 109 , 1 2007 107 , 6 100 · 103 , 7 = 111 , 6 117 <?page no="130"?> 118 Lösungen zu Kapitel 7: Indexrechnung [b] P La =? Formel-Navigator Verwenden Sie hier Formel 64. P La = 111 , 6 98 , 4 = 1 , 134146 ≈ 1 , 13 d. h. die Preissteigerung beträgt 13 Prozent. [c] In Abwandlung von Formel 8 ergibt sich: 2007−1999 √ 111 , 6 98 , 4 = 8 √ 1 , 134146 = 1 , 015859 d. h. die durchschnittliche jährliche Inflationsrate beträgt 1,6 %. [d] Kaufkraft = 1 P La = 1 1 , 134146 = 0 , 8817204 d. h. der Kaufkraftverlust beträgt 11,8 %. [e] Q =? Formel-Navigator Verwenden Sie hier Formel 61 und Formel 64. W = 314 118 307 669 = 1 , 020961 und P La = 101 , 4 100 = 1 , 014 Formel-Navigator Verwenden Sie hier Formel 66. Q Pa = W P La = 1 , 020961 1 , 014 = 1 , 006865 d. h. die reale Steigerung beträgt 0,7 %. 7.2 [a] W = 2006−2002 √ 2 376 , 2 2 000 = 4 √ 1 , 1881 = 1 , 044 mit Formel 61 und Formel 8 d. h. durchschnittlich ist das BIP im Zeitraum 2002 bis 2006 um 4,4 % pro Jahr nominal gewachsen. [b] Q La = ? Formel-Navigator Verwenden Sie hier Formel 62. <?page no="131"?> Lösungen zu Kapitel 7: Indexrechnung 119 Lösungen Q La 02 , 03 = 2 070 2 000 = 1 , 0350 Q La 02 , 04 = 2 105 2 000 = 1 , 0525 Q La 02 , 05 = 2 120 2 000 = 1 , 06 Q La 02 , 06 = 2 180 2 000 = 1 , 09 [1] Da die Preise aus dem Basisjahr 2002 stammen, handelt es sich um einen Laspeyres- Mengenindex. [2] 2006−2002 √ 1 , 09 = 4 √ 1 , 09 = 1 , 0218 mit Formel 8 d. h. durchschnittlich ist das BIP im Zeitraum 2002 bis 2006 um 2,18 % pro Jahr real gewachsen. [c] P Pa = ? Formel-Navigator Verwenden Sie hier Formel 65. P Pa 02 , 03 = 2 132 , 1 2 070 = 1 , 03 P Pa 02 , 04 = 2 189 , 2 2 105 = 1 , 04 P Pa 02 , 05 = 2 247 , 2 2 120 = 1 , 06 P Pa 02 , 06 = 2 376 , 2 2 180 = 1 , 09 [1] Da die Mengen aus dem Berichtsjahr stammen, handelt es sich um einen Paasche- Preisindex. [2] 2006−2002 √ 1 , 09 = 4 √ 1 , 09 = 1 , 0218 mit Formel 8 d. h. die durchschnittliche jährliche Inflationsrate im Zeitraum 2002 bis 2006 beträgt +2,18 %. 7.3 [a] P La = 103 , 4 98 , 0 = 1 , 0551 mit Formel 64 d. h. im Zeitraum von 1998 bis 2002 sind die Verbraucherpreise um 5 , 5 % insgesamt gestiegen. [b] 2002−1998 √ 1 , 0551 = 4 √ 1 , 0551 = 1 , 0135 mit Formel 8 d. h. im Zeitraum von 1998 bis 2002 sind die Verbraucherpreise um durchschnittlich 1 , 4 % pro Jahr gestiegen. <?page no="132"?> 120 Lösungen zu Kapitel 7: Indexrechnung [c] Kaufkraft = 1 Preisindex = 1 1 , 0551 = 0 , 9478 d. h. im Zeitraum von 1998 bis 2002 ist die Kaufkraft um 5 , 2 % insgesamt gesunken. [d] Umbasierung mit Dreisatz: 98 , 0 ̂ =100 98 , 6 ̂ = 100 98 , 0 · 98 , 6 = 98 , 6 98 , 0 · 100 = 100 , 6 Jahr Index 1998 98 , 0 98 , 0 · 100 = 100 , 0 1999 98 , 6 98 , 0 · 100 = 100 , 6 2000 100 , 0 98 , 0 · 100 = 102 , 0 2001 102 , 0 98 , 0 · 100 = 104 , 1 2002 103 , 4 98 , 0 · 100 = 105 , 5 7.4 [a] Preisindex von Laspeyres, berechnet gemäß Formel 64 aus den Preisverhältnissen (Preismessziffern) und den Ausgabeanteilen: P La = ∑ i p t i p 0 i · p 0 i q 0 i ∑ j p 0 j q 0 j [b] Der Preisindex für die Lebenshaltung der privaten Haushalte in Deutschland ist im Zeitraum von 1995 bis 1999 um 4 , 9 % gestiegen. [c] 1999−1995 √ 1 , 049 = 4 √ 1 , 049 = 1 , 012 mit Formel 8 d. h. im Zeitraum von 1995 bis 1999 beträgt die durchschnittliche jährliche Inflationsrate 1 , 2 % . [d] 104 , 9 = V P I = 101 , 7 · 0 , 13126 + . . . + 104 , 5 · 0 , 06095 100 % − 3 , 439 % = 96 , 561 % V P I ohne G-Pflege = 104 , 9 − 110 , 6 · 0 , 03439 0 , 96561 = 104 , 7 Im Zeitraum von 1995 bis 1999 ist in Deutschland der Preisindex ohne die Ausgaben für Gesundheitspflege um 4,7 % gestiegen. Das sollten Sie wissen! Faktor = 1 + Rate <?page no="133"?> Lösungen zu Kapitel 7: Indexrechnung 121 Lösungen Tipp! Sind in einer Tabelle lediglich die Raten der Veränderungen gegenüber dem Vorjahr bekannt, so ist es sehr hilfreich, wenn in einer zusätzlichen Spalte in der Tabelle zunächst alle Faktoren der Veränderungen gegenüber dem Vorjahr berechnet werden (wie z. B. in Aufgabe 7.5). 7.5 Zunächst werden die Faktoren der Veränderung berechnet: Jahr Rate (in %) Faktor 2004 −1 , 9 0,981 2005 −2 , 0 0,980 2006 0 1,000 2007 +1 , 0 1,010 2008 +0 , 6 1,006 2009 +0 , 5 1,005 2010 +2 , 6 1,026 2011 +5 , 4 1,054 [a] W = 0 , 981 · 0 , 980 · . . . · 1 , 054 = 1 , 061618 d. h. im Zeitraum 2003 bis 2011 sind die Hauspreise um nominal 6,2 % insgesamt gestiegen. [b] x G =? Formel-Navigator Verwenden Sie hier Formel 8. 2011−2003 √ 1 , 061618 = 8 √ 1 , 061618 = 1 , 007502 d. h. im Zeitraum 2003 bis 2011 sind die Hauspreise um 0,8 % durchschnittlich pro Jahr nominal gestiegen. [c] W = 1 , 010 · 1 , 006 · . . . · 1 , 054 = 1 , 104265 Formel-Navigator Verwenden Sie hier Formel 66. Q = W P = 1 , 104265 1 , 095 = 1 , 008461 2011−2006 √ 1 , 008461 = 5 √ 1 , 008461 = 1 , 001687 mit Formel 8 d. h. im Zeitraum 2006 bis 2011 sind die Hauspreise um 0,2 % durchschnittlich pro Jahr real gestiegen. <?page no="134"?> 122 Lösungen zu Kapitel 7: Indexrechnung 7.6 [a] W = 1 , 01 · 0 , 953 · 1 , 037 · 1 , 022 = 1 , 020103 d. h. im Zeitraum vom 01.01.2008 bis 31.12.2011 wird das Bruttoinlandsprodukt voraussichtlich nominal um 2,0 % insgesamt gestiegen sein. [b] 2011−2007 √ 1 , 01 · 0 , 953 · 1 , 037 · 1 , 022 = 4 √ 1 , 020103 = 1 , 004988 mit Formel 8 d. h. im Zeitraum vom 01.01.2008 bis 31.12.2011 wird das Bruttoinlandsprodukt voraussichtlich um 0,5 % durchschnittlich pro Jahr nominal gestiegen sein. [c] 2 404 , 4 · 1 , 037 · 1 , 022 = 2 548 , 2 d. h. das BIP wird Ende 2011 voraussichtlich 2 548,2 Mrd. Euro betragen. [d] 2 404 , 4 · 0 , 03 = 72 , 1 d. h. im Jahr 2009 betrug das staatliche Defizit 72,1 Mrd. Euro. [e] Q =? Formel-Navigator Verwenden Sie hier Formel 66. Q = W P = 1 , 037 1 , 011 = 1 , 0257 d. h. im Jahr 2010 ist das BIP um etwa 2,6 % real gestiegen. <?page no="135"?> Lösungen Lösungen zu Kapitel 8: Binomialverteilung Das sollten Sie wissen! Eine Zufallsvariable ist genau dann binomialverteilt, wenn sie zählt, wie oft bei n Wiederholungen eines Zufallsexperiments ein bestimmtes Ereignis A eintritt. Dazu müssen die n Wiederholungen stochastisch unabhängig sein. Und bei jeder der n Wiederholungen muss die Wahrscheinlichkeit p = P ( A ) gleich groß sein. Tipp! Zur Orientierung, wann eine Binomialverteilung vorliegt und wie ggf. näherungsweise Wahrscheinlichkeiten berechnet werden, soll das folgende Entscheidungsdiagramm helfen: X i Ja/ Nein Variable Y = X 1 + . . . + X n P ( Y ≤ y ) =? p = P ( X i = 1) = konstant? X 1 , . . . , X n stoch. unabh.? np ≥ 10? n (1 − p ) ≥ 10? n N ≤ 0 , 05 ? Hypergeom. Vert. ≈ F U ( y +0 , 5− np √ np (1− p ) ) Y ∼ B ( n ; p ) Y ≈ B ( n ; p = M N ) ja nein nein ja nein ja 123 <?page no="136"?> 124 Lösungen zu Kapitel 8: Binomialverteilung Tipp! Für einen übersichtlichen Lösungsweg sollten Sie kurz festhalten, welches der beiden Ereignisse der Ja/ Nein-Variablen Sie zählen, also z. B. X = „Anzahl der Ausschussstücke unter den n entnommenen Stücken“ oder aber X = „Anzahl der Qualitätsstücke unter den n entnommenen Stücken“. Dabei ist es für das Ergebnis unerheblich, welches der beiden Ereignisse A oder A Sie zählen. Sie sollten sich aber vor den Berechnungen entschieden haben. 8.1 X = Anzahl der Aufwärtsbewegungen binnen n Monaten X ∼ B( n ; p = 0 , 4) [a] X ∼ B( n = 5; p = 0 , 4) Formel-Navigator Verwenden Sie hier Formel 68. E [ X ] = np = 5 · 0 , 4 = 2 d. h. in dem Zeitraum ist mit zwei Aufwärtsbewegungen zu rechnen. [b] X ∼ B( n = 6; p = 0 , 4) Formel-Navigator Verwenden Sie hier Formel 67. P ( X = 6) = ( 6 6 ) · 0 , 4 6 · 0 , 6 0 = 0 , 0041 d. h. die Wahrscheinlichkeit für sechs Aufwärtsbewegungen in sechs Monaten beträgt 0,0041. [c] X ∼ B( n = 4; p = 0 , 4) P ( X = 2) = ( 4 2 ) · 0 , 4 2 · 0 , 6 2 = 0 , 3456 mit Formel 67 d. h. die Wahrscheinlichkeit dafür, dass nach vier Monaten wieder der Anfangskurs erreicht wird, beträgt 0,3456. 8.2 X = Anzahl der ausgefallenen Rechner X ∼ B( n = 10; p = 0 , 03) <?page no="137"?> Lösungen zu Kapitel 8: Binomialverteilung 125 Lösungen [a] P ( X = 0) = 0 , 7374 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,7374. [b] P ( X = 2) = 0 , 0317 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,0317. [c] P ( X > 2) = 1 − P ( X ≤ 2) = 1 − P ( X = 0) − P ( X = 1) − P ( X = 2) = 1 − 0 , 7374 − 0 , 2281 − 0 , 0317 = 0 , 0028 d. h. die Wahrscheinlichkeit beträgt 0,0028. [d] 360 · 0 , 0028 = 1 , 008 d. h. im Mittel fällt die Anlage etwa einmal im Jahr aus. 8.3 X = Anzahl der Ausschussstücke in der Lieferung X ∼ B( n = 20; p = 0 , 15) x 0 1 2 3 P ( X = x ) 0,0388 0,1368 0,2293 0,2428 P ( X ≤ x ) 0,0388 0,1756 0,4049 0,6477 [a] E [ X ] = n · p = 20 · 0 , 15 = 3 mit Formel 68 [b] P ( X = 3) = ( 20 3 ) · (0 , 15) 3 · (0 , 85) 17 = 0 , 2428 mit Formel 67 [c] P ( X ≤ 3) = 0 , 6477 mit Formel 67 [d] P ( X = 0) = 0 , 0388 mit Formel 67 Das sollten Sie wissen! Ist in einer Grundgesamtheit die Anzahl N aller Elemente in dieser Grundgesamtheit bekannt und werden aus dieser Grundgesamtheit n Elemente zufällig ohne Zurücklegen herausgezogen, so ist die Zufallsvariable X = „Anzahl der Elemente mit der Eigenschaft A unter den n ausgewählten Elementen“ hypergeometrisch verteilt. Beträgt jedoch der Auswahlsatz n N höchstens 5 %, so darf näherungsweise mit der Binomialverteilung gerechnet werden (wie z. B. in Aufgabe 8.4 [a]). 8.4 N = 1 000 Kisten M = 112 Kisten mit überreifen Früchten n = 50 Kisten werden gekauft Bei der Auswahl der 50 Kisten handelt es sich um ein Ziehen von 50 aus 1 000 ohne Zurücklegen. Sei A das Ereignis, dass die Kiste überreife Früchte enthält. Dann beträgt vor der ersten Auswahl einer Kiste P ( A ) = M N = 112 1 000 . <?page no="138"?> 126 Lösungen zu Kapitel 8: Binomialverteilung Falls die erste Kiste keine überreifen Früchte enthält, so beträgt vor der zweiten Auswahl einer Kiste P ( A ) = 112 999 , anderenfalls beträgt P ( A ) = 111 999 . d. h. P ( A ) ist vor jeder Wiederholung des Zufallsexperiments nicht gleich groß. (Die Wahrscheinlichkeit P ( A ) wäre vor jeder Wiederholung gleich groß, wenn die gezogene Kiste wieder zurückgelegt werden würde und somit erneut gezogen werden könnte; d. h. wir also 50 aus 1 000 ziehen würden mit Zurücklegen.) Also liegt keine exakte Binomialverteilung vor. Die Binomialverteilung kann aber dennoch gemäß der Formel 75 zur näherungsweisen Berechnung herangezogen werden, falls der Auswahlsatz n N höchstens 0,05 beträgt. X = Anzahl der Kisten mit überreifen Früchten X ≈ B( n = 50; p = 0 , 112) ; da der Auswahlsatz n N = 0 , 05 beträgt. [a] P ( X = 0) ≈ ( 50 0 ) · 0 , 112 0 · 0 , 888 50 = 0 , 002634197 mit Formel 75 d. h. die Wahrscheinlichkeit ist sehr gering und beträgt näherungsweise 0,0026. [b] P ( X ≥ 1) = 1 − P ( X = 0) ≈ 1 − 0 , 0026 = 0 , 9974 d. h. die Wahrscheinlichkeit ist mit dem Näherungswert 0,9974 sehr hoch. Die Großhändlerin muss also mit fast sicherer Wahrscheinlichkeit damit rechnen, mindestens eine Kiste mit überreifen Früchten zu erwerben. [c] E [ X ] = n · p = 50 · 0 , 112 = 5 , 6 mit Formel 68 d. h. die Großhändlerin muss damit rechnen, im Mittel etwa 5,6 Kisten mit überreifen Früchten zu erwerben. Das sollten Sie wissen! Für „große“ Werte von n lassen sich Wahrscheinlichkeiten einer Binomialverteilung näherungsweise mit der Formel 70 und der Formel 71 berechnen. 8.5 X = Anzahl der Männer unter n erwerbstätigen Vätern mit Kindern unter drei Jahren, die Elternzeit beantragen X ∼ B( n ; p = 0 , 012) [a] n = 10 E [ X ] = 10 · 0 , 012 = 0 , 12 mit Formel 68 d. h. im Mittel beantragen 0,12 Väter Elternzeit. [b] n = 20 P ( X ≤ 1) = P ( X = 0) + P ( X = 1) = ( 20 0 ) 0 , 012 0 · 0 , 988 20 + ( 20 1 ) 0 , 012 1 · 0 , 988 19 = 0 , 785 + 0 , 191 = 0 , 976 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,976. <?page no="139"?> Lösungen zu Kapitel 8: Binomialverteilung 127 Lösungen [c] n = 900 Formel-Navigator Verwenden Sie hier Formel 70. Faustregel: 900 · 0 , 012 = 10 , 8 ≥ 10 und 900 · 0 , 988 = 889 , 2 ≥ 10 erfüllt 0 , 95 = P ( X ≥ x ) ⇔ 0 , 05 = P ( X ≤ x − 1) ⇔ −1 , 6449 ≈ x − 1 + 0 , 5 − 10 , 8 √ 10 , 8 · 0 , 988 x = 11 , 3 − 1 , 6449 · √ 10 , 6704 = 5 , 926839 ≈ 6 d. h. die mit der Wahrscheinlichkeit 0,95 zu erwartende Mindestanzahl beträgt etwa sechs Väter. 8.6 X = Anzahl der Reiserücktritten unter n Verträgen X ∼ BV ( n ; p = 0 , 12) [a] n = 10 [1] E [ X ] = n · p = 10 · 0 , 12 = 1 , 2 mit Formel 68 d. h. pro Tag ist mit 1,2 Reisrücktritten zu rechnen. [2] P ( X = 0) = ( 10 0 ) · 0 , 12 0 · 0 , 88 10 = 0 , 2785 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt etwa 28 %. [3] P ( X > 2) = 1 − P ( X ≤ 2) = 1 − P ( X = 0) − P ( X = 1) − P ( X = 2) P ( X = 2) = ( 10 2 ) · 0 , 12 2 · 0 , 88 8 = 0 , 2330 mit Formel 67 P ( X = 1) = ( 10 1 ) · 0 , 12 · 0 , 88 9 = 0 , 3798 mit Formel 67 P ( X > 2) = 1 − 0 , 2785 − 0 , 3798 − 0 , 2330 = 0 , 1087 d. h. die Wahrscheinlichkeit beträgt etwa 11 %. [b] n = 320 [1] E [ X ] = n · p = 320 · 0 , 12 = 38 , 4 mit Formel 68 d. h. pro Jahr ist mit 38,4 Reiserücktritten zu rechnen. [2] Var [ X ] = np (1 − p ) = 38 , 4 · 0 , 88 = 33 , 792 mit Formel 69 √ 33 , 792 = 5 , 81 d. h. die Standardabweichung beträgt 5,81. [3] Faustregel: n · p = 38 , 4 ≥ 10 und n · (1 − p ) = 281 , 6 ≥ 10 ist erfüllt Formel-Navigator Verwenden Sie hier Formel 70 und die Tabelle auf der Seite 190. <?page no="140"?> 128 Lösungen zu Kapitel 8: Binomialverteilung 0 , 90 = P ( X > x ) ⇔ 0 , 10 = P ( X ≤ x ) = F U ( x + 0 , 5 − 38 , 4 5 , 81 ) ⇔ −1 , 2816 = x − 37 , 9 5 , 81 ⇔ x = 37 , 9 − 1 , 2816 · 5 , 81 = 30 , 454 ≈ 30 d. h. mit der Wahrscheinlichkeit von etwa 90 % muss mit über 30 Rücktritten pro Jahr gerechnet werden. 8.7 X = Anzahl der falschen Steuererklärungen unter n geprüften X ∼ BV( n ; p = 0 , 2) [a] n = 500 E [ X ] = n · p = 500 · 0 , 2 = 100 mit Formel 68 100 · 2 = 200 d. h. es ist mit Zusatzkosten in Höhe von 200 Euro zu rechnen. [b] n = 20 P ( X = 4) = ( 20 4 ) · 0 , 2 4 · 0 , 8 16 = 0 , 2181994 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 22 %. [c] n = 10 000 E [ X ] = n · p = 2 000 mit Formel 68 Var [ X ] = np (1 − p ) = 1 600 mit Formel 69 Faustregel: n · p = 2 000 ≥ 10 und n · (1 − p ) = 8 000 ≥ 10 ist erfüllt Formel-Navigator Verwenden Sie hier Formel 70 und die Tabelle auf der Seite 191. 0 , 95 = P ( X ≤ x ) = F U ( x + 0 , 5 − 2 000 40 ) ⇔ 1 , 6449 = x + 0 , 5 − 2 000 40 ⇔ x = 2 065 , 296 2 065 , 296 · 2 GE = 4 130 , 592 GE d. h. mit der Wahrscheinlichkeit von 95 % liegen die Zusatzkosten nicht über 4 130,59 Euro. Tipp! Ist die Faustregel aus der Formel 71 erfüllt, so spart es Zeit, die Wahrscheinlichkeit P ( X = x ) dennoch über die Formel 67 (statt über die Formel 71) zu berechnen, vorausgesetzt Ihr Taschenrechner liefert ein Ergebnis für den Binomialkoeffizienten ( n x ) . <?page no="141"?> Lösungen zu Kapitel 8: Binomialverteilung 129 Lösungen Das sollten Sie wissen! Ist für eine binomialverteilte Zufallsvariable X ein oberer Prozentpunkt gesucht, z. B. 0 , 05 = P ( X ≥ x ) , so muss für die näherungsweise Berechnung mit der Formel 70 das Gegenereignis 0 , 95 = P ( X < x ) = P ( X ≤ x − 1) betrachtet werden. 8.8 [a] X = Anzahl der verspäteten Flüge von sieben Flügen X ∼ BV( n = 7; p = 0 , 12) [1] P ( X = 0) = ( 7 0 ) · 0 , 12 0 · 0 , 88 7 = 0 , 4087 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt etwa 41 %. [2] P ( X > 3) = 1 − P ( X ≤ 3) P ( X = 1) = ( 7 1 ) · 0 , 12 1 · 0 , 88 6 = 0 , 3901 mit Formel 67 P ( X = 2) = ( 7 2 ) · 0 , 12 2 · 0 , 88 5 = 0 , 1596 mit Formel 67 P ( X = 3) = ( 7 3 ) · 0 , 12 3 · 0 , 88 4 = 0 , 0363 mit Formel 67 P ( X > 3) = 1 − 0 , 4087 − 0 , 3901 − 0 , 1596 − 0 , 0363 = 0 , 0054 d. h. die Wahrscheinlichkeit beträgt etwa 0,5 %. [3] P ( X = 2) = 0 , 1596 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt etwa 16 %. [b] X = Anzahl der verspäteten Flüge von 150 Flügen X ∼ BV( n = 150; p = 0 , 12) [1] P ( X = 18) =? 1. Lösungsweg: (mit Formel 67) P ( X = 18) = ( 150 18 ) · 0 , 12 18 · 0 , 88 132 = 0 , 0998 d. h. die Wahrscheinlichkeit beträgt etwa 10 %. 2. Lösungsweg: (über ZGWS mit Formel 71) Faustregel np = 18 ≥ 10 okay und n (1 − p ) = 132 ≥ 10 okay P ( X = 18) ≈ F U ( 18 , 5 − 18 3 , 98 ) − F U ( 17 , 5 − 18 3 , 98 ) = F U (0 , 1256) − F U (−0 , 1256) = 0 , 550 − 0 , 450 = 0 , 100 d. h. die Wahrscheinlichkeit beträgt etwa 10 %. P ( X ≤ 18) =? P ( X ≤ 18) ≈ F U ( 18 , 5 − 18 3 , 98 ) = 0 , 550 mit Formel 70 d. h. die Wahrscheinlichkeit beträgt etwa 55 %. <?page no="142"?> 130 Lösungen zu Kapitel 8: Binomialverteilung [2] x =? mit 0 , 90 = P ( X ≥ x ) 1. Lösungsweg: (mit Formel 70) 0 , 90 = P ( X ≥ x ) ⇔ 0 , 10 = P ( X < x ) = P ( X ≤ x − 1) 0 , 10 = P ( X ≤ x − 1) = F U ( x − 1 + 0 , 5 − 18 3 , 98 ) ⇔ −1 , 2816 = x − 1 + 0 , 5 − 18 3 , 98 ⇔ x = 18 , 5 − 1 , 2816 · 3 , 98 = 13 , 40 ≈ 13 d. h. mit einer Wahrscheinlichkeit von 90 % ist mindestens mit etwa 13 verspäteten Flügen zu rechnen. 2. Lösungsweg: (mit Formel 70) 0 , 10 = P ( X ≤ x ) = F U ( x + 0 , 5 − 18 3 , 98 ) ⇔ −1 , 2816 = x + 0 , 5 − 18 3 , 98 ⇔ x = 17 , 5 − 1 , 2816 · 3 , 98 = 12 , 40 ≈ 12 d. h. 0 , 10 ≈ P ( X ≤ 12) ⇔ 0 , 90 ≈ P ( X > 12) = P ( X ≥ 13) d. h. mit einer Wahrscheinlichkeit von 90 % ist mindestens mit etwa 13 verspäteten Flügen zu rechnen. 8.9 Y = Anzahl der Kunden, die eine Bestellung aufgeben Y ∼ B( n ; p = 0 , 61) [a] n = 10 P ( Y > 6) = P ( Y = 7) + P ( Y = 8) + P ( Y = 9) + P ( Y = 10) P ( Y = 7) = ( 10 7 ) · 0 , 61 7 · 0 , 39 3 = 0 , 2237 mit Formel 67 P ( Y = 8) = ( 10 8 ) · 0 , 61 8 · 0 , 39 2 = 0 , 1312 mit Formel 67 P ( Y = 9) = ( 10 9 ) · 0 , 61 9 · 0 , 39 1 = 0 , 0456 mit Formel 67 P ( Y = 10) = ( 10 10 ) · 0 , 61 10 · 0 , 39 0 = 0 , 0071 mit Formel 67 P ( Y > 6) = 0 , 4077 d. h. die Wahrscheinlichkeit beträgt etwa 41 %. [b] n = 100 E [ Y ] = np = 100 · 0 , 61 = 61 mit Formel 68 Var [ Y ] = np (1 − p ) = 61 · 0 , 39 = 23 , 79 mit Formel 69 √ 23 , 79 = 4 , 88 Faustregel für ZGWS (Formel 70): np = 61 ≥ 10 ok. und n (1 − p ) = 100 · 0 , 39 = 39 ≥ 10 ok. <?page no="143"?> Lösungen zu Kapitel 8: Binomialverteilung 131 Lösungen P ( Y > 60) = 1 − P ( Y ≤ 60) ≈ 1 − F U ( 60 + 0 , 5 − 61 4 , 88 ) = 1 − 0 , 459 = 0 , 541 d. h. die Wahrscheinlichkeit beträgt annähernd 54 %. [c] n = 1 000 E [ Y ] = np = 1 000 · 0 , 61 = 610 mit Formel 68 Var [ Y ] = np (1 − p ) = 610 · 0 , 39 = 237 , 9 mit Formel 69 √ 237 , 9 = 15 , 42 Faustregel für ZGWS (Formel 70): np = 610 ≥ 10 ok. und n (1 − p ) = 1 000 · 0 , 39 = 390 ≥ 10 ok. P ( Y > 600) = 1 − P ( Y ≤ 600) ≈ 1 − F U ( 600 + 0 , 5 − 610 15 , 42 ) = 1 − 0 , 269 = 0 , 731 d. h. die Wahrscheinlichkeit beträgt annähernd 73 %. [d] Das ist das Schwache Gesetz der Großen Zahlen. n y P ( Y > y ) 10 6 = n · p − 0 , 01 · n 0,4077 100 60 = n · p − 0 , 01 · n 0,541 1 000 600 = n · p − 0 , 01 · n 0,731 Y = n ∑ i =1 X i mit X i = Ja/ Nein-Variablen P ( Y > np − 0 , 01 n ) = P ( n ∑ i =1 X i > np − 0 , 01 n ) = P ( X − p > −0 , 01 ) Gemäß dem Schwachen Gesetz der Großen Zahlen strebt diese Wahrscheinlichkeit für wachsendes n gegen 1, da sich X und p dann kaum noch unterscheiden. 8.10 X = Anzahl der Sendungen, bei denen von der Kodiermaschine Empfänger und Absender vertauscht werden X ∼ B( n ; p = 0 , 02) [a] X ∼ B( n = 10; p = 0 , 02) P ( X ≤ 2) = P ( X = 0) + P ( X = 1) + P ( X = 2) = ( 10 0 ) · 0 , 02 0 · 0 , 98 10 + ( 10 1 ) · 0 , 02 1 · 0 , 98 9 + ( 10 2 ) · 0 , 02 2 · 0 , 98 8 = 0 , 8171+0 , 1667+0 , 0153 = 0 , 9991 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,9991. [b] X ∼ B( n = 1 200; p = 0 , 02) E [ X ] = np = 1 200 · 0 , 02 = 24 mit Formel 68 <?page no="144"?> 132 Lösungen zu Kapitel 8: Binomialverteilung Var [ X ] = np (1 − p ) = 24 · 0 , 98 = 23 , 52 mit Formel 69 X ≈ ZGWS N ; da Faustregel np ≥ 10 und np (1 − p ) ≥ 10 erfüllt ist (Formel 70) P ( X ≤ 14) ≈ F U ( 14 + 0 , 5 − 24 √ 23 , 52 ) = F U (−1 , 9589) = 0 , 025 d. h. die Wahrscheinlichkeit beträgt annähernd 0,025. <?page no="145"?> Lösungen Lösungen zu Kapitel 9: Normalverteilung Das sollten Sie wissen! In den Grundlagen der Statistik gibt es genau drei Fälle, in denen Wahrscheinlichkeiten gemäß einer Normalverteilung bestimmt werden: Die Normalverteilung wurde in der Aufgabe vorgegeben oder für eine Binomialverteilung wird näherungsweise mit einer Normalverteilung gerechnet (wie z. B. in Aufgabe 8.5 [c]) oder für eine beliebige Verteilung wird näherungsweise mit einer Normalverteilung gerechnet (wie z.B. in Aufgabe 9.5). Tipp! Zur Orientierung bei der Anwendung des Zentralen Grenzwertsatzes soll das folgende Entscheidungsdiagramm helfen: P ( X 1 + . . . X n ≤ y ) =? BV ? np ≥ 10? n (1 − p ) ≥ 10? n ≥ 30 ? ≈ F U ( y +0 , 5− np √ np (1− p ) ) Y = X 1 + . . . + X n Y ∼ B( n ; p ) ≈ F U ( y − n · μ √ n · σ 2 ) Ende ja nein ja nein ja nein Das sollten Sie wissen! Die Normalverteilungs-Wahrscheinlichkeit P ( X = x ) beträgt null. 133 <?page no="146"?> 134 Lösungen zu Kapitel 9: Normalverteilung Das sollten Sie wissen! Da nur die Standard-Normalverteilung N( μ = 0; σ = 1 ) tabelliert ist, muss für Berechnungen mit anderen Erwartungswerten μ und Varianzen σ 2 zunächst die Zufallsvariable gemäß Formel 80 standardisiert werden: P ( X ≤ x ) = F U ( x − μ σ ) . Ferner sind in den Tabellen auf den Seiten 190 und 191 nur Normalverteilungs- Wahrscheinlichkeiten für Ereignisse der Form { X ≤ x } tabelliert. Deshalb müssen vor dem Nachschlagen in diesen Tabellen alle übrigen Ereignisse auf die Form { X ≤ x } gebracht werden. Das sollten Sie wissen! Die zentralen Schwankungsintervalle haben folgende Überdeckungswahrscheinlichkeiten: Das einfache zentrale Schwankungsintervall [ μ − σ ; μ + σ ] hat die Überdeckungswahrscheinlichkeit 68 %. Das zweifache zentrale Schwankungsintervall [ μ − 2 σ ; μ + 2 σ ] hat die Überdeckungswahrscheinlichkeit 95 %. Das dreifache zentrale Schwankungsintervall [ μ − 3 σ ; μ + 3 σ ] hat die Überdeckungswahrscheinlichkeit 99 %. 9.1 X =Wartezeit (in Min) zwischen zwei Anschlussflügen X ∼ N( μ = 120; σ = 60) [a] [1] P ( X ≤ 55) =? Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 190. P ( X ≤ 55) = F U ( 55 − 120 60 ) = F U (−1 , 0833) = 0 , 139 d. h. die Wahrscheinlichkeit beträgt 0,139. [2] P ( X = 55) = 0 d. h. die Wahrscheinlichkeit beträgt null. [3] P ( X > 90) = 1 − F U ( 90 − 120 60 ) = 1 − F U (−0 , 5) = 1 − 0 , 309 = 0 , 691 d. h. die Wahrscheinlichkeit beträgt 0,691. [b] x =? mit 0 , 95 = P ( X ≥ x ) Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 190. <?page no="147"?> Lösungen zu Kapitel 9: Normalverteilung 135 Lösungen 0 , 95 = P ( X ≥ x ) ⇔ 0 , 05 = P ( X < x ) = P ( X ≤ x ) ⇔ −1 , 6449 = x − 120 60 ⇔ x = 120 − 1 , 6449 · 60 = 21 , 306 d. h. mit einer Wahrscheinlichkeit von 95 % muss mit einer Umsteigezeit von mindestens etwa 21 Minuten gerechnet werden. Das sollten Sie wissen! Interessiert unter Vorliegen einer Normalverteilung N( μ ; σ ) nur, ob bei n stochastisch unabhängigen Wiederholungen ein bestimmtes Ereignis A (z. B. A = { X ≤ x } ) eintritt oder nicht, so ist die Anzahl der Eintritte von A bei diesen n Wiederholungen binomialverteilt mit n und p = P ( X ≤ x ) = F U ( x − μ σ ) (wie z. B. in Aufgabe 9.2 [c]). 9.2 X =Auslieferungszeit (in Stunden) eines Paketboten X ∼ N( μ = 8; σ = 2) [a] [1] P ( X ≤ 7) = F U ( 7 − 8 2 ) = F U (−0 , 5) = 0 , 309 d. h. die Wahrscheinlichkeit beträgt 30,9 %. [2] P ( X = 8) = 0 ; d. h. die Wahrscheinlichkeit beträgt 0 %. [3] P ( X > 8) = P ( X > μ ) = 0 , 5 ; d. h. die Wahrscheinlichkeit beträgt 50 %. [4] 1. Lösungsweg: 68 % ist die Überdeckungswahrscheinlichkeit des einfachen zentralen Schwankungsintervalls [ μ − σ ; μ + σ ] = [6; 10] ; d. h. die Wahrscheinlichkeit beträgt 68 %. 2. Lösungsweg: P ( X ≤ 10) − P ( X ≤ 6) = F U ( 10 − 8 2 ) − F U ( 6 − 8 2 ) = F U (1) − F U (−1) = 0 , 841 − 0 , 159 = 0 , 682 ≈ 0 , 68 [b] 0 , 05 = P ( X ≤ x ) ⇔ −1 , 6449 = x − 8 2 ⇔ x = 8 − 1 , 6449 · 2 = 4 , 7102 d. h. die gesuchte Auslieferungszeit beträgt etwa 4,7 Stunden. [c] [1] 1. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 32. P (( X 1 ≤ 7) ∪ ( X 2 ≤ 7)) = P ( X 1 ≤ 7) + P ( X 2 ≤ 7) − P (( X 1 ≤ 7) ∩ ( X 2 ≤ 7)) = 0 , 309 + 0 , 309 − 0 , 309 · 0 , 309 = 0 , 523 d. h. die Wahrscheinlichkeit beträgt 52,3 %. 2. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 67. <?page no="148"?> 136 Lösungen zu Kapitel 9: Normalverteilung Y =Anzahl der Tage, in denen die Auslieferungszeit höchstens sieben Stunden beträgt. Y ∼ B( n = 2; p = 0 , 309) P ( Y ≥ 1) = 1 − P ( Y < 1) = 1 − P ( Y = 0) = 1 − ( 2 0 ) · 0 , 309 0 · 0 , 691 2 = 1 − 0 , 477 = 0 , 523 [2] Y =Anzahl der Tage, in denen die Auslieferungszeit höchstens sieben Stunden beträgt. Y ∼ B( n = 6; p = 0 , 309) P ( Y = 1) = ( 6 1 ) · 0 , 309 · 0 , 691 5 = 0 , 2920788 ≈ 0 , 292 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 29,2 %. 9.3 [a] X = Funktionsdauer der Taschenlampe vom Typ X X ∼ N( μ = 240; σ = 20) [1] P ( X > 250) = 1 − F U ( 250−240 20 ) = 1 − F U (0 , 5) = 0 , 309 d. h. die Wahrscheinlichkeit beträgt 0,309. [2] 0 , 975 = P ( X ≤ x ) = F U ( x − 240 20 ) 1 , 96 = x − 240 20 ⇒ x = 240 + 1 , 96 · 20 = 279 , 2 d. h. die Funktionsdauer beträgt etwa 279 Stunden. [3] 240 ± 2 · 20 = [200; 280] d. h. das zweifache zentrale Schwankungsintervall beträgt [200 ; 280]. [4] 0 , 95 = P ( X ≤ 240 + c · 20) = F U ( 240 + c · 20 − 240 20 ) = F U ( c ) 1 , 6449 = c 240 ± 1 , 6449 · 20 = [207 , 1 ; 272 , 9] d. h. das gesuchte Intervall beträgt etwa [207 ; 273]. [b] Y = Funktionsdauer der Taschenlampe vom Typ Y Y ∼ N( μ = 200; σ ) Wir wissen schon, dass NV vorliegt und dass der Erwartungswert μ = 200 beträgt. Um mit der NV rechnen zu können, fehlt noch die Angabe der Standardabweichung σ . [1] Gesucht σ =? 0 , 025 = P ( Y ≤ 180 , 4) = F U ( 180 , 4 − 200 σ ) = F U ( −19 , 6 σ ) −1 , 96 = −19 , 6 σ ⇒ σ = 10 d. h. es liegt eine Normalverteilung mit dem Erwartungswert 200 und der Standardabweichung 10 vor. <?page no="149"?> Lösungen zu Kapitel 9: Normalverteilung 137 Lösungen 9.4 X =Anzahl Pkw an einem Wochenende auf der Kreuzung X ∼ N( μ = 10 000; σ = 2 000) [a] P ( X < 11 000) = P ( X ≤ 11 000) = F U ( 11 000 − 10 000 2 000 ) = F U (0 , 5) = 0 , 691 d. h. die Wahrscheinlichkeit beträgt 0,691. [b] Y =Anzahl der Wochenenden mit X < 11 000 Y ∼ B( n ; p = 0 , 691) [1] n = 2 P ( Y = 1) = ( 2 1 ) · 0 , 691 · 0 , 309 = 0 , 427 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,427. [2] n = 6 P ( Y = 2) = ( 6 2 ) · 0 , 691 2 · 0 , 309 4 = 0 , 065 mit Formel 67 d. h. die Wahrscheinlichkeit beträgt 0,065. Das sollten Sie wissen! Der Zentrale Grenzwertsatz ist verfasst für Ereignisse der Form { X ≤ x } . Bevor eine der beiden Formeln (Formel 81 und Formel 82) benutzt werden darf, muss deshalb das vorliegende Ereignis ggf. umgeformt werden wie z. B. in Aufgabe 9.5 [b] und [c]. 9.5 X =Gewinn (in GE pro Ticket) x 2 5 10 P ( X = x ) 0,2 0,5 0,3 [a] [1] E [ X ] = 2 · 0 , 2 + 5 · 0 , 5 + 10 · 0 , 3 = 5 , 9 mit Formel 42 d. h. der erwartete Gewinn pro Ticket beträgt 5,9 GE. [2] Var [ X ] = (2 − 5 , 9) 2 · 0 , 2 + (5 − 5 , 9) 2 · 0 , 5 + (10 − 5 , 9) 2 · 0 , 3 = 8 , 49 mit Formel 43 d. h. die theoretische Varianz beträgt 8,49. [b] Faustregel für ZGWS: n = 400 ≥ 30 ist erfüllt Formel-Navigator Verwenden Sie hier Formel 81. P ( X 1 + X 2 + . . . + X 400 > 2 400) = 1 − P ( X 1 + X 2 + . . . + X 400 ≤ 2 400) ≈ 1 − F U ( 2 400 − 400 · 5 , 9 √ 400 · 8 , 49 ) = 1 − F U (0 , 6864) = 1 − 0 , 754 = 0 , 246 d. h. die Wahrscheinlichkeit beträgt näherungsweise 25 %. <?page no="150"?> 138 Lösungen zu Kapitel 9: Normalverteilung [c] Faustregel für ZGWS: n = 400 ≥ 30 ist erfüllt Formel-Navigator Verwenden Sie hier Formel 81. 0 , 05 = P ( X 1 + X 2 + . . . + X 400 ≤ x ) ≈ F U ( x − 400 · 5 , 9 √ 400 · 8 , 49 ) ⇔ −1 , 6449 = x − 400 · 5 , 9 √ 400 · 8 , 49 ⇔ x = 400 · 5 , 9 − 1 , 6449 · √ 400 · 8 , 49 = 2 264 , 143 d. h. mit einer Wahrscheinlichkeit von 95 % liegt der Gewinn über etwa 2 264 GE. 9.6 Kundenstamm Kategorie A-Kunde B-Kunde C-Kunde D-Umsatz 100 e 50 e 10 e Anteil 22 % 58 % 20 % [a] X = Einnahmen (in e pro Monat) je Neukunde E [ X ] = 100 · 0 , 22 + 50 · 0 , 58 + 10 · 0 , 20 = 53 mit Formel 42 d. h. pro Neukunde ist mit 53 e an Einnahmen zu rechnen. 53 · 10 000 = 530 000 e ; d. h. es ist mit Mehreinnahmen in Höhe von 530 000 e zu rechnen. [b] Var [ X ] = (100 − 53) 2 · 0 , 22 + (50 − 53) 2 · 0 , 58 + (10 − 53) 2 · 0 , 20 = 861 mit Formel 43 n = 10 000 ≥ 30 d. h. Faustregel für ZGWS erfüllt. Formel-Navigator Verwenden Sie hier Formel 81. P ( X 1 + . . . + X 10 000 > 527 000) ≈ 1 − F U ( 527 000 − 10 000 · 53 √ 10 000 · 861 ) = 1 − F U (−1 , 0224) = 1 − 0 , 153 = 0 , 847 d. h. die Wahrscheinlichkeit beträgt näherungsweise 85 %. [c] Value at Risk: Formel-Navigator Verwenden Sie hier Formel 81. 0 , 05 = P ( X 1 + . . . + X 10 000 ≤ x ) ≈ F U ( x − 10 000 · 53 √ 10 000 · 861 ) −1 , 6449 = x − 10 000 · 53 √ 10 000 · 861 ⇔ x = 530 000 − 1 , 6449 · √ 8 610 000 = 525 173 , 4 <?page no="151"?> Lösungen zu Kapitel 9: Normalverteilung 139 Lösungen d. h. mit einer Wahrscheinlichkeit von 5 % liegen die Mehreinnahmen der 10 000 Neukunden unter etwa 525 173 e . <?page no="153"?> Lösungen Lösungen zu Kapitel 10: Konfidenzintervalle Tipp! Wir können für genau zwei Parameter ein Konfidenzintervall berechnen: Für μ und für p . Für die Berechnung eines Konfidenzintervalls für μ müssen als Stichprobe n reelle Zahlen vorliegen. Für die Berechnung eines Konfidenzintervalls für p können als Stichprobe n reelle Zahlen vorliegen. Jedoch müssen die Stichprobenwerte x 1 , . . . , x n auch so erhoben werden können, dass für jedes x i entschieden werden kann, ob damit ein bestimmtes Ereignis A eingetreten ist oder nicht: Also x i = 1 oder x i = 0 . Tipp! Zur Orientierung, welches Konfidenzintervall für μ berechnet wird, soll das folgende Entscheidungsdiagramm helfen: 0,95-KI für μ = ? σ bekannt? n ≥ 30 ? X ∼ NV? Ende n ≥ 30 ? Ende x ± 1 , 96 · s √ n x ± 1 , 96 · σ √ n ja nein nein nein nein ja ja ja 141 <?page no="154"?> 142 Lösungen zu Kapitel 10: Konfidenzintervalle Das sollten Sie wissen! Mit folgenden Formeln aus der Formelsammlung (am Ende des Buches ab Seite 175) werden Konfidenzintervalle berechnet: Formel 83 Konfidenzintervall für μ bei vorliegender Normalverteilung mit bekannter Varianz Formel 85 approximatives Konfidenzintervall für μ , falls n mindestens 30 beträgt Formel 87 approximatives Konfidenzintervall für p , falls n mindestens 10 beträgt Formel 88 approximatives Konfidenzintervall für p , falls n mindestens 100 beträgt Die dabei erhaltenen Intervallgrenzen sollten immer gerundet werden, da jedes Konfidenzintervall nur ein geschätztes Intervall ist. Beim Runden gilt als Faustregel: Intervallgrenzen genauso runden, wie die Eingangsdaten Nachkommastellen haben. 10.1 X = Ausgaben (in GE) für eine Urlaubsreise [a] x = 78 900 100 = 789 mit Formel 5 s 2 x = 9 137 900 100 = 91 379 mit Formel 12 s x = √ 91 379 = 302 , 2896 mit Formel 18 Formel-Navigator Verwenden Sie hier Formel 85. Faustregel n ≥ 30 erfüllt x ± 1 , 96 · s √ n = 789 ± 1 , 96 · 302 , 2896 10 = 789 ± 59 , 2488 = [729 , 7512; 848 , 2488] [b] Das Intervall [730; 848] ist ein geschätztes Intervall für den Bereich, in dem die mittlere Ausgabenhöhe mit einer Wahrscheinlichkeit von 0,95 liegt. 10.2 X = Zeitaufwand (in h) eines Studierenden für Nebenbeschäftigungen [a] Gesucht n =? Formel-Navigator Verwenden Sie hier Formel 86. n ≥ 1 , 96 2 · 1 , 2 2 0 , 2 2 = 138 , 2976 d. h. es sind mindestens 139 Studierende zu befragen. <?page no="155"?> Lösungen zu Kapitel 10: Konfidenzintervalle 143 Lösungen [b] 0,95-KI für E [ X ] = ? Formel-Navigator Verwenden Sie hier Formel 85. Faustregel n ≥ 30 ok 0,95-KI für E [ X ] : [12 , 5 ± 1 , 96 · 2 √ 150 ] = [12 , 5 ± 0 , 32] = [12 , 18 ; 12 , 82] ≈ [12 , 2 ; 12 , 8] [c] Bei der Berechnung des Mindeststichprobenumfangs unter Teilaufgabe [a] wurde die Standardabweichung aus einer früheren Stichprobe verwendet. Sobald dieser alte Wert nicht mehr zutrifft, ist auch der berechnete Mindeststichprobenumfang hinfällig. 10.3 [a] Das 0,95-Konfidenzintervall ist schmaler als das 0,99-Konfidenzintervall. Die Breiten betragen wie folgt: 1 − α Breite 0,95 2 · 1 , 96 · s x √ n 0,99 2 · 2 , 5758 · s x √ n Die Zahl 2,5758 ist größer als die Zahl 1,96. Somit ist das 0,99-Konfidenzintervall breiter. Oder: Ist das Konfidenzniveau 1 − α größer, so liegt μ mit einer größeren Wahrscheinlichkeit in dem Intervall. Deshalb muss auch das Konfidenzintervall breiter sein. [b] Die Breite des 0,95-Konfidenzintervalls beträgt 2 · 1 , 96 · s x √ n . Da im Nenner √ n steht, wird die Breite kleiner, je größer n ist. Also ist der Stichprobenumfang zu vergrößern, um ein schmaleres 0,95-Konfidenzintervall zu erhalten. 10.4 X = Einkommen (in Euro) eines Arztes 0 , 95 -Konfidenzintervall für μ mit Formel 85: [ x − 1 , 96 · s √ n ; x + 1 , 96 · s √ n ] = [ 80 000 − 1 , 96 · 7 500 √ 100 ; 80 000 + 1 , 96 · 7 500 √ 100 ] = [80 000 − 1 470; 80 000 + 1 470] = [78 530; 81 470] <?page no="156"?> 144 Lösungen zu Kapitel 10: Konfidenzintervalle d. h. [78 530; 81 470] ist ein geschätztes Intervall für den Bereich, in dem das mittlere Einkommen der 10 000 Ärzte mit einer Wahrscheinlichkeit von 0,95 liegt. 10.5 X = Wartezeit (in Sekunden) X ∼ N( μ ; σ ) [a] 0,95-Konfidenzintervall für μ mit Formel 85: [ 20 − 1 , 96 · 6 , 40 √ 40 ; 20 + 1 , 96 · 6 , 40 √ 40 ] = [20 − 1 , 9834; 20 + 1 , 9834] = [18 , 02; 21 , 98] [b] [18; 22] ist ein geschätztes Intervall für den Bereich, in dem die mittlere Wartezeit eines Kunden mit der Wahrscheinlichkeit von 0,95 liegt. [c] Breite des 0,95-KI soll 2 betragen d. h. ε = halbe Breite = 1 Formel-Navigator Verwenden Sie hier Formel 86. n ≥ (1 , 96) 2 · (6 , 40) 2 1 2 = 157 , 35 ⇒ n ≥ 158 d. h. damit das 0,95-KI für μ die Breite 2 hat, muss bei mindestens n = 158 Kunden die Wartezeit erfragt werden. Tipp! Zur Orientierung, welches Konfidenzintervall für p berechnet wird, soll das folgende Entscheidungsdiagramm helfen: 0,95-KI für p = ? n ≥ 100? n ≥ 10? Ende ̂ p + u 2 2 n ± u · √ ̂ p (1− ̂ p ) n + u 2 4 n 2 1 + u 2 n mit u = 1 , 96 ̂ p ± 1 , 96 · √ ̂ p (1 − ̂ p ) n ja ja nein nein <?page no="157"?> Lösungen zu Kapitel 10: Konfidenzintervalle 145 Lösungen 10.6 p = Anteil der Facebook-Nutzer unter den über 13-Jährigen in der BRD ̂ p = Anteil der Facebook-Nutzer in der Stichprobe [a] 1. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 89. n ≥ 2 , 0537 2 · 0 , 34 · 0 , 66 0 , 03 2 = 1 051 , 609 d. h. es sind mindestens 1 052 über 13-Jährige zu befragen. 2. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 90. n ≥ 2 , 0537 2 · 0 , 25 0 , 03 2 = 1 171 , 579 d. h. es sind mindestens 1 172 über 13-Jährige zu befragen. [b] [1] KI für p = ? Formel-Navigator Verwenden Sie hier Formel 88. Faustregel n = 1 200 ≥ 100 erfüllt 421 1 200 ± 2 , 0537 · √ 421 1 200 · 779 1 200 1 200 = 0 , 350833 ± 0 , 028293 = [0 , 322540; 0 , 379126] [2] d. h. [32 % ; 38 %] ist ein geschätztes Intervall für den Bereich, in dem der Anteil der über 13-Jährigen Facebook-Nutzer in der BRD mit einer Wahrscheinlichkeit von 96 % liegt. 10.7 p = Anteil der Raucher in der Stadt ̂ p = 269 897 ≈ 0 , 30 = Anteil der Raucher in der Stichprobe Stichprobenumfang: n = 897 Faustregel: n ≥ 100 ist erfüllt 0 , 95 -KI für p mit Formel 88: <?page no="158"?> 146 Lösungen zu Kapitel 10: Konfidenzintervalle [ 0 , 3 ± 1 , 96 · √ 0 , 3 · 0 , 7 897 ] = [0 , 3 ± 0 , 03] = [0 , 27; 0 , 33] d. h. [0,27; 0,33] ist ein geschätztes Intervall für den Bereich, in dem der Anteil der Raucher in der Stadt mit einer Wahrscheinlichkeit von 0 , 95 liegt. 10.8 [a] Mindeststichprobenumfang mit Formel 90: n ≥ 1 , 96 2 · 0 , 25 0 , 03 2 = 1 067 , 1 d. h. es sind mindestens 1 068 Kunden zu befragen. [b] p = Anteil der treuen Kunden in der Grundgesamtheit ̂ p = Anteil der treuen Kunden in der Stichprobe = 87 + 23 1 246 = 0 , 0883 Faustregel n = 1 246 ≥ 100 ist erfüllt 0,95-KI für p mit Formel 88: 0 , 0883 ± 1 , 96 · √ 0 , 0883 · 0 , 9117 1 246 = 0 , 0883 ± 0 , 0158 = [0 , 0725; 0 , 1041] [c] d. h. [7,3 % ; 10,4 %] ist ein geschätztes Intervall für den Bereich, in dem der Anteil der treuen Kunden in der Grundgesamtheit mit einer Wahrscheinlichkeit von 0,95 liegt. <?page no="159"?> Lösungen Lösungen zu Kapitel 11: Statistische Tests Das sollten Sie wissen! Die Nullhypothese H 0 eines statistischen Tests zum Niveau α wird genau dann abgelehnt, wenn der p -Wert höchstens so groß ist wie alpha. Der p -Wert wird anhand der Verteilung der Teststatistik unter H 0 berechnet. Ist diese Verteilung nicht vollständig tabelliert, so erfolgt die Testentscheidung anhand der tabellierten Prozentpunkte dieser Verteilung. Für die vier Tests aus meinem Lehrbuch Arrenberg [1] erfolgt die Ablehnung von H 0 genau dann, wenn gilt: p -Wert ≤ α beim Gaußtest p -Wert ≤ α beim t -Test der empirische Wert der Teststatistik ist mindestens so groß wie der obere α · 100 % - Punkt der χ 2 -Verteilung beim χ 2 -Unabhängigkeitstest der empirische Wert der Teststatistik ist mindestens so groß wie der obere α · 100 % - Punkt der χ 2 -Verteilung beim χ 2 -Anpassungstest Der p -Wert eines einseitigen Gaußtests oder t -Tests wird wie folgt bestimmt: p -Wert (einseitig) = 0 , 5 · p -Wert (zweiseitig) Tipp! Einigen Studierenden fällt es manchmal schwer, zwischen dem χ 2 -Unabhängigkeitstest und dem χ 2 -Anpassungstest zu unterscheiden: Soll überprüft werden, ob zwei statistische Variablen stochastisch unabhängig voneinander sind, so ist ein χ 2 -Unabhängigkeitstest durchzuführen. Soll überprüft werden, ob eine statistische Variable einer bestimmten Verteilung gehorcht, so ist ein χ 2 -Anpassungstest durchzuführen. Diese „bestimmte“ Verteilung muss im Aufgabentext vorgegeben sein. Soll überprüft werden, ob der Erwartungswert einer statistischen Variablen einen bestimmten Wert hat, so ist ein Gaußtest durchzuführen, falls diese Variable normalverteilt ist und die theoretische Varianz bekannt ist. Soll überprüft werden, ob der Erwartungswert einer statistischen Variablen einen bestimmten Wert hat, so ist ein t -Test durchzuführen, falls die theoretische Varianz dieser statistischen Variablen unbekannt ist. 147 <?page no="160"?> 148 Lösungen zu Kapitel 11: Statistische Tests Tipp! Zur Orientierung, wie die Alternative H 1 eines einseitigen Gaußtest oder eines einseitigen t -Tests lautet, soll das folgende Entscheidungsdiagramm helfen: zweiseitiger Test H 0 : μ = μ 0 H 1 : μ = μ 0 Ablehnung von H 0 ? Ende x < μ 0 ? einseitiger Test H 0 : μ ≥ μ 0 H 1 : μ < μ 0 einseitiger Test H 0 : μ ≤ μ 0 H 1 : μ > μ 0 p -Wert einseitig = 1 2 · p -Wert zweiseitig H 0 des einseitigen Tests wird abgelehnt ja nein ja nein Für den Fall x = μ 0 wird H 0 des zweiseitigen Tests zum Niveau 0,05 nicht abgelehnt. 11.1 Gaußtest X = Schuldauer Tochter minus Schuldauer Mutter (in Jahren) X ∼ NV( μ ; σ = 3 , 37) n = 722 und x = 13 , 04 − 10 , 53 = 2 , 51 [1] Zweiseitiger Gaußtest H 0 : Kein Unterschied zwischen den mittleren Schuldauern von Töchtern und ihren <?page no="161"?> Lösungen zu Kapitel 11: Statistische Tests 149 Lösungen Müttern; d. h. E [ X ] = 0 H 1 : Es gibt Unterschiede; d. h. E [ X ] = 0 Formel-Navigator Verwenden Sie hier Formel 91 mit μ 0 = 0 . p -Wert Gaußtest = 2 · F U ( − ∣ ∣ ∣ ∣ ∣ 2 , 51 − 0 3 , 37 √ 722 ∣ ∣ ∣ ∣ ∣ ) = 2 · F U (−20 , 01301) ≈ 2 · 0 = 0 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. es gibt signifikante Unterschiede in den mittleren Schuldauern von Töchtern und ihren Müttern. [2] Da in der Stichprobe die durchschnittliche Schuldauer von Töchtern höher ist als die durchschnittliche Schuldauer der Mütter, lautet das einseitige Testproblem: H 0 : Nicht H 1 ; d. h. E [ X ] ≤ 0 H 1 : Töchter gehen im Mittel länger zur Schule als ihre Mütter; d. h. E [ X ] > 0 p -Wert einseitiger Gaußtest ≈ 0 , 5 · 0 = 0 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. Töchter gehen signifikant länger zur Schule als ihre Mütter. 11.2 Anzahl Kinder in der Ursprungsfamilie = Anzahl Geschwister + 1 X = Differenz Anzahl der Kinder in der Ursprungsfamilie minus Anzahl eigener Kinder E [ X ] = μ Nr. Differenz Differenz 2 Nr. Differenz Differenz 2 1 −1 1 16 4 16 2 1 1 17 3 9 3 1 1 18 4 16 4 2 4 19 10 100 5 4 16 20 4 16 6 2 4 21 1 1 7 4 16 22 7 49 8 3 9 23 4 16 9 4 16 24 4 16 10 −1 1 25 5 25 11 6 36 26 7 49 12 −3 9 27 1 1 13 1 1 28 5 25 14 1 1 29 −1 1 15 6 36 30 −1 1 31 6 36 Die Summe aller Differenzen beträgt 93. Die Summe aller quadrierten Differenzen beträgt 529. <?page no="162"?> 150 Lösungen zu Kapitel 11: Statistische Tests x = 93 31 = 3 mit Formel 5 s 2 x = 529 31 − 3 2 = 8 , 0645 mit Formel 12 s x = √ 8 , 0645 = 2 , 8398 mit Formel 18 Faustregel n = 31 ≥ 30 für t -Test ist erfüllt. [1] zweiseitiger t -Test: H 0 : Es gibt im Vergleich zu früher keinen Unterschied in der mittleren Kinderanzahl eines Paares; d. h. E [ X ] = 0 H 1 : Die mittlere Kinderanzahl eines Paares von heute im Vergleich zu früher hat sich verändert; d. h. E [ X ] = 0 Formel-Navigator Verwenden Sie hier Formel 92 mit μ 0 = 0 . p -Wert t -Test ≈ 2 · F U ( − ∣ ∣ ∣ ∣ ∣ 3 − 0 2 , 8398 √ 31 ∣ ∣ ∣ ∣ ∣ ) = 2 · F U (−5 , 881855) ≈ 2 · 0 ≈ 0 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. die mittlere Kinderanzahl gegenüber früher hat sich signifikant verändert. [2] einseitiger t -Test: arithmetische Mittel Kinder früher heute 142 31 = 4 , 58 49 31 = 1 , 58 Da es in der Stichprobe früher mehr Kinder gab als heute, lautet das Testproblem: H 0 : Nicht H 1 ; d. h. E [ X ] ≤ 0 H 1 : Paare hatten früher im Mittel mehr Kinder als heute; d. h. E [ X ] > 0 p -Wert einseitiger t -Test ≈ 0 , 5 · 0 = 0 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. Paare hatten früher im Mittel signifikant mehr Kinder als heute. Oder anders ausgedrückt: Heute hat ein Paar im Mittel signifikant weniger Kinder als früher. [3] [a] Unterschied= 1 Kind Zweiseitiger t -Test: H 0 : E [ X ] = 1 gegen H 1 : E [ X ] = 1 Formel-Navigator Verwenden Sie hier Formel 92 mit μ 0 = 1 . p -Wert t -Test ≈ 2 · F U ( − ∣ ∣ ∣ ∣ ∣ 3 − 1 2 , 8398 √ 31 ∣ ∣ ∣ ∣ ∣ ) = 2 · F U (−3 , 9211237) ≈ 2 · 0 ≈ 0 ≤ 0 , 05 = α <?page no="163"?> Lösungen zu Kapitel 11: Statistische Tests 151 Lösungen d. h. H 0 wird abgelehnt; d. h. der Unterschied zwischen der mittleren Kinderanzahl von heute und früher beträgt signifikant nicht ein Kind. Einseitiges Testproblem mit Unterschied von einem Kind: H 0 : Nicht H 1 ; d. h. E [ X ] ≤ 1 H 1 : Paare hatten früher im Mittel mehr als ein Kind mehr als heutzutage; d. h. E [ X ] > 1 ; da x = 3 > 1 = μ 0 gilt p -Wert t -Test ≈ 0 , 5 · 0 ≈ 0 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. Paare hatten früher im Mittel signifikant mehr als ein Kind mehr als heutzutage. [b] Unterschied = 2 Kinder Zweiseitiger t -Test: H 0 : E [ X ] = 2 gegen H 1 : E [ X ] = 2 Formel-Navigator Verwenden Sie hier Formel 92 mit μ 0 = 2 . p -Wert t -Test ≈ 2 · F U ( − ∣ ∣ ∣ ∣ ∣ 3 − 2 2 , 8398 √ 31 ∣ ∣ ∣ ∣ ∣ ) = 2 · F U (−1 , 960618) ≈ 2 · 0 , 025 = 0 , 05 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. der Unterschied zwischen der mittleren Kinderanzahl von heute und früher beträgt signifikant nicht zwei Kinder. Einseitiges Testproblem mit Unterschied von zwei Kindern: H 0 : Nicht H 1 ; d. h. E [ X ] ≤ 2 H 1 : Paare hatten früher im Mittel mehr als zwei Kinder mehr als heutzutage; d. h. E [ X ] > 2 ; da x = 3 > 2 = μ 0 gilt p -Wert t -Test ≈ 0 , 5 · 0 , 05 = 0 , 025 ≤ 0 , 05 = α d. h. H 0 wird abgelehnt; d. h. Paare hatten früher im Mittel signifikant mehr als zwei Kinder mehr als heutzutage. [c] Unterschied = 3 Kinder Zweiseitiger t -Test: H 0 : E [ X ] = 3 gegen H 1 : E [ X ] = 3 Formel-Navigator Verwenden Sie hier Formel 92 mit μ 0 = 3 . p -Wert t -Test ≈ 2 · F U ( − ∣ ∣ ∣ ∣ ∣ 3 − 3 2 , 8398 √ 31 ∣ ∣ ∣ ∣ ∣ ) = 2 · F U (0) = 2 · 0 , 5 = 1 > 0 , 05 = α d. h. H 0 wird nicht abgelehnt; d. h. dass der Unterschied drei Kinder beträgt, kann nicht verworfen werden. 11.3 [1] Chi-Quadrat-Unabhängigkeitstest [2] H 0 : Ausbildungsbereich und Geschlecht sind stochastisch unabhängig <?page no="164"?> 152 Lösungen zu Kapitel 11: Statistische Tests [3] Erwartete Häufigkeiten: Ausbildungsbereich Frauen Männer Summe Industrie und Handel 40 60 100 Handwerk 40 60 100 öffentlicher Dienst 40 60 100 Summe 120 180 300 Die minimale erwartete Häufigkeit beträgt 40 und ist größer gleich eins. Außerdem hat keine Zelle eine erwartete Häufigkeit kleiner als fünf, erlaubt wären hier bis zu 20 % aller Zellen. Also ist die Faustregel erfüllt. [4] χ 2 emp. =? Formel-Navigator Verwenden Sie hier Formel 94. Der empirische Wert der Teststatistik beträgt: χ 2 emp. = (60 − 40) 2 40 + (40 − 60) 2 60 + (20 − 40) 2 40 + (80 − 60) 2 60 + (40 − 40) 2 40 + (60 − 60) 2 60 = 33 , 3 [5] I = Anzahl der Zeilen = 3 J = Anzahl der Spalten = 2 Freiheitsgrad df = ( I − 1)( J − 1) = 2 · 1 = 2 Gemäß der Tabelle auf der Seite 193 beträgt der obere 5 %-Punkt der Chi-Quadrat- Verteilung mit zwei Freiheitsgraden 5,991. Da gilt: 33 , 3 > 5 , 991 , wird H 0 abgelehnt; d. h. der Ausbildungsbereich und Geschlecht sind nicht stochastisch unabhängig. 11.4 [1] Chi-Quadrat-Unabhängigkeitstest [2] H 0 : Stillbereitschaft und Berufstätigkeit sind stochastisch unabhängig [3] Erwartete Häufigkeiten: Berufstätig Summe Stillen nein ja nein 66 54 120 ja 44 36 80 Summe 110 90 200 Die minimale erwartete Häufigkeit beträgt somit 36 und ist größer gleich eins. Außerdem hat keine Zelle eine erwartete Häufigkeit kleiner als fünf, erlaubt wären hier bis zu 20 % aller Zellen. Also ist die Faustregel erfüllt. <?page no="165"?> Lösungen zu Kapitel 11: Statistische Tests 153 Lösungen [4] χ 2 emp. =? I = Anzahl der Zeilen = 2 J = Anzahl der Spalten = 2 Freiheitsgrad df = ( I − 1)( J − 1) = 1 · 1 = 1 Formel-Navigator Verwenden Sie hier Formel 93. Da df = 1 gilt, greift die Kontinuitätskorrektur nach Yates: χ 2 emp. = (| 40 − 66 | −0 , 5) 2 66 + (| 80 − 54 | −0 , 5) 2 54 + (| 70 − 44 | −0 , 5) 2 44 + (| 10 − 36 | −0 , 5) 2 36 = 54 , 735 [5] Gemäß der Tabelle auf der Seite 193 beträgt der obere 5 %-Punkt der Chi-Quadrat- Verteilung mit einem Freiheitsgrad 3,841. Da gilt: 54 , 735 > 3 , 841 , wird H 0 abgelehnt; d. h. Stillbereitschaft und Berufstätigkeit sind nicht stochastisch unabhängig. 11.5 [1] Chi-Quadrat-Anpassungstest [2] p 1 = Wahrscheinlichkeit, dass eine Reparatur am Montag stattfindet usw. p 5 = Wahrscheinlichkeit, dass eine Reparatur am Freitag stattfindet H 0 : p 1 = . . . = p 5 = 1 5 [3] Erwartete Häufigkeiten: Wochentag Mo Di Mi Do Fr Anzahl Kunden 30 40 40 60 30 n = 200 n · p i 40 40 40 40 40 200 Somit ist die Faustregel n · p i ≥ 5 erfüllt. [4] χ 2 emp. =? Formel-Navigator Verwenden Sie hier Formel 95. Der empirische Wert der Teststatistik beträgt: χ 2 emp. = (30 − 40) 2 40 + (40 − 40) 2 40 + (40 − 40) 2 40 + (60 − 40) 2 40 + (30 − 40) 2 40 = 15 [5] Da die Verteilung unter H 0 durch fünf Einzelwahrscheinlichkeiten p 1 , . . . , p 5 eindeutig festgelegt ist, gilt I = 1 . <?page no="166"?> 154 Lösungen zu Kapitel 11: Statistische Tests Freiheitsgrad df = I − 1 − 0 = 5 − 1 = 4 Gemäß der Tabelle auf der Seite 193 beträgt der obere 5 %-Punkt der Chi-Quadrat- Verteilung mit vier Freiheitsgraden 9,488. Da gilt: 15 > 9 , 488 , wird H 0 abgelehnt; d. h. die Reparatur-Wochentage sind nicht alle gleich wahrscheinlich. <?page no="167"?> Lösungen Lösungen zu Kapitel 12: Gemischte Aufgaben 12.1 X = Berufserfahrung (in Jahren) Y = Umsatz (in 1 000 Euro) i x i y i x 2 i y 2 i x i · y i 1 1 80 1 6 400 80 2 3 97 9 9 409 291 3 6 103 36 10 609 618 4 10 119 100 14 161 1 190 5 11 117 121 13 689 1 287 ∑ 31 516 267 54 268 3 466 [a] [1] a 1 + b 1 · 9 =? Formel-Navigator Verwenden Sie hier Formel 53 und Formel 54. b 1 = 5 · 3 466 − 31 · 516 5 · 267 − 31 2 = 1 334 374 = 3 , 57 a 1 = 516 − 3 , 57 · 31 5 = 81 , 07 81 , 07 + 3 , 57 · 9 = 113 , 2 mit Formel 52 d. h. es ist mit einem Jahresumsatz von etwa 113 000 Euro zu rechnen. [2] b 1 = 3 , 57 d. h. steigt die Berufserfahrung um ein Jahr, so steigt der Jahresumsatz um etwa 3 570 Euro. [3] r = ? Formel-Navigator Verwenden Sie hier Formel 60. b 2 = 1 334 5 · 54 268 − 516 2 = 1 334 5 084 = 0 , 26 mit Formel 56 r = √ 3 , 57 · 0 , 26 = √ 0 , 9282 = 0 , 96 9 ∈ [ x min ; x max ] = [1; 11] ; d. h. 113,2 ist ein interpolierter Wert, auf den Verlass ist, da die Korrelation stark ist. [b] B = über fünf Jahre Berufserfahrung U = überdurchschnittlicher Jahresumsatz 0 , 20 = P ( U ) 155 <?page no="168"?> 156 Lösungen zu Kapitel 12: Gemischte Aufgaben Formel-Navigator Verwenden Sie hier Formel 33. 0 , 75 = P ( B | U ) = P ( B ∩ U ) P ( U ) = P ( B ∩ U ) 0 , 80 ⇒ P ( B ∩ U ) = 0 , 75 · 0 , 80 = 0 , 60 0 , 50 = P ( B | U )) = P ( B ∩ U ) P ( U ) = P ( B ∩ U ) 0 , 20 ⇒ P ( B ∩ U ) = 0 , 50 · 0 , 20 = 0 , 10 Arbeitstabelle: U U ∑ B 0,10 0,20 0,30 B 0,10 0,60 0,70 ∑ 0,20 0,80 1 [1] P ( B ∩ U ) = 0 , 10 d. h. der Anteil beträgt 10 %. [2] P ( B ) = 0 , 30 d. h. der Anteil beträgt 30 %. 12.2 E = Entwurfsphase termingerecht abgeschlossen K = Konstruktionsphase termingerecht abgeschlossen 0 , 60 = P ( E ) 0 , 70 = P ( K | E ) ⇒ P ( E ∩ K ) = 0 , 70 · 0 , 60 = 0 , 42 mit Formel 34 0 , 20 = P ( E ∩ K ) Arbeitstabelle: E E ∑ K 0,42 0,20 0,62 K 0,18 0,20 0,38 ∑ 0,60 0,40 1 [a] [1] P ( E ∩ ¯ K ) = 0 , 18 [2] P ( K ) = 0 , 62 [3] P ( E | K ) = 0 , 2 0 , 62 ≈ 0 , 32 [b] E , K stochastisch unabhängig? Formel-Navigator Verwenden Sie hier Formel 36. <?page no="169"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 157 Lösungen P ( E ) · P ( K ) = 0 , 6 · 0 , 62 = 0 , 372 = 0 , 42 = P ( E ∩ K ) d. h. die Ereignisse sind nicht stochastisch unabhängig. [c] Wahrscheinlichkeitsfunktion P ( X = x ) : x 6 7 8 9 10 P ( X = x ) 0,1 0,4 0,2 0,1 0,2 Formel-Navigator Verwenden Sie hier Formel 42, Formel 43 und Formel 44. E [ X ] = 6 · 0 , 1 + 7 · 0 , 4 + 8 · 0 , 2 + 9 · 0 , 1 + 10 · 0 , 2 = 7 , 9 V ar [ X ] = 6 2 · 0 , 1 + 7 2 · 0 , 4 + 8 2 · 0 , 2 + 9 2 · 0 , 1 + 10 2 · 0 , 2 − 7 , 9 2 = 64 , 1 − 62 , 41 = 1 , 69 √ Var [ X ] = √ 1 , 69 = 1 , 3 Es ist zu erwarten, dass die Konstruktionsphase eines zufälligen Projekts 7,9 Monate dauert. Die Schwankung gemessen mit der Standardabweichung für die Dauer der Konstruktionsphase beläuft sich auf 1,3 Monate. 12.3 [a] 1. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 8. Faktor = Rate + 1 Zeitraum 4. Woche bis 7. Woche = drei wöchentliche Veränderungen Faktor = 7−4 √ 0 , 9 · 1 , 2 · 0 , 9 = 3 √ 0 , 972 = 0 , 9905782 Rate = Faktor − 1 = 0 , 9905782 − 1 = −0 , 0094218 ≈ −0 , 009 d. h. im Zeitraum 4. bis 7. Kalenderwoche ist die Quote um durchschnittlich 0,9 % pro Woche gesunken. 2. Lösungsweg: Annahme: Die Quote beträgt in der 4. Kalenderwoche 10 %: Woche Quote 4 10 % 5 10 · 0 , 9 = 9 % 6 9 · 1 , 2 = 10 , 8 % 7 10 , 8 · 0 , 9 = 9 , 72 % <?page no="170"?> 158 Lösungen zu Kapitel 12: Gemischte Aufgaben Faktor= 7−4 √ Quote 7. Woche Quote 4. Woche = 3 √ 9 , 72 10 = 0 , 9905782 Rate = Faktor − 1 = 0 , 9905782 − 1 = −0 , 0094218 ≈ −0 , 009 ̂ = − 0 , 9 % [b] p = Anteil der Wochen, an denen die Quote sinkt. 30-mal ist in der Stichprobe die Veränderung negativ, also ̂ p = 30 104 Faustregel n = 104 ≥ 100 ist erfüllt. Der 97 %-Punkt der Standard-Normalverteilung beträgt 1,8808. KI für p = ? Formel-Navigator Verwenden Sie hier Formel 88. 30 104 ± 1 , 8808 · √ 30 104 · 74 104 104 = [0 , 2049072; 0 , 3720159] ≈ [0 , 20; 0 , 37] d. h. [20 % ; 37 %] ist ein geschätztes Intervall für den Bereich, in dem p mit einer Wahrscheinlichkeit von 94 % liegt. [c] X = Anzahl der Wochen, in denen die Quote sinkt. X ∼ B( n = 13; p = 0 , 25) [1] E [ X ] = 13 · 0 , 25 = 3 , 25 mit Formel 68 d. h. es ist zu erwarten, dass im kommenden Quartal die Quote an etwa drei der dreizehn Wochen sinkt. [2] P ( X = 6) =? Formel-Navigator Verwenden Sie hier Formel 67. P ( X = 6) = ( 13 6 ) · 0 , 25 6 · 0 , 75 7 = 0 , 0559 d. h. die Wahrscheinlichkeit beträgt 0,0559 12.4 Arbeitstabelle: j x ∗ j −1 < x ≤ x ∗ j n j F x ′ j 1 0 ≤ x ≤ 250 000 300 3/ 9 125 000 2 250 000 < x ≤ 500 000 400 7/ 9 375 000 3 500 000 < x ≤ 750 000 150 8,5/ 9 625 000 4 750 000 < x ≤ 1 000 000 50 1 875 000 ∑ n = 900 1 <?page no="171"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 159 Lösungen [a] x 0 , 60 =? Formel-Navigator Verwenden Sie hier Formel 2. x 0 , 60 ≈ 250 000 + 0 , 6 − 3 / 9 4 / 9 · 250 000 = 400 000 [b] x =? Formel-Navigator Verwenden Sie hier Formel 7. x ≈ 125 000 · 3 9 + 375 000 · 4 9 + 625 000 · 1 , 5 9 + 875 000 · 0 , 5 9 = 361 111 , 1 ≈ 361 111 d. h. der durchschnittliche Gewinn pro Filiale beträgt etwa 361 111 GE. x 0 , 50 =? Formel-Navigator Verwenden Sie hier Formel 2. x 0 , 50 ≈ 250 000 + 0 , 5 − 3 / 9 4 / 9 · 250 000 = 343 750 d. h. 50 % aller Filialen machen einen Gewinn von etwa höchstens 343 750 GE. [c] s =? Formel-Navigator Verwenden Sie hier Formel 16 und Formel 18. s 2 ≈ (125 000 − 361 111 , 1) 2 · 3 9 + (375 000 − 361 111 , 1) 2 · 4 9 + (625 000 − 361 111 , 1) 2 · 1 , 5 9 + (875 000 − 361 111 , 1) 2 · 0 , 5 9 = 44 945 987 654 s ≈ √ 44 945 987 654 ≈ 212 004 , 69 d. h. die Schwankungen des Datensatzes gemessen mit der Standardabweichung betragen in etwa 212 005 GE. [d] H = zufällig ausgewählter Kunde kauft ein Handy P C = zufällig ausgewählter Kunde kauft einen PC Arbeitstabelle: H H ∑ P C 0,0375 0,1125 0,15 P C 0,2125 0,6375 0,85 ∑ 0,25 0,75 1 <?page no="172"?> 160 Lösungen zu Kapitel 12: Gemischte Aufgaben [1] P ( P C ∩ H ) = 0 , 6375 [2] P ( P C ∪ H ) = 1 − 0 , 6375 = 0 , 3625 [3] P C , H stochastisch unabhängig? Formel-Navigator Verwenden Sie hier Formel 36. P ( P C ) · P ( H ) = 0 , 25 · 0 , 15 = 0 , 0375 = P ( P C ∩ H ) d. h. P C und H sind stochastisch unabhängig voneinander. 12.5 X = F&E-Ausgaben Y = Anzahl der angemeldeten Patente Um die kumulierten relativen Häufigkeiten der x -Werte berechnen zu können, müssen die x -Werte aufsteigend geordnet werden: i x i y i x 2 i y 2 i x i · y i n x i n x i / n F ( x i ) 1 100 5 10 000 25 500 1 1/ 5 0,2 2 120 4 14 400 16 480 1 1/ 5 0,4 3 140 7 19 600 49 980 1 1/ 5 0,6 4 160 7 25 600 49 1 120 1 1/ 5 0,8 5 190 9 36 100 81 1 710 1 1/ 5 1 ∑ 710 32 105 700 220 4 790 n = 5 1 [a] Arithmetisches Mittel: x = 1 5 · 710 = 142 mit Formel 5 Die F&E-Ausgaben lagen im Durchschnitt bei 142 Mio. Euro. Median: x 0 , 50 ≈ 140 Die F&E-Ausgaben lagen in mindestens 50 % der Fälle höchstens bei einem Wert von 140 Mio. Euro. Oder: Die medianen Ausgaben betrugen in etwa 140 Mio. Euro. Standardabweichung: s x = √ ( 1 5 · 105 700 ) − 142 2 = √ 976 ≈ 31 , 241 mit Formel 12 und Formel 18 Die Schwankungen der F&E-Ausgaben gemessen mit der Standardabweichung liegen bei 31,241 Mio. Euro. [b] 1. Lösungsweg: r = ? Formel-Navigator Verwenden Sie hier Formel 60. b 1 = 5 · 4 790 − 710 · 32 5 · 105 700 − 710 2 = 1 230 24 400 = 0 , 0504 mit Formel 53 <?page no="173"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 161 Lösungen b 2 = 1 230 5 · 220 − 32 2 = 1 230 76 = 16 , 1842 mit Formel 56 r = √ 16 , 1842 · 0 , 0504 = √ 0 , 8157 = 0 , 903 d. h. es liegt ein positiver starker linearer Zusammenhang zwischen den Ausgaben und den angemeldeten Patenten vor. 2. Lösungsweg: B = ? Formel-Navigator Verwenden Sie hier Formel 60. B = 16 , 1842 · 0 , 0504 = 0 , 816 d. h. es liegt ein positiver starker linearer Zusammenhang zwischen den Ausgaben und den angemeldeten Patenten vor. [c] a 1 + b 1 · 154 = ? a 1 = 32 − 0 , 0504 · 710 5 = −0 , 7568 mit Formel 54 −0 , 7568 + 0 , 0504 · 154 = 7 , 0048 ≈ 7 mit Formel 52 d. h. es ist mit sieben angemeldeten Patenten zu rechnen. Der Prognosewert 7 Patente ist zuverlässig, da 154 ∈ [100; 190] und die Korrelation stark ist. [d] [1] b 1 = 0 , 0504 d. h. werden die Ausgaben um eine Mio. Euro gesenkt, so sinkt die Anzahl der angemeldeten Patente um 0,0504 Patente. [2] b 1 · 20 = 0 , 0504 · 20 = 1 , 008 d. h. werden die Ausgaben um 20 Mio. Euro gesenkt, so wird etwa ein Patent weniger angemeldet. 12.6 [a] In Abwandlung von Formel 8 ergibt sich: 2009−2000 √ 513 490 = 9 √ 1 , 046939 = 1 , 005110 d. h. die durchschnittliche jährliche Steigerung betrug 0,5 % pro Jahr. [b] X = Punkte in Mathematik Y = Punkte in Naturwissenschaften Arbeitstabelle: i x i y i x i · y i x 2 i y 2 i 1 490 487 238 630 240 100 237 169 2 503 502 3 504 516 n = 4 513 520 ∑ 2 010 2 025 1 017 960 1 010 294 1 025 829 <?page no="174"?> 162 Lösungen zu Kapitel 12: Gemischte Aufgaben [1] a 1 + b 1 · 500 = ? Formel-Navigator Verwenden Sie hier Formel 52, Formel 53 und Formel 54. b 1 = 4 · 1 017 960 − 2 010 · 2 025 4 · 1 010 294 − 2 010 2 = 1 590 1 076 = 1 , 477695 a 1 = 2 025 − b 1 · 2 010 4 = −236 , 291822 a 1 + b 1 · 500 = 502 , 5558 ≈ 503 d. h. es ist mit etwa 503 Punkten in der Naturwissenschaften-Kompetenz zu rechnen. [2] Der Prognosewert 503 ist ein interpolierter Wert, da 500 ∈ [490; 513] liegt. r = ? Formel-Navigator Verwenden Sie hier Formel 56 und Formel 60. b 2 = 1 590 4 · 1 025 829 − 2 025 2 = 1 590 2 691 = 0 , 59085841 r = √ b 1 · b 2 = 0 , 9344028 d. h. bei der Prognose handelt es sich um einen interpolierten Wert bei gleichzeitig starker Korrelation, insofern ist der Prognosewert 503 als zuverlässig anzusehen. 12.7 [a] μ = erwartete Flugzeit KI für μ = ? Formel-Navigator Verwenden Sie hier Formel 85. [1] x = 258 , 70 30 = 8 , 62 mit Formel 5 s 2 x = 8 , 4413 30 = 0 , 2814 mit Formel 12 s x = √ 0 , 2814 = 0 , 53 mit Formel 18 Faustregel n ≥ 30 erfüllt x ±1 , 96· s √ n = 8 , 62±1 , 96· 0 , 53 √ 30 = 8 , 62±0 , 19 = [8 , 43; 8 , 81] = [8 h 26 Min ; 8 h 49 Min ] [2] Das Intervall [8 h 26 Min ; 8 h 49 Min ] ist ein geschätztes Intervall für den Bereich, in dem die erwartete Flugzeit mit einer Wahrscheinlichkeit von 0,95 liegt. <?page no="175"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 163 Lösungen [b] X = Flugzeit (in h) ∼ N( μ = 8 , 5; σ = 0 , 5) [1] x =? mit 0 , 05 = P ( X ≤ x ) Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 190. −1 , 6449 = x − 8 , 5 0 , 5 ⇔ x = 7 , 67755 0 , 67755 · 60 = 40 , 7 Minuten ≈ 41 Minuten d. h. mit der Wahrscheinlichkeit von 95 % ist mit einer Flugzeit von mindestens 7 Stunden und 41 Minuten zu rechnen. [2] P ( X = 8 , 5) = 0 d. h. die Wahrscheinlichkeit beträgt null. [3] 1. Lösungsweg: Zweifaches zentrales Schwankungsintervall μ ± 2 · σ 8 , 5 ± 2 · 0 , 5 = [7 , 5; 9 , 5] d. h. 95 % aller Flugzeiten liegen zwischen 7 1 2 Stunden und 9 1 2 Stunden. 2. Lösungsweg: 0 , 95 = P ( X ≤ μ + c ) − P ( X ≤ μ − c ) 0 , 975 = P ( X ≤ μ + c ) = F U ( μ + c − μ σ ) = F U ( c σ ) 1 , 96 = c σ ⇔ c = 1 , 96 · σ = 1 , 96 · 0 , 5 8 , 5 ± 1 , 96 · 0 , 5 = [7 , 52; 9 , 48] d. h. 95 % aller Flugzeiten liegen zwischen 7 1 2 Stunden und 9 1 2 Stunden. 12.8 [a] [1] x = ? Formel-Navigator Verwenden Sie hier Formel 7. x ≈ 10 · 50 250 + 40 · 150 250 + 90 · 50 250 = 11 000 250 = 44 d. h. im Durchschnitt beträgt der Anreiseweg eines FH-Studierenden etwa 44 Minuten. [2] s 2 = ? Formel-Navigator Verwenden Sie hier Formel 16. s 2 ≈ (10 − 44) 2 · 50 250 + (40 − 44) 2 · 150 250 + (90 − 44) 2 · 50 250 = 166 000 250 = 664 <?page no="176"?> 164 Lösungen zu Kapitel 12: Gemischte Aufgaben [3] 1 − F (30) = ? Formel-Navigator Verwenden Sie hier Formel 1. 1 − F (30) ≈ 1 − 0 , 2 − 0 , 6 40 (30 − 20) = 1 − 0 , 35 = 0 , 65 d. h. etwa 65 % aller FH-Studierenden benötigen mehr als 30 Minuten Anreisezeit zur FH. [b] X = Anreiseweg (in Min) eines FH-Studierenden X ∼ N( μ = 40; σ = 20) [1] P ( X = 30) = 0 d. h. die Wahrscheinlichkeit beträgt null. [2] 0 , 95 = P ( X ≤ x ) = F U ( x − 40 20 ) mit Formel 80 1 , 6449 = ( x − 40 20 ) mit der Tabelle auf der Seite 191 x = 40 + 1 , 6449 · 20 = 72 , 898 d. h. die gesuchte Anreisezeit beträgt etwa 73 Minuten. 12.9 [a] KI für p = ? Formel-Navigator Verwenden Sie hier Formel 88. Faustregel n = 100 ≥ 100 erfüllt ̂ p = 2 + 8 + 23 100 = 0 , 33 0,95-KI für p = 0 , 33 ± 1 , 96 · √ 0 , 33 · 0 , 67 100 = [0 , 24; 0 , 42] d. h. [24 % ; 42 %] ist ein geschätztes Intervall für den Bereich, in dem der Anteil aller Tankfüllungen mit einer gesamten Kilometerleistung von höchstens 900 km mit der Wahrscheinlichkeit 0,95 liegt. [b] X = Kilometerleistung pro Tankfüllung X ∼ N( μ = 1 000; σ = 250) [1] 1. Lösungsweg: Die Gesamtfläche unter der Glockenkurve beträgt eins. Aufgrund der Symmetrie der NV liegt links von μ die Hälfte der Gesamtfläche: P ( X ≤ μ ) = 0 , 5 <?page no="177"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 165 Lösungen 2. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 191. P ( X ≤ μ ) = F U ( μ − μ σ ) = F U (0) = 0 , 5 d. h. die Wahrscheinlichkeit beträgt 0,5. [2] P ( X = μ ) = 0 d. h. die Wahrscheinlichkeit beträgt null. [3] P ( X ≤ 1 100) − P ( X ≤ 800) = ? Formel-Navigator Verwenden Sie hier Formel 80 sowie die beiden Tabellen auf den Seiten 190 und 191. P ( X ≤ 1 100) − P ( X ≤ 800) = F U ( 1 100 − 1 000 250 ) − F U ( 800 − 1 000 250 ) = F U (0 , 4) − F U (−0 , 8) = 0 , 655 − 0 , 212 = 0 , 443 d. h. die Wahrscheinlichkeit beträgt 44 %. 12.10 [a] n = ? Formel-Navigator Verwenden Sie hier Formel 90. n ≥ 1 , 96 2 · 0 , 25 0 , 03 2 = 1 067 , 1 d. h. es sind mindestens 1 068 Mobilfunknutzer zu befragen. [b] KI für μ = ? Formel-Navigator Verwenden Sie hier Formel 85. Faustregel n = 1 278 ≥ 30 erfüllt x = 51 351 , 44 1 287 = 39 , 9 mit Formel 5 s 2 = 1 1 287 · 31 449 , 98 = 24 , 43666 mit Formel 12 s = √ 24 , 43666 = 4 , 9 mit Formel 18 <?page no="178"?> 166 Lösungen zu Kapitel 12: Gemischte Aufgaben 0,95 KI für μ = 39 , 9 ± 1 , 96 · 4 , 9 √ 1 287 = [39 , 6; 40 , 2] d. h. [39,6; 40,2] ist ein geschätztes Intervall für den Bereich, in dem die mittleren Ausgaben für monatliche Handygebühren mit einer Wahrscheinlichkeit von 0,95 liegen. [c] X = monatliche Ausgaben (in Euro) X ∼ N( μ = 40; σ = 5) P ( X ≤ 42) − P ( X ≤ 30) = ? Formel-Navigator Verwenden Sie hier Formel 80 sowie die beiden Tabellen auf den Seiten 190 und 191. P ( X ≤ 42) − P ( X ≤ 30) = F U ( 42 − 40 5 ) − F U ( 30 − 40 5 ) = F U (0 , 4) − F U (−2) = 0 , 655 − 0 , 023 = 0 , 632 d. h. der Anteil beträgt etwa 63 %. 12.11 [a] [1] 1. Lösungsweg: Die Gesamtfläche unter der Glockenkurve beträgt eins. Aufgrund der Symmetrie der NV liegt links von μ die Hälfte der Gesamtfläche: P ( X ≤ μ ) = 0 , 5 2. Lösungsweg: Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 191. P ( X ≤ μ ) = F U ( μ − μ σ ) = F U (0) = 0 , 5 d. h. die Wahrscheinlichkeit beträgt 50 %. [2] P ( X = 21) = 0 d. h. die Wahrscheinlichkeit beträgt null. [3] P ( X ≤ 30) − P ( X ≤ 20) = ? Formel-Navigator Verwenden Sie hier Formel 80 sowie die beiden Tabellen auf den Seiten 190 und 191. P ( X ≤ 30) − P ( X ≤ 20) = F U ( 30 − 21 10 ) − F U ( 20 − 21 10 ) = F U (0 , 9) − F U (−0 , 1) = 0 , 816 − 0 , 460 = 0 , 356 d. h. die Wahrscheinlichkeit beträgt etwa 36 %. <?page no="179"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 167 Lösungen [b] [1] x = ? mit 0 , 10 = P ( X ≤ x ) Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 190. −1 , 2816 = x − 21 10 ⇒ x = 8 , 2 d. h. mit 90 %-iger Wahrscheinlichkeit ist mit einer Wartezeit von mindestens acht Tagen zu rechnen. [2] x = ? mit 0 , 95 = P ( X ≤ x ) Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 191. 1 , 6449 = x − 21 10 ⇒ x = 37 , 4 d. h. mit 95 %-iger Wahrscheinlichkeit ist mit einer Wartezeit von höchstens siebenunddreißig Tagen zu rechnen. [c] p = Anteil der Kunden, die länger als achtundzwanzig Tage auf ihren Neuwagen warten müssen KI für p = ? Formel-Navigator Verwenden Sie hier Formel 88. ̂ p = 147 250 = 0 , 588 Faustregel n = 250 ≥ 100 erfüllt 0,99-KI für p 0 , 588 ± 2 , 5758 · √ 0 , 588 · 0 , 412 250 = [0 , 508; 0 , 668] ≈ [51 % ; 67 %] 12.12 [a] n = ? Formel-Navigator Verwenden Sie hier Formel 86. Für den Mindeststichprobenumfang gilt: n ≥ 2 , 5758 2 · 1 , 4 2 0 , 25 2 ≈ 208 , 7 Das heißt, es müssen mindestens 209 Packungen nachgewogen werden. <?page no="180"?> 168 Lösungen zu Kapitel 12: Gemischte Aufgaben [b] Weil der Stichprobenumfang größer als 30 ist, ist die Faustregel erfüllt, nach der die Annahmen des Zentralen Grenzwertsatzes greifen. Deshalb ist das gesuchte Konfidenzintervall gemäß Formel 85 gegeben durch: [ 12 , 3 − 2 , 5758 1 , 2 √ 210 ; 12 , 3 + 2 , 5758 1 , 2 √ 210 ] ≈ [12 , 09; 12 , 51] [c] Es bezeichne X die Zufallsvariable „Abfüllmenge“. Es ist X ∼ N( μ = 12 , 3; σ = 1 , 2) . Damit gilt für das 0 , 2 % Quantil von X gemäß Formel 80: 0 , 002 = P ( X ≤ x ) = F U ( x − 12 , 3 1 , 2 ) Mit der Tabelle auf der Seite 190 ergibt sich daraus: −2 , 8782 = x − 12 , 3 1 , 2 ⇔ x = 12 , 3 − 3 , 4538 ⇔ x = 8 , 85 d. h. bei 99,8 % aller Packungen liegt das Gewicht über 8,85 g. 12.13 X = Anzahl der Jahre, seitdem eine Kundin das Produkt A kauft Y = Anzahl der Jahre, seitdem ein Kunde das Produkt A kauft [a] [1] x = 5 , 3 und y = 5 mit Formel 5 d. h. die Frauen kaufen im Durchschnitt seit 5,3 Jahren das Produkt A, die Männer im Durchschnitt erst seit fünf Jahren. [2] x 0 , 50 = 3 , da F X (3) = 0 , 5 y 0 , 50 = 5 , da F Y (4) = 0 , 1 < 0 , 5 und F Y (5) = 0 , 9 > 0 , 5 d. h. 50 % der befragen Frauen kaufen das Produkt seit höchstens drei Jahren, mindestens 50 % der befragten Männer kaufen das Produkt seit höchstens fünf Jahren. [3] x Modus = 2 und y Modus = 5 mit Formel 4 d. h. bei den befragten Frauen war zwei Jahre die häufigste Antwort, bei den befragten Männern war fünf Jahre die häufigste Antwort. [4] s x = √ 10 , 81 = 3 , 29 und s y = √ 0 , 2 = 0 , 45 mit Formel 12 und Formel 18 d. h. bei den Frauen schwanken die Angaben stärker um den Durchschnittswert als bei den Männern. Oder anders ausgedrückt: Bei den Männern schwanken die Angaben weniger um den Durchschnittswert als bei den Frauen. [b] X ∼ N( μ = 5 , 3; σ = 3 , 3) [1] x = ? mit P ( X ≤ x ) = 0 , 25 Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 190. 0 , 25 = P ( X ≤ x ) = F U ( x − 5 , 3 3 , 3 ) <?page no="181"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 169 Lösungen −0 , 6745 = x − 5 , 3 3 , 3 ⇔ x = 3 , 07 d. h. etwa 75 % aller Kundinnen kaufen das Produkt seit mindestens drei Jahren. [2] x = ? mit P ( X ≤ x ) = 0 , 75 Formel-Navigator Verwenden Sie hier Formel 80 und die Tabelle auf der Seite 191. 0 , 75 = P ( X ≤ x ) = F U ( x − 5 , 3 3 , 3 ) 0 , 6745 = x − 5 , 3 3 , 3 ⇒ x = 7 , 53 d. h. etwa 75 % aller Kundinnen kaufen das Produkt seit höchstens 7 1 2 Jahren. 12.14 1. Lösungsweg: X = BIP-Rate (in %) Y = Dax 30 Arbeitstabelle: i x i y i x i · y i x 2 i y 2 i 1 +4 , 1 6 914 28 347,4 16,81 47 803 396 2 +3 , 6 5 898 3 +0 , 4 7 612 4 +0 , 1 9 552 n = 5 +1 , 4 9 866 ∑ 9,6 39 842 67 392,6 31,9 329 111 004 [a] In Abwandlung von Formel 8 ergibt sich: 2014−2010 √ 9 866 6 914 = 4 √ 1 , 426960 = 1 , 092957 d. h. die durchschnittliche jährliche Steigerung des Dax 30 im Zeitraum 31.12.2010 bis 31.12.2014 beträgt etwa 9,3 %. [b] r = ? Formel-Navigator Verwenden Sie hier Formel 53, Formel 56 und Formel 60. b 1 = 5 · 67 392 , 6 − 9 , 6 · 39 842 5 · 31 , 9 − 9 , 6 2 = −45 520 , 2 67 , 34 = −675 , 9756 b 2 = −45 520 , 2 5 · 329 111 004 − 39 842 2 = −45 520 , 2 58 170 056 = −0 , 000 782 536 6 r = − √ −675 , 9756 · −0 , 000 782 536 6 = − √ 0 , 528 975 6 = −0 , 727 307 1 <?page no="182"?> 170 Lösungen zu Kapitel 12: Gemischte Aufgaben d. h. mittelstarke negative Korrelation; d. h. mittelstarke Tendenz dafür, dass steigende BIP-Raten einhergehen mit sinkenden Dax-Index-Werten. [c] Gesucht: a 1 + b 1 · 1 , 4 = ? Formel-Navigator Verwenden Sie hier Formel 52 und Formel 54. a 1 = 39 842 − (−675 , 9756) · 9 , 6 5 = 9 266 , 2732 9 266 , 2732 + (−675 , 9756) · 1 , 4 = 8 319 , 907 ≈ 8 320 d. h. gemäß der Methode der kleinsten Quadrate wäre mit einem Dax Index-Wert von etwa 8 320 zu rechnen. Da 1 , 4 ∈ [0 , 1; 4 , 1] liegt, ist 8 320 ein interpolierter Wert. [d] Gesucht: a 2 + b 2 · 9 960 = ? Formel-Navigator Verwenden Sie hier Formel 55 und Formel 57. a 2 = 9 , 6 − (−0 , 000 782 536 6) · 39 842 5 = 8 , 155 564 938 8 8 , 155 564 938 8 + (−0 , 000 782 536 6) · 9 960 = 0 , 361 500 4 ≈ 0 , 4 d. h. gemäß der Methode der kleinsten Quadrate wäre mit einem BIP-Wachstum von etwa 0,4 % zu rechnen. Da 9 960 / ∈ [5 898; 9 866] liegt, ist 0,4 ein extrapolierter Wert. 2. Lösungsweg: X = BIP-Faktor Y = Dax 30 Arbeitstabelle: i x i y i x i · y i x 2 i y 2 i 1 1,041 6 914 7 197,474 1,083681 47 803 396 2 1,036 5 898 3 1,004 7 612 4 1,001 9 552 n = 5 1,014 9 866 ∑ 5,096 39 842 40 515,93 5,19519 329 111 004 [a] In Abwandlung von Formel 8 ergibt sich: 2014−2010 √ 9 866 6 914 = 4 √ 1 , 426960 = 1 , 092957 d. h. die durchschnittliche jährliche Steigerung des Dax 30 im Zeitraum 31.12.2010 bis 31.12.2014 beträgt etwa 9,3 %. <?page no="183"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 171 Lösungen [b] r = ? Formel-Navigator Verwenden Sie hier Formel 53, Formel 56 und Formel 60. b 1 = 5 · 40 515 , 93 − 5 , 096 · 39 842 5 · 5 , 19519 − 5 , 096 2 = −455 , 202 0 , 006734 = −67 597 , 56 b 2 = −455 , 202 5 · 329 111 004 − 39 842 2 = −455 , 202 58 170 056 = −0 , 000 007 825 366 r = − √ −67 597 , 56 · −0 , 000 007 825 366 = − √ 0 , 528 975 6 = −0 , 727 d. h. mittelstarke negative Korrelation; d. h. mittelstarke Tendenz dafür, dass steigende BIP-Raten einhergehen mit sinkenden Dax-Index-Werten. [c] Gesucht: a 1 + b 1 · 1 , 014 = ? Formel-Navigator Verwenden Sie hier Formel 52 und Formel 54. a 1 = 39 842 − (−67 597 , 56) · 5 , 096 5 = 76 863 , 84 76 863 , 84 + (−67 597 , 56) · 1 , 014 = 8 319 , 9 ≈ 8 320 d. h. gemäß der Methode der kleinsten Quadrate wäre mit einem Dax Index-Wert von etwa 8 320 zu rechnen. Da 1 , 014 ∈ [1 , 001; 1 , 041] liegt, ist 8 320 ein interpolierter Wert. [d] Gesucht: a 2 + b 2 · 9 960 = ? Formel-Navigator Verwenden Sie hier Formel 55 und Formel 57. a 2 = 5 , 096 − (−0 , 000 007 825 366) · 39 842 5 = 1 , 081 556 1 , 081 556 + (−0 , 000 007 825 366) · 9 960 = 1 , 003615 ≈ 1 , 004 d. h. gemäß der Methode der kleinsten Quadrate wäre mit einem BIP-Wachstum von etwa 0,4 % zu rechnen. Da 9 960 / ∈ [5 898; 9 866] liegt, ist 0,4 ein extrapolierter Wert. 12.15 Z = Kölner geht zum Rosenmontagszug K = Altersklasse 0 bis 12 Jahre J = Altersklasse 13 bis 18 Jahre E = Altersklasse 19 bis 50 Jahre A = Altersklasse über 50 Jahre <?page no="184"?> 172 Lösungen zu Kapitel 12: Gemischte Aufgaben [a] Gegeben sind die folgenden Wahrscheinlichkeiten: Formel-Navigator Verwenden Sie hier Formel 34. 0 , 41 = P ( Z | K ) und 0 , 10 = P ( K ) ⇒ P ( Z ∩ K ) = 0 , 41 · 0 , 10 = 0 , 0410 0 , 72 = P ( Z | J ) und 0 , 06 = P ( J ) ⇒ P ( Z ∩ J ) = 0 , 72 · 0 , 06 = 0 , 0432 0 , 68 = P ( Z | E ) und 0 , 50 = P ( E ) ⇒ P ( Z ∩ E ) = 0 , 68 · 0 , 50 = 0 , 3400 0 , 54 = P ( Z | A ) und 0 , 34 = P ( A ) ⇒ P ( Z ∩ K ) = 0 , 54 · 0 , 34 = 0 , 1836 Da die Ereignisse K , J , E , A eine Zerlegung darstellen, lässt sich eine Arbeitstabelle aufstellen: K J E A ∑ Z 0,0410 0,0432 0,3400 0,1836 0,6078 Z ∑ 0,10 0,06 0,50 0,34 1 [1] P ( K | Z ) = ? Formel-Navigator Verwenden Sie hier Formel 33. P ( K | Z ) = 0 , 0410 0 , 6078 = 0 , 0675 d. h. 6,75 % der Kölner Rosenmontagszug-Besucher sind Kinder. [2] P ( J | Z ) = 0 , 0432 0 , 6078 = 0 , 0711 mit Formel 33 d. h. 7,11 % der Kölner Rosenmontagszug-Besucher sind Jugendliche. [3] P ( E | Z ) = 0 , 3400 0 , 6078 = 0 , 5594 mit Formel 33 d. h. 55,94 % der Kölner Rosenmontagszug-Besucher sind Erwachsene bis 50 Jahre. [4] P ( A | Z ) = 0 , 1836 0 , 6078 = 0 , 3021 mit Formel 33 d. h. 30,21 % der Kölner Rosenmontagszug-Besucher sind Erwachsene über 50 Jahre. [b] Gegeben sind die folgenden Wahrscheinlichkeiten: 0 , 10 = P ( K ) 0 , 06 = P ( J ) 0 , 50 = P ( E ) 0 , 34 = P ( A ) 0 , 6078 = P ( Z ) <?page no="185"?> Lösungen zu Kapitel 12: Gemischte Aufgaben 173 Lösungen Formel-Navigator Verwenden Sie hier Formel 34. 0 , 0675 = P ( K | Z ) ⇒ P ( Z ∩ K ) = 0 , 0675 · 0 , 6078 = 0 , 0410 0 , 0711 = P ( J | Z ) ⇒ P ( Z ∩ J ) = 0 , 0711 · 0 , 6078 = 0 , 0432 0 , 5594 = P ( E | Z ) ⇒ P ( Z ∩ E ) = 0 , 5594 · 0 , 6078 = 0 , 3400 0 , 3021 = P ( A | Z ) ⇒ P ( Z ∩ A ) = 0 , 3021 · 0 , 6078 = 0 , 1836 Da die Ereignisse K , J , E , A eine Zerlegung darstellen, lässt sich eine Arbeitstabelle aufstellen: K J E A ∑ Z 0,0410 0,0432 0,3400 0,1836 0,6078 Z ∑ 0,10 0,06 0,50 0,34 1 [1] P ( Z | K ) = ? Formel-Navigator Verwenden Sie hier Formel 33. P ( Z | K ) = 0 , 0410 0 , 10 = 0 , 41 d. h. 41 % der Kölner Kinder gehen zum Zug. [2] P ( Z | J ) = 0 , 0432 0 , 06 = 0 , 72 mit Formel 33 d. h. 72 % der Kölner Jugendlichen gehen zum Zug. [3] P ( Z | E ) = 0 , 3400 0 , 50 = 0 , 68 mit Formel 33 d. h. 68 % der Kölner 19 - 50-Jährigen gehen zum Zug. [4] P ( Z | A ) = 0 , 1836 0 , 34 = 0 , 54 mit Formel 33 d. h. 54 % der Kölner über 50-Jährigen gehen zum Zug. Das sollten Sie wissen! Beim Zentralen Grenzwertsatz wird unterschieden, ob eine Binomialverteilung vorliegt oder nicht: Liegt eine Binomialverteilung vor, so werden Wahrscheinlichkeiten mit der Formel 30 bzw. Formel 71 näherungsweise berechnet. Liegt keine Binomialverteilung vor, so werden Wahrscheinlichkeiten mit der Formel 81 bzw. Formel 82 näherungsweise berechnet. <?page no="186"?> 174 Lösungen zu Kapitel 12: Gemischte Aufgaben 12.16 X = Höhe der Entschädigungszahlungen (in e ) der Eisenbahngesellschaft pro Zugfahrt x 0 40 · 20 e = 800 e 40 · 30 e =1 200 e P ( X = x ) 0,915 0,08 0,005 [a] E [ X ] = ? Formel-Navigator Verwenden Sie hier Formel 42. E [ X ] = 0 · 0 , 915 + 800 · 0 , 08 + 1 200 · 0 , 005 = 70 d. h. pro Zugfahrt muss die Eisenbahngesellschaft mit einer Entschädigungshöhe von 70 e rechnen. [b] Var [ X ] = ? Formel-Navigator Verwenden Sie hier Formel 43. Var [ X ] = (0 − 70) 2 · 0 , 915 + (800 − 70) 2 · 0 , 08 + (1 200 − 70) 2 · 0 , 005 = 53 500 d. h. die Varianz beträgt 53 500. [c] P ( X 1 + . . . + X 100 ≤ 12 000) = ? Formel-Navigator Verwenden Sie hier Formel 81 und die Tabelle auf der Seite 191. P ( X 1 + . . . + X 100 ≤ 12 000) ≈ F U ( 12 000 − 100 · 70 √ 100 · 53 500 ) = F U ( 12 000 − 7 000 2 313 , 0067 ) = F U (2 , 1617) = 0 , 985 d. h. die Wahrscheinlichkeit beträgt 0,985. [d] x = ? mit 0 , 10 = P ( X 1 + . . . X 100 ≤ x ) Formel-Navigator Verwenden Sie hier Formel 81 und die Tabelle auf der Seite 190. 0 , 10 = P ( X 1 + . . . X 100 ≤ x ) = F U ( x − 7 000 2 313 , 0067 ) −1 , 2816 = x − 7 000 2 313 , 0067 ⇔ x = 7 000 − 1 , 2816 · 2 313 , 0067 = 4 035 , 65 d. h. bei 100 Zugfahrten muss die Eisenbahngesellschaft mit der Wahrscheinlichkeit von 0,90 mit einer Entschädigungshöhe von mindestens etwa 4 040 e rechnen. <?page no="187"?> Formeln Kennzahlen aus Daten Bezeichnungen x ∗ j Obergrenze der Einfallsklasse x ∗ j −1 Untergrenze der Einfallsklasse n j n relative Häufigkeit der Einfallsklasse b j x ∗ j − x ∗ j −1 Breite der Einfallsklasse F kumulierte relative Häufigkeiten Anteilswerte F ( x ) ≈ F ( x ∗ j −1 ) + n j / n b j · ( x − x ∗ j −1 ) , für x ∈ ( x ∗ j −1 ; x ∗ j ] (1) Prozentpunkte ( p -Quantile) x p ≈ x ∗ j −1 + p − F ( x ∗ j −1 ) n j / n · b j , für p ∈ ( F ( x ∗ j −1 ); F ( x ∗ j ) ] (2) Median x 0 , 50 = 50 %-Punkt (3) Modus häufigster bzw. dichtester Wert (4) Arithmetisches Mittel aus Einzelwerten x = 1 n n ∑ i =1 x i (5) Arithmetisches Mittel aus tabellierten Daten x = 1 n m ∑ i =1 x i · n i (6) 175 <?page no="188"?> 176 Formeln Arithmetisches Mittel aus klassierten Daten x ≈ 1 n k ∑ j =1 x ′ j · n j , mit x ′ j = Klassenmitte (7) Geometrisches Mittel aus Einzelwerten x G = n √ x 1 · x 2 · . . . · x n = n √ √ √ √ n ∏ i =1 x i , mit x i > 0 für alle i (8) Harmonisches Mittel x H = n n ∑ i =1 1 x i (9) Spannweite aus Einzelwerten R = max { x 1 , . . . , x n } − min { x 1 , . . . , x n } = x ( n ) − x (1) (10) Quartilsabstand Q ≈ x 0 , 75 − x 0 , 25 (11) Varianz aus Einzelwerten s 2 x = 1 n n ∑ i =1 ( x i − x ) 2 = ( 1 n n ∑ i =1 x 2 i ) − ( x ) 2 (12) oder 1 n − 1 n ∑ i =1 ( x i − x ) 2 (13) Varianz aus tabellierten Daten s 2 x = 1 n m ∑ i =1 ( x i − x ) 2 · n i = ( 1 n m ∑ i =1 x 2 i · n i ) − ( x ) 2 (14) oder 1 n − 1 m ∑ i =1 ( x i − x ) 2 · n i (15) <?page no="189"?> Formeln 177 Formeln Varianz aus klassierten Daten s 2 x ≈ 1 n k ∑ j =1 ( x ′ j − x ) 2 · n j = ⎛ ⎝ 1 n k ∑ j =1 ( x ′ j ) 2 · n j ⎞ ⎠ − ( x ) 2 (16) oder 1 n − 1 k ∑ j =1 ( x ′ j − x ) 2 · n j (17) Standardabweichung s x = √ s 2 x (18) Variationskoeffizient v = s x x (19) Relativer Quartilsabstand x 0 , 75 − x 0 , 25 x 0 , 50 (20) Anzahl der Permutationen des n -Tupels (1 , . . . , n ) n ! = 1 · 2 · 3 · . . . · n (21) des n -Tupels (1 , 1 , . . . , 1 ︸ ︷︷ ︸ n 1 -mal , 2 , 2 , . . . , 2 ︸ ︷︷ ︸ n 2 -mal , . . . , k , k , . . . , k ︸ ︷︷ ︸ n k -mal ) n ! n 1 ! · n 2 ! · . . . · n k ! (22) Ziehen von k Elementen aus n Elementen ohne Zurücklegen mit Berücksichtigung der Reihenfolge n ! ( n − k )! (23) mit Zurücklegen mit Berücksichtigung der Reihenfolge n k (24) <?page no="190"?> 178 Formeln ohne Zurücklegen ohne Berücksichtigung der Reihenfolge ( n k ) (25) mit Zurücklegen ohne Berücksichtigung der Reihenfolge ( n + k − 1 k ) (26) Wahrscheinlichkeiten Bezeichnungen S Stichprobenraum A Ereignis B Ereignis B 1 Ereignis ... B k Ereignis Allgemeine Regeln nach A. Kolmogorov 0 ≤ P ( A ) ≤ 1 (27) P (S) = 1 (28) P ( A ∪ B ) = P ( A ) + P ( B ) ; wenn A ∩ B = ∅ (29) Klassischer Wahrscheinlichkeitsbegriffnach P. Laplace P ( A ) = A S = Anzahl der für A günstigen Ergebnisse Anzahl aller gleich möglichen Ergebnisse (30) Statistischer Wahrscheinlichkeitsbegriffnach R. von Mises P ( A ) = lim n →∞ n ( A ) n (31) Additionssatz P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) (32) <?page no="191"?> Formeln 179 Formeln Bedingte Wahrscheinlichkeit P ( A | B ) = P ( A ∩ B ) P ( B ) , für P ( B ) > 0 (33) Allgemeiner Multiplikationssatz P ( A ∩ B ) = P ( A | B ) · P ( B ) = P ( B | A ) · P ( A ) (34) Stochastisch unabhängige Ereignisse P ( A | B ) = P ( A ) (35) P ( A ∩ B ) = P ( A ) · P ( B ) (36) Satz von der totalen Wahrscheinlichkeit P ( A ) = k ∑ i =1 P ( B i ) · P ( A | B i ) (37) Satz von Bayes P ( B i | A ) = P ( A | B i ) · P ( B i ) P ( A | B 1 ) · P ( B 1 ) + . . . + P ( A | B k ) · P ( B k ) (38) Diskrete Zufallsvariablen Bezeichnungen X Zufallsvariable Y Zufallsvariable F ( x ) = P ( X ≤ x ) Verteilungsfunktion x i mögliche angeordnete Werte der diskreten Zufallsvariablen X y j mögliche angeordnete Werte der diskreten Zufallsvariablen Y Einzelwahrscheinlichkeiten f ( x i ) = P ( X = x i ) , mit ∑ i f ( x i ) = 1 (39) Verteilungsfunktion an der Stelle x i F ( x i ) = P ( X ≤ x i ) = f ( x 1 ) + f ( x 2 ) + . . . + f ( x i ) (40) <?page no="192"?> 180 Formeln Stochastische Unabhängigkeit P ( X = x i ∩ Y = y j ) = P ( X = x i ) · P ( Y = y j ) , für alle x i , y j (41) Erwartungswert μ X = E [ X ] = ∑ i x i · P ( X = x i ) (42) Varianz σ 2 X = Var [ X ] = ∑ i ( x i − E [ X ]) 2 · P ( X = x i ) = ∑ i x 2 i P ( X = x i ) − ( E [ X ]) 2 (43) Standardabweichung σ X = √ Var [ X ] (44) Stetige Zufallsvariablen Bezeichnungen X Zufallsvariable F ( x ) = P ( X ≤ x ) Verteilungsfunktion Dichtefunktion f ( x ) ≥ 0 mit ∫ +∞ −∞ f ( x ) d ( x ) = 1 (45) Verteilungsfunktion an der Stelle x 0 F ( x 0 ) = P ( X ≤ x 0 ) = ∫ x 0 −∞ f ( x ) d ( x ) (46) Erwartungswert μ X = E [ X ] = ∫ +∞ −∞ x · f ( x ) d ( x ) (47) Varianz σ 2 X = Var [ X ] = ∫ +∞ −∞ ( x − E [ X ]) 2 · f ( x ) d ( x ) (48) <?page no="193"?> Formeln 181 Formeln Standardabweichung σ X = √ Var [ X ] (49) Kovarianz aus Einzelwerten s x y = 1 n n ∑ i =1 ( x i − x )( y i − y ) = ( 1 n n ∑ i =1 x i · y i ) − x · y (50) aus tabellierten Daten s x y = 1 n m ∑ i =1 q ∑ j =1 ( x i − x )( y j − y ) · n i,j = ⎛ ⎝ 1 n m ∑ i =1 q ∑ j =1 x i · y j · n i,j ⎞ ⎠ − x · y (51) Lineare Regression von Y auf X Regressionsgerade ̂ y i = a 1 + b 1 · x i (52) Regressionskoeffizient b 1 = s x y s 2 x = n · ( n ∑ i =1 x i · y i ) − ( n ∑ i =1 x i ) · ( n ∑ i =1 y i ) n · ( n ∑ i =1 x 2 i ) − ( n ∑ i =1 x i ) 2 (53) Konstante a 1 = y − b 1 · x = ( n ∑ i =1 y i ) − b 1 · ( n ∑ i =1 x i ) n (54) Lineare Regression von X auf Y Regressionsgerade ̂ x i = a 2 + b 2 · y i (55) <?page no="194"?> 182 Formeln Regressionskoeffizient b 2 = s x y s 2 y = n · ( n ∑ i =1 x i · y i ) − ( n ∑ i =1 x i ) · ( n ∑ i =1 y i ) n · ( n ∑ i =1 y 2 i ) − ( n ∑ i =1 y i ) 2 (56) Konstante a 2 = x − b 2 · y = ( n ∑ i =1 x i ) − b 2 · ( n ∑ i =1 y i ) n (57) Korrelation Korrelationskoeffizient von Bravais-Pearson r x y = s x y s x · s y = n · ( n ∑ i =1 x i · y i ) − ( n ∑ i =1 x i ) · ( n ∑ i =1 y i ) √ √ √ √ √ ⎡ ⎣ n · ( n ∑ i =1 x 2 i ) − ( n ∑ i =1 x i ) 2 ⎤ ⎦ · ⎡ ⎣ n · ( n ∑ i =1 y 2 i ) − ( n ∑ i =1 y i ) 2 ⎤ ⎦ (58) wobei − 1 ≤ r x y ≤ +1 Bestimmtheitsmaß B = b 2 1 · s 2 x s 2 y = b 2 2 · s 2 y s 2 x (59) B = ( r x y ) 2 = b 1 · b 2 , wobei 0 ≤ B ≤ +1 (60) Indizes Bezeichnungen q Menge p Preis je Mengeneinheit 0 Basisjahr t Berichtsjahr i Laufindex der m Güter <?page no="195"?> Formeln 183 Formeln Wertindex W = m ∑ i =1 p t i q t i m ∑ i =1 p 0 i q 0 i (61) Mengenindex nach Laspeyres Q La = m ∑ i =1 p 0 i q t i m ∑ i =1 p 0 i q 0 i = m ∑ i =1 ( q t i q 0 i ) · ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ p 0 i q 0 i m ∑ j =1 p 0 j q 0 j ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ (62) Mengenindex nach Paasche Q P a = m ∑ i =1 p t i q t i m ∑ i =1 p t i q 0 i = m ∑ i =1 ( q t i q 0 i ) · ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ p t i q 0 i m ∑ j =1 p t j q 0 j ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ (63) Preisindex nach Laspeyres P La = m ∑ i =1 p t i q 0 i m ∑ i =1 p 0 i q 0 i = m ∑ i =1 ( p t i p 0 i ) · ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ p 0 i q 0 i m ∑ j =1 p 0 j q 0 j ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ (64) Preisindex nach Paasche P P a = m ∑ i =1 p t i q t i m ∑ i =1 p 0 i q t i = m ∑ i =1 ( p t i p 0 i ) · ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ p 0 i q t i m ∑ j =1 p 0 j q t j ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ (65) Zusammenhang von Wert-, Mengen- und Preisindex W = P La · Q P a = P P a · Q La (66) <?page no="196"?> 184 Formeln Binomialverteilung X ∼ B( n ; p ) Einzelwahrscheinlichkeiten P ( X = x ) = ( n x ) · p x (1 − p ) n − x ; x = 0 , 1 , 2 , . . . , n (67) Erwartungswert E [ X ] = n · p (68) Standardabweichung √ Var [ X ] = √ n · p · (1 − p ) (69) Näherungslösung durch Normalverteilung P ( X ≤ x ) ≈ P ( U ≤ x + 0 , 5 − np √ np (1 − p ) ) = F U ( x + 0 , 5 − np √ np (1 − p ) ) (70) wenn np ≥ 10 und n (1 − p ) ≥ 10 P ( X = x ) ≈ F U ( x + 0 , 5 − np √ np (1 − p ) ) − F U ( x − 0 , 5 − np √ np (1 − p ) ) (71) wenn np ≥ 10 und n (1 − p ) ≥ 10 Hypergeometrische Verteilung X ∼ H( N ; M ; n ) Einzelwahrscheinlichkeiten P ( X = x ) = ( M x )( N − M n − x ) ( N n ) , für max {0 , n − ( N − M )} ≤ x ≤ min { n, M } (72) Erwartungswert E [ X ] = n · M N (73) Standardabweichung √ Var [ X ] = √ n · M N · ( 1 − M N ) · N − n N − 1 (74) <?page no="197"?> Formeln 185 Formeln Näherungslösung durch Binomialverteilung P ( X = x ) ≈ ( n x ) · ( M N ) x ( 1 − M N ) n − x ; wenn n N ≤ 0 , 05 (75) Normalverteilung X ∼ N( μ ; σ ) Dichtefunktion f ( x ) = 1 σ · √ 2 π e − ( x − μ ) 2 2 σ 2 ; x ∈ (−∞; +∞) (76) mit π = 3 , 14 . . . und e = 2 , 71828 . . . Erwartungswert E [ X ] = μ (77) Standardabweichung √ Var [ X ] = σ (78) Standardisierung der Zufallsvariablen X U = X − μ σ mit U ∼ N(0; 1) (79) P ( X ≤ x ) = P ( U ≤ x − μ σ ) = F U ( x − μ σ ) , tabelliert (80) Zentraler Grenzwertsatz P ( n ∑ i =1 X i ≤ x ) ≈ P ( U ≤ x − nμ √ nσ 2 ) = F U ( x − nμ √ nσ 2 ) (81) P ( X ≤ x ) ≈ P ( U ≤ x − μ σ √ n ) = F U ( x − μ σ √ n ) (82) mit E [ X ] = μ und √ Var [ X ] = σ ∈ (0; ∞) Konfidenzintervalle Bezeichnungen 1 − α Konfidenzniveau u (1 − α 2 )− Quantil der Standard-Normalverteilung 2 · ε Breite des Konfidenzintervalls <?page no="198"?> 186 Formeln Für den Mittelwert E [ X ] [ x − u · σ √ n ; x + u · σ √ n ] , falls X ∼ N( μ ; σ ) (83) Mindeststichprobenumfang n ≥ u 2 · σ 2 ε 2 (84) Approximativ für den Mittelwert E [ X ] [ x − u · s x √ n ; x + u · s x √ n ] , falls n ≥ 30 (85) Mindeststichprobenumfang n ≥ u 2 · s 2 alt ε 2 (86) Approximativ für den Anteilswert p ⎡ ⎣ ̂ p + u 2 2 n − u · √ ̂ p (1− ̂ p ) n + u 2 4 n 2 1 + u 2 n ; ̂ p + u 2 2 n + u · √ ̂ p (1− ̂ p ) n + u 2 4 n 2 1 + u 2 n ⎤ ⎦ , falls n ≥ 10 (87) [ ̂ p − u · √ ̂ p (1 − ̂ p ) n ; ̂ p + u · √ ̂ p (1 − ̂ p ) n ] , falls n ≥ 100 (88) Mindeststichprobenumfang n ≥ u 2 · ̂ p alt (1 − ̂ p alt ) ε 2 (89) n ≥ u 2 · 0 , 25 ε 2 (90) Statistische Tests Gaußtest (zweiseitig) H 0 : E [ X ] = μ 0 gegen H 1 : E [ X ] = μ 0 Ablehnung von H 0 ⇔ p -Wert ≤ α , falls X normalverteilt ist mit der bekannten theoretischen Varianz σ 2 . p -Wert = 2 · F U ( − | x − μ 0 σ/ √ n | ) (91) <?page no="199"?> Formeln 187 Formeln t -Test (zweiseitig) H 0 : E [ X ] = μ 0 gegen H 1 : E [ X ] = μ 0 Ablehnung von H 0 ⇔ p -Wert ≤ α , falls der Stichprobenumfang n mindestens 30 beträgt. p -Wert ≈ 2 · F U ( − | x − μ 0 s/ √ n | ) (92) Chi-Quadrat-Unabhängigkeitstest H 0 : X, Y sind stochastisch unabhängig gegen H 1 : X, Y sind stochastisch abhängig Ablehnung von H 0 ⇔ p -Wert ≤ α Faustregel: In der Kontingenztabelle dürfen höchstens 20 % aller Zellen eine erwartete Häufigkeit kleiner als fünf haben. Und die minimale erwartete Häufigkeit muss mindestens eins betragen. Der Freiheitsgrad df einer Kontingenztabelle mit I Zeilen und J Spalten beträgt df = ( I − 1)( J − 1) . χ 2 emp. = I ∑ i =1 J ∑ j =1 ( | n ij − n i • · n • j n | −0 , 5 ) 2 n i • · n • j n , falls df = 1 (93) χ 2 emp. = I ∑ i =1 J ∑ j =1 ( n ij − n i • · n • j n ) 2 n i • · n • j n , falls df > 1 (94) Falls χ 2 emp. gleich oder größer ist als der obere α -Prozentpunkt der Chi-Quadratverteilung mit ( I − 1)( J − 1) Freiheitsgraden, wird die Nullhypothese abgelehnt. Chi-Quadrat-Anpassungstest H 0 : Die Variable hat die Verteilung F gegen H 1 : Die Variable hat nicht die Verteilung F Ablehnung von H 0 ⇔ p -Wert ≤ α , wobei F eine spezifische theoretische Verteilungsfunktion mit I ∈ {1 , 2 , 3 , . . . } spezifischen Einzelwahrscheinlichkeiten p 1 , p 2 , . . . , p I ist. Faustregel: n · p i ≥ 5 für alle i = 1 , 2 , . . . , I χ 2 emp. = I ∑ i =1 ( n i − n · p i ) 2 n · p i (95) <?page no="200"?> 188 Formeln Falls χ 2 emp. gleich oder größer ist als der obere α -Prozentpunkt der Chi-Quadratverteilung mit ( I − 1 − m ) Freiheitsgraden, wird die Nullhypothese abgelehnt, wobei m die Anzahl der zu schätzenden Parameter bezeichnet. <?page no="201"?> Formeln 189 Formeln Tabellen Verteilungsfunktion der Standard-Normalverteilung Ablesebeispiel: P ( U ≤ u ) = 0 , 164 ⇒ u = −0 , 9782 u = −0 , 9822 ⇒ P ( U ≤ u ) = 0 , 163 <?page no="202"?> 190 Formeln Wkt. ,000 ,001 ,002 ,003 ,004 ,005 ,006 ,007 ,008 ,009 0,00 -3,0902 -2,8782 -2,7478 -2,6521 -2,5758 -2,5121 -2,4573 -2,4089 -2,3656 0,01 -2,3263 -2,2904 -2,2571 -2,2262 -2,1973 -2,1701 -2,1444 -2,1201 -2,0969 -2,0749 0,02 -2,0537 -2,0335 -2,0141 -1,9954 -1,9774 -1,9600 -1,9431 -1,9268 -1,9110 -1,8957 0,03 -1,8808 -1,8663 -1,8522 -1,8384 -1,8250 -1,8119 -1,7991 -1,7866 -1,7744 -1,7624 0,04 -1,7507 -1,7392 -1,7279 -1,7169 -1,7060 -1,6954 -1,6849 -1,6747 -1,6646 -1,6546 0,05 -1,6449 -1,6352 -1,6258 -1,6164 -1,6072 -1,5982 -1,5893 -1,5805 -1,5718 -1,5632 0,06 -1,5548 -1,5464 -1,5382 -1,5301 -1,5220 -1,5141 -1,5063 -1,4985 -1,4909 -1,4833 0,07 -1,4758 -1,4684 -1,4611 -1,4538 -1,4466 -1,4395 -1,4325 -1,4255 -1,4187 -1,4118 0,08 -1,4051 -1,3984 -1,3917 -1,3852 -1,3787 -1,3722 -1,3658 -1,3595 -1,3532 -1,3469 0,09 -1,3408 -1,3346 -1,3285 -1,3225 -1,3165 -1,3106 -1,3047 -1,2988 -1,2930 -1,2873 0,10 -1,2816 -1,2759 -1,2702 -1,2646 -1,2591 -1,2536 -1,2481 -1,2426 -1,2372 -1,2319 0,11 -1,2265 -1,2212 -1,2160 -1,2107 -1,2055 -1,2004 -1,1952 -1,1901 -1,1850 -1,1800 0,12 -1,1750 -1,1700 -1,1650 -1,1601 -1,1552 -1,1503 -1,1455 -1,1407 -1,1359 -1,1311 0,13 -1,1264 -1,1217 -1,1170 -1,1123 -1,1077 -1,1031 -1,0985 -1,0939 -1,0893 -1,0848 0,14 -1,0803 -1,0758 -1,0714 -1,0669 -1,0625 -1,0581 -1,0537 -1,0494 -1,0450 -1,0407 0,15 -1,0364 -1,0322 -1,0279 -1,0237 -1,0194 -1,0152 -1,0110 -1,0069 -1,0027 -0,9986 0,16 -0,9945 -0,9904 -0,9863 -0,9822 -0,9782 -0,9741 -0,9701 -0,9661 -0,9621 -0,9581 0,17 -0,9542 -0,9502 -0,9463 -0,9424 -0,9385 -0,9346 -0,9307 -0,9269 -0,9230 -0,9192 0,18 -0,9154 -0,9116 -0,9078 -0,9040 -0,9002 -0,8965 -0,8927 -0,8890 -0,8853 -0,8816 0,19 -0,8779 -0,8742 -0,8705 -0,8669 -0,8633 -0,8596 -0,8560 -0,8524 -0,8488 -0,8452 0,20 -0,8416 -0,8381 -0,8345 -0,8310 -0,8274 -0,8239 -0,8204 -0,8169 -0,8134 -0,8099 0,21 -0,8064 -0,8030 -0,7995 -0,7961 -0,7926 -0,7892 -0,7858 -0,7824 -0,7790 -0,7756 0,22 -0,7722 -0,7688 -0,7655 -0,7621 -0,7588 -0,7554 -0,7521 -0,7488 -0,7454 -0,7421 0,23 -0,7388 -0,7356 -0,7323 -0,7290 -0,7257 -0,7225 -0,7192 -0,7160 -0,7128 -0,7095 0,24 -0,7063 -0,7031 -0,6999 -0,6967 -0,6935 -0,6903 -0,6871 -0,6840 -0,6808 -0,6776 0,25 -0,6745 -0,6713 -0,6682 -0,6651 -0,6620 -0,6588 -0,6557 -0,6526 -0,6495 -0,6464 0,26 -0,6433 -0,6403 -0,6372 -0,6341 -0,6311 -0,6280 -0,6250 -0,6219 -0,6189 -0,6158 0,27 -0,6128 -0,6098 -0,6068 -0,6038 -0,6008 -0,5978 -0,5948 -0,5918 -0,5888 -0,5858 0,28 -0,5828 -0,5799 -0,5769 -0,5740 -0,5710 -0,5681 -0,5651 -0,5622 -0,5592 -0,5563 0,29 -0,5534 -0,5505 -0,5476 -0,5446 -0,5417 -0,5388 -0,5359 -0,5330 -0,5302 -0,5273 0,30 -0,5244 -0,5215 -0,5187 -0,5158 -0,5129 -0,5101 -0,5072 -0,5044 -0,5015 -0,4987 0,31 -0,4959 -0,4930 -0,4902 -0,4874 -0,4845 -0,4817 -0,4789 -0,4761 -0,4733 -0,4705 0,32 -0,4677 -0,4649 -0,4621 -0,4593 -0,4565 -0,4538 -0,4510 -0,4482 -0,4454 -0,4427 0,33 -0,4399 -0,4372 -0,4344 -0,4316 -0,4289 -0,4261 -0,4234 -0,4207 -0,4179 -0,4152 0,34 -0,4125 -0,4097 -0,4070 -0,4043 -0,4016 -0,3989 -0,3961 -0,3934 -0,3907 -0,3880 0,35 -0,3853 -0,3826 -0,3799 -0,3772 -0,3745 -0,3719 -0,3692 -0,3665 -0,3638 -0,3611 0,36 -0,3585 -0,3558 -0,3531 -0,3505 -0,3478 -0,3451 -0,3425 -0,3398 -0,3372 -0,3345 0,37 -0,3319 -0,3292 -0,3266 -0,3239 -0,3213 -0,3186 -0,3160 -0,3134 -0,3107 -0,3081 0,38 -0,3055 -0,3029 -0,3002 -0,2976 -0,2950 -0,2924 -0,2898 -0,2871 -0,2845 -0,2819 0,39 -0,2793 -0,2767 -0,2741 -0,2715 -0,2689 -0,2663 -0,2637 -0,2611 -0,2585 -0,2559 0,40 -0,2533 -0,2508 -0,2482 -0,2456 -0,2430 -0,2404 -0,2378 -0,2353 -0,2327 -0,2301 0,41 -0,2275 -0,2250 -0,2224 -0,2198 -0,2173 -0,2147 -0,2121 -0,2096 -0,2070 -0,2045 0,42 -0,2019 -0,1993 -0,1968 -0,1942 -0,1917 -0,1891 -0,1866 -0,1840 -0,1815 -0,1789 0,43 -0,1764 -0,1738 -0,1713 -0,1687 -0,1662 -0,1637 -0,1611 -0,1586 -0,1560 -0,1535 0,44 -0,1510 -0,1484 -0,1459 -0,1434 -0,1408 -0,1383 -0,1358 -0,1332 -0,1307 -0,1282 0,45 -0,1257 -0,1231 -0,1206 -0,1181 -0,1156 -0,1130 -0,1105 -0,1080 -0,1055 -0,1030 0,46 -0,1004 -0,0979 -0,0954 -0,0929 -0,0904 -0,0878 -0,0853 -0,0828 -0,0803 -0,0778 0,47 -0,0753 -0,0728 -0,0702 -0,0677 -0,0652 -0,0627 -0,0602 -0,0577 -0,0552 -0,0527 0,48 -0,0502 -0,0476 -0,0451 -0,0426 -0,0401 -0,0376 -0,0351 -0,0326 -0,0301 -0,0276 0,49 -0,0251 -0,0226 -0,0201 -0,0176 -0,0150 -0,0125 -0,0100 -0,0075 -0,0050 -0,0025 <?page no="203"?> Formeln 191 Formeln Wkt. , 000 , 001 , 002 , 003 , 004 , 005 , 006 , 007 , 008 , 009 0 , 50 0 , 0000 0 , 0025 0 , 0050 0 , 0075 0 , 0100 0 , 0125 0 , 0150 0 , 0176 0 , 0201 0 , 0226 0 , 51 0 , 0251 0 , 0276 0 , 0301 0 , 0326 0 , 0351 0 , 0376 0 , 0401 0 , 0426 0 , 0451 0 , 0476 0 , 52 0 , 0502 0 , 0527 0 , 0552 0 , 0577 0 , 0602 0 , 0627 0 , 0652 0 , 0677 0 , 0702 0 , 0728 0 , 53 0 , 0753 0 , 0778 0 , 0803 0 , 0828 0 , 0853 0 , 0878 0 , 0904 0 , 0929 0 , 0954 0 , 0979 0 , 54 0 , 1004 0 , 1030 0 , 1055 0 , 1080 0 , 1105 0 , 1130 0 , 1156 0 , 1181 0 , 1206 0 , 1231 0 , 55 0 , 1257 0 , 1282 0 , 1307 0 , 1332 0 , 1358 0 , 1383 0 , 1408 0 , 1434 0 , 1459 0 , 1484 0 , 56 0 , 1510 0 , 1535 0 , 1560 0 , 1586 0 , 1611 0 , 1637 0 , 1662 0 , 1687 0 , 1713 0 , 1738 0 , 57 0 , 1764 0 , 1789 0 , 1815 0 , 1840 0 , 1866 0 , 1891 0 , 1917 0 , 1942 0 , 1968 0 , 1993 0 , 58 0 , 2019 0 , 2045 0 , 2070 0 , 2096 0 , 2121 0 , 2147 0 , 2173 0 , 2198 0 , 2224 0 , 2250 0 , 59 0 , 2275 0 , 2301 0 , 2327 0 , 2353 0 , 2378 0 , 2404 0 , 2430 0 , 2456 0 , 2482 0 , 2508 0 , 60 0 , 2533 0 , 2559 0 , 2585 0 , 2611 0 , 2637 0 , 2663 0 , 2689 0 , 2715 0 , 2741 0 , 2767 0 , 61 0 , 2793 0 , 2819 0 , 2845 0 , 2871 0 , 2898 0 , 2924 0 , 2950 0 , 2976 0 , 3002 0 , 3029 0 , 62 0 , 3055 0 , 3081 0 , 3107 0 , 3134 0 , 3160 0 , 3186 0 , 3213 0 , 3239 0 , 3266 0 , 3292 0 , 63 0 , 3319 0 , 3345 0 , 3372 0 , 3398 0 , 3425 0 , 3451 0 , 3478 0 , 3505 0 , 3531 0 , 3558 0 , 64 0 , 3585 0 , 3611 0 , 3638 0 , 3665 0 , 3692 0 , 3719 0 , 3745 0 , 3772 0 , 3799 0 , 3826 0 , 65 0 , 3853 0 , 3880 0 , 3907 0 , 3934 0 , 3961 0 , 3989 0 , 4016 0 , 4043 0 , 4070 0 , 4097 0 , 66 0 , 4125 0 , 4152 0 , 4179 0 , 4207 0 , 4234 0 , 4261 0 , 4289 0 , 4316 0 , 4344 0 , 4372 0 , 67 0 , 4399 0 , 4427 0 , 4454 0 , 4482 0 , 4510 0 , 4538 0 , 4565 0 , 4593 0 , 4621 0 , 4649 0 , 68 0 , 4677 0 , 4705 0 , 4733 0 , 4761 0 , 4789 0 , 4817 0 , 4845 0 , 4874 0 , 4902 0 , 4930 0 , 69 0 , 4959 0 , 4987 0 , 5015 0 , 5044 0 , 5072 0 , 5101 0 , 5129 0 , 5158 0 , 5187 0 , 5215 0 , 70 0 , 5244 0 , 5273 0 , 5302 0 , 5330 0 , 5359 0 , 5388 0 , 5417 0 , 5446 0 , 5476 0 , 5505 0 , 71 0 , 5534 0 , 5563 0 , 5592 0 , 5622 0 , 5651 0 , 5681 0 , 5710 0 , 5740 0 , 5769 0 , 5799 0 , 72 0 , 5828 0 , 5858 0 , 5888 0 , 5918 0 , 5948 0 , 5978 0 , 6008 0 , 6038 0 , 6068 0 , 6098 0 , 73 0 , 6128 0 , 6158 0 , 6189 0 , 6219 0 , 6250 0 , 6280 0 , 6311 0 , 6341 0 , 6372 0 , 6403 0 , 74 0 , 6433 0 , 6464 0 , 6495 0 , 6526 0 , 6557 0 , 6588 0 , 6620 0 , 6651 0 , 6682 0 , 6713 0 , 75 0 , 6745 0 , 6776 0 , 6808 0 , 6840 0 , 6871 0 , 6903 0 , 6935 0 , 6967 0 , 6999 0 , 7031 0 , 76 0 , 7063 0 , 7095 0 , 7128 0 , 7160 0 , 7192 0 , 7225 0 , 7257 0 , 7290 0 , 7323 0 , 7356 0 , 77 0 , 7388 0 , 7421 0 , 7454 0 , 7488 0 , 7521 0 , 7554 0 , 7588 0 , 7621 0 , 7655 0 , 7688 0 , 78 0 , 7722 0 , 7756 0 , 7790 0 , 7824 0 , 7858 0 , 7892 0 , 7926 0 , 7961 0 , 7995 0 , 8030 0 , 79 0 , 8064 0 , 8099 0 , 8134 0 , 8169 0 , 8204 0 , 8239 0 , 8274 0 , 8310 0 , 8345 0 , 8381 0 , 80 0 , 8416 0 , 8452 0 , 8488 0 , 8524 0 , 8560 0 , 8596 0 , 8633 0 , 8669 0 , 8705 0 , 8742 0 , 81 0 , 8779 0 , 8816 0 , 8853 0 , 8890 0 , 8927 0 , 8965 0 , 9002 0 , 9040 0 , 9078 0 , 9116 0 , 82 0 , 9154 0 , 9192 0 , 9230 0 , 9269 0 , 9307 0 , 9346 0 , 9385 0 , 9424 0 , 9463 0 , 9502 0 , 83 0 , 9542 0 , 9581 0 , 9621 0 , 9661 0 , 9701 0 , 9741 0 , 9782 0 , 9822 0 , 9863 0 , 9904 0 , 84 0 , 9945 0 , 9986 1 , 0027 1 , 0069 1 , 0110 1 , 0152 1 , 0194 1 , 0237 1 , 0279 1 , 0322 0 , 85 1 , 0364 1 , 0407 1 , 0450 1 , 0494 1 , 0537 1 , 0581 1 , 0625 1 , 0669 1 , 0714 1 , 0758 0 , 86 1 , 0803 1 , 0848 1 , 0893 1 , 0939 1 , 0985 1 , 1031 1 , 1077 1 , 1123 1 , 1170 1 , 1217 0 , 87 1 , 1264 1 , 1311 1 , 1359 1 , 1407 1 , 1455 1 , 1503 1 , 1552 1 , 1601 1 , 1650 1 , 1700 0 , 88 1 , 1750 1 , 1800 1 , 1850 1 , 1901 1 , 1952 1 , 2004 1 , 2055 1 , 2107 1 , 2160 1 , 2212 0 , 89 1 , 2265 1 , 2319 1 , 2372 1 , 2426 1 , 2481 1 , 2536 1 , 2591 1 , 2646 1 , 2702 1 , 2759 0 , 90 1 , 2816 1 , 2873 1 , 2930 1 , 2988 1 , 3047 1 , 3106 1 , 3165 1 , 3225 1 , 3285 1 , 3346 0 , 91 1 , 3408 1 , 3469 1 , 3532 1 , 3595 1 , 3658 1 , 3722 1 , 3787 1 , 3852 1 , 3917 1 , 3984 0 , 92 1 , 4051 1 , 4118 1 , 4187 1 , 4255 1 , 4325 1 , 4395 1 , 4466 1 , 4538 1 , 4611 1 , 4684 0 , 93 1 , 4758 1 , 4833 1 , 4909 1 , 4985 1 , 5063 1 , 5141 1 , 5220 1 , 5301 1 , 5382 1 , 5464 0 , 94 1 , 5548 1 , 5632 1 , 5718 1 , 5805 1 , 5893 1 , 5982 1 , 6072 1 , 6164 1 , 6258 1 , 6352 0 , 95 1 , 6449 1 , 6546 1 , 6646 1 , 6747 1 , 6849 1 , 6954 1 , 7060 1 , 7169 1 , 7279 1 , 7392 0 , 96 1 , 7507 1 , 7624 1 , 7744 1 , 7866 1 , 7991 1 , 8119 1 , 8250 1 , 8384 1 , 8522 1 , 8663 0 , 97 1 , 8808 1 , 8957 1 , 9110 1 , 9268 1 , 9431 1 , 9600 1 , 9774 1 , 9954 2 , 0141 2 , 0335 0 , 98 2 , 0537 2 , 0749 2 , 0969 2 , 1201 2 , 1444 2 , 1701 2 , 1973 2 , 2262 2 , 2571 2 , 2904 0 , 99 2 , 3263 2 , 3656 2 , 4089 2 , 4573 2 , 5121 2 , 5758 2 , 6521 2 , 7478 2 , 8782 3 , 0902 <?page no="204"?> 192 Formeln Prozentpunkte der t -Verteilung mit df Freiheitsgraden df 0,900 0,950 0,975 0,990 0,995 1 3,0777 6,3138 12,706 31,820 63,657 2 1,8856 2,9200 4,3027 6,9646 9,9248 3 1,6377 2,3534 3,1824 4,5407 5,8409 4 1,5332 2,1318 2,7764 3,7469 4,6041 5 1,4759 2,0150 2,5706 3,3649 4,0321 6 1,4398 1,9432 2,4469 3,1427 3,7074 7 1,4149 1,8946 2,3646 2,9980 3,4995 8 1,3968 1,8595 2,3060 2,8965 3,3554 9 1,3830 1,8331 2,2622 2,8214 3,2498 10 1,3722 1,8125 2,2281 2,7638 3,1693 11 1,3634 1,7959 2,2010 2,7181 3,1058 12 1,3562 1,7823 2,1788 2,6810 3,0545 13 1,3502 1,7709 2,1604 2,6503 3,0123 14 1,3450 1,7613 2,1448 2,6245 2,9768 15 1,3406 1,7531 2,1314 2,6025 2,9467 16 1,3368 1,7459 2,1199 2,5835 2,9208 17 1,3334 1,7396 2,1098 2,5669 2,8982 18 1,3304 1,7341 2,1009 2,5524 2,8784 19 1,3277 1,7291 2,0930 2,5395 2,8609 20 1,3253 1,7247 2,0860 2,5280 2,8453 21 1,3232 1,7207 2,0796 2,5176 2,8314 22 1,3212 1,7171 2,0739 2,5083 2,8188 23 1,3195 1,7139 2,0687 2,4999 2,8073 24 1,3178 1,7109 2,0639 2,4922 2,7969 25 1,3163 1,7081 2,0595 2,4851 2,7874 26 1,3150 1,7056 2,0555 2,4786 2,7787 27 1,3137 1,7033 2,0518 2,4727 2,7707 28 1,3125 1,7011 2,0484 2,4671 2,7633 29 1,3114 1,6991 2,0452 2,4620 2,7564 30 1,3104 1,6973 2,0423 2,4573 2,7500 >30 1,2816 1,6445 1,9600 2,3263 2,5758 Für df > 30 gilt die Approximation durch die Standard-Normalverteilung. <?page no="205"?> Formeln 193 Formeln Oberer 5 %-Punkt χ 2 -Verteilung Ablesebeispiel: P df =8 ( χ 2 > z ) = 0 , 05 ⇒ z = 15 , 507 df z 1 3 , 841 2 5 , 991 3 7 , 815 4 9 , 488 5 11 , 070 6 12 , 592 7 14 , 067 8 15 , 507 9 16 , 919 10 18 , 307 df z 11 19 , 675 12 21 , 026 13 22 , 362 14 23 , 685 15 24 , 996 16 26 , 296 17 27 , 587 18 28 , 869 19 30 , 144 20 31 , 410 df z 21 32 , 671 22 33 , 924 23 35 , 172 24 36 , 415 25 37 , 652 26 38 , 885 27 40 , 113 28 41 , 337 29 42 , 557 30 43 , 773 df z 31 44 , 985 32 46 , 194 33 47 , 400 34 48 , 602 35 49 , 802 36 50 , 998 37 52 , 192 38 53 , 384 39 54 , 572 40 55 , 758 df z 41 56 , 942 42 58 , 124 43 59 , 304 44 60 , 481 45 61 , 656 46 62 , 830 47 64 , 001 48 65 , 171 49 66 , 339 50 67 , 505 df z 51 68 , 669 52 69 , 832 53 70 , 993 54 72 , 153 55 73 , 311 56 74 , 468 57 75 , 624 58 76 , 778 59 77 , 931 60 79 , 082 df z 61 80 , 232 62 81 , 381 63 82 , 529 64 83 , 675 65 84 , 821 66 85 , 965 67 87 , 108 68 88 , 250 69 89 , 391 70 90 , 531 df z 71 91 , 670 72 92 , 808 73 93 , 945 74 95 , 081 75 96 , 217 76 97 , 351 77 98 , 484 78 99 , 617 79 100 , 749 80 101 , 879 Für df ≥ 80 ergeben sich die oberen 5 %-Punkte z der χ 2 -Verteilung näherungsweise mit der Wilson-Hilferty-Approximation (vgl. Schlittgen [2]) wie folgt: z ≈ df · ( 1 − 2 9 · df + 1 , 6449 · √ 2 9 · df ) 3 <?page no="207"?> Literaturverzeichnis [1] Arrenberg, J. (2015). Wirtschaftsstatistik für Bachelor. 2., überarbeitete und erweiterte Auflage, Konstanz, UVK-Verl.-Ges. (UTB, 3914) [2] Schlittgen, R. (2012). Einführung in die Statistik. 12., korrigierte Auflage, München, Oldenbourg 195 <?page no="208"?> Tipp- und Wissen-Verzeichnis Tipp Binomialverteilung, 50-52, 123, 124, 128 Tipp gemischte Aufgaben, 71 Tipp Indexrechnung, 42, 43, 121 Tipp Kennzahlen, 18, 19, 89, 97 Tipp Konfidenzintervall, 63, 64, 141, 144 Tipp lineare Regression, 34, 35, 111 Tipp Normalverteilung, 57, 133 Tipp Skalierung, 87 Tipp statistischer Test, 69, 147, 148 Tipp Wahrscheinlichkeiten, 25, 26, 101, 106 Tipp Zufallsvariablen, 27, 29 Wissen Binomialverteilung, 45, 123, 125, 126, 129, 135 Wissen Indexrechnung, 37, 117, 120 Wissen Kennzahlen, 11, 92, 94, 95 Wissen Konfidenzintervall, 59, 142 Wissen lineare Regression, 31, 33, 111, 113 Wissen Normalverteilung, 53, 133, 134, 137 Wissen Skalierung, 7 Wissen statistischer Test, 65, 147 Wissen Wahrscheinlichkeiten, 21, 101, 103, 106 Wissen Zufallsvariablen, 109 196