Statistik-Formeln
0514
2014
978-3-8385-4102-0
978-3-8252-4102-5
UTB
Peter Schmidt
Diese Sammlung beinhaltet die wichtigsten Formeln der deskriptiven und induktiven Statistik und ist damit ein hilfreicher Begleiter durch die Statistikveranstaltung im Bachelorstudium - und auch darüber hinaus. Neben den Formeln sind wichtige Begriffe auch in englischer Sprache zu finden. Diese Formelsammlung ist eine sinnvolle Ergänzung zum UTB-Arbeitsbuch "Statistik Schritt für Schritt" (978-3-8252-8561-6) von Peter Schmidt. Die Formelsammlung richtet sich an Bachelorstudierende der Wirtschafts- und Sozialwissenschaften.
<?page no="1"?> Eine Arbeitsgemeinschaft der Verlage Böhlau Verlag · Wien · Köln · Weimar Verlag Barbara Budrich · Opladen · Toronto facultas.wuv · Wien Wilhelm Fink · Paderborn A. Francke Verlag · Tübingen Haupt Verlag · Bern Verlag Julius Klinkhardt · Bad Heilbrunn Mohr Siebeck · Tübingen Nomos Verlagsgesellschaft · Baden-Baden Ernst Reinhardt Verlag · München · Basel Ferdinand Schöningh · Paderborn Eugen Ulmer Verlag · Stuttgart UVK Verlagsgesellschaft · Konstanz, mit UVK / Lucius · München Vandenhoeck & Ruprecht · Göttingen · Bristol vdf Hochschulverlag AG an der ETH Zürich <?page no="2"?> Peter Schmidt Statistik-Formeln UVK Verlagsgesellschaft mbH · Konstanz mit UVK/ Lucius · München <?page no="3"?> Prof. Dr. Peter Schmidt lehrt Volkswirtschaftslehre und Statistik an der Hochschule Bremen. Lob und Kritik Wir freuen uns darüber, dass Sie sich für ein UTB-Lehrbuch entschieden haben und hoffen, dass Sie dieses Buch in Ihrem Studium sinnvoll unterstützt. Für Lob und Kritik haben wir stets ein offenes Ohr: Schreiben Sie uns einfach eine E-Mail an das Lektorat (wirtschaft@uvk.de). Online-Angebote oder elektronische Ausgaben sind erhältlich unter www.utb-shop.de. Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http: / / dnb.ddb.de> abrufbar. Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. © UVK Verlagsgesellschaft mbH, Konstanz und München 2014 Lektorat: Rainer Berger Einbandgestaltung: Atelier Reichert, Stuttgart Einbandmotiv: © branchecarica - Fotolia.com Druck und Bindung: fgb freiburger graphische betriebe, Freiburg UVK Verlagsgesellschaft mbH Schützenstr. 24 · 78462 Konstanz Tel. 07531/ 9053-0 · Fax 07531/ 9053-98 www.uvk.de UTB-Nr. 4102 ISBN 978-3-8252-4102-5 <?page no="4"?> Inhalt Teil 1: Deskriptive Statistik ........................................................ 9 <?page no="5"?> 6 Formelsammlung Teil 2: Induktive Statistik .........................................................27 <?page no="6"?> Inhalt 7 Teil 3: Services .........................................................................53 Tipp! Statistik Schritt für Schritt <?page no="8"?> Teil 1: Deskriptive Statistik Grundlagen 1 X, Y, ... Merkmal (Variable) Summenzeichen i=1 bis n <?page no="9"?> 10 Formelsammlung Eindimensionale Daten: Auswertung 2 und Darstellung für mehrfache Nennungen oder Klassen Häufigkeiten 2.1 Absolute Häufigkeiten von k verschiedenen Merkmalsausprägungen Relative Häufigkeiten von k Merkmalsausprägungen Anteil Prozentuale Häufigkeit (Prozentanteil) der Merkmalsausprägung x i Klassierte Daten Häufigkeitsdichte (für Histogramm) <?page no="10"?> Teil 1: Deskriptive Statistik 11 Summenhäufigkeiten Absolute Summenhäufigkeit Relative Summenhäufigkeit Konzentrationsmessung einzelnen aller <?page no="11"?> 12 Formelsammlung Lagemaße (Mittelwerte) 2.2 Arithmetisches Mittel Einfaches arithmetisches Mittel bei (diskreten) Einzelwerten Gewichtetes arithmetisches Mittel (bei Häufigkeitsverteilungen) <?page no="12"?> Teil 1: Deskriptive Statistik 13 Median (Zentralwert) sortieren Index m m Mitte Quantile (Percentile) Häufigster Wert (Modus) Schiefe Geometrisches Mittel <?page no="13"?> 14 Formelsammlung Streuungsmaße 2.3 Spannweite Durchschnittliche (mittlere) absolute Abweichung Hilfsgröße: Varianz Stichprobe - s² Population - ² Standardabweichung <?page no="14"?> Teil 1: Deskriptive Statistik 15 Variationskoeffizient (Standardisierter) Z-Score Zusammenhänge zwischen 3 mehrdimensionalen Daten Allgemeine Grundbegriffe 3.1 Randverteilungen (Zeilen/ Spalten) <?page no="15"?> 16 Formelsammlung Zusammenhänge zwischen metrisch 3.2 skalierten Merkmalen Kovarianz Korrelationskoeffizient (Bravais-Pearson) Lineare Regression Regressionsfunktion: <?page no="16"?> Teil 1: Deskriptive Statistik 17 Lineare Einfachregression nach der Methode der Kleinsten Quadrate (KQ) : Bestimmtheitsmaß/ Gütemaß R ² (Vorhergesagte) Schätzwerte <?page no="17"?> 18 Formelsammlung Rangkorrelationen für ordinal skalierte 3.3 Merkmale (nach Spearman) Kontingenzanalyse bei nominal skalierten 3.4 Variablen 1. Schritt: erwarteten Häufigkeiten 2. Schritt: Errechnen von Kontingenzkoeffizient <?page no="18"?> Teil 1: Deskriptive Statistik 19 Elemente der Zeitreihenanalyse 4 Komponenten einer Zeitreihe 4.1 Glättung durch Gleitende Durchschnitte 4.2 t 4.2.1 Zentrierte Gleitende Durchschnitte <?page no="19"?> 20 Formelsammlung 4.2.2 Endwertige Gleitende Durchschnitte Glättung durch lineare Trendfunktion 4.3 Hinweis: <?page no="20"?> Teil 1: Deskriptive Statistik 21 Ermittlung der (additiven) Saisonkompo- 4.4 nente und Saisonbereinigung 1. Schritt: 2. Schritt: Saisonkomponente 3. Schritt: <?page no="21"?> 22 Formelsammlung Prognosen 4.5 Einfache Prognosen Konstante Entwicklung Additive Entwicklung Multiplikative Entwicklung Prognosen auf Basis von Trendfunktionen für t zukünftige Werte Saisonale Einflüsse bei linearer Trendprognose <?page no="22"?> Teil 1: Deskriptive Statistik 23 Maß- und Indexzahlen 5 Verhältniszahlen 5.1 Gliederungszahl Beziehungszahl Messziffern oder Messzahlen Reihen von Messziffern Vor <?page no="23"?> 24 Formelsammlung Preis- und Mengenindizes 5.2 <?page no="24"?> Teil 1: Deskriptive Statistik 25 Wertindex reihen <?page no="26"?> Teil 2: Induktive Statistik Kombinatorik und 6 Wahrscheinlichkeitsrechnung Kombinatorik 6.1 der Permutationen Fakultäten Binomialkoeffizient Kombinationen <?page no="27"?> 28 Formelsammlung Grundbegriffe und Definitionen der Wahr- 6.2 scheinlichkeitsrechnung oder und Definitionen von Wahrscheinlichkeiten Klassische Definition nach Laplace Empirische Wahrscheinlichkeiten realisierte <?page no="28"?> Teil 2: Induktive Statistik 29 Axiomatische Definition nach Kolmogoroff Rechnen mit Wahrscheinlichkeiten 6.3 Wahrscheinlichkeiten zusammengesetzter Ereignisse Allgemeiner Additionssatz Spezieller Additionssatz Bedingte Wahrscheinlichkeiten lies: „W von B gegeben A“ lies: „W von A gegeben B“ <?page no="29"?> 30 Formelsammlung Allgemeiner Multiplikationssatz Stochastische Unabhängigkeit voneinander und Spezieller Multiplikationssatz <?page no="30"?> Teil 2: Induktive Statistik 31 Theoretische Verteilungen 7 Zufallsvariablen 7.1 7.1.1 Dichte- und Verteilungsfunktion Diskrete Zufallsvariable Wahrscheinlichkeitsfunktion Verteilungsfunktion Stetige Zufallsvariable Dichtefunktion (Wahrscheinlichkeitsdichte) <?page no="31"?> 32 Formelsammlung Verteilungsfunktion 7.1.2 Parameter von Verteilungen Erwartungswert E einer diskreten ZV Erwartungswert E einer stetigen ZV Varianz einer ZV (allgemeine Form) Varianz einer diskreten ZV Varianz einer stetigen ZV <?page no="32"?> Teil 2: Induktive Statistik 33 Einige spezielle Verteilungen 7.2 7.2.1 Diskrete Verteilungen Binomialverteilung Multinomialverteilung <?page no="33"?> 34 Formelsammlung Hypergeometrische Verteilung Poissonverteilung Gleichverteilung <?page no="34"?> Teil 2: Induktive Statistik 35 7.2.2 Stetige Verteilungen Normalverteilung Schreibweise Standardnormalverteilung N N <?page no="35"?> 36 Formelsammlung -Verteilung („Chi-Quadrat“) verteilt t-Verteilung (Studentverteilung) t-verteilt 7.2.3 Zentraler Grenzwertsatz <?page no="36"?> Teil 2: Induktive Statistik 37 Stichprobenfunktion normalverteilt 7.2.4 Approximationen von Verteilungen Bedingungen hypergeometrischen Verteilung durch die Binomialverteilung Binomialverteilung durch die Poisson verteilung hypergeometrischen Verteilung durch die Poissonverteilung <?page no="37"?> 38 Formelsammlung Binomialverteilung durch die Normalverteilung hypergeometrischen Verteilung durch die Normalverteilung Poissonverteilung durch die Normalverteilung -Verteilung durch die Normalverteilung t Verteilung durch die Standard normalverteilung <?page no="38"?> Teil 2: Induktive Statistik 39 Schluss von der Stichprobe auf die 8 Grundgesamtheit Schätztheorie: Stichprobenfunktionen 8.1 Stichprobenmittel einer nur Stichprobenanteil einer ggf. zu multiplizieren mit End lichkeitskorrektur, vgl. (8 5) <?page no="39"?> 40 Formelsammlung Konfidenzintervalle 8.2 zur Parameterschätzung 8.2.1 Konfidenzintervall für den Mittelwert ( = „wahrer“ Mittelwert der Population) Konfidenzintervall N Tabellierung der Standardnormalverteilung, Tabelle 3 Achtung: Fallunterscheidung <?page no="40"?> Teil 2: Induktive Statistik 41 1. Fall: Vergleiche zur Endlichkeitskorrektur (8 5) 2. Fall: 3. Fall: <?page no="41"?> 42 Formelsammlung Vergleiche zur Endlichkeitskorrektur (8 5) 4. Fall: Studentverteilung <?page no="42"?> Teil 2: Induktive Statistik 43 Überblick über Fälle für Stichprobenstandard abweichung 8.2.2 Konfidenzintervall für den Anteilswert Konfidenzintervall <?page no="43"?> 44 Formelsammlung Vergleiche zur Endlichkeitskorrektur (8 5) 8.2.3 Notwendiger Stichprobenumfang Schätzung des Mittelwertes <?page no="44"?> Teil 2: Induktive Statistik 45 Schätzung des Anteilswertes p <?page no="45"?> 46 Formelsammlung Hypothesentests 8.3 Schritte eines Hypothesentests kritischer Wert z c Variante A: Testentscheidung auf Basis absoluter Werte: kritischen Grenzen c (bzw. p c ) Achtung: Bezeichnung von und 1 in der Literatur uneinheitlich <?page no="46"?> Teil 2: Induktive Statistik 47 (analog für Testwerte t und 2 ) Variante B: einfacher aber fehleranfälliger „Z Test“ Testentscheidung auf Basis der standardisierten Z Werte ; <?page no="47"?> 48 Formelsammlung Parametrische Tests 8.4 8.4.1 Testen von Mittelwerten Prüfgröße Fallunterscheidung Prüfgröße <?page no="48"?> Teil 2: Induktive Statistik 49 8.4.2 Testen von Anteilswerten Prüfgröße 8.4.3 Zweistichprobentests Mittelwertdifferenz zweier unabhängiger Stichproben („t-Test“) <?page no="49"?> 50 Formelsammlung Prüfgröße Differenzen von Anteilswerten zweier unabhängiger Stichproben Prüfgröße 8.4.4 Testen der Regressionskoeffizienten bei Mehrfachregression <?page no="50"?> Teil 2: Induktive Statistik 51 Prüfgröße Nicht-Parametrische Tests 8.5 8.5.1 Chi-Quadrat-Unabhängigkeitstest <?page no="51"?> 52 Formelsammlung 2 Wertes erwarteten Häufig keiten h e Prüfgröße 8.5.2 Chi-Quadrat-Anpassungstest 2 Wertes erwarteten Häufig keiten h e Prüfgröße <?page no="52"?> Teil 3: Services Tabellenanhang 1 Tabelle 1: Tabelle 2: Tabelle 3: Tabelle 4: Tabelle 5: <?page no="53"?> 54 Formelsammlung Tabelle 1: Einige Zufallszahlen (zwischen 0 und 99) <?page no="54"?> Teil 3: Services 55 Tabelle 2: Binomialverteilung p n x 0,01 0,05 0,1 0,15 0,2 0,25 0,3 0,4 0,5 1 1 2 2 2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 6 6 6 6 6 6 6 <?page no="55"?> 56 Formelsammlung Tabelle 2: Binomialverteilung (Fortsetzung) p n x 0,01 0,05 0,1 0,15 0,2 0,25 0,3 0,4 0,5 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 <?page no="56"?> Teil 3: Services 57 Tabelle 2: Binomialverteilung (Fortsetzung) p n x 0,01 0,05 0,1 0,15 0,2 0,25 0,3 0,4 0,5 10 10 10 10 10 10 10 10 10 10 10 <?page no="57"?> 58 Formelsammlung Tabelle 3: Standardnormalverteilung Ablesen der Tabellen der Standardnormalverteilung: 0 z 0 0 z +z c z c 0 z <?page no="58"?> Teil 3: Services 59 Tabelle 3: Standardnormalverteilung <?page no="59"?> 60 Formelsammlung Tabelle 3: Standardnormalverteilung (Fortsetzung) <?page no="60"?> Teil 3: Services 61 Tabelle 3: Standardnormalverteilung (Fortsetzung) <?page no="61"?> 62 Formelsammlung Tabelle 4: Chi-Quadrat-Verteilung 2 0,95 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 0 0,0005 0,001 0,0015 0,002 0,0025 0 5 10 15 20 25 30 35 40 45 ² Verteilungen mit verschiedenen Freiheitsgraden <?page no="62"?> Teil 3: Services 63 2 0,95 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,652 38,885 40,113 41,337 42,557 43,773 55,758 67,505 124,342 <?page no="63"?> 64 Formelsammlung Tabelle 5a: Verteilungsfunktion der t-Verteilung F (t) 0,95 0,975 0,995 0,05 0,025 0,005 0,025 0,0125 0,0025 6,314 12,706 63,656 2,920 4,303 9,925 2,353 3,182 5,841 2,132 2,776 4,604 2,015 2,571 4,032 1,943 2,447 3,707 1,895 2,365 3,499 1,860 2,306 3,355 1,833 2,262 3,250 1,812 2,228 3,169 1,796 2,201 3,106 1,782 2,179 3,055 1,771 2,160 3,012 1,761 2,145 2,977 1,753 2,131 2,947 1,746 2,120 2,921 1,740 2,110 2,898 1,734 2,101 2,878 1,729 2,093 2,861 1,725 2,086 2,845 1,721 2,080 2,831 1,717 2,074 2,819 1,714 2,069 2,807 1,711 2,064 2,797 1,708 2,060 2,787 <?page no="64"?> Teil 3: Services 65 F (t) 0,95 0,975 0,995 0,05 0,025 0,005 0,025 0,0125 0,0025 1,706 2,056 2,779 1,703 2,052 2,771 1,701 2,048 2,763 1,699 2,045 2,756 1,697 2,042 2,750 1,684 2,021 2,704 1,676 2,009 2,678 1,671 2,000 2,660 1,664 1,990 2,639 1,660 1,984 2,626 1,655 1,976 2,609 1,650 1,968 2,592 1,646 1,962 2,581 1,645 1,960 2,576 <?page no="65"?> 66 Formelsammlung Tabelle 5b: t-Verteilung: D(t) Symmetrisches Intervall um den Mittelwert D(t) 0,9 0,95 0,99 0,1 0,05 0,01 0,05 0,025 0,005 6,314 12,706 63,656 2,920 4,303 9,925 2,353 3,182 5,841 2,132 2,776 4,604 2,015 2,571 4,032 1,943 2,447 3,707 1,895 2,365 3,499 1,860 2,306 3,355 1,833 2,262 3,250 1,812 2,228 3,169 1,796 2,201 3,106 1,782 2,179 3,055 1,771 2,160 3,012 1,761 2,145 2,977 1,753 2,131 2,947 1,746 2,120 2,921 1,740 2,110 2,898 1,734 2,101 2,878 1,729 2,093 2,861 1,725 2,086 2,845 1,721 2,080 2,831 1,717 2,074 2,819 1,714 2,069 2,807 1,711 2,064 2,797 1,708 2,060 2,787 <?page no="66"?> Teil 3: Services 67 D (t) 0,9 0,95 0,99 0,1 0,05 0,01 0,05 0,025 0,005 1,706 2,056 2,779 1,703 2,052 2,771 1,701 2,048 2,763 1,699 2,045 2,756 1,697 2,042 2,750 1,684 2,021 2,704 1,676 2,009 2,678 1,671 2,000 2,660 1,664 1,990 2,639 1,660 1,984 2,626 1,655 1,976 2,609 1,650 1,968 2,592 1,646 1,962 2,581 1,645 1,960 2,576 <?page no="68"?> Vokabeln deutsch/ englisch 2 deutsch englisch Teil siehe <?page no="69"?> 70 Formelsammlung <?page no="70"?> Teil 3: Services 71 <?page no="71"?> 72 Formelsammlung <?page no="72"?> Teil 3: Services 73 <?page no="73"?> 74 Formelsammlung Vocabulary English/ German 3 englisch deutsch Teil siehe <?page no="74"?> Teil 3: Services 75 <?page no="75"?> 76 Formelsammlung <?page no="76"?> Teil 3: Services 77 <?page no="77"?> 78 Formelsammlung <?page no="78"?> Stichwortregister 4 <?page no="79"?> 80 Formelsammlung <?page no="80"?> Teil 3: Services 81