Mathematik für Wirtschaftswissenschaften
mit über 300 Aufgaben und Online-Lösungen
0925
2023
978-3-8385-8818-6
978-3-8252-8818-1
UTB
Ingolf Terveer
10.36198/9783838588186
Der wertvolle Begleiter durch das Studium
Wer Wirtschaftswissenschaften studiert, muss fit in Mathematik sein. Dieses Buch hilft dabei. Es geht auf lineare, quadratische, rationale und spezielle Funktionen wie Exponential-, Logarithmus- oder trigonometrische Funktionen ein und erklärt Folgen sowie Reihen. Auch die Differential- und Integralrechnung stellt es vor, ebenso lineare Gleichungen und Optimierungen. Vektoren und Matrizen berücksichtigt es zudem. Zusammenfassungen, Aufgaben und Musterklausuren bereiten ideal auf die Prüfung vor.
Neu: Das Buch schließt gleich zu Beginn Wissenslücken durch schulmathematische Grundlagen.
Das Buch richtet sich an Studierende der Betriebs- und Volkswirtschaftslehre sowie Wirtschaftsinformatik.
<?page no="0"?> Ingolf Terveer Mathematik für Wirtschaftswissenschaften mit über 300 Aufgaben und Online-Lösungen 5. Auflage <?page no="1"?> utb 8506 Eine Arbeitsgemeinschaft der Verlage Brill | Schöningh - Fink · Paderborn Brill | Vandenhoeck & Ruprecht · Göttingen - Böhlau · Wien · Köln Verlag Barbara Budrich · Opladen · Toronto facultas · Wien Haupt Verlag · Bern Verlag Julius Klinkhardt · Bad Heilbrunn Mohr Siebeck · Tübingen Narr Francke Attempto Verlag - expert verlag · Tübingen Psychiatrie Verlag · Köln Ernst Reinhardt Verlag · München transcript Verlag · Bielefeld Verlag Eugen Ulmer · Stuttgart UVK Verlag · München Waxmann · Münster · New York wbv Publikation · Bielefeld Wochenschau Verlag · Frankfurt am Main PrintCSS_UTB (XL) Impressum_3_22.indd 1 PrintCSS_UTB (XL) Impressum_3_22.indd 1 24.07.2023 10: 02: 51 24.07.2023 10: 02: 51 <?page no="2"?> Dr. Ingolf Terveer ist Akademischer Oberrat am Institut für Wirtschaftsinformatik der Westfälischen Wilhelms-Universität Münster. <?page no="3"?> Ingolf Terveer Mathematik für Wirtschaftswissenschaften mit über 300 Aufgaben und Online-Lösungen 5., vollständig überarbeitete und erweiterte Auflage UVK Verlag · München <?page no="4"?> DOI: https: / / doi.org/ 10.36198/ 9783838588186 5., vollständig überarbeitete und erweiterte Auflage 4., überarbeitete und erweiterte Auflage 2019 3., überarbeitete Auflage 2012 2., überarbeitete und aktualisierte Auflage 2008 (als „BWL-Crash-Kurs Mathematik“) 1. Auflage 2005 (als „BWL-Crash-Kurs Mathematik“) © UVK Verlag 2023 ‒ ein Unternehmen der Narr Francke Attempto Verlag GmbH + Co. KG Dischingerweg 5 · D-72070 Tübingen Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Alle Informationen in diesem Buch wurden mit großer Sorgfalt erstellt. Fehler können dennoch nicht völlig ausgeschlossen werden. Weder Verlag noch Autor: innen oder Herausgeber: innen übernehmen deshalb eine Gewährleistung für die Korrektheit des Inhaltes und haften nicht für fehlerhafte Angaben und deren Folgen. Diese Publikation enthält gegebenenfalls Links zu externen Inhalten Dritter, auf die weder Verlag noch Autor: innen oder Herausgeber: innen Einfluss haben. Für die Inhalte der verlinkten Seiten sind stets die jeweiligen Anbieter oder Betreibenden der Seiten verantwortlich. Internet: www.narr.de eMail: info@narr.de Einbandgestaltung: siegel konzeption | gestaltung CPI books GmbH, Leck utb-Nr. 8506 ISBN 978-3-8252-8818-1 (Print) ISBN 978-3-8385-8818-6 (ePDF) Umschlagabbildung: © Hermann Littich ∙ iStock Autorinnenbild: © privat Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http: / / dnb.dnb.de abrufbar. www.fsc.org MIX Papier aus verantwortungsvollen Quellen FSC ® C083411 ® <?page no="5"?> Inhalt Vorwort 11 1 Einordnung und Grundlagen 15 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.1 Einordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.2 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.2.1 Operationen mit Mengen . . . . . . . . . . . . . . . . . . . . . . 21 1.2.2 Aussagen und Aussageformen . . . . . . . . . . . . . . . . . . . . 22 1.3 Terme und Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.3.1 Terme und Termumformungen . . . . . . . . . . . . . . . . . . . 26 1.3.2 Gleichungen und Ungleichungen . . . . . . . . . . . . . . . . . . 27 2 Das Funktionskonzept 33 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.1 Funktionen und Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2 Graphische Darstellung, Bild und Urbild . . . . . . . . . . . . . . . . . . 37 2.3 Wachstums- und Krümmungseigenschaften von Funktionen . . . . . . . 42 2.3.1 Lage des Funktionsgraphen im Koordinatensystem . . . . . . . . 42 2.3.2 Monotonieeigenschaften von Funktionen . . . . . . . . . . . . . . 43 2.3.3 Krümmung von Funktionen . . . . . . . . . . . . . . . . . . . . . 43 2.4 Verkettung und Umkehrung von Funktionen . . . . . . . . . . . . . . . . 46 2.5 Exkurs: Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3 Lineare Funktionen 51 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.1 Normalform linearer Funktionen . . . . . . . . . . . . . . . . . . . . . . 52 3.1.1 Interpretation des Faktors a der Normalform . . . . . . . . . . . 52 3.1.2 Interpretation des Summanden b der Normalform . . . . . . . . . 52 3.1.3 Nullstellen linearer Funktionen . . . . . . . . . . . . . . . . . . . 52 3.1.4 Bestimmung der Normalform einer linearen Funktion aus zwei Punkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.2 Punkt-Steigungsform linearer Funktionen . . . . . . . . . . . . . . . . . 54 3.3 Koordinatenform linearer Funktionen . . . . . . . . . . . . . . . . . . . . 54 3.4 Umkehrfunktion und Normale einer linearen Funktion . . . . . . . . . . 55 3.4.1 Die Umkehrfunktion einer linearen Funktion . . . . . . . . . . . 55 3.4.2 Die Normale einer linearen Funktion . . . . . . . . . . . . . . . . 56 3.5 Schnittpunkte linearer Funktionen . . . . . . . . . . . . . . . . . . . . . 57 3.6 Ökonomische Anwendungen linearer Funktionen . . . . . . . . . . . . . 58 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4 Quadratische Funktionen 61 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 48818_Terveer.indd 5 48818_Terveer.indd 5 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="6"?> 6 Inhalt 4.1 Normalform quadratischer Funktionen . . . . . . . . . . . . . . . . . . . 61 4.2 Scheitelpunktform quadratischer Funktionen . . . . . . . . . . . . . . . . 63 4.3 Nullstellen und Schnittpunkte quadratischer Funktionen . . . . . . . . . 65 4.4 Linearform quadratischer Funktionen . . . . . . . . . . . . . . . . . . . . 67 4.5 Umkehrung quadratischer Funktionen . . . . . . . . . . . . . . . . . . . 68 4.6 Ökonomische Anwendungen quadratischer Funktionen . . . . . . . . . . 69 4.6.1 Quadratische Gewinnfunktionen bei linearer Nachfragefunktion . 69 4.6.2 Modellierung von Nachfragesituationen durch quadratische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.6.3 Kleinste-Quadrate-Methode . . . . . . . . . . . . . . . . . . . . . 73 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5 Rationale Funktionen 75 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.1 Potenzen und Monome . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.2 Polynome und ganz-rationale Funktionen . . . . . . . . . . . . . . . . . 80 5.3 Teilbarkeit von Polynomen und Polynomdivision . . . . . . . . . . . . . 83 5.4 Nullstellen von Polynomen . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.5 Interpolation durch Polynome . . . . . . . . . . . . . . . . . . . . . . . . 92 5.6 Gebrochen-rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . 95 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6 Spezielle Funktionen 101 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 6.1 Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 6.1.1 Die Schreibweise f ( x ) = a x für die Exponentialfunktion . . . . . 103 6.1.2 Das Monotonieverhalten der Exponentialfunktion . . . . . . . . . 103 6.1.3 Die Eulersche Exponentialfunktion . . . . . . . . . . . . . . . . . 104 6.2 Logarithmusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.3 Potenzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 6.4 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 110 6.4.1 Geometrische Festlegung der trigonometrischen Funktionen . . . 110 6.4.2 Rechenregeln für trigonometrische Funktionen . . . . . . . . . . . 115 6.4.3 Anwendungen trigonometrischer Funktionen . . . . . . . . . . . . 116 6.5 Stückweise definierte Funktionen . . . . . . . . . . . . . . . . . . . . . . 118 6.5.1 Die Betragsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . 119 6.5.2 Exkurs: Die Indikatorfunktion . . . . . . . . . . . . . . . . . . . 121 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 7 Folgen und Reihen 125 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 7.1 Folgen in der Ökonomie . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 7.2 Explizite und implizite Folgen . . . . . . . . . . . . . . . . . . . . . . . . 127 7.3 Konvergenz von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 7.3.1 Grenzwertbestimmung bei expliziten Folgen . . . . . . . . . . . . 134 7.3.2 Grenzwertbestimmung bei impliziten Folgen . . . . . . . . . . . . 139 7.3.3 Nachweismöglichkeiten für Konvergenz . . . . . . . . . . . . . . . 139 7.4 Summenfolgen und unendliche Reihen . . . . . . . . . . . . . . . . . . . 143 7.4.1 Summenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.4.2 Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . 144 48818_Terveer.indd 6 48818_Terveer.indd 6 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="7"?> Inhalt 7 7.4.3 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 7.4.4 Exkurs: Erzeugende Funktionen . . . . . . . . . . . . . . . . . . . 150 7.5 Exkurs: Gleichgewichte bei Marktpreisen . . . . . . . . . . . . . . . . . . 152 7.6 Finanzmathematische Folgen und Reihen . . . . . . . . . . . . . . . . . 155 7.6.1 Zinseszinsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . 155 7.6.2 Rentenrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 7.6.3 Annuitätenrechnung . . . . . . . . . . . . . . . . . . . . . . . . . 157 7.6.4 Barwert und Endwert . . . . . . . . . . . . . . . . . . . . . . . . 158 7.6.5 Kapitalwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 8 Differentialrechnung in einer Variablen 163 8.1 Funktionsgrenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 8.1.1 Von Folgengrenzwerten zu Funktionsgrenzwerten . . . . . . . . . 163 8.1.2 Einseitige Funktionsgrenzwerte . . . . . . . . . . . . . . . . . . . 165 8.1.3 Methoden zur Bestimmung von Funktionsgrenzwerten . . . . . . 166 8.1.4 Divergente und uneigentliche Grenzwerte . . . . . . . . . . . . . 169 8.1.5 Grenzwertverhalten gebrochen-rationaler Funktionen . . . . . . . 170 8.1.6 Asymptoten von Funktionen . . . . . . . . . . . . . . . . . . . . 171 8.2 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.3 Differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 177 8.3.1 Tangenten an Funktionsgraphen . . . . . . . . . . . . . . . . . . 178 8.3.2 Ableitung als Grenzwert von Sekantensteigungen . . . . . . . . . 178 8.3.3 Die Ableitungsfunktion . . . . . . . . . . . . . . . . . . . . . . . 181 8.3.4 Ableitung und Linearisierung . . . . . . . . . . . . . . . . . . . . 183 8.3.5 Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 8.3.6 Ableitungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . 184 8.4 Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 8.4.1 Faktorregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 8.4.2 Summenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.4.3 Produktregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.4.4 Quotientenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 8.4.5 Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 8.4.6 Ableitung von Potenzreihen . . . . . . . . . . . . . . . . . . . . . 189 8.5 Ableitung und Funktionseigenschaften . . . . . . . . . . . . . . . . . . . 191 8.5.1 Ableitung erster Ordnung und Nullstellen . . . . . . . . . . . . . 192 8.5.2 Ableitung erster Ordnung und Monotonieverhalten . . . . . . . . 193 8.5.3 Ableitung erster Ordnung und Regel von de l’Hospital . . . . . . 195 8.5.4 Ableitungen erster Ordnung und Bedingungen für Extrema . . . 196 8.5.5 Ableitungen erster und zweiter Ordnung und lokale Extrema . . 198 8.5.6 Ableitung zweiter Ordnung und Krümmungsverhalten . . . . . . 201 8.5.7 Kurvendiskussionen und Funktionssteckbriefe . . . . . . . . . . . 203 8.6 Ökonomische Anwendungen der Differentialrechnung . . . . . . . . . . . 208 8.6.1 Optimaler Preis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 8.6.2 Gewinnmaximierung . . . . . . . . . . . . . . . . . . . . . . . . . 210 8.6.3 Elastizitäten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 8.6.4 Marginalanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 8.6.5 Kostenminimierung . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 48818_Terveer.indd 7 48818_Terveer.indd 7 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="8"?> 8 Inhalt 9 Integralrechnung 219 9.1 Flächenintegrale und Stammfunktionen . . . . . . . . . . . . . . . . . . 219 9.1.1 Stammfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 9.1.2 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . 221 9.1.3 Flächenintegrale bei Funktionen mit Vorzeichenwechsel . . . . . 223 9.2 Numerische Berechnung von Flächenintegralen . . . . . . . . . . . . . . 225 9.2.1 Numerische Integration mit der Trapezregel . . . . . . . . . . . . 227 9.2.2 Numerische Integration mit der Simpson-Regel . . . . . . . . . . 227 9.2.3 Exkurs: Das Lebesgue-Integral . . . . . . . . . . . . . . . . . . . 228 9.3 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 9.3.1 Faktorregel und Summenregel . . . . . . . . . . . . . . . . . . . . 230 9.3.2 Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . 232 9.3.3 Substitutionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . 234 9.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 9.5 Exkurs: Konsumentenrente und Produzentenrente . . . . . . . . . . . . 240 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 10 Lineare Gleichungssysteme 247 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 10.1 Lineare Eingabe-Ausgabe-Beziehungen . . . . . . . . . . . . . . . . . . . 247 10.2 Das Gauß’sche Eliminationsverfahren . . . . . . . . . . . . . . . . . . . . 251 10.2.1 Zeilenumformungen eines LGS . . . . . . . . . . . . . . . . . . . 252 10.2.2 Die Staffelform eines LGS . . . . . . . . . . . . . . . . . . . . . . 253 10.2.3 Die Zeilenstufenform eines LGS . . . . . . . . . . . . . . . . . . . 256 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 11 Lineare Optimierung 259 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 11.1 Probleme der linearen Optimierung . . . . . . . . . . . . . . . . . . . . . 259 11.1.1 Optimaler Verbrauch von Rohstoffen . . . . . . . . . . . . . . . . 260 11.1.2 Transportprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . 260 11.1.3 Zuordnungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . 260 11.2 Standardform eines LOP . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 11.3 Simplex-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 11.3.1 Beispiel mit einer freien Variable . . . . . . . . . . . . . . . . . . 263 11.3.2 Simplex-Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 11.3.3 Basiswechsel mit einer freien Variablen . . . . . . . . . . . . . . . 267 11.3.4 Basiswechsel mit mehreren freien Variablen . . . . . . . . . . . . 269 11.3.5 Schematische Darstellung des Simplex-Verfahrens . . . . . . . . . 272 11.3.6 Diskussion des Verfahrens . . . . . . . . . . . . . . . . . . . . . . 273 11.4 Zweiphasenmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 12 Vektoren 281 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 12.1 Vektoren und Operationen mit Vektoren . . . . . . . . . . . . . . . . . . 281 12.1.1 Elementare Operationen mit Vektoren . . . . . . . . . . . . . . . 283 12.1.2 Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 12.2 Koordinatensysteme und Linearkombinationen . . . . . . . . . . . . . . 287 48818_Terveer.indd 8 48818_Terveer.indd 8 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="9"?> Inhalt 9 12.3 Untervektorraum und Basis . . . . . . . . . . . . . . . . . . . . . . . . . 297 12.3.1 Gewinnung einer Basis aus einem Erzeugendensystem . . . . . . 299 12.3.2 Gewinnung einer Basis zur Lösungsmenge eines homogenen linearen Gleichungssystems . . . . . . . . . . . . . . . . . . . . . . 300 12.4 Vektorgeometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 12.5 Abstandsmessung, Projektionen und KQ-Methode . . . . . . . . . . . . 309 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 13 Matrizen 319 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 13.1 Matrix-Vektor-Verflechtungen . . . . . . . . . . . . . . . . . . . . . . . . 319 13.2 Matrix-Matrix-Verflechtungen . . . . . . . . . . . . . . . . . . . . . . . . 323 13.3 Quadratische Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 13.4 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 13.4.1 Berechnung der Determinante mittels Zeilenumformungen . . . . 335 13.4.2 Laplace-Entwicklungsformel für Determinanten . . . . . . . . . 337 13.4.3 Strategien zur Berechnung von Determinanten . . . . . . . . . . 338 13.4.4 Anwendungen der Determinante . . . . . . . . . . . . . . . . . . 340 13.5 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . 341 13.5.1 Bestimmung von Eigenwerten und Eigenvektoren . . . . . . . . . 343 13.5.2 Eigenschaften von Eigenwerten und Eigenvektoren . . . . . . . . 344 13.5.3 Eigenwerte bei symmetrischen Matrizen . . . . . . . . . . . . . . 345 13.6 Definitheit von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 13.6.1 Definitheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349 13.6.2 Definitheit unter Nebenbedingungen . . . . . . . . . . . . . . . . 352 13.7 Exkurs: Anwendungen der Matrizenrechnung . . . . . . . . . . . . . . . 354 13.7.1 Input-Output-Analysen und Leontief-Modelle . . . . . . . . . . . 354 13.7.2 Übergangsmatrizen und Markoff-Ketten . . . . . . . . . . . . . . 356 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360 14 Differentialrechnung in mehreren Variablen 363 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 14.1 Funktionen mehrerer Variablen . . . . . . . . . . . . . . . . . . . . . . . 364 14.1.1 Definitionsbereiche für Funktionen mehrerer Variablen . . . . . . 364 14.1.2 Lineare und quadratische Funktionen mehrerer Variablen . . . . 366 14.1.3 Grenzwerte von Funktionen mehrerer Variablen . . . . . . . . . . 367 14.1.4 Grafische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . 368 14.2 Funktionen mehrerer Variablen in der Ökonomie . . . . . . . . . . . . . 370 14.2.1 Lineare Funktionen mehrerer Variablen in der Ökonomie . . . . . 370 14.2.2 Nachfragefunktionen in mehreren Variablen . . . . . . . . . . . . 371 14.2.3 Produktionsfunktionen in mehreren Variablen . . . . . . . . . . . 373 14.2.4 Homogene Funktionen in der Ökonomie . . . . . . . . . . . . . . 375 14.3 Ableitungskonzepte für Funktionen mehrerer Variablen . . . . . . . . . . 377 14.3.1 Die partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . 378 14.3.2 Das Differential . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 14.3.3 Ableitungsregeln für Funktionen mehrerer Variablen . . . . . . . 387 14.4 Ableitungskonzepte auf Grundlage des Differentials . . . . . . . . . . . . 390 14.4.1 Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . 390 14.4.2 Elastizitäten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 48818_Terveer.indd 9 48818_Terveer.indd 9 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="10"?> Inhalt 14.4.3 Implizite Ableitungen und ihre Anwendungen . . . . . . . . . . . 396 14.5 Ableitungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . 404 14.5.1 Die Hesse-Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . 405 14.5.2 Krümmung impliziter Funktionen . . . . . . . . . . . . . . . . . . 407 14.5.3 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 409 14.6 Integrale für Funktionen mehrerer Variablen . . . . . . . . . . . . . . . . 412 14.6.1 Volumenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 412 14.6.2 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 15 Optimierungsaufgaben 419 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 15.1 Optimierungsaufgaben ohne Nebenbedingungen . . . . . . . . . . . . . . 419 15.1.1 Bestimmung kritischer Punkte . . . . . . . . . . . . . . . . . . . 420 15.1.2 Hinreichende Bedingungen für lokale Extrema . . . . . . . . . . . 422 15.1.3 Optimierung konvexer Funktionen . . . . . . . . . . . . . . . . . 425 15.1.4 Numerische Optimierung mit dem Gradientenabstiegsverfahren . 428 15.1.5 Numerische Optimierung mit dem Newton-Verfahren . . . . . . . 429 15.2 Optimierung unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . 431 15.2.1 Optimierung bei einer Nebenbedingung in Gleichungsform . . . . 433 15.2.2 Optimierung unter Ungleichungsrestriktionen . . . . . . . . . . . 442 15.3 Hinreichende Bedingungen für Extrema . . . . . . . . . . . . . . . . . . 449 15.3.1 Hinreichende Bedingungen für lokale Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . 450 15.3.2 Nachweis der Optimalität durch Randwertvergleich . . . . . . . . 454 15.3.3 Optimierung konvexer Funktionen unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . 461 15.4 Komparative Statik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 15.4.1 Ein Verbrauchsproblem . . . . . . . . . . . . . . . . . . . . . . . 465 15.4.2 Das Envelope-Theorem . . . . . . . . . . . . . . . . . . . . . . . 467 15.4.3 Ein Kostenproblem . . . . . . . . . . . . . . . . . . . . . . . . . . 470 15.4.4 Das Theorem impliziter Funktionen . . . . . . . . . . . . . . . . 472 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 Übungsklausuren 475 Klausur 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 Klausur 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477 Klausur 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 Klausur 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481 Klausur 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 Abbildungen 485 Tabellen 489 Symbole und Abkürzungen 491 Das griechische Alphabet 493 Literatur 495 Index 497 48818_Terveer.indd 10 48818_Terveer.indd 10 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="11"?> Vorwort Vorwort zur fünften Auflage Das vorliegende Lehrbuch soll Ihnen, liebe Studienanfängerinnen und -anfänger der Wirtschaftswissenschaften, eine Einführung in die mathematischen Grundlagen der Analysis und linearen Algebra geben. Es kann entweder als Begleitlektüre einer einbis zweisemestrigen Einführungsveranstaltung in die Wirtschaftsmathematik genutzt und dann „linear“ gelesen werden oder verschiedene Teilveranstaltungen unterstützen, wobei die inhaltlichen Abhängigkeiten in Abbildung 0.1 berücksichtigt werden sollten: ■ Die „Analysis in einer Variablen“ wird in den Kapiteln 2 bis 9 behandelt. ■ Die „Lineare Algebra“ ist Gegenstand der Kapitel 10 bis 13. Für Abschnitte 12.4 und 12.5 sollte man sich etwas mit der Betragsfunktion und den trigonometrischen Funktionen auszukennen und ggf. Abschnitte 6.4 und 6.5 erarbeiten. ■ Die „Analysis in mehreren Variablen“ ist Thema der Kapitel 14 und 15 und erfordert die die Kenntnis von Ableitungen in einer Variablen empfehlenswert ist es deshalb, zuvor die Analysis in einer Variablen erarbeitet zu haben. Bei Aussagen zu Ableitungen, die Vektoren oder Matrizen verwenden, sollte man die entsprechenden Notationen aus Kapitel 12 und 13 kennen. Die meisten Aussagen werden aber explizit auch für Funktionen von zwei Variablen ohne Matrix- und Vektorkalkül formuliert und anhand von dazu passenden Beispielen besprochen. Meine Erfahrung mit Studierenden im ersten Semester zeigt, dass elementare Themen wie Terme und Gleichungen sowie deren Umformungen - alles in allem unerlässliche Basiskompetenzen für die Themen der Analysis und linearen Algebra - in der Schule oft nicht explizit behandelt geschweige denn ausreichend geübt wurden: ■ Zum einen mögen landesspezifische Unterschiede in den inhaltlichen Vorgaben sowie in der Unterrichtsdurchführung für diese Defizite verantwortlich sein. ■ Studierende, die Mathematik „nur“ als Grundkurs oder nicht einmal als Abiturfach hatten, bringen oft besonders wenig Grundlagenkenntnisse mit ins Studium. ■ Schließlich scheint auch der überzogene Gebrauch von CAS-Rechnern in der Schule dazu zu führen, dass die genannten Grundkenntnisse vernachlässigt wurden und an der Universität erst mühsam erarbeitet werden müssen. Neben dem unmittelbaren Nutzen dieser Grundkenntnisse, aber auch anderen der im Lehrbuch behandelten Themen, werden Sie später feststellen, dass die hartnäckige Beschäftigung mit den sehr oft unangenehm komplexen Begriffen und Methoden Ihr Abstraktionsvermögen auch dann im Studium unterstützt, wenn es einmal nicht primär um mathematische Anwendungen geht. Wenn Sie sich jetzt möglicherweise in einer der oben erwähnten „Gruppen mit Nachholbedarf“ wiederfinden, so kann Ihnen das einführende (und neu in dieser Auflage hinzugefügte) Kapitel 1 dieses Lehrbuchs einen Einstieg geben, an den Grundkenntnissen zu arbeiten. Beim ersten Lesen kann dieses Kapitel gegebenenfalls übersprungen werden; sollten Sie aber während der Lektüre der anderen Kapitel mit den entsprechenden Techniken Schwierigkeiten haben, insbesondere eben beim Umformen von Termen, Umgang mit Brüchen und Variablen und dem Auflösen von Gleichungen, so sollten Sie 48818_Terveer.indd 11 48818_Terveer.indd 11 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="12"?> Vorwort 8 9 Analysis in 1 V. 2 3 4 5 6 Funktionen einer Variablen 7.6 Finanzmathematik 7.1 7.2 7.3 7.4 Folgen und Reihen 7.5 Marktgleichgewichte 14 15 Analysis in n V. 10 12 13 Lineare Algebra 11 Lineare Optimierung 1 Grundlagen Abbildung 0.1: Abhängigkeiten zwischen den Themenblöcken im Lehrbuch Kapitel 1 doch noch einmal lesen und insbesondere die Übungsaufgaben darin bearbeiten, ehe Sie mit der Lektüre der anderen Kapitel fortfahren. Überhaupt werden Sie erst durch die eigenständige Bearbeitung von Übungsaufgaben die erforderliche Kompetenz im Umgang mit mathematischen Konzepten erhalten. Das Buch enthält deshalb über 300 Aufgaben (40 mehr als in der vergangenen Auflage) mit unterschiedlichem Schwierigkeitsgrad, gerade bei Standardaufgaben oft mit parallelen Teilaufgaben. Hinzu kommen noch fünf Übungsklausuren. Dateien mit Lösungsvorschlägen zu den Aufgaben sind online frei zugänglich unter https: / / www.wi.uni-muenster.de/ de/ institut/ statistik/ personen/ ingolf-terveer/ zusatzmaterial-mawiwi In der Darstellung wird Ihnen vielleicht auffallen, dass einige Passagen wie im vorliegenden Absatz in zurückgenommener Weise formatiert sind. Es handelt sich dabei oft um Herleitungen, in denen die Grundideen der zugehörigen mathematischen Beweise zusammengefasst sind (welche dann mit dem Symbol enden) oder die einen Ausblick bzw. eine Verallgemeinerung geben. Auch wenn dieses Lehrbuch Mathematik behandelt, so ist es doch in erster Linie nicht für Mathematikerinnen und Mathematiker geschrieben, so dass Sie die genannten Passagen vielleicht erst einmal überschlagen möchten; für die weitere Lektüre bedeutet dies keinen Nachteil. Auch die als Exkurs gekennzeichneten Abschnitte können erst überschlagen bzw. bei Interesse/ Bedarf gelesen werden. Vor allem wurde der nach der zweiten Auflage in den „Analysis-Brückenkurs“ ausgelagerte und dort weiter entwickelte Bereich „Analysis in einer Variablen“ nun wieder eingebunden, so dass alle relevanten Themen jetzt in einem Lehrbuch vereint sind. Dabei wurden viele Passagen beider Lehrbücher auch infolge von Anregungen aus meinen Lehrveranstaltungen überarbeitet und ergänzt, insbesondere erfuhren sämtliche Grafiken und Schaubilder, deren Zahl jetzt bei über 200 liegt, eine Sonderbehandlung. Schließlich wurden durch zahlreiche Querverweise Bezüge zwischen den zusammengeführten Inhalten hergestellt. Bisher aufgefallene Fehler der vierten Auflage wurden beseitigt, neue sind bei der Überarbeitung hoffentlich nicht dazugekommen. Münster, im August 2023 Ingolf Terveer 48818_Terveer.indd 12 48818_Terveer.indd 12 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="13"?> Vorwort Aus den Vorworten früherer Auflagen (August 2005) Dieses Lehrbuch richtet sich an Sie, die Studienanfängerinnen und -anfänger der Wirtschaftswissenschaften. Es ist aus Vorlesungen entstanden, die ich an der Universität Münster für Erstsemester im Fachbereich Wirtschaftswissenschaften halte, und behandelt die Grundlagen der linearen Algebra und der Analysis mit der Ausrichtung auf wirtschaftliche Anwendungen, wie sie in einer einbis zweisemestrigen Veranstaltung vermittelt werden. (. . . ) (August 2007) Mit der zweiten Auflage des Lehrbuches wurde einige Themen aus Kapitel 6 (Folgen und Reihen) zugunsten einer ausführlicheren Behandlung von Gleichgewichtspreisen beschnitten. Damit verbunden findet sich in Kapitel 7 jetzt eine kurze Einführung in die Wohlfahrtsrechnung als Anwendung der Integralrechnung. Kapitel 8 behandelt die Optimierung unter Nebenbedingungen jetzt in einer organischeren Form: zunächst werden die notwendigen Bedingungen behandelt, so dass der Einstieg in die Lagrange-Methode etwas einfacher fallen sollte; die komplizierteren hinreichenden Bedingungen wurden in einem anschließenden Abschnitt zusammengefasst; das Konzept des Randwertvergleichs wurde dabei auf ökonomische Standardsituationen abgestimmt. Neben den etwas gestrafften Übungsaufgaben finden Sie nun drei Übungsklausuren, die jeweils den Inhalt des Buches abdecken und für eine Klausurdauer von 120 bis 180 Minuten konzipiert sind. (. . . ) (Oktober 2012) In der dritten Auflage wurden größere „Umbauten“ vorgenommen (. . . ) ■ In der linearen Algebra ist vor allem der Abschnitt über Vektoren recht umfassend neugestaltet worden, die Konzepte Linearkombination, lineare Unabhängigkeit und Basis wurden deutlicher herausgestellt; zudem findet sich in diesem Kapitel jetzt auch ein Abschnitt über Projektionen. ■ Das Thema Folgen und Reihen wurde um spezifische Aspekte der Finanzmathematik ergänzt. ■ (. . . ) ■ Bei der Optimierung ohne Nebenbedingungen finden Sie jetzt eine kurze Darstellung numerischer Verfahren; bei der Optimierung unter Nebenbedingungen schließlich illustrieren mehr typische Beispiele die Herangehensweise beim Randwertvergleich. (. . . ) Die Aufgaben wurden überarbeitet, ergänzt und finden sich jetzt nach jedem Abschnitt, hervorgehoben durch ? . Wenn Sie den Stoff des Buches systematisch erarbeiten wollen, so empfehle ich Ihnen, die Aufgaben eines jeden Abschnittes zunächst weitgehend zu lösen, bevor Sie den nächsten Abschnitt angehen. Einige Kapitel schließen zusätzlich mit vertiefenden Aufgaben. Ausführliche Lösungen sind im Web-Auftritt zum Buch verfügbar,(. . . ) (Februar 2019) Mit dem neuen Kapitel „Lineare Optimierung“ (Simplex-Algorithmus, Zweiphasenmethode) weist die vierte Auflage eine größere Erweiterung auf. Hierzu wurden auch die Übungsklausuren angepasst. Im Detail gibt es auch in folgenden Teilen inhaltliche Änderungen: 48818_Terveer.indd 13 48818_Terveer.indd 13 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="14"?> Vorwort ■ In Kapitel 4.4 wird die Leibniz-Regel anhand von 3 x 3-Matrizen erklärt und nachfolgend genutzt, um die Determinantenregeln bei Zeilenumformungen zu erläutern. ■ Kapitel 5.5 enthält nun eine kurze Herleitung der Grenzwertformel für die stetige Verzinsung. ■ In Kapitel 7.4 wurden einige Beispiele ersetzt, insbesondere das einführende Beispiel zum Envelope-Theorem in Abschnitt 7.4.1. (. . . ) Die Übungsaufgaben werden in einem zweispaltigen Format dargestellt. Matrizen haben nun runde anstatt eckiger Klammern. (. . . ) 48818_Terveer.indd 14 48818_Terveer.indd 14 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="15"?> 1 Einordnung und Grundlagen Übersicht Zu Beginn wollen wir einige grundlegende mathematische Begriffe und Techniken besprechen, die in der Wirtschaftsmathematik vielfach verwendet werden. 1.1 Einordnung Die Mathematik ist für die Wirtschaftswissenschaften eine Hilfswissenschaft, die immer dann herangezogen wird, wenn sich im ökonomischen Kontext ein quantitatives Problem ergibt. Dabei nimmt die Mathematik in der Problemlösung eine operative Rolle ein, wie sie in Abbildung 1.1 dargestellt wird. Man versucht zunächst, das konkrete Problem in ein mathematisches Modell zu überführen, welches gleich einer Karikatur die wesentlichen Aspekte des Problems erfasst. Aus dem realen Problem wird somit ein mathematisches Problem, für welches die Mathematik ein Verfahren bzw. einen Algorithmus zur Verfügung stellt, oft unter Verwendung informatischer Techniken, mit welchem zunächst eine mathematische Aussage gewonnen wird. Diese Ausssage muss im nächsten Schritt in das reale Problem zurücktransportiert werden. Die gewonnene Antwort wird dann dahingehend geprüft, ob sie für die Problemstellung eine zufrieden stellende Lösung ist. Manchmal stellt sich heraus, dass dies nicht der Fall ist, etwa weil eine wichtige Anforderung im realen Problem übersehen wurde. Dann beginnt man von neuem mit einer konkretisierten Problemstellung, passt das mathematische Modell an, findet eine modifizierte mathematische Aussage hierzu und überträgt diese wieder zurück in die Realität. Diese Schritte müssen oft mehrfach iteriert werden, wie wir im folgenden Beispiel illustrieren: Beispiel 1.1 (Produktmengenplanung) Für ein Produkt liegen Bestellungen an fünf aufeinanderfolgenden Tagen vor: Tag 1 2 3 4 5 Absatz 4 12 11 11 6 [1] Problemstellung: Das Produkt kann täglich produziert und auch für den Absatz an einem folgenden Tag gelagert werden, dabei können täglich jeweils höchstens 10 Stück produziert und gelagert werden. Angenommen wird, dass das Lager am Tag 1 leer ist. Es fällt auf, dass an den Tagen 2 bis 4 mehr benötigt wird als produziert werden kann, so dass am Tag 1 auch für das Lager und nicht nur für die Nachfrage am Tag 1 produziert werden muss. Zu klären ist hier, wieviele Einheiten tatsächlich täglich hergestellt werden müssen. Im folgenden soll die Lösungsfindung anhand des Schemas in Abbildung 1.1 beschrieben werden: [2] Mathematisches Modell: Dazu gehören gehören neben den Tagesabsätzen 48818_Terveer.indd 15 48818_Terveer.indd 15 18.07.2023 11: 47: 06 18.07.2023 11: 47: 06 <?page no="16"?> 16 1 Einordnung und Grundlagen 1. Problemstellung 2. Mathematisches Modell 4. Antwort 3. Mathematische Aussage Abbild math. Verfahren Interpretation Prüfung Realität Theorie Abbildung 1.1: Operative Rolle der Wirtschaftsmathematik noch „Entscheidungsvariablen“ p 1 , . . . , p 5 für die Tagesproduktion sowie Variablen ℓ 1 , . . . , ℓ 5 , welche den Lagerbestand am Ende von Tag 1,. . . ,5 beschreiben. Die Lagerbestände ändern sich dabei durch Auffüllen mit der Produktion und Abgreifen der Absatzmenge. Konkret gilt: ℓ 1 = p 1 − 4 ℓ 2 = ℓ 1 + p 2 − 12 ℓ 3 = ℓ 2 + p 3 − 11 ℓ 4 = ℓ 3 + p 4 − 11 ℓ 5 = ℓ 4 + p 5 − 6 [3] Mathematische Aussage: Wir versuchen nun ein möglichst einfaches Verfahren: An jedem Tag wird die maximal mögliche Menge hergestellt, die mathematische Aussage hierzu ist p 1 = · · · = p 5 = 10; damit ergeben sich die Lagerbestände ℓ 1 = 10 − 4 = 6 ℓ 2 = 6 + 10 − 12 = 4 ℓ 3 = 4 + 10 − 11 = 3 ℓ 4 = 3 + 10 − 11 = 2 ℓ 5 = 2 + 10 − 6 = 6 [4] Antwort: Die Auftragserbringung ist durch maximale Produktion möglich, die maximale Lagerkapazität wird nicht überschritten. Die Prüfung der Antwort ergibt, dass das Lager am Ende nicht leer ist, was zusätzliche und vermeidbare Kosten verursacht. [1] Problemstellung: In der bisherigen Problemstellung soll das Lager am Ende ebenfalls leer sein, um vermeidbare Kosten zu reduzieren. [2] Mathematisches Modell: das bestehende Modell wird um eine Bedingung an ℓ 5 erweitert: ℓ 1 = p 1 − 4 ℓ 2 = ℓ 1 + p 2 − 12 ℓ 3 = ℓ 2 + p 3 − 11 ℓ 4 = ℓ 3 + p 4 − 11 ℓ 5 = ℓ 4 + p 5 − 6 ℓ 5 = 0 [3] Mathematische Aussage: Man verringert die Produktion am letzten Tag so, dass das Lager leer ist, indem am letzten Tag 6 Einheiten weniger produziert werden, die restlichen Produktionen bleiben erhalten: p 1 = p 2 = p 3 = p 4 = 10 , p 5 = 6. Daraus ergeben sich die Lagerbestände 48818_Terveer.indd 16 48818_Terveer.indd 16 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="17"?> 1.1 Einordnung 17 ℓ 1 = 10 − 4 = 6 ℓ 2 = 6 + 10 − 12 = 4 ℓ 3 = 4 + 10 − 11 = 3 ℓ 4 = 3 + 10 − 11 = 2 ℓ 5 = 2 + 4 − 6 = 0 [4] Antwort: Durch Ausschöpfen der Produktionskapazität an Tag 1,. . . ,4 und eine Restproduktion von vier Einheiten an Tag 5 können die Absatzmengen erfüllt werden und das Lager ist am Ende leer. Die Prüfung der Antwort führt zu der Frage, ob die Lagerhaltungskosten auch an den anderen Tagen nicht noch reduziert werden können. [1] Problemstellung: Es wird festgestellt, dass die Einlagerung einer Einheit zu 5 Geldeinheiten pro Tag erfolgt. Die bisher gefundene Lösung hat dann Lagerkosten 5 · 6 + 5 · 4 + 5 · 3 + 5 · 2 + 5 · 0 = 65 Geldeinheiten. In Ergänzung suchen wir nun nach Tagesproduktionen, welche die gesamten Lagerkosten verringern bzw. möglichst minimieren. [2] Mathematisches Modell: Wir suchen nach einer Lösung des bisherhigen Problems, für die die Gesamtkosten 5 ℓ 1 + 5 ℓ 2 + 5 ℓ 3 + 5 ℓ 4 + 5 ℓ 5 minimal werden. [3] Mathematische Aussage: Für Optimierungsprobleme dieser Art steht das Simplex-Verfahren zur Verfügung, vgl. Kapitel 11. Dieses berechnet für die Tagesproduktionen die folgende Lösung, welche die Lagerkosten minimiert: p 1 = 8 , p 2 = p 3 = p 4 = 10 , p 5 = 6. Die Lagermengen sind dann ℓ 1 = 8 − 4 = 4 ℓ 2 = 4 + 10 − 12 = 2 ℓ 3 = 2 + 10 − 11 = 1 ℓ 4 = 1 + 10 − 11 = 0 ℓ 5 = 0 + 6 − 6 = 0 Der Minimalwert ist 5 · 4 + 5 · 2 + 5 · 1 + 5 · 0 + 5 · 0 = 35. [4] Antwort: Die minimalen Lagerkosten betragen 35. Die vorgegebene Problemstellung ist damit beantwortet. Weitere Fragen könnten die Sensitivität dieser Lösung betreffen, z.B. die Änderung des Optimalwertes und der Optimallösung bei Anpassung von Bestimmungsgrößen wie den Absatzmengen oder den Tages-Lagerkosten. Hierauf soll jetzt nicht weiter eingegangen werden. Das im Beispiel vorgestellte Problem gehört zu einer Reihe von Themen der Wirtschaftswissenschaften, in denen diverse Bereiche der Mathematik Anwendung finden vgl. Abbildung 1.2 . Der Übersicht kann man auch entnehmen, dass innerhalb der mathematischen Themenbereiche gewisse Grundlagen essentiell sind, nämlich die Lineare Algebra und die Analysis, die zudem auch direkt in den Wirtschaftswissenschaften benötigt werden und daher mit Recht am Anfang eines Wirtschaftsstudium stehen sollten. Deshalb stellt dieses Buch genau die Methoden und Konzepte der Analysis und linearen Algebra bereit. Ein Teil dieser Konzepte und Techniken wurde bereits in der Schule behandelt, allerdings in erheblich einfacherer Form, und auch zahlreiche grundlegenden Sprechweisen und Hilfsmittel werden nach meinen Erfahrungen dort nicht mehr in der Weise verinnerlicht, dass man an der Hochschule darauf bauen kann. Gerade in der Analysis werden etwa Techniken wie Termumformungen, das Lösungen von Gleichungen und Ungleichungen, aber auch die Logik von Aussagen und das grundlegende Arbeiten mit Mengen in erheblichem Umfang eine Rolle spielen und das 48818_Terveer.indd 17 48818_Terveer.indd 17 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="18"?> 18 1 Einordnung und Grundlagen BWL/ VWL Bereiche der Mathematik math. Grundlagen Produktionsplanung Verschnittprobleme Transportprobleme Qualitätskontrolle Lagerhaltung Bediensysteme Finanzmärkte Marketing Oligopole Ökonometrie Optimierung WS-Rechnung Statistik Spieltheorie Zeitreihenanalyse Lineare Algebra Analysis Abbildung 1.2: Bereiche der Wirtschaftswissenschaften, in denen mathematische Verfahren zur Anwendung kommen Verständnis und die Nutzung der eigentlichen Konzepte unterstützen. Deshalb sollen diese grundlegenden Themen zunächst noch einmal besprochen werden. 1.2 Mengen Mengen fassen Objekte (oft Zahlen) zu Bündeln zusammen. Die Objekte, die in einer Menge liegen, heißen Elemente der Menge. Mengen sind im Sachzusammenhang oft vorgegeben und es gibt für die gängigen Mengen eine feste Symbolik, wie z.B. die Menge N der natürlichen Zahlen oder die Menge R der reellen Zahlen oder aber Intervalle [ a ; b ]. Im Sachzusammenhang interessiert man sich oft für Elemente der Menge, die nicht genau bestimmt sind, sondern von denen man nur weiß oder annimmt, dass sie bestimmte Eigenschaften haben. Ist beispielsweise D der Definitionsbereich einer Gewinnfunktion, so möchte man wissen, für welches Element in D der Gewinn maximal wird. Solange diese Elemente aber nicht bekannt sind, kann man keine konkreten Werte verwenden, sondern verwendet für sie einen Platzhalter, den man Variable nennt; am häufigsten wird x als Variable verwendet (z.B. für das Argument einer Funktion f ( x )). Die Systematik von Begriffen und Sachverhalten wird mit Variablen meist wesentlich verbindlicher und auch effizienter formuliert als unter Verwendung der korrekten Werte für diese Begriffe oder Sachverhalte. Deshalb werden wir immer wieder auf Variablen zurückgreifen, und es geht auch schon gleich los: Liegt ein Objekt x in einer Menge A oder enthält A das Objekt x , so schreibt man dafür x ∈ A . Enthält A das Element nicht, so schreibt man x ̸∈ A . Mengen werden meist mit Großbuchstaben, ihre Elemente mit Kleinbuchstaben bezeichnet. Einige ausgezeichnete Mengen erhalten besondere meist doppelt-gestrichene Symbole wie die Menge N der natürlichen Zahlen oder aber die Lösungsmenge L einer oder mehrerer bestimmter Gleichungen. Beispiele für Mengen in der Ökonomie sind Definitions- und Wertebereiche ökonomisch motivierter Funktionen oder Bereiche, in denen Funktionen bestimmte Eigenschaften haben, z.B. die Gewinnzone oder die Phasen eines Ertragsgesetzes. Mengen haben oft die Form von Intervallen reeller 48818_Terveer.indd 18 48818_Terveer.indd 18 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="19"?> 1.2 Mengen 19 Zahlen, worauf wir später noch eingehen. In der Wahrscheinlichkeitsrechnung bündeln Mengen bestimmte Ergebnisse von Zufallsexperimenten, diese Mengen nennt man dann Ereignisse. Die Darstellung einer Menge erfolgt oft durch Aufzählen der Elemente oder Beschreibung der Eigenschaften der Elemente in der Menge innerhalb des Klammerpaars { , } . Beispiel 1.2 ■ A = { 0 , 2 , 4 , 6 , 8 , 10 } . ■ N 0 : = { 0 , 1 , 2 , 3 , . . . } , die Menge der natürlichen Zahlen inklusive Null, ein typisches Beispiel, dass die Aufzählung aller Elemente oft nicht möglich ist, sondern durch Angabe „typischer“ Elemente zusammen mit . . . die Systematik erklärt wird. Lässt man 0 weg, so bezeichnet man diese Menge mit N, d.h. N = { 1 , 2 , 3 , . . . } . ■ B = { 10 , 0 , 8 , 2 , 4 , 6 } stimmt mit A überein, weil anders als bei Tupeln die Reihenfolge der Aufzählung der Elemente bei Mengen keine Rolle spielt. Die Elemente einer Menge können auch wiederholt aufgezählt werden. ■ C = { 0 , 2 , 4 , . . . } , die Menge aller geraden natürlichen Zahlen inklusive Null. Die Menge, die überhaupt kein Element enthält, wird folgerichtig als { } notiert, sie heißt leere Menge. Eine andere Notation dafür ist ∅ . Die obigen Beispiele zählen die Elemente der Mengen auf. Vorteilhafter ist es, die in der Menge liegende Systematik durch die Verwendung von Variablen und Bedingungen, welche diese Variablen erfüllen müssen, in einer der folgenden Formen zu beschreiben: ■ M = { „Variable“ ∈ „Wertebereich“ : „Bedingung(en) für die Variable“ } . ■ oder M = { „Term mit Variable“ : „Variable“ ∈ „Wertebereich“ } . ■ oder M = { „Term mit Variable“ : „Bedingungen für die Variable“ } . Dabei ist „Wertebereich“ meist ein Zahlenbereich wie N 0 . In der Wahrscheinlichkeitsrechnung ist „Wertebereich“ oft die Grundgesamtheit des Zufallsexperimentes. Die beschreibende Darstellung rechts oder links von „: “ benötigt meist Variablen, Terme und Gleichungen oder Ungleichungen, auf die wir später genauer eingehen. Beispiel 1.3 ■ C = { 0 , 2 , 4 , . . . } = { n ∈ N 0 : n = 2 m für ein m ∈ N 0 } = { 2 m : m ∈ N 0 } . Dafür schreibt man auch C = 2N 0 (alle Elemente aus N 0 werden mit 2 multipliziert). ■ D = { n ∈ N 0 : es gibt m ∈ N 0 mit n = 2 m + 1 } = { 2 · 0 + 1 , 2 · 1 + 1 , . . . } = { 1 , 3 , 5 , . . . } ist die Menge aller ungeraden natürlichen Zahlen. Hier könnte man auch schreiben D = 2N 0 + 1 oder D = C + 1 mit der obigen Menge C . ■ E = { x ∈ N 0 : x ≥ 4 , x ≤ 18 } = { 4 , 5 , 6 , . . . , 16 , 17 , 18 } . Durch Komma getrennte Bedingungen müssen gleichzeitig gelten. ■ Statt des Kommas in der Bedingung kann auch auch das logische „und“ oder das Symbol ∧ verwendet werden, z.B. F = { x ∈ N 0 : x ≥ 6 ∧ x ≤ 8 } = { 6 , 7 , 8 } . ■ G = { x ∈ N 0 , x ≥ 15 ∧ x ≤ 20 } = { 15 , 16 , 17 , 18 , 19 , 20 } . ■ H = { x ∈ N 0 : x ≤ 6 oder x ≥ 9 } = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 9 , 10 , 11 . . . } . Das logische 48818_Terveer.indd 19 48818_Terveer.indd 19 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="20"?> 20 1 Einordnung und Grundlagen „oder“ wird mit dem Symbol ∨ geschrieben, d.h. H = { x ∈ N 0 : x ≤ 6 ∨ x ≥ 9 } Mengen stehen oft in einer Teilmengenbeziehung zueinander, die auch Inklusion genannt wird. Die Teilmengenbeziehung A ⊆ B bedeutet, dass die Elemente einer Menge A sämtlich auch in B liegen. Eine strikte Inklusion wird als A ⊂ B oder A ⊊ B geschrieben, d.h. dann enthält B Elemente, die nicht in A liegen. Beispiel 1.4 Für die oben genannten Mengen haben wir folgende Inklusionen: ■ A = { 0 , 2 , 4 , 6 , 8 , 10 } ⊂ C = { 0 , 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , . . . } . Natürlich gilt hier auch A ⊆ C , dies unterschlägt aber die Information, dass es Elemente in C gibt (z.B. 12), die nicht in A liegen. Dass die Teilmengenbeziehung A ⊆ B gilt, prüft man, indem man nachweist, dass jedes Element von A auch in B vorliegt. Hier ist das durch visuelle Markierung illustriert. Ergänzend mit den Aussagen 12 ∈ B und 12 / ∈ A ergibt sich die strikte Inklusion A ⊂ B . ■ A = { 0 , 2 , 4 , 6 , 8 , 10 } ⊂ N 0 = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , . . . } . Dies gilt nicht nur für A , sondern für jede der Mengen B, C, D, E, F, G, H . ■ F = { 6 , 7 , 8 } ⊂ E = { 4 , 5 , 6 , 7 , 8 , 9 , . . . , 16 , 17 , 18 } ■ Für jede Menge M gilt {} ⊆ M . Ist M ̸ = {} , so ist die Inklusion strikt, d.h. es gilt {} ⊂ M , denn es gibt ein Element in M und dieses ist sicher nicht in {} . Eine banale, aber praktisch sehr wichtige Eigenschaft ist, dass zwei Mengen M 1 , M 2 genau dann gleich sind, wenn beide Inklusionen M 1 ⊆ M 2 und M 2 ⊆ M 1 gelten. Die prominentesten Mengen, die in der Wirtschaftsmathematik (aber nicht nur dort! ) verwendet werden sind neben den bereits genannten natürlichen Zahlen N bzw. N 0 ■ Die Menge Z der ganzen Zahlen, Z = { 0 , − 1 , 1 , − 2 , 2 , − 3 , 3 , . . . } . ■ Die Menge Q der rationalen Zahlen, Q = { p q : p ∈ Z ∧ q ∈ N } . Jede rationale Zahl kann als nichtabbrechende periodische Dezimalzahl geschrieben werden, z.B. 17 = 0 , 142857 oder 2 = 1 , 9. ■ Die Menge R der reellen Zahlen. Diese entsteht, wenn man die rationalen Zahlen Q, also die nichtabbrechenden periodischen Dezimalzahlen um die nichtabbrechenden nichtperiodischen Dezimalzahlen erweitert, zu denen z.B. Lösungen von quadratischen Gleichungen wie x 2 = 2 oder die Kreiskonstante π gehören. ■ Die Menge C der komplexen Zahlen. Bekanntlich hat die Gleichung x 2 = − 1 keine reelle Lösung. Nimmt man an, dass diese Gleichung doch eine Lösung hat, die mit i abgekürzt wird (in der Physik verwendet man statt dessen j , weil i oder I als Symbol für die Stromstärke genutzt wird), so gilt also i 2 = − 1. Es ist klar, dass i keine reelle Zahl ist, aber man kann mit ihr rechnen wie mit reellen Zahlen, wenn die Gleichung i 2 = − 1 ausgenutzt wird. Eine komplexe Zahl hat dann die Form a + b · i , wobei a, b ∈ R. Man kann komplexe Zahlen addieren, z.B. (2+3 i )+(( − 1)+2 i ) = (2+( − 1))+(3+2) i = 1+5 i und multiplizieren, z.B. (2+3 i )(( − 1)+2 i ) = 2 · ( − 1) + 3 · 2 · i 2 + (2 · 2 + ( − 1) · 3) i = 2 · ( − 1) − 3 · 2 · +(2 · 2 + ( − 1) · 3) i = − 8 + 1 · i , sogar Divisionen und Kehrwerte sind möglich. Zwischen den genannten Mengen besteht folgende Inklusionsbeziehung: N ⊂ N 0 ⊂ Z ⊂ Q ⊂ R ⊂ C. In der Wirtschaftsmathematik sind vor allem die reellen Zahlen von Bedeutung, weil die Werte ökonomischer Größen sich mit ihnen darstellen lassen. Besondere Teilmengen der rellen Zahlen sind (mit a, b ∈ R) 48818_Terveer.indd 20 48818_Terveer.indd 20 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="21"?> 1.2 Mengen 21 [1] abgeschlossene Intervalle ■ [ a ; b ] : = { x ∈ R : x ≥ a ∧ x ≤ b } , [2] offene Intervalle ■ ] a ; b [: = { x ∈ R : x > a ∧ x < b } , [3] halboffene Intervalle ■ [ a ; b [: = { x ∈ R : x ≥ a ∧ x < b } , ■ ] a ; b ] : = { x ∈ R : x > a ∧ x ≤ b } , [4] uneigentliche abgeschlossene Intervalle ■ [ a ; ∞ [: = { x ∈ R : x ≥ a } , ■ ] − ∞ , b ] = { x ∈ R : x ≤ b } , [5] uneigentliche offene Intervalle ■ ] a ; ∞ [: = { x ∈ R : x > a } , ■ ] − ∞ ; b [: = { x ∈ R : x < b } . Für die Größe von Mengen gibt es mehrere unterscheidende Sprechweisen: ■ Eine Menge heißt endlich, wenn sie nur endlich viele Elemente enthält. Die Kardinalität einer endlichen Menge M ist die Anzahl ihrer Elemente, sie wird mit # M oder | M | bezeichnet. ■ Eine Menge heißt abzählbar, wenn es eine Zuordnung der natürlichen Zahlen N 0 = zu den Elementen gibt, so dass jedes Element wenigstens eine Zahl erhält und zwei verschiedene Elemente stets verschiedene Zahlen haben. Insofern sind auch endliche Mengen abzählbar. ■ Eine Menge heißt überabzählbar, wenn sie weder endlich noch abzählbar ist. Beispiel 1.5 [1] Die in den obigen Beispielen genannten Mengen A , B , E , F , G sind endlich mit # A = # B = # G = 6, # E = 15 und # F = 3. Die Mengen C, D, H sowie N, N 0 , Z, Q, R und C sind nicht endlich. [2] Die Menge N 0 selber ist abzählbar, jedes Element ist seine eigene Ordnungszahl. Auch die Menge C der geraden natürlichen Zahlen (s.o.) kann über die Darstellung 2 n auf die Ordnungszahlen 0 , 1 , 2 , . . . zurückgeführt werden und ist deshalb abzählbar. Gleiches gilt für die Menge D der ungeraden natürlichen Zahlen. Auch die rationalen Zahlen Q sind abzählbar. Eine mögliche Abzählung ist Q = { 0 , 1 , ± 12 , ± 21 , ± 13 , ± 2 2 , ± 31 , ± 14 , ± 23 , ± 32 , ± 41 , . . . } . Dabei werden Brüche ± p q mit einer festen Summe p + q gemeinsam systematisch aufgezählt. [3] Beispiele überabzählbarer Mengen sind R, C und alle Intervalle, deren linke Intervallgrenze kleiner als die rechte Intervallgrenze ist. Beispielsweise ist das Intervall ]0; 1[ überabzählbar. Wäre es das nicht, so könnte man seine Elemente abzählen als { x 1 , x 2 , x 3 , x 4 , . . . } . Jedes x i lässt sich als Dezimalzahl mit unendlich vielen Ziffern darstellen. Hieraus konstruiert man eine weitere Dezimalzahl z , deren i -te Ziffer 1 ist wenn die i -te Ziffer von x i ungleich 1 ist, ansonsten sei diese Ziffer 2. Das bedeutet aber, dass die i -te Ziffer von z und die i -te Ziffer von x i verschieden sind, so dass auch z und x i nicht übereinstimmen. Mit z hat man dann eine weitere Zahl im Intervall ]0; 1[ gefunden, die mit keinem der x i übereinstimmt und deshalb nicht in der aufgezählten Menge { x 1 , x 2 , . . . } enthalten ist. Deshalb kann ]0; 1[ nicht abzählbar sein. Dieser indirekte Beweis geht auf den Mathematiker Georg Cantor zurück. 1.2.1 Operationen mit Mengen Aus Mengen lassen sich neue Mengen „konstruieren“ mit den Mengen-Operationen Vereinigung, Schnitt und Komplement. Dies kann auch mit Hilfe so genannter Venn-Diagramme illustriert werden vgl. Abbildung 1.3 48818_Terveer.indd 21 48818_Terveer.indd 21 18.07.2023 11: 47: 07 18.07.2023 11: 47: 07 <?page no="22"?> 22 1 Einordnung und Grundlagen A B A B A B A B A ∨ B A ∧ B A \ B B c = Ω \ B Abbildung 1.3: Venn-Diagramme für Vereinigung, Schnitt und Komplement ■ Die Vereinigung A ∪ B zweier Mengen A , B besteht aus allen Elementen, die in A oder in B sind, als Formel A ∪ B = { x : x ∈ A ∨ x ∈ B } . Das Symbol ∨ wird auch Disjunktion genannt und verbindet zwei logische Ausdrücke (s.u.) mit „oder“. ■ Der Schnitt A ∩ B zweier Mengen A, B enthält alle Elemente, die sowohl in A als auch in B sind, als Formel A ∩ B = { x : x ∈ A ∧ x ∈ B } . Das Symbol ∧ wird auch Konjunktion genannt und verbindet zwei logische Ausdrücke mit „und“. ■ Das relative Komplement A \ B zweier Mengen A, B enthält alle Elemente, die in A , aber nicht in B sind, als Formel A \ B = { x : x ∈ A ∧ x / ∈ B } . Mit Bezug auf eine Obermenge Ω von A schreibt man auch A c oder A für das Komplement Ω \ A . Mit dieser Notation gilt für das relative Komplement A \ B = A ∩ B c . Beispiel 1.6 Mit den Mengen A, B, C, D, E, F, G, N 0 aus den obigen Beispielen gilt ■ E ∪ G = { 4 , 5 , . . . , 17 , 18 }∪{ 15 , 16 , 17 , 18 , 19 , 20 } = { 4 , 5 , · · · , 15 , 16 , 17 , 18 , 19 , 20 } ■ C ∪ D = { 0 , 2 , 4 , . . . } ∪ { 1 , 3 , 5 , . . . } = { 0 , 1 , 2 , 3 , 4 , 5 , . . . } = N 0 ■ D ∩ F = { 0 , 2 , 4 , . . . } ∩ { 4 , 5 , 6 , . . . , 16 , 17 , 18 } = { 4 , 6 , 8 , . . . , 16 , 18 } ■ F \ G = { 4 , 5 , 6 , 7 , 8 , 9 , . . . , 16 , 17 , 18 } \ { 6 , 7 , 8 } = { 4 , 5 , 9 , 10 , 11 , . . . , 16 , 17 , 18 } Verbindet man die Mengenoperationen miteinander, sind folgende Regeln zu beachten (hierfür seien A, B, C beliebige Teilmengen einer Menge Ω so dass z.B. A c = Ω \ A ): Kommutativgesetze A ∪ B = B ∪ A A ∩ B = B ∩ A Assoziativgesetze A ∪ ( B ∪ C ) = ( A ∪ B ) ∪ C A ∩ ( B ∩ C ) = ( A ∩ B ) ∩ C Distributivgesetze A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) De-Morgan-Gesetze ( A ∪ B ) c = A c ∩ B c ( A ∩ B ) c = A c ∪ B c Die Herleitung des ersten Distributivgesetzes und des ersten De-Morgan-Gesetzes mit Venn-Diagrammen ist in Abbildung 1.4 dargestellt. 1.2.2 Aussagen und Aussageformen In der Mathematik spielen logische Ausdrücke eine Rolle, denen ein bestimmter Wahrheitswert zugewiesen werden kann, manchmal unter zusätzlichen Annahmen. Die möglichen Wahrheitswerte sind „wahr“ bzw. „falsch“. Besitzt ein logischer Ausdruck unmittelbar einen dieser Wahrheitswerte, so nennt man ihn Aussage. Beispiel 1.7 Der Ausdruck „3 = 7 − 4“ist eine wahre Aussage, „3 = 7 · 2“ ist eine falsche Aussage. Im Unterschied zum Begriff Aussage versteht man unter einer Aussageform einen logischen Ausdruck, der noch Variablen beinhaltet, so dass der Ausdruck erst durch Belegung aller Variablen mit konkreten Werten zu einer Aussage wird. Für die Variablen 48818_Terveer.indd 22 48818_Terveer.indd 22 18.07.2023 11: 47: 08 18.07.2023 11: 47: 08 <?page no="23"?> 1.2 Mengen 23 A B C A B C A B C A B A B A B ∪ C A ∩ ( B ∪ C ) A ∪ B ( A ∪ B ) c A B C A B C A B C A B A B A B A ∩ B A ∩ C ( A ∩ B ) ∪ ( A ∩ C ) A c B c A c ∩ B c Abbildung 1.4: Venn-Diagramme für A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) (links) und ( A ∪ B ) c = A c ∩ B c (rechts) müssen dabei konkrete Definitionsbereiche gegeben sein, in den meisten Anwendungen sind dies R oder eine Teilmenge von R. Abhängig von der Belegung der Variablen können also prinzipiell Aussagen mit den Wahrheitswerten „wahr“ und „falsch“entstehen. Je nachdem, was möglich ist, nennt man eine Aussageform ■ allgemeingültig, wenn sie für jede Belegung aller in ihr auftretenden Variablen aus ihren Definitionsbereichen wahr ist, ■ erfüllbar, wenn es Belegungen aller Variablen gibtt, so dass sie wahr ist, ■ widerlegbar, wenn es Belegungen („Gegenbeispiele“), für die sie falsch ist, ■ unerfüllbar, wenn sie für jede Belegung zu einer falschen Aussage wird. Statt unerfüllbar sagt man dann auch unlösbar. Beispiel 1.8 [1] Die Gleichung x + 6 = 2( x + 3) − x ist allgemeingültig in R, d.h. mit R als Definitionsbereich für x . Denn die rechte Seite der Gleichung vereinfacht sich zu 2( x + 3) − x = 2 x + 6 − x = x + 6, was die linke Seite ist. [2] Die Gleichung 3 = 7 − x ist erfüllbar, denn mit der Belegung x = 4 stimmt die rechte Seite 7 − x = 7 − 4 = 3 mit der linken Seite überein, die Gleichung wird also damit zu einer wahren Aussage. [3] Die Gleichung 3 + x = 7 − y ist erfüllbar, denn sie wird z.B. mit x = 4 , y = 0 zu einer wahren Aussage. Tatsächlich wird die Gleichung mit beliebigem x und y = 4 − x zu einer wahren Aussage. Ersetzt man also nur y durch 4 − x , so wird die entstehende Aussageform 3 + x = 7 − (4 − x ) allgemeingültig. [4] Die Gleichung 3 = 7 − x ist auch widerlegbar, denn z.B. mit der Belegung x = 0 stimmt die rechte Seite 7 − x = 7 − 0 = 4 nicht mit der linken Seite überein. [5] Die Gleichung 3 = 4 + x 2 ist unerfüllbar in R. Sie ist allerdings erfüllbar in C, der Menge der komplexen Zahlen mit x = ± i . Sie haben gesehen, wie Aussageformen zu wahren Aussagen werden, wenn Variablen bestimmte Werte annehmen. Wird eine Aussageform durch das beliebige Belegen einer Variablen x zu einer allgemeingültigen Aussageform, so schreibt man dies durch Voranstellen des sogenannten Allquantors ∀ x . Wird eine Aussageform zu einer allgemeingültigen Aussageform für wenigstens eine Belegung einer Variable x , so kann man dies durch Voranstellen des Existenzquantors ∃ x darstellen. Wird dadurch die einzige Variable in der Aussageform gebunden, so entsteht jeweils eine Aussage. 48818_Terveer.indd 23 48818_Terveer.indd 23 18.07.2023 11: 47: 08 18.07.2023 11: 47: 08 <?page no="24"?> 24 1 Einordnung und Grundlagen Beispiel 1.9 [1] Die Aussageform 3 = 7 − x ist erfüllbar in x ∈ R, d.h. ∃ x ∈ R : 3 = 7 − x ist eine wahre Aussage. [2] Die Aussageform x + 6 = 2( x + 3) − x ist allgemeingültig in x ∈ R, d.h. ∀ x ∈ R : x + 6 = 2( x + 3) − x . [3] Es können auch mehrere Variablen durch verschiedene Quantoren gebunden werden, wobei die Aussageformen „von innen nach außen“geprüft werden: Betrachtet man die Aussageform 3 + x = 7 − y , so ist ∃ y : 3 + x = 7 − y erfüllbar für jedes x ∈ R, d.h. ∀ x ∈ R : ∃ y ∈ R : 3 + x = 7 − y ist eine wahre Aussage. Die Doppelpunkte hinter den Quantoren werden zuweilen weggelassen, ebenso der Definitionsbereich, für den die Aussageform erfüllbar bzw. allgemeingültig sein soll, wenn dieser aus dem Zusammenhang hervorgeht, z.B. als Menge der rellen Zahlen. Logische Ausdrücke wie Aussageformen und Aussagen werden mit logischen Operationen verbunden. Dabei kommen die Konjunktion, d.h. die „und“-Verknüpfung ∧ , die Disjunktion, d.h. die „oder“-Verknüpfung ∨ und die Negation zur Anwendung. Beispiel 1.10 Es sei x eine Variable mit Definitionsbereich R. [1] Die Aussageform x ≥ 0 ∧ x ≤ 1 beschreibt das Intervall [0; 1]. Man kann auch sagen, dass die Aussageformen x ≥ 0 ∧ x ≤ 1 und x ∈ [0; 1] für jede Belegung von x den gleichen Wahrheitswert haben. [2] Die Aussageform x ≥ 0 hat für jede Belegung von x den gleichen Wahrheitswert wie x < 0. Logische Ausdrücke können mit logischen Operationen zu neuen Ausdrücken zusammengesetzt werden, wie schon im letzten Beispiel gesehen. Dabei gibt es Rechenregeln, mit denen diese Ausdrücke zusammengefasst werden können. Hierzu seien a, b, c logische Ausdrücke Kommutativgesetze a ∨ b = b ∨ a a ∧ b = b ∧ a Assoziativgesetze a ∨ ( b ∨ c ) = ( a ∨ b ) ∨ c a ∧ ( b ∧ c ) = ( a ∧ b ) ∧ c Distributivgesetze a ∧ ( b ∨ c ) = ( a ∧ b ) ∨ ( a ∧ c ) a ∨ ( b ∧ c ) = ( a ∨ b ) ∧ ( a ∨ c ) De-Morgan-Gesetze - ( a ∨ b ) = a ∧ b - ( a ∧ b ) = a ∨ b Sie sehen an diesen Regeln auch, dass die Negation vorrangig aufgelöst wird. Kommen Ihnen diese Regeln bekannt vor? Das liegt daran, dass sie in analoger Weise bereits für Mengen formuliert wurden. Betrachtet man nämlich Mengen A , B und zugehörige logische Ausdrücke x ∈ A und x ∈ B , so gilt [1] x ∈ A ∨ x ∈ B beschreibt genau die Elemente der Menge A ∪ B , d.h. hat dieselben Wahrheitswerte wie x ∈ A ∩ B , [2] x ∈ A ∧ x ∈ B beschreibt genau die Elemente der Menge A ∩ B , d.h. hat dieselben Wahrheitswerte wie x ∈ A ∩ B , [3] - ( x ∈ A ) beschreibt genau die Elemente der Menge A c , d.h. hat dieselben Wahrheitswerte wie x ∈ A c . In mathematischen Ausdrucksweisen finden Sie auch oft die Äquivalenz ⇔ und die die Implikation ⇒ . Mit den bisherigen Bezeichnungen kann man auch diese Begriffe formal festlegen: 48818_Terveer.indd 24 48818_Terveer.indd 24 18.07.2023 11: 47: 08 18.07.2023 11: 47: 08 <?page no="25"?> 1.2 Mengen 25 ■ Ein logischer Ausdruck a impliziert impliziert einen weiteren logischen Ausdruck b , geschrieben a ⇒ b , wenn der logische Ausdruck a ∨ b allgemeingültig ist. ■ Zwei logische Ausdrücke a, b sind äquivalent, geschrieben a ⇔ b , wenn a ⇒ b und b ⇒ a allgemeingültig sind. Um eine Implikation a ⇒ b auf Allgemeingültigkeit zu prüfen, nimmt man an, dass der logische Ausdruck a wahr bzw. allgemeingültig ist und rechnet nach, dass dann auch b wahr bzw. allgemeingültig ist. Für eine Äquivalenz a ⇔ b muss man entsprechend prüfen, dass a ⇒ b und b ⇒ a wahr bzw. allgemeingültig sind. Beispiel 1.11 Es sei x eine reelle Variable [1] Der logische Ausdruck ∀ x : x ≤ 0 ⇒ x < 1 stimmt überein mit dem logischen Ausdruck ∀ x : - ( x ≤ 0) ∨ x < 1. Nach den Regeln für die Negation stimmt dieser Ausdruck für jede Belegung von x mit x > 0 ∨ x < 1 überein. Dieser ist aber offensichtlich allgemeingültig, jedes x ∈ R liegt oberhalb von Null oder unterhalb von Eins (oder beides). Sie werden aus Anwendungssicht mit Recht den Einwand erheben, dass die Überführung in den Ausdruck - ( x ≤ 0) ∨ x < 1 die Argumentation recht sperrig macht. Mit dem eingangs Gesagten würde man wie folgt schließen: Wenn x ≤ 0 ist, so folgt auch x ≤ 0 < 1, d.h. indem man den Anfang und das Ende der Ungleichungskette in Beziehung setzt, x < 1. [2] Der logische Ausdruck ∀ x ∈ R : x ≥ 0 ⇔ − x ≤ 0 stimmt überein mit dem logischen Ausdruck ∀ x ∈ R( x ≥ 0 ⇒ − x ≥ 0) ∧ ( − x ≤ 0 ⇒ x ≥ 0). Wir untersuchen die Erfüllbarkeit der beiden geklammerten Ausdrücke getrennt: ■ ( x ≥ 0 ⇒ − x ≤ 0) ist ( - ( x ≥ 0) ∨ − x ≤ 0) Dabei stimmt aber - ( x ≥ 0) mit x < 0 überein und − x ≤ 0 mit x ≥ 0. Deshalb stimmt ( x ≥ 0 ⇒ − x ≤ 0) mit x < 0 ∨ x ≥ 0 überein. Diese Aussageform ist aber offenbar allgemeingültig, denn eine relle Zahl ist entweder < 0 oder ≥ 0. Eine etwas handlichere Begründung lautet: Wenn x ≥ 0 ist und man diese Ungleichung mit − 1 multipliziert, so dreht sich das Ungleichungszeichen um, d.h. es gilt − x ≤ 0. ■ Entsprechend ist auch ( − x ≤ 0 ⇒ x ≥ 0) allgemeingültig. Zwei durch ∧ verknüpfte allgemeingültige Aussageformen sind aber ebenfalls allgemeingültig. Deshalb ist die obige Aussageform allgemeingültig und damit sind die beiden Aussageformen äquivalent. Übungen zu Abschnitt 1.2 ? 1. Geben Sie für jede der Inklusionen in N ⊂ N 0 ⊂ Z ⊂ Q ⊂ R ⊂ C ein Beispiel dafür an, dass sie strikt ist. 2. Erläutern Sie die Regeln A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C )und ( A ∩ B ) c = A c ∪ B C mit Venn-Diagrammen. 3. Bestimmen Sie a) N ∩ ] − 3; 3[, b) ] − 2; 7[ ∪ ( [3; ∞ [ ∩ ] − ∞ ; 8] ) , 48818_Terveer.indd 25 48818_Terveer.indd 25 18.07.2023 11: 47: 08 18.07.2023 11: 47: 08 <?page no="26"?> 26 1 Einordnung und Grundlagen c) (] − ∞ ; 5] ∪ ]7; ∞ [) c , d) [3; 9] \ [0; 5]. 4. Es sei S die Menge der BWL- Studierenden im Hörsaal, P die Menge der Prüfungsordnungen, gemäß derer Studierende, welche den Kurs belegen, eingeschrieben sind. a) Welche Eigenschaft(en) hat die Aussageform „ s studiert BWL“? b) Was würde gelten, wenn die Aussageform unerfüllbar wäre? c) Bestimmen Sie p , so dass die folgende Aussageform wahr wird: ∀ x „ x studiert BWL im ersten Fachsemester“ ⇒ „ x studiert nach Prüfungsordnung p “ 1.3 Terme und Gleichungen Reelle Terme und Gleichungen und deren Umformungen gehören zu den wichtigsten elementaren Hilfsmitteln der Analysis und linearen Algebra. Da sich Gleichungen aus Termen aufbauen, besprechen wir hier erst Terme und deren Umformungen. 1.3.1 Terme und Termumformungen Ein (reeller) Term ist ein Ausdruck, der für eine reelle Zahl steht und aus Zahlen, Variablen sowie mathematischen Operationen auf diesen Zahlen und Variablen zusammengesetzt ist, wobei ■ die auftretenden Variablen mit Werten aus R oder einer Teilmenge von R belegt werden können, ■ zwischen den Operationen gewisse Vorrangregeln gelten, z.B. „Punktrechnung vor Strichrechnung“, „Exponentiation vor Punktrechung“ usw. ■ für den Fall, dass Vorrangregeln bewusst aufgehoben werden sollen, Klammerpaare eingesetzt werden Terme können auch konkrete Zahlen sein oder nur aus Zahlen und Rechenoperationen gebildet eine bestimmte Zahl ergeben. Für jede in einem Term eingesetzte Variable muss es einen Definitionsbereich geben, beispielsweise, indem man die Variablenwerte ausschließt, für welche die Terme undefiniert sind (z.B. weil man sonst durch Null teilen würde). Eine Termumformung ist die Überführung eines Terms t 1 in einen Term t 2 , so dass der logische Ausdruck, der aus den beiden Termen und der zwischen ihnen ausgeführten Umformung gebildet wird, eine wahre Aussage bzw. allgemeingültige Aussageform ist: Meist handelt es sich bei Termumforumungen um ■ Gleichungsumformungen t 1 = t 2 , ■ Ungleichungsumformungen t 1 ≤ t 2 bzw. t 1 < t 2 bzw. t 1 ≥ t 2 bzw. t 1 > t 2 . Man spricht dann auch von Abschätzungen. Die wichtigsten Gleichungsumformungen (mit Termen t 1 , t 2 , t 3 , t 4 ) aufgrund der Grundrechenarten + , − , · , / sind die folgenden: [tg1] Kommutativität (Vertauschung): 48818_Terveer.indd 26 48818_Terveer.indd 26 18.07.2023 11: 47: 08 18.07.2023 11: 47: 08 <?page no="27"?> 1.3 Terme und Gleichungen 27 ■ bei Addition von Termen t 1 + t 2 = t 2 + t 1 ■ bei Multiplikation von Termen t 1 · t 2 = t 2 · t 1 [tg2] Assoziativität (Klammersetzung): ■ bei Addition von Termen: ( t 1 + t 2 ) + t 3 = t 1 + ( t 2 + t 3 ) ■ bei Multiplikation von Termen ( t 1 · t 2 ) · t 3 = t 1 · ( t 2 · t 3 ) [tg3] Distributivität: t 1 · ( t 2 + t 3 ) = t 1 · t 2 + t 1 · t 3 . Dreht man die Gleichung um und schreibt t 1 · t 2 + t 1 · t 3 = t 1 · ( t 2 + t 3 ), so bezeichnet man diesen Vorgang als Faktorisierung. [tg4] Brüche gleichnamig machen: t 1 t 2 ± t 3 t 4 = t 1 · t 4 ± t 2 · t 3 t 2 · t 4 wenn t 2 ̸ = 0 , t 4 ̸ = 0. Auch die umgekehrte Gleichung kommt vor, bei gebrochen rationalen Termen spricht man dann auch von Partialbruchzerlegung. [tg5] Neutrale Elemente Null und Eins: ■ Addition: 0 + t 1 = t 1 und t 1 + ( − t 1 ) = t 1 − t 1 = 0 ■ Multiplikation: 1 · t 1 = t 1 und für t 1 ̸ = 0 ist t 1 t 1 = 1 Daraus resultieren die folgenden Termerweiterungen: ■ Addititiv: t 1 = t 1 + t 2 − t 2 . Weil t 2 − t 2 = 0, wird diese Vorgehensweise auch als „fette Null“ bezeichnet. ■ Multiplikativ: Erweitern/ Kürzen von Brüchen t 1 t 2 = t 1 · t 3 t 2 · t 3 . Hier muss man bei den Definitionsbereichen Vorsicht walten lassen, da dies nur für t 3 ̸ = 0 richtig ist. [tg6] Umgang mit dem Minuszeichen bei Klammern: t 1 + t 2 = t 1 − ( − t 2 ) und t 1 − t 2 = t 1 + ( − t 2 ) Die wichtigsten Abschätzungen von Termen sind [tu1] Additiv: ist t 2 ≥ 0 so ist t 1 ≤ t 2 + t 3 . Für t 2 > 0 ist t 1 < t 1 + t 2 . [tu2] Multiplikativ: Sind t 1 ≥ 0 , t 2 ≥ 1, so ist t 1 ≤ t 1 t 2 . Sind t 1 > 0 , t 2 > 1, so ist t 1 < t 1 t 2 . Die genannten Termumformungen umfassen nur den Umgang mit den Grundrechenarten Addition, Subtraktion, Multiplikation und Division. Weitere Termumformungen („Rechenregeln“), insbesondere Abschätzungen werden wir noch besprechen, wenn die verschiedenen Funktionstypen behandelt werden. Termumformungen sollen in den dazu beitragen, dass ein vorhandener Term ■ vereinfacht wird, wobei das durchaus abhängig vom Sachzusammenhang auf verschiedene Arten erfolgen kann, ■ so dargestellt wird, dass man ein bestimmtes Verhalten ablesen kann (z.B. wann der Term Null oder ein anderer vorgegebener Wert wird). 1.3.2 Gleichungen und Ungleichungen Eine Gleichung ist eine Aussage oder eine Aussageform t 1 = t 2 mit Termen t 1 , t 2 . Treten Variablen in einer Gleichung auf, so erhält die Gleichung aller Variablen durch Belegung mit konkreten Werten einen logischen Wert. Ist dieser Wert stets „wahr“, so ist die Gleichung allgemeingültig, man spricht auch von einer Tautologie. Ist die Gleichung als Aussageform erfüllbar, so heißt sie lösbar. Die Menge aller Belegungen der Variablen, die zu einer wahren Aussage führen, nennt man die Lösungsmenge einer Gleichung. Ist sie unerfüllbar, so heißt sie auch unlösbar. 48818_Terveer.indd 27 48818_Terveer.indd 27 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="28"?> 28 1 Einordnung und Grundlagen Beispiel 1.12 [1] Die Gleichung 3 = 7 − x ist erfüllbar in x ∈ R mit x = 4. [2] Die Gleichung x + 6 = 2( x + 3) − x ist eine Tautologie. [3] Die Gleichung x 2 + 1 = 0 ist (in R) unlösbar. Gleichungen, die man durch Gleichungsumformungen zwischen zwei Termen erhält, sind Tautologien. Haben zwei Gleichungen t 1 = t 2 und t 3 = t 4 dieselbe Lösungsmenge, so sind sie äquivalent und man schreibt t 1 = t 2 ⇔ t 3 = t 4 (in Übereinstimmung mit der obigen Definition von Äquivalenz). Gilt für jede Lösung d der Gleichung t 1 = t 2 , dass sie auch Lösung der Gleichung t 3 = t 4 ist, so sagt man, dass die Gleichung t 1 = t 2 die Gleichung t 3 = t 4 impliziert und schreibt t 1 = t 2 ⇒ t 3 = t 4 . Beachten Sie: Wenn Sie Gleichungsumformungen an einem Term t 1 durchführen und dabei eine Gleichungkette t 1 = t 2 = t 3 = · · · erhalten, so dürfen Sie hierfür nicht t 1 ⇔ t 2 ⇔ t 3 . . . und auch nicht t 1 ⇒ t 2 ⇒ t 3 . . . schreiben. Wenn Sie unbedingt mit Äquivalenzen arbeiten wollen, so müssten in diesem Fall Sie t 1 = t 2 ⇔ t 2 = t 3 . . . schreiben. Man schreibt also nicht 2 + (3 + x ) ⇒ (2 + 3) + x ⇒ 5 + x , sondern 2 + (3 + x ) = (2 + 3) + x = 5 + x Die Hauptaufgabe im Zusammenhang mit Gleichungen besteht darin, die Lösungsmenge zu finden. Hat die Gleichung nur eine Variable, etwa x , so besteht die Vorgehensweise darin, Äquivalenzumformungen durchzuführen, bis die Variable alleine auf einer (meist der linken) Seite steht. Man sagt auch, die Variable wird freigestellt. Der Wert auf der rechten Seite stellt dann die Lösung für x dar. Gibt es mehrere Variablen in der Gleichung, so versucht man oft, nach einer der Variablen freizustellen und verwendet die gewonnene Gleichung, um eine Abhängigkeit zwischen der Variablen auf der linken und der bzw. denen auf der rechten Seite zu erklären. Diese wird dann als Funktion interpretiert. Oft entstehen beim Auflösen Fallunterscheidungen, die zu mehreren Lösungszweigen und dann auch mehreren Lösungen führen (z.B. bei quadratischen Gleichungen). Es treten beispielsweise in der Analysis mehrerer Variablen oder in der linearen Algebra auch Situationen ein, in denen die Lösungsmenge durch mehrere Gleichungen in mehreren Variablen beschrieben wird. Äquivalenzumformungen zur Bestimmung der Lösungsmenge beziehen sich dann oft auf jeweils eine der Gleichungen, wobei die anderen Gleichungen als Voraussetzungen verwendet werden können. Folgende Äquivalenzumformungen werden beim Lösen von Gleichungen oft verwendet, dabei seien t 1 , t 2 , t 3 Terme: [g1] Vertauschung: t 1 = t 2 ⇔ t 2 = t 1 [g2] Addition: t 1 = t 2 ⇔ t 1 + t 3 = t 2 + t 3 [g3] Multiplikation: Ist t 3 ̸ = 0, so gilt t 1 = t 2 ⇔ t 1 · t 3 = t 2 · t 3 . Wenn man t 3 ̸ = 0 nicht voraussetzen kann, so gilt nur t 1 = t 2 ⇒ t 1 · t 3 = t 2 · t 3 . Hierdurch kann sich die Lösungsmenge vergrößern, etwa wenn der Term t 3 durch eine Belegung der darin vorkommenden Variable x zu Null wird und die Tautologie t 1 · 0 = t 2 · 0 entsteht. [g4] Einsetzen durch Transitivität: Ist t 2 = t 3 , so gilt t 1 = t 2 ⇔ t 2 = t 3 . Dies entspricht der Gleichungskette von Termumformungen t 1 = t 2 = t 3 . Finden Sie den Aufwand, der hier betrieben wird, um das Umformen von Gleichungen zu beschreiben, zu hoch? Sich die einzelnen Schritte genau zu vergegenwärtigen und die zulässigen Umformungen zu kennen, verhindert immer wieder beobachtete Fehler beim Lösen von Gleichungen. Nach einiger Zeit gehen Ihnen die obigen Konzepte „in Fleisch und Blut“ über, die Fehlerquote sinkt deutlich und Sie können sogar parametrische Gleichungen behandeln. 48818_Terveer.indd 28 48818_Terveer.indd 28 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="29"?> 1.3 Terme und Gleichungen 29 Beispiel 1.13 Wir lösen die Gleichung 3 = x − 5 mit den genannten Umformungen. Natürlich sieht man durch Ausprobieren hier schnell, dass x = 8 die einzige Lösung ist. Bei komplizierteren Gleichungen ist das aber nicht mehr so einfach. Löst man die Gleichung nur mit den genannten Umformungen unter Verwendung von Termumformungen, so gilt 3 = x − 5 [g1] ⇔ x − 5 = 3 [g2] ⇔ ( x − 5) + 5 = 3 + 5 [tg2] ⇔ x + ( − 5 + 5) = 3 + 5 ⇔ x = 8 Eine Ungleichung ist eine Aussage(-form) vom Typ t 1 ≤ t 2 , t 1 < t 2 , t 1 ≥ t 2 oder t 1 > t 2 mit Termen t 1 , t 2 . Auch hier können Variablen in den Termen vorkommen, so dass man wie bei Gleichungen die Eigenschaften der Lösbarkeit und Unlösbarkeit sowie das Konzept einer Lösungsmenge erklären kann; folgende Äquivalenzumformungen gibt es (dabei seien wieder t 1 , t 2 Terme): [u1] Vertauschung: ■ t 1 ≤ t 2 ⇔ t 2 ≥ t 1 und t 1 ≥ t 2 ⇔ t 2 ≤ t 1 , ■ t 1 < t 2 ⇔ t 2 > t 1 und t 1 > t 2 ⇔ t 2 < t 1 . [u2] Addition: ■ t 1 ≤≥ t 2 ⇔ t 1 + t 3 ≥≤ t 2 + t 3 ■ t 1 < > t 2 ⇔ t 1 + t 3 > < t 2 + t 3 [u3] Multiplikation mit t 3 > 0 ■ t 1 ≤≥ t 2 ⇔ t 1 t 3 ≤≥ t 2 t 3 ■ t 1 < > t 2 ⇔ t 1 t 3 < > t 2 t 3 [u4] Multiplikation mit t 3 < 0 ■ t 1 ≤≥ t 2 ⇔ t 1 t 3 ≥≤ t 2 t 3 ■ t 1 < > t 2 ⇔ t 1 t 3 > < t 2 t 3 Beispiel 1.14 Wir lösen die Ungleichung 3 ≤ x − 5 mit den genannten Umformungen. 3 ≤ x − 5 [u1] ⇔ x − 5 ≥ 3 [u2] ⇔ ( x − 5) + 5 ≥ 3 + 5 [tg2] ⇔ x ≥ 8 Übungen zu Abschnitt 1.3 ? 5. Versuchen Sie, die folgenden Terme zu vereinfachen, wenn für x, y die angegebenen Zahlen eingesetzt werden. Warum ist dies im zweiten Fall nicht möglich? a) xy x + x y für x = − 8 , y = 4 b) x 2 − y x +2 für x = − 2 , y = 4 6. Welche Terme sind gleich? a) x 2 + 14 x − 4, b) x 2 − 4, c) ( x + 7) 2 − 53, d) ( x − 2) x + 2 x − 4 7. Vereinfachen Sie die Terme so weit wie 48818_Terveer.indd 29 48818_Terveer.indd 29 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="30"?> 30 1 Einordnung und Grundlagen möglich, dabei seien x, y relle Variablen: a) 2( x + 8 y ) + 4(5 x − 4 y ) b) 3( − 7 x + 5 y ) − 12 (6 x − 23 y ) 8. Fassen Sie zu einem Bruch zusammen: 2 x 5 x +7 − 4 2 x +1 9. Faktorisieren Sie so weit wie möglich a) x 3 y 2 − x 2 y 3 x 4 y 2 + x 6 y 3 und b) x 2 − 6 x +5 x 2 +3 x +2 10. Ordnen Sie die Terme für x ≥ − 12 aufsteigend nach Wert: a) ( x + 1) 2 b) x 2 c) 2 x − 1 11. Lösen Sie die Gleichung x − 4 2 x +2 = x +7 2 x − 1 in x . 12. Lösen Sie die Ungleichung x − 4 2 x +2 ≤ x +7 2 x − 1 in x 48818_Terveer.indd 30 48818_Terveer.indd 30 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="31"?> Funktionen einer Variablen 48818_Terveer.indd 31 48818_Terveer.indd 31 19.07.2023 09: 08: 26 19.07.2023 09: 08: 26 <?page no="32"?> 48818_Terveer.indd 32 48818_Terveer.indd 32 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="33"?> 2 Das Funktionskonzept Übersicht Sicherlich haben Sie sich in der Schule öfter die Frage gestellt, warum Sie mit Funktionen arbeiten müssen. Ziel dieses Kapitels ist es, das Funktionskonzept insbesondere als Hinführung zur Mathematisierung ökonomischer Fragestellungen zu erläutern; letztere betreffen im betriebswirtschaftlichen Kontext ökonomische Größen im Zusammenhang mit begrenzt verfügbaren Gütern wie z.B. den Preis oder die Absatzmenge oder die nachgefragte Menge eines Produktes, den daraus erzielten Umsatz bzw. Erlös, die Kosten und den Gewinn bzw. Deckungsbeitrag einer Produktion und last but not least die Einsatzmengen der verwendeten Produktionsfaktoren. In der Volkswirtschaftslehre werden gesamtwirtschaftliche Indikatoren wie (Volks-)Einkommen, Konsum, Preise oder Nachfragen untersucht. Betrachten Sie beispielsweise den Geschäftsbericht eines Unternehmens, so werden Sie für viele derartige Größen Zahlenbeispiele finden. Das legt die Vermutung nahe, dass man in ökonomischen Modellen ebenfalls vor allem mit Zahlen arbeitet. Das Gegenteil ist aber der Fall, die Zahlen stehen eher am Ende eines Entscheidungsprozesses. Beispielsweise wird ein Unternehmen durch genaue Beobachtung des Marktes sowie seiner eigenen Kostensituation einen Preis für sein Produkt festlegen wollen. Das bedeutet aber, dass der Preis noch nicht feststeht, sondern als Veränderliche bzw. Variable. Auch Gewinn, Absatzmenge, Kosten sind in diesem Sinne oft Variablen. Selbst nach einer Festlegung können ökonomische Variablen aufgrund von Änderungen der Rahmenbedingungen, unter denen Entscheidungen getroffen werden, aber weiterhin geändert werden müssen, und bleiben insofern Variablen. Zwischen den jeweils relevanten ökonomischen Variablen lassen sich zudem Zusammenhänge annehmen, die sich oft in Form von Gleichungen schreiben lassen, in welchen die Variablen vorkommen. Löst man diese Gleichungen nach einer der Variablen auf, so entstehen Zuordnungen, beispielsweise von Absatzmenge zu Marktpreis (ggf. den Preisen mehrerer Anbieter), Absatzmenge zu Umsatz, Rohstoffeinsatz zu Produktions-Output oder Lagerbestand zu Lagerstückkosten, wobei man durch Einsetzen des Wertes für eine Variable den zugehörigen Wert der anderen Variable mittels einer Formel bestimmt. Diese Formel wird auch Funktionsterm genannt. Wir verwenden als Bezeichner für die Variablen x , y , p ,. . . . Sie stellen Platzhalter für die konkreten Zahlen dar. Später werden auch Zusammenhänge zwischen mehreren Variablen gleichen Typs behandelt, beispielsweise bei mehreren Rohstoffen für ein Produkt oder mehreren Anbietern eines Produktes mit verschiedenen Preisen. In diesem Fall werden die typgleichen Variablen dann oft indiziert, um sie zu unterscheiden. 48818_Terveer.indd 33 48818_Terveer.indd 33 18.07.2023 11: 47: 09 18.07.2023 11: 47: 09 <?page no="34"?> 34 2 Das Funktionskonzept 2.1 Funktionen und Abbildungen Definition 2.1 ! Eine Funktion f : D → W ist eine Vorschrift, die festgelegt ist durch [1] einen Definitionsbereich D ⊆ R, meist ein Intervall [ a ; b ], [2] einen Wertebereich W ⊆ R, meist R selbst oder [0; ∞ [, [3] eine Regel, die jedem x ∈ D genau ein y ∈ W zuordnet, meist in Form eines Terms, der die Variable x enthält. Man schreibt dafür auch x → y = f ( x ). Dabei steht f ( x ) als Symbol für ■ den Term der Zuordnungsregel gemäß [3]. Dieser wird Funktionsterm genannt. ■ den x zugeordneten Wert y aus W. Dieser wird Funktionswert genannt. Statt f ( x ) wird auch oft y ( x ) geschrieben, um die Verwendung eines Funktionssymbols zu sparen und direkt die Abhängigkeit der Variable y von der Variable x zu betonen. Ein synonymer Ausdruck für „Funktion“ ist Abbildung. Die Variable x wird auch als Argument der Funktion bezeichnet. Beispiel 2.1 Die Funktion f : [ − 3; 3] → R, f ( x ) = x 3 − 2 x 2 − 4 x + 8, hat den Definitionsbereich D = [ − 3; 3]. Für Argumente x aus diesem Intervall wird der Funktionswert durch den Term x 3 − 2 x 2 − 4 x +8 berechnet. Beispielsweise ist f ( − 1) = ( − 1) 3 − 2( − 1) 2 − 4( − 1)+ 8 = 9. Der Wertebereich der Funktion ist R, die Menge aller reellen Zahlen. Als Definitionsbereich könnte auch die Menge R aller reellen Zahlen verwendet werden, dies ist hier aber ausdrücklich nicht so „ gewünscht“. Beispiel 2.2 Angenommen wird, dass bei der Herstellung eines Computerbauteils neben fixen Kosten von 20.000 e (Abschreibungskosten für die Produktionsstätte, Wartung der Maschinen usw.) noch Herstellungskosten von 0,45 e je Bauteil anfallen. Bei x Bauteilen betragen die durchschnittlichen Kosten für die Herstellung eines Bauteils dann y = f ( x ) = 0 , 45 x +20 . 000 x = 0 , 45 + 20000 x . Als Definitionsbereich D dieser Funktion f kann die Menge N der natürlichen Zahlen { 1 , 2 , 3 . . . } verwendet werden, da nicht-ganzzahlige Werte praktisch sinnlos sind, weil sie keine Anzahlen von Bauteilen repräsentieren. Auch 0 liegt nicht im Definitionsbereich, weil hierfür der Funktionstermin kein sinnvolles Ergebnis liefert. Aus mathematischer Sicht kann es hilfreich sein, die Funktion auf dem Definitionsbereich D =]0; ∞ [= { x ∈ R : x > 0 } zu betrachten, um die für Funktionen auf Intervallen bereit stehenden Techniken, z.B. die Ableitung, verwenden zu können. Die gefundenen Resultate müssen abschließend wieder im Kontext interpretiert werden (z.B. ist ggf. eine Rundung auf ganze Zahlen erforderlich). Für den Wertebereich der Funktion bietet sich hier W = R oder W =]0; ∞ [ an, beide stellen ausreichend „ große“ Wertevorräte dar. Definitions- und Wertebereich erfassen verschiedene Anforderungen, die im praktischen Umgang mit dem Funktionsterm auftreten können: ■ Manchmal dürfen gewisse Werte in den Funktionsterm nicht eingesetzt werden, weil die damit verbundenen Rechenoperationen mathematisch nicht erlaubt sind 48818_Terveer.indd 34 48818_Terveer.indd 34 18.07.2023 11: 47: 10 18.07.2023 11: 47: 10 <?page no="35"?> 2.1 Funktionen und Abbildungen 35 (Brüche, deren Nenner Null werden, Wurzeln aus negativen Zahlen,. . . ). Die entsprechenden Werte werden dann aus dem „Standard“-Definitionsbereich D = R entfernt. Der maximale Definitionsbereich einer Funktion f besteht aus allen x ∈ R, für die der Wert f ( x ) anhand des Funktionsterms gebildet werden kann. ■ Ökonomische Variablen, die man in einen Funktionsterm einsetzt, dürfen oftmals nicht negativ sein, d.h. zumeist ist der Definitionsbereich einer Funktion im ökonomischen Kontext schon automatisch auf den Bereich [0; ∞ [= { x ∈ R : x ≥ 0 } oder ]0; ∞ [= { x ∈ R : x > 0 } eingeschränkt. Oft wird der Definitionsbereich durch Kapazitätsrestriktionen auf ein abgeschlossenes Intervall [ a ; b ] = { x ∈ R : a ≤ x ≤ b } bzw. ein offenes Intervall ] a ; b [= { x ∈ R : a < x < b } begrenzt. In allen Fällen spricht man dann von einem ökonomischen Definitionsbereich. Der maximale Definitionsbereich einer Funktion umfasst diesen ökonomischen Definitionsbereich, d.h. letzterer darf keine mathematisch unzulässigen Werte x enthalten. ■ Statt Wertebereich wird auch oft der Begriff Wertevorrat verwendet. Der Wertebereich W einer Funktion muss so verstanden werden, dass die Funktion höchstens die in W angegebenen Werte annehmen kann. Das ist nicht gleichbedeutend damit, dass alle in W liegenden Werte auch als Funktionswerte auftreten. Wenn zu Beginn der Untersuchung einer Funktion eine Eingrenzung des Wertebereiches noch nicht vorgenommen werden kann oder soll, so setzt man der Einfachheit halber W = R. In der Mathematik gibt es einige Standardfunktionen, für die man sprechende Bezeichnungen (selten mit mehr als drei Buchstaben) festgelegt hat. Wir werden später insbesondere auf die Funktionen abs, exp, log, sin, cos, tan eingehen. Beispiel 2.3 Eine besonders einfache Funktion ist die so genannte Identitätsfunktion bzw. Identität id : D → W. Sie verändert den Eingabewert nicht, d.h. sie hat den Funktionsterm id( x ) = x . Sie wird beispielsweise im Ansatz für die Berechnung von Umkehrfunktionen verwendet, worauf wir in Abschnitt 2.4 vgl. S. 46 noch genauer eingehen. Als Definitions- und Wertebereich werden zumeist D = W = R angesetzt, bei Umkehrfunktionen auch die Definitionsbzw. Wertebereiche der Funktionen, die umgekehrt werden sollen. Wertetabellen sind ein wichtiges Hilfsmittel der Arbeit mit Funktionen. In ihnen werden zu einer Auswahl „ geeigneter“ Elemente x 1 , . . . , x n des Definitionsbereiches D die Wertepaare ( x i | f ( x i )) in einer zweispaltigen Tabelle angegeben. Wertetabellen werden zur graphischen Darstellung im Koordinatenkreuz vgl. Unterabschnitt 2.2, S. 37 , aber auch in der Optimierung zum Randwertevergleich verwendet. Bei Steckbriefproblemen muss eine Funktion erst anhand einer gegebenen Wertetabelle „rekonstruiert“ werden. Eng verwandt mit der Wertetabelle sind folgende Darstellungsmöglichkeiten: ■ Pfeildiagramm: Definitions- und Wertebereich werden nebeneinander als Mengendiagramme (Venn-Diagramme) dargestellt. Die Argumentwerte x 1 , . . . , x n aus der Wertetabelle werden in der linken Menge symbolisch angegeben, ebenso die Funktionswerte f ( x 1 ) , . . . , f ( x n ) in der rechten Menge. Zusammengehörige Paare ( x i | f ( x i )) werden markiert, indem sie mit einem Pfeil verbunden werden. Diese Da rstellung ist eher unstrukturiert. ■ Parallelkoordinaten: Mehr Struktur bekommt ein Pfeildiagramm, wenn Argumentwerte und Funktionswerte auf je einem Zahlenstrahl eingetragen und dann 48818_Terveer.indd 35 48818_Terveer.indd 35 18.07.2023 11: 47: 10 18.07.2023 11: 47: 10 <?page no="36"?> 36 2 Das Funktionskonzept x y 1 20000,45 2 10000,45 3 6667,12 4 5000,45 5 4000,45 5 4 3 2 1 4000 , 45 5000 , 45 6667 , 12 10000 , 45 20000 , 45 1 20000.45 2 10000.45 3 6667.12 4 5000.45 5 4000.45 x y Abbildung 2.1: Wertetabelle, Pfeildiagramm und Parallelkoordinaten in Beispiel 2.2 mit Pfeilen verbunden werden. Man spricht hier von Parallelkoordinaten, wenn die Zahlengeraden parallel zueinander angeordnet sind. Bestimmte Strukturen wie Linearität lassen sich oft aus der Darstellung erkennen. Auch die Verknüpfung von Funktionen (s.u.) lässt sich mit Parallelkoordinaten gut darstellen, zudem sind Parallelkoordinaten ein Werkzeug zur Darstellung multivariater Daten in der explorativen Datenanalyse [Wegman, 1990]. Für Beispiel 2.2 sind Wertetabelle, Pfeildiagramm und Parallelkoordinaten für Werte von x ∈ { 1 , 2 , 3 , 4 , 5 } in Abbildung 2.1 angegeben. Übungen zu Abschnitt 2.1 ? 1. Ermitteln Sie jeweils eine geeignete Funktion f : D → R, d.h. Funktionsterm y = f ( x ) und Definitionsbereich D. a) Je Einheit eines Rohstoffes entstehen 2,3 Einheiten eines Produktes ( x : eingesetzte Menge des Rohstoffs, y : hergestellte Menge des Produkts). b) Der Marktpreis eines Produktes sinkt je angebotener Einheit um 0,35 e . Ab einem Preis von 30 e wird kein Produkt mehr verkauft (Prohibitivpreis). ( x : abgesetzte Menge des Produkts, y Marktpreis bzw. Umsatz) c) Ein Produkt wird gelagert. Bei monatlichen Fixkosten von 2700 e für den Lagerhallenbetrieb verursacht jede eingelagerte Einheit 25 e Kosten im Monat, ( x : eingelagerte Menge des Produkts, y : Lagerstückkosten je Monat) 2. Überlegen Sie, ob der Zusammenhang zwischen folgenden Größen x und y jeweils durch eine Funktion x → y = f ( x ) beschrieben werden kann, und geben Sie eine geeignete Funktion an, bzw. begründen Sie gegebenenfalls, warum es diese Funktion nicht gibt. x y a) Gewicht eines Briefes Briefporto b) Füllmenge eines Gefäßes mit Ablaufvorrichtung Dauer des Entleerungsvorganges c) Distanz zweier Bahnhöfe Fahrtkosten 2. Klasse d) natürliche Zahl ein Teiler der Zahl e) natürliche Zahl Anzahl der Teilmengen von { 1 , . . . , x } 3. Überprüfen Sie, ob es zu den folgenden Wertetabellen Funktionen gibt. Falls ja, geben Sie einen möglichen Funktionsterm sowie den (maximalen) Definitionsbereich an. a) x 1 6 3 2 1 4 y 3 2 5 4 2 7 b) x − 3 − 2 − 1 0 1 2 y 8 6 4 2 0 − 2 c) x − 3 − 2 − 1 0 1 2 3 y − 26 − 7 0 1 2 9 28 d) x − 3 − 2 − 1 1 2 3 y 13 12 1 − 1 − 12 − 13 4. Berechnen Sie jeweils die Funktionswerte f ( 23 ), f ( − 5), f ( t ), f ( t 3 + 1), f ( 1 t ), und 48818_Terveer.indd 36 48818_Terveer.indd 36 18.07.2023 11: 47: 10 18.07.2023 11: 47: 10 <?page no="37"?> 2.2 Graphische Darstellung, Bild und Urbild 37 vereinfachen Sie gegebenenfalls so weit wie möglich. a) f ( x ) = 3 x + 2 b) f ( x ) = − 9( x − 1) 2 + 4 c) f ( x ) = x +1 x − 1 5. Bestimmen Sie zu den folgenden Funktionstermen jeweils die maximal möglichen Definitionsbereiche. Vereinfachen Sie den zweiten Funktionsterm anschließend so weit wie möglich: a) f ( x ) = 1 ( x − 1)(3 x +2) b) f ( x ) = 1 1+ 2 1 − x +1 x 2.2 Graphische Darstellung, Bild und Urbild Neben dem Funktionsterm als rechnerischem Zugang zu Funktionen verwendet man oft auch eine graphische Darstellung von Funktionen in einem Koordinatensystem, der so genannten Anschauungsebene R 2 = R × R = { ( x | y ) : x ∈ R , y ∈ R } . Die Anschauungsebene ist ein Beispiel des kartesischen Produktes. Definition 2.2 ! Das kartesische Produkt zweier Mengen D,W ist die Menge D × W = { ( x | y ) : x ∈ D , y ∈ W } Der Begriff wird hier meist für Intervalle D , W reeller Zahlen verwendet. Die Menge [ a ; b ] × [ c ; d ] ist beispielweise ein (abgeschlossenes) Rechteck. Eine Funktion kann im Koordinatensystem dargestellt werden, indem die Paare ( x | f ( x )) darin eingetragen werden. Mit dieser Darstellung können Sie sich die wesentlichen Eigenschaften wie Monotonie, Krümmung und Extremwertverhalten veranschaulichen - allerdings ersetzt dies in aller Regel nicht die genauen Rechnungen anhand des Funktionsterms. Definition 2.3 ! Der Graph einer Funktion f : D → W ist die folgende Menge von Punkten in der Anschauungsebene R × R G f = { ( x | f ( x )) : x ∈ D } Beispiel 2.4 Die Funktion f : {− 2 , − 1 , 0 , 1 , 2 } → R, f ( x ) = x 3 − 2 x 2 − 4 x + 8 hat den Graph G f = { ( − 2 | 0) , ( − 1 | 9) , (0 | 8) , (1 | 3) , (2 | 0) } . Dazu berechnet man für die fünf Elemente des Definitionsbereiches in diesem „eingeschränkten“ die Funktionswerte f ( − 2) = 0, f ( − 1) = 9, f (0) = 8, f (1) = 3 und f (2) = 0. Zeichnet man diese Teilmenge in ein Koordinatensystem, so wird diese Darstellung ebenfalls als Graph bezeichnet. Händisch trägt man dabei die Punkte einer Wertetabelle in ein Koordinatensystem ein. Je umfangreicher die Wertetabelle - d.h. je näher die x -Werte der Punkte beieinander liegen- desto genauer wird die Visualisierung des Graphen. Schließlich entsteht der Eindruck, einer - oftmals glatten - Kurve. „Zwischen den Punkten“ zeichnet man Liniensegmente. Es entsteht ein Polygonzug, dessen 48818_Terveer.indd 37 48818_Terveer.indd 37 18.07.2023 11: 47: 10 18.07.2023 11: 47: 10 <?page no="38"?> 38 2 Das Funktionskonzept x f ( x ) − 3 − 25 − 2 , 5 − 10 , 125 − 2 0 − 1 , 5 6 , 125 − 1 9 − 0 , 5 9 , 375 0 8 0 , 5 5 , 625 1 3 1 , 5 0 , 875 2 0 2 , 5 1 , 125 3 5 −3 −2 −1 1 2 −20 −10 10 x y Abbildung 2.2: Graph einer Funktion als „Vervollständigung“ einer Wertetabelle Ecken bei ausreichend vielen Punkten in der Wertetabelle nicht mehr unbedingt sichtbar sind. Mit Computerprogrammen werden auch Kurvenstücke verwendet, z.B. zu Spline-Polynomen über drei oder mehr benachbarte Punkte, um den Eindruck einer glatten Kurve zu erwecken. Beispiel 2.5 In Abbildung 2.2 wird der Graph zur Funktion f : [ − 3; 3] → R, f ( x ) = x 3 − 2 x 2 − 4 x + 8 auf Grundlage einer Wertetabelle dargestellt. Eine Funktion f : D → W muss nicht jeden Wert y ∈ W annehmen, in diesem Sinne ist der Wertebereich der Funktion als Wertevorrat zu verstehen. Will man genau diejenigen Werte in W adressieren, die auch Funktionswerte y = f ( x ) sind, so spricht man vom Bild der Funktion: Definition 2.4 ! Für eine Teilmenge E ⊂ D heißt f (E) : = { f ( x ) : x ∈ E } Bild von E unter f , Bild ( f ) : = f (D) heißt Bild von f . f (E) ist also die Menge aller Funktionswerte f ( x ), wobei x die Menge E durchläuft. Bei Bild ( f ) durchläuft x den gesamten Definitionsbereich. Für endliche Mengen E werden einfach alle Funktionswerte f (E) bestimmt. Kommt ein Funktionswert mehrfach in f (E) vor, so muss er natürlich nur einmal in der Menge angegeben werden. Beispiel 2.6 Betrachten Sie die Funktion f : {− 2 , − 1 , 0 , 1 , 2 } → R, f ( x ) = x 3 − 2 x 2 − 4 x + 8. mit dem Graph G f = { ( − 2 | 0) , ( − 1 | 9) , (0 | 8) , (1 | 3) , (2 | 0) } . Das Bild von f ist hier die Menge f ( {− 2 , − 1 , 0 , 1 , 2) } ) = { 0 , 3 , 8 , 9 } . Mit E ist auch f (E) oft ein Intervall oder zumindest eine Vereinigung von Intervallen. Beispiel 2.7 Die Funktion f : R → R, f ( x ) = x 2 gehört zum Graph der „Normalparabel, vgl. Abbildung 2.3. Die Funktion nimmt jeden Wert y ≥ 0 als Funktionswert an, denn zu jedem y ≥ 0 gibt es ein x ≥ 0 mit x 2 = y , dieses x wird Quadratwurzel von y genannt und mit √ y bezeichnet. Deshalb gilt Bild ( f ) = R. Betrachtet man z.B. E = [2 , 5; 3], so gilt f (E) = F = [2 , 5 2 ; 3 2 ] = [6 , 25; 9], denn 48818_Terveer.indd 38 48818_Terveer.indd 38 18.07.2023 11: 47: 10 18.07.2023 11: 47: 10 <?page no="39"?> 2.2 Graphische Darstellung, Bild und Urbild 39 ■ Einerseits gilt f (E) ⊆ F. Denn für 2 , 5 ≤ x ≤ 3 gilt 2 , 5 2 ≤ x 2 ≤ 3 2 , also 6 , 25 ≤ f ( x ) ≤ 9, d.h. f ( x ) ∈ F ■ Andererseits gilt F ⊆ f (E): falls 6 , 25 ≤ y ≤ x , so gilt auch √ 6 , 25 ≤ √ y ≤ √ 9, d.h. 2 , 5 ≤ √ y ≤ 3. Mit x = √ y folgt also x ∈ E und f ( x ) = x 2 = y . Es folgt y ∈ f (E). f (E) ⊆ F und F ⊆ f (E) bedeuten zusammen aber f (E) = F. Der Wertebereich W einer Funktion f : D → W wird in der Regel „zu groß“ angesetzt, d.h. nicht alle y ∈ W sind auch Funktionswerte f ( x ) und liegen somit im Bild von f . Ist dies aber doch der Fall, so gibt es hierfür einen eigenen Begriff: Definition 2.5 ! f : D → W heißt surjektiv, wenn für alle y ∈ W ein x ∈ D existiert mit y = f ( x ). Anders ausgedrückt, gilt bei einer surjektiven Funktion f : D → W nicht nur Bild ( f ) ⊆ W, sondern schon Bild ( f ) = W. Bei surjektiven Funktionen muss man für y ∈ W nicht danach unterscheiden, ob y als Funktionswert angenommen wird oder nicht, was manchmal von Vorteil sein kann. Deshalb versucht man, manchmal, eine nicht surjektive Funktion zu einer surjektiven Funktion zu machen, indem man W so verkleinert, dass es Bild ( f ) entspricht. Dazu jedoch muss Bild ( f ) erst einmal bestimmt werden. Beispiel 2.8 Die Funktion f : R → R, f ( x ) = x 2 kann keine negativen Werte annehmen. Wird der Wertebereich W = R aber zu W = [0; ∞ [ verkleinert, so gilt wegen Bild ( f ) = [0; ∞ [, dann Bild ( f ) = W, und f wird dadurch surjektiv. Wie Ihnen im vorigen Beispiel schon aufgefallen sein könnte, kann eine Funktion Werte y ∈ W mehrfach annehmen. Neben dem Bild einer Funktion, welches eine Menge im Wertebereich zuweist, gibt das Urbild die Möglichkeit, umgekehrt einer Menge im Wertebereich die zugehörige Menge im Definitionsbereich zuzuweisen: Definition 2.6 ! Für eine Funktion f : D → R und W ⊆ R heißt f − 1 (W) : = { x : x ∈ D , f ( x ) ∈ W } das Urbild von W unter f . Beispiel 2.9 Die Funktion f : R → R, f ( x ) = x 2 haben wir bereits hinsichtlich ihres Bildverhaltens besprochen. Für ein y > 0 ist x 1 = √ y eine Lösung der Gleichung x 2 = y . Es gibt aber noch eine weitere Lösung, nämlich x 2 = −√ y = − x 1 , denn x 22 = ( −√ y ) 2 = ( − 1) 2 · ( √ y ) 2 = √ y 2 = x 21 = y . Man kann also sagen, dass jeder Wert y > 0 unter f zwei Urbilder hat, nämlich √ y und −√ y . Das lässt sich verwenden, um Urbilder von endlichen Mengen W zu bestimmen. Betrachten wir beispielsweise die Menge W = { 1 , 4 } und bestimmen das Urbild f − 1 (W). Gesucht sind also alle x ∈ R mit x 2 ∈ W. Weil W aber nur zwei Elemente enthält, kann man für jedes der Elemente 1 und 4 diese Überprüfung getrennt vornehmen, d.h. es muss geprüft werden, für welche x die Gleichung x 2 = 1 oder aber die Gleichung x 2 = 4 erfüllt ist. Im ersten Fall erhält man die Lösungen x = 1 und x = − 1, im zweiten Fall die Lösungen x = 2 und x = − 2. Es ist also 48818_Terveer.indd 39 48818_Terveer.indd 39 18.07.2023 11: 47: 11 18.07.2023 11: 47: 11 <?page no="40"?> 40 2 Das Funktionskonzept f − 1 ( { 1 , 4 } ) = {− 2 , − 1 , 1 , 2 } . Für unendliche Mengen, speziell Intervallmengen W ergibt sich das Urbild oft als Vereinigung von Intervallen. Beispiel 2.10 Wie betrachten wieder die Funktion f : R → R, f ( x ) = x 2 und wollen nun das Urbild f − 1 ([1; 4]) des Intervalls W = [1; 4] bestimmen. Wir haben gerade gesehen, dass das Urbild der Menge { 1 , 4 } der beiden Randpunkte des Intervalls unter f die Menge {− 2 , − 1 , 1 , 2 } . Könnte also vielleicht das Urbild des Intervalls [1; 4] aus den beiden Intervallen [ − 2; − 1] und [1 , 2] bestehen, d.h. gilt f − 1 ([1; 4]) = [ − 2; − 1] ∪ [1 , 2]? Wir erinnern uns an das Prinzip für Mengenidentitäten und prüfen zwei Inklusionen: ■ Gilt [ − 2; − 1] ∪ [1 , 2] ⊆ f − 1 ([1; 4])? Dazu muss gelten - Einerseits [1; 2] ⊆ f − 1 ([1; 4]) Nach dem Inklusionsprinzip ist zu prüfen,ob für x ∈ [1; − 2] auch gilt f ( x ) ∈ [1; 4], d.h. ob aus 1 ≤ x ≤ 2 auch folgt 1 ≤ x 2 ≤ 4. Das ist offensichtlich der Fall, also gilt [1; 2] ⊆ f − 1 ([1; 4]). - Andererseits [ − 2; − 1] ⊆ f − 1 ([1; 4]). Es ist zu prüfen, ob für x ∈ [ − 2; − 1] auch gilt f ( x ) ∈ [1; 4], d.h. ob aus − 2 ≤ x ≤ − 1 auch folgt 1 ≤ x 2 ≤ 4. Das ist offensichtlich auch der Fall. Es gilt also [ − 2; − 1] ⊆ f − 1 ([1; 4]). Insgesamt folgt [ − 2; − 1] ∪ [1; 2] ⊆ f − 1 ([1; 4]). ■ Gilt f − 1 ([1; 4]) ⊆ [ − 2; 1] ∪ [1 , 2]? D.h. gilt für ein x mit 1 ≤ y = x 2 ≤ 4, dass − 2 ≤ x ≤ 1 oder 1 ≤ x ≤ 2? Es werden die Fälle x > 0 und x < 0 unterschieden. - Für x > 0 folgt x = √ y und 1 ≤ √ y ≤ 2, also 1 ≤ x ≤ 2, also x ∈ [1; 2]. - Für x < 0 gilt x = −√ y , d.h. √ y = − x . Dann folgt aber wegen 1 ≤ √ y ≤ 2 also 1 ≤ − x ≤ 2, also − 2 ≤ x ≤ − 1, also x ∈ [ − 2; 1]. Insgesamt gilt also x ∈ [1; 2] oder x ∈ [ − 2; 1], d.h. x ∈ [ − 2; 1] ∪ [1; 2] Die beiden Inklusionseigenschaften zeigen nun, dass f − 1 ([1; 4]) = [ − 2; − 1] ∪ [1; 2]. Das Urbild des Intervalls ist also eine Vereinigung zweier Intervalle. In Beispiel 2.10 haben wir das folgende Mengenprinzip verwendet: Gilt für drei Mengen A, B, C jeweils A ⊆ C und B ⊆ C , so gilt auch A ∪ B ⊆ C . Die Intervalleigenschaften der Beispiele zur Normalparabel sind in Abbildung 2.3 veranschaulicht. Vielleicht kennen Sie f − 1 schon als Notation der Umkehrfunktion einer Funktion f . Das Urbild stellt eine Verallgemeinerung dar, die vor allem in der Wahrscheinlichkeitsrechnung verwendet wird. Umkehrfunktionen existieren nicht immer (die gerade besprochene Quadratfunktion f : R → R, f ( x ) = x 2 ist ein wichtiges Beispiel dafür). Anhand des Urbildes f − 1 ( { y } ) kann man erkennen, ob f sich zur Umkehrung „eignet“, nämlich dann, wenn dieses Urbild stets aus höchstens einem x ∈ D besteht. Hiermit ist ein weiterer Begriff verbunden: 48818_Terveer.indd 40 48818_Terveer.indd 40 18.07.2023 11: 47: 11 18.07.2023 11: 47: 11 <?page no="41"?> 2.2 Graphische Darstellung, Bild und Urbild 41 Abbildung 2.3: Bild und Urbild für f : R → R, f ( x ) = x 2 Definition 2.7 ! Eine Funktion f : D → W heißt injektiv, wenn für x 1 , x 2 in D gilt: Aus f ( x 1 ) = f ( x 2 ) folgt x 1 = x 2 . Das bedeutet, dass jedes y ∈ Bild ( f ) höchstens ein Urbild hat. Logisch umgekehrt bedeutet dies zudem, dass im Falle von x 1 ̸ = x 2 auch gilt f ( x 1 ) ̸ = f ( x 2 ). Eine nicht injektive Funktion kann injektiv gemacht werden, indem ihr Definitionsbereich so verkleinert wird, dass alle Urbilder einelementiger Mengen (höchstens) einelementig sind. Beispiel 2.11 Die Funktion f : R → R, f ( x ) = x 2 ist nicht injektiv, denn y > 0 hat zwei Urbilder, nämlich x = √ y und x = −√ y . Verkleinert man aber D = R zu D = [0; ∞ [ so entfällt jeweils die negative Lösung. Die Funktion f : [0; ∞ [ → R, f ( x ) = x 2 ist also injektiv. Beachten Sie, dass beim Verkleinern von Definitions- oder Wertebereich streng formal eine neue Funktion entsteht, denn zur Beschreibung einer Funktion gehört eben nicht nur der Funktionsterm, sondern auch Definitions- und Wertebereich. Gleichzeitig surjektive und injektive Funktionen lassen sich umkehren, hierzu gibt es einen weiteren Begriff: Definition 2.8 ! Eine Funktion f : D → W, die sowohl surjektiv als auch injektiv ist, heißt bijektiv. Wir gehen darauf, aber auch auf die Umkehrfunktion in Abschnitt 2.4 ein. Übungen zu Abschnitt 2.2 ? 6. Zeichnen Sie die Graphen der Funktionen aus Aufgabe 3 vgl. S. 36 , jeweils mit geeigneter Wertetabelle. 7. Welcher der nachfolgenden Graphen stellt eine Funktion x → y = f ( x ) dar? Geben Sie für diesen Fall jeweils den Definitionsbereich der Funktion an. Geben Sie in Teilaufgabe c) die Antwort in Abhängigkeit vom Winkel α . a) b) 48818_Terveer.indd 41 48818_Terveer.indd 41 18.07.2023 11: 47: 11 18.07.2023 11: 47: 11 <?page no="42"?> 42 2 Das Funktionskonzept x y Abszisse Ordinate Ursprung Nullstelle Nullstelle Ordinaten-( y -Achsen-)Abschnitt Abbildung 2.4: Lage des Funktionsgraphen im Koordinatenkreuz c) d) 8. Berechnen Sie Bilder und Urbilder: a) f : R → R, f ( x ) = 2 x − 1. Gesucht sind f ([0; 5]) und f − 1 ([ − 2; 0]). b) g : [0; 1[ → R, g ( x ) = 2 − 5 x . Gesucht sind Bild ( g ) und g − 1 ([ − 4; − 1]). c) h : [1; 2] → R, h ( x ) = x − 1 x +3 . Gesucht sind Bild ( h ) und h − 1 ([0; 1]). 2.3 Wachstums- und Krümmungseigenschaften von Funktionen Wir führen hier zu den Graphen von Funktionen mathematische Sprechweisen ein, und geben Ihnen gleich auch einige Beispiele, wie mit deren Hilfe qualitative Aussagen ökonomischer Zusammenhänge mathematisiert werden können: 2.3.1 Lage des Funktionsgraphen im Koordinatensystem In Abbildung 2.4 sind grundlegende Begriffe des Funktionsgraphen im Zusammenhang mit dem Koordinatenkreuz zusammengefasst. ■ Die Koordinatenachsen heißen Abszisse ( x -Achse) und Ordinate ( y -Achse). An ihrem Schnittpunkt liegt der Ursprung des Koordinatensystems. ■ Vorausgesetzt, dass 0 zum Definitionsbereich von f gehört, so hat der Graph der Funktion genau den Schnittpunkt (0 | f (0)), welcher Ordinaten-Abschnitt oder y -Achsen-Abschnitt heißt. Beispielsweise bei einer Kostenfunktion bestimmt dieser die Fixkosten unabhängig von der produzierten Menge. ■ Die Schnittpunkte des Graphen mit der Abszisse legen die sogenannten Nullstellen der Funktion fest. Sie werden berechnet, indem man den Funktionsterm gleich Null setzt und anschließend die Gleichung nach x auflöst. Ökonomische Anwendungen, z.B. die Berechnung der Gewinnzone (Gewinnschwelle und Gewinngrenze) einer Gewinnfunktion folgen noch. Es sei aber schon jetzt darauf hingewiesen, dass die Nullstellenberechnung auch eine fundamentale technische Bedeutung bei der Analyse ökonomischer Funktionen im Rahmen der Differenzialrechnung hat. 48818_Terveer.indd 42 48818_Terveer.indd 42 18.07.2023 11: 47: 12 18.07.2023 11: 47: 12 <?page no="43"?> 2.3 Wachstums- und Krümmungseigenschaften von Funktionen 43 x y a x 1 x 2 b Abbildung 2.5: Monotonie/ Extrema für f : [ a ; b ] → R 2.3.2 Monotonieeigenschaften von Funktionen In Abbildung 2.5 werden Sprechweisen im Zusammenhang mit Zu- und Abnahme einer Funktion dargestellt. Auf dem Funktionsgraphen fallen sogenannte Extrempunkte, d.h. höchste und tiefste Punkte auf, speziell ein globales Maximum an der Stelle x 1 und ein globales (Rand)-Minimum an der Stelle a . Der zweite Tiefpunkt zur Stelle x 2 ist dagegen nur ein lokales Minimum der Funktion. Am rechten Randwert b findet man ein lokales (Rand)-Maximum. Globale Maxima werden z.B. für den Gewinn oder den Erlös, globale Minima z.B. für die Kosten und für den Verlust angestrebt. Zwischen je zwei dieser Extremwerte hat die Funktion einen einheitlich zu- oder abnehmenden Verlauf. Sie heißt zwischen a und x 1 bzw. x 2 und b (streng) isoton oder (streng) monoton wachsend und zwischen x 1 und x 1 (streng) antiton oder (streng) monoton fallend. Der Zusatz „streng“ wird verwendet, wenn stets ein echter Anstieg oder Abfall erfolgt. Antitone Zusammenhänge bestehen z.B. in der Regel zwischen Nachfrage und Preis (je höher der Preis, desto geringer die Nachfrage), isotone zwischen Angebot und Preis (je höher der Preis, desto mehr Anbieter finden sich für das Produkt, wodurch das Angebot steigt). Die „je. . . ,desto. . . “-Sprechweise für monotone Funktionen lässt sich formalisieren: Definition 2.9 ! Es sei f : D → R eine Funktion, wobei D ⊂ R ein Intervall sei. f heißt ■ monoton wachsend, wenn für alle x 1 , x 2 ∈ D mit x 1 < x 2 gilt f ( x 1 ) ≤ f ( x 2 ). ■ monoton fallend, wenn für alle x 1 , x 2 ∈ D mit x 1 < x 2 gilt f ( x 1 ) ≥ f ( x 2 ) ■ streng monoton wachsend, wenn für alle x 1 , x 2 ∈ D mit x 1 < x 2 gilt f ( x 1 ) < f ( x 2 ), ■ streng monoton fallend, wenn für alle x 1 , x 2 ∈ D mit x 1 < x 2 gilt f ( x 1 ) > f ( x 2 ). Monotonie kann mit der Ableitung überprüft werden vgl. Unterabschnitt 8.5.2 . 2.3.3 Krümmung von Funktionen Neben dem Wachstumsverhalten spielt auch die Krümmung einer Funktion eine wichtige Rolle, vgl. Abbildung 2.6. 48818_Terveer.indd 43 48818_Terveer.indd 43 18.07.2023 11: 47: 12 18.07.2023 11: 47: 12 <?page no="44"?> 44 2 Das Funktionskonzept x y a x 2 b Abbildung 2.6: Krümmungseigenschaften einer Funktion f : [ a ; b ] → R x y x 1 x 2 x y 1 y y 2 Abbildung 2.7: Bei einer (streng) konvexen Funktion liegt die Verbindungsstrecke zwischen zwei Punkten auf dem Funktionsgraph stets oberhalb des Graphen, d.h. es gilt mit den Bezeichnungen in der Abbildung y ≥ f ( x ). Den Graphen können Sie sich als Abbild einer Straße vorstellen, auf der abwechselnd Links- und Rechtskurven auftreten. Der Punkt, an dem eine Linksin einer Rechtskurve übergeht, wird Wendepunkt genannt, die entsprechende Stelle auf der Abszisse (in Abbildung 2.6 also x 2 ) heißt Wendestelle. Zwischen zwei Wendestellen liegt ein einheitliches Krümmungsverhalten vor: Bei Linkskrümmung heißt f (streng) konvex, bei Rechtskrümmung heißt f (streng) konkav. Der Zusatz „streng“ darf verwendet werden, wenn ausgeschlossen werden kann, dass im Bereich einer Links- oder einer Rechtskurve „ gerade Stücke“ auftreten. In Abbildung 2.6 ist die Funktion im gestrichelten Teil des Graphen konvex und im durchgezogenen Teil konkav. Die Krümmung eines Graphen beschreibt die „Trend-Änderung“ des Zusammenhangs der x - und y - Werte. Man kann mit ihr Aussagen mathematisch präzisieren, wie z.B. „die Abnahme der Nachfrage verlangsamt sich bei zunehmendem Preis“. Das Krümmungsverhalten kann auch direkt mit dem Funktionsterm beschrieben werden, dazu betrachten wir eine linksgekrümmte Funktion f : [ a ; b ] → R und x 1 , x 2 ∈ [ a ; b ] mit x 1 < x 2 und y 1 = f ( x 1 ) , y 2 = f ( x 2 ) gemäß Abbildung 2.7. Es sei x ∈ ] x 1 ; x 2 [ und ( x | y ) der Punkt auf der Verbindungsstrecke zwischen ( x 1 | y 1 ), ( x 2 | y 2 ). Nach den Strahlensätzen stimmt das Streckenverhältnis t = x − x 1 x 2 − x 1 ∈ ]0; 1[ mit y − y 1 y 2 − y 1 überein. Für x, y leitet man her her: 48818_Terveer.indd 44 48818_Terveer.indd 44 18.07.2023 11: 47: 12 18.07.2023 11: 47: 12 <?page no="45"?> 2.3 Wachstums- und Krümmungseigenschaften von Funktionen 45 ■ t = x − x 1 x 2 − x 1 ⇔ x − x 1 = t ( x 2 − x 1 ) ⇔ x = (1 − t ) x 1 + tx 2 und entsprechend ■ t = y − y 1 y 2 − y 1 ⇔ y = (1 − t ) y 1 + ty 2 = (1 − t ) f ( x 1 ) + tf ( x 2 ) Die Linkskrümmung des Funktionsgraphen besagt außerdem, dass f ( x ) < y . Setzt man die obigen Terme für x, y ein, so ergibt sich f ((1 − t ) x 1 + tx 2 ) < ( t − 1) f ( x 1 )+ tf ( x 2 ). Mit dieser Beziehung wird nun das Konzept einer „echten“ Krümmung von der graphischen auf eine algebraische Darstellung umgestellt: Definition 2.10 ! Es sei f : D → R eine Funktion, wobei D ⊂ R ein Intervall sei. Gilt für alle x 1 , x 2 ∈ D mit x 1 ̸ = x 2 sowie t ∈ ]0; 1[ ■ f ((1 − t ) x 1 + tx 2 ) ≤ (1 − t ) f ( x 1 ) + tf ( x 2 ), so heißt f konvex, ■ f ((1 − t ) x 1 + tx 2 ) ≥ (1 − t ) f ( x 1 ) + tf ( x 2 ), so heißt f konkav, ■ f ((1 − t ) x 1 + tx 2 ) < (1 − t ) f ( x 1 ) + tf ( x 2 ), so heißt f streng konvex, ■ f ((1 − t ) x 1 + tx 2 ) > (1 − t ) f ( x 1 ) + tf ( x 2 ), so heißt f streng konkav. Konvexität kann mit zweiten Ableitungen überprüft werden vgl. Unterabschnitt 8.5.6 Übungen zu Abschnitt 2.3 ? 9. Welche der nachfolgenden Graphen die nachfolgenden Funktionseigenschaften? ■ f ist monoton steigend / streng monoton steigend ■ f ist monoton fallend / streng monoton fallend ■ f ist konvex / streng konvex ■ f ist konkav / streng konkav a) b) c) d) e) f) Geben Sie bei den nicht einheitlich gekrümmten Funktionen auch die ungefähre Lage der Wendepunkte an. 10. Zeichnen Sie anhand der Graphen in Aufgabe 6 vgl. S. 41 die gerade vorgestellten Begriffe aus. 11. Im nebenstehenden Schaubild finden Sie jeweils in Abhängigkeit von der abgesetzten (und produzierten) Gütermenge x die Graphen einer ■ Kostenfunktion: K ( x ) = 10 x + 100 ■ Erlösfunktion: E ( x ) = 1 22500 x 3 − 4 30 x 2 + 110 x ■ Gewinnfunktion: G ( x ) = E ( x ) − K ( x ) Beschreiben Sie für jede der drei Funktionen den ungefähren Funktionsverlauf mit Hilfe der in diesem Abschnitt behandelten Begriffe. Versuchen Sie auch eine ökonomische Interpretation des Verlaufes. 48818_Terveer.indd 45 48818_Terveer.indd 45 18.07.2023 11: 47: 12 18.07.2023 11: 47: 12 <?page no="46"?> 46 2 Das Funktionskonzept 2.4 Verkettung und Umkehrung von Funktionen Die Berechnung ökonomischer Größen erfolgt oftmals durch Einsetzen von Funktionstermen ineinander. Dieser Vorgang wird als Verkettung bezeichnet. Vielfach wird nur der verkettete Zusammenhang benötigt, nicht aber die Stufen der Verkettung. Beispiel 2.12 Aus einem Produktionsfaktor x wird ein Produkt in der Menge r = 3 √ x hergestellt. Der Erlös, der aus der Produktion erzielt wird, betrage 5 r . Ist man nur an dem Zusammenhang zwischen Faktoreinsatz x und Erlös y interessiert, so könnte man die Variable r weglassen. Dazu setzt man den Ausdruck r = 3 √ x in y = 5 r ein und erhält y = 5 r = 5 · 3 √ x = 15 √ x . Umgekehrt wird ein Funktionsterm auch oft „über Zwischenergebnisse“ ausgerechnet. Beispiel 2.13 Der Funktionsterm f ( x ) = x 2 +1 x 2 − 1 wird zweistufig berechnet: [1] den Term x quadrieren, d.h. den Term v = x 2 berechnen, [2] den Term y = v +1 v − 1 berechnen. Die Schritte beinhalten Funktionen g , h mit den Termen g ( x ) = x 2 und h ( v ) = v +1 v − 1 . Beachten Sie, dass die Durchführung der Rechenschritte erfordert, dass v ̸ = 1, da ansonsten durch Null dividiert würde. Beim Verketten muss man also aufpassen, dass für die jeweiligen Variablen „korrekte“ Werte eingesetzt werden. Das bedeutet, die Definitions- und Wertebereiche der den Termen zugehörigen Funktionen in zueinander passender Form vorliegen zu haben. Dann ergibt sich die Funktion f , indem man die beiden Funktionen g, h hintereinander ausführt bzw. in richtiger Reihenfolge ineinander einsetzt, und man spricht von der Verkettung der Funktionen g, h . Definition 2.11 ! Es seien Funktionen g : D g → W g mit D g , W g ⊆ R und h : D h → W h mit D h , W h ⊆ R gegeben, wobei W g ⊆ D h . Unter der Verkettung h ◦ g der Funktionen g, h versteht man die Funktion f : D g → W h mit dem Funktionsterm f ( x ) = ( h ◦ g )( x ) = h ( g ( x )). Ungewohnt an der Schreibweise h ◦ g ist die Tatsache, dass die zuerst „ausgeführte“ Funktion g an zweiter Stelle im Ausdruck steht, die zuletzt ausgeführte Funktion h hingegen an erster Stelle. Man muss den Ausdruck h ◦ g hinsichtlich seiner „Evaluation“ also „von rechts nach links“ lesen. Beispiel 2.14 In Beispiel 2.13 lauten die beiden verketteten Funktionen ■ g : D g = R \ { 1 } → W g = [0; ∞ [ \{ 1 } : g ( x ) = x 2 ■ h : D h = R \ { 1 } → W g = R \ { 1 } : h ( v ) = v +1 v − 1 Sie haben im Zusammenhang mit dem Funktionskonzept gesehen, dass sich Funktionen oft durch Auflösung einer Gleichung ergeben. Dabei wird eine der in der Gleichung 48818_Terveer.indd 46 48818_Terveer.indd 46 18.07.2023 11: 47: 13 18.07.2023 11: 47: 13 <?page no="47"?> 2.4 Verkettung und Umkehrung von Funktionen 47 auftretenden Variablen x, y als Funktion der anderen geschrieben. Für diesen Vorgang gibt es bei zwei Variablen prinzipiell zwei Möglichkeiten, den Zusammenhang durch eine Funktion zu beschreiben: Auflösung nach x oder Auflösung nach y . Beispiel 2.15 Es sei angenommen, dass ein ökonomischer Zusammenhang zwischen dem Preis x eines Produktes und der von diesem Produkt nachgefragten Menge y besteht, der von der Form y = 40 − 2 x ist, wobei x ∈ [0 , 20]. Die nachgefragte Menge y liegt dann im Intervall [0 , 40]. Wir haben es also hier mit der Funktion f : [0; 20] → [0; 40], f ( x ) = 40 − 2 x zu tun. In der Anwendung (z.B. bei der Berechnung von Cournot- Punkten) interessiert meist der umgekehrte Zusammenhang, nämlich welcher Preis x zu einer bestimmten nachgefragten Menge gehört. Hier löst man die Gleichung y = 40 − 2 x durch Freistellung nach x auf und erhält − 2 x = y − 40 ⇔ x = 20 − 12 y . Der neu erhaltene Term in Abhängigkeit von y gehört zu einer Funktion, die man Umkehrfunktion zu f nennt: Definition 2.12 ! Eine Funktion g heißt Umkehrfunktion einer Funktion f : D → W, wenn gilt: [1] zu jedem y ∈ f (D) gibt es genau ein x ∈ D mit f ( x ) = y , [2] zu jedem y ∈ f (D) gilt f ( x ) = y genau dann, wenn g ( y ) = x . Man schreibt für die Umkehrfunktion g dann f − 1 : f (D) → D Den Wert f − 1 ( y ) kann man sich anhand des Graphen von f verdeutlichen vgl. Abbildung 2.8 . Verwendet man das Verkettungssymbol ◦ , so ergibt sich bei Verkettung der Funktion f mit der Umkehrfunktion f − 1 die Identität, f − 1 ◦ f = id, d.h. ( f − 1 ◦ f )( x ) = f − 1 ( f ( x )) = x . Ebenso gilt f ◦ f − 1 = id . Umkehrbare Funktionen sind genau die bijektiven Funktionen: Satz 2.1 f : D → W ist genau dann umkehrbar, wenn f bijektiv, d.h. surjektiv und injektiv ist. Denn ist f surjektiv, dann hat jedes y ∈ W mindestens ein Urbild. Ist f zusätzlich injektiv, dann hat y ∈ W höchtens ein Urbild. Insgesamt hat bei einer surjektiven und injektiven Funktion jedes y ∈ W genau ein Urbild x , d.h. die Gleichung f ( x ) = y lässt sich eindeutig nach x auflösen und man erhält die Zuordnung x = g ( y ). Ist eine Funktion umkehrbar, so besagt [1], dass f injektiv und surjektiv ist. Eine Umkehrfunktion muss nicht notwendig existieren, denn die Gleichung f ( x ) = y kann in x mehrere Lösungen haben, wie schon das Beispiel der Funktion f ( x ) = x 2 zeigt. Allerdings existiert immer die Umkehrfunktion einer streng monotonen Funktion: Satz 2.2 Ist f : [ a ; b ] → R eine streng monoton wachsende oder streng monoton fallende Funktion, so hat f eine Umkehrfunktion. Funktion und Umkehrfunktion werden im gleichen Koordinatensystem gezeichnet. Den Graphen von f − 1 gewinnt man durch Tausch von Abszisse und Ordinate, d.h als Punktmenge { ( f ( x ) | x ) : x ∈ D } . Zeichnerisch erhält man den Graphen durch Spiegelung des 48818_Terveer.indd 47 48818_Terveer.indd 47 18.07.2023 11: 47: 13 18.07.2023 11: 47: 13 <?page no="48"?> 48 2 Das Funktionskonzept Abbildung 2.8: Graphische Ermittlung der Umkehrfunktion durch Spiegelung an der Diagonale y = x Graphen von f an der „Hauptdiagonalen“ y = x ; dazu muss auf Abszisse und Ordinate die gleiche Skalierung gewählt werden. vgl. Abbildung 2.8 Eine inhaltliche Interpretation der Koordinatenachsen ist nicht mehr möglich, wenn man Funktion und Umkehrfunktion in dasselbe Koordinatensystem einzeichnet. Beispielsweise stellt die Abszisse bei einer Nachfragefunktion x → p ( x ) die nachgefragte Menge dar. Zeichnet man die zugehörige Umkehrfunktion p → x ( p ) in dieses Schaubild, so stellt die Abszisse jetzt auch den Preis dar. Die gleiche Ambivalenz gilt für die Ordinate. Deshalb werden gemeinsame graphische Darstellungen von Funktion und Umkehrfunktion meist nicht inhaltlich, sondern mathematisch-technisch interpretiert. Übungen zu Abschnitt 2.4 ? 12. Berechnen Sie die Funktion f = h ◦ g a) h ( x ) = x 2 , g ( x ) = 2 x b) h ( x ) = x − x 3 , g ( x ) = 5 x + 7 c) h ( x ) = 2 x − 5, g ( x ) = 12 x + 52 13. Berechnen Sie für die nachstehenden Funktionen f, g ∈ { f 1 , f 2 , f 3 , f 4 , f 5 } jeweils die Verkettung, d.h. die Hintereinanderausführung ( f ◦ g )( x ) = f ( g ( x )). Achten Sie dabei darauf, die Definitions- und Wertebereiche passend festzulegen. Welche der Funktionen f i ist Umkehrfunktion welcher Funktion f j ? Bestätigen Sie Ihre Zuordnung von Funktion und Umkehrfunktion auch graphisch, indem Sie Funktion und Umkehrfunktion in ein Koordinatensystem zeichnen. f 1 ( x ) = x +1 x , f 2 ( x ) = − x , f 3 ( x ) = 1 x , f 4 ( x ) = x , f 5 ( x ) = 1 x − 1 14. Welche der Funktionen zu den nachstehenden Graphen hat eine Umkehrfunktion? Begründen Sie Ihre Antwort jeweils. a) b) c) 15. Bestimmen Sie Umkehrfunktionen zu folgenden Funktionen f (Geben Sie auch den Definitionsbereich von f an, für den eine Umkehrfunktion existiert, sowie den Definitionsbereich der Umkehrfunktion): a) f ( x ) = 7 x − 20 b) f ( x ) = 2 / x c) f ( x ) = x +1 x − 1 16. Finden Sie h mit f = h ◦ g . a) f ( x ) = 5 x − 3, g ( x ) = 1 − x b) f ( x ) = x 2 , g ( x ) = 2 x + 7 48818_Terveer.indd 48 48818_Terveer.indd 48 18.07.2023 11: 47: 14 18.07.2023 11: 47: 14 <?page no="49"?> 2.5 Exkurs: Relationen 49 Abbildung 2.9: Graphische Darstellung von Relationen - links Parabel und Umkehrparabel, Mitte Relation aus Beispiel 2.16, rechts Gebote, die zum Zuschlag für Bieter A bei einer Auktion führen 2.5 Exkurs: Relationen Wie wir soeben gesehen haben, kann man zu jeder Funktion ihren Graphen als eine besondere Punktmenge im Koordinatensystem zeichnen. Umgekehrt aber gibt es eine Vielzahl von Punktmengen, die nicht Graphen von Funktionen sind. Zeichnet man beispielsweise den Graphen von f ( x ) = x 2 und spiegelt ihn an der Winkelhalbierenden y = x , so ergibt sich eine auf der Seite liegende Parabel vgl. Abbildung 2.9 . Hier ist nicht jedem x -Wert ein eindeutiger y -Wert zugeordnet, sondern man erhält zu jedem x -Wert mit x > 0 gleich zwei y -Werte, nämlich die beiden Wurzeln (s.o). Dieser Umstand führt zum Begriff der Relation: Definition 2.13 ! Es seien D , W Teilmengen von R. Eine Relation R zwischen D und W ist eine Teilmenge von D × W. Dabei versteht man unter dem kartesischen Produkt D × W die Menge aller Punkte ( x | y ), für die gilt x ∈ D und y ∈ W. Beispiel 2.16 Die Menge D × W mit D = [1; 4] und W = [0 , 25; 1] besteht aus allen Punkten ( x | y ) für die 1 ≤ x ≤ 4 und 0 , 25 ≤ y ≤ 1 gilt. Geometrisch ist sie das Rechteck mit den Eckpunkten (1 | 0 . 25), (1 | 1), (4 | 0 , 25) und (4 | 1). Eine Relation zwischen D und W ist D × W selber, aber auch die Menge M = { P (12 t (1 − t ) + 1 | ( t +1) 2 4 ) : t ∈ [0; 1] } ist eine Relation zwischen [1; 4] und [0; 1]. M ist aber keine Funktion vgl. Abbildung 2.9 . Auch Beziehungen zwischen ökonomischen Größen sind nicht immer eindeutig: Beispiel 2.17 Es seien x und y die verdeckten Angebote zweier Bieter A und B bei einer Auktion, bei welcher A als erster bietet. Dann entspricht der Zuschlag für Bieter A der mathematischen Relation R A = { ( x | y ) : x, y ≥ 0 , x ≥ y } . Bekommt Anbieter A den Zuschlag, d.h. gilt ( x | y ) ∈ R A , so schreibt man auch: xR A y . Mit dieser Relation R A können die Gebote aller Bieter, die an der Auktion teilnehmen, zueinander in 48818_Terveer.indd 49 48818_Terveer.indd 49 18.07.2023 11: 47: 14 18.07.2023 11: 47: 14 <?page no="50"?> 50 2 Das Funktionskonzept Beziehung gesetzt werden. Relationen können auch graphisch dargestellt werden vgl. Abbildung 2.9 , indem die betreffenden Mengen R skizziert werden. Übungen zu Abschnitt 2.5 ? 17. Skizzieren Sie die Graphen der folgenden Relationen: a) R 1 = { ( x | y ) ∈ R 2 : x 2 + y 2 = 1 } b) R 2 = { ( x | y ) ∈ R 2 : xy − x = y − 1 } c) R 3 = { ( x | y ) ∈ R 2 : | x − y | ≤ 1 } d) R 4 = { ( x | y ) ∈ R 2 : x ist Gewicht, y ist Porto eines Briefes (Standard-, Kompakt-, Groß-, Maxibrief, Versand innerhalb Deutschland, ohne Zusatzleistungen und Rabatte) } Zusammenfassung Mit Funktionen werden (nicht nur) in den Wirtschaftswissenschaften rechnerische Zusammenhänge zwischen quantitativen Größen modelliert. Nach Bearbeitung von Kapitel 1 sollten Sie ■ Funktionen als Zuordnungen quantitativer Größen verstehen, ■ grundlegende Begriffe wie Definitions- und Wertebreich, Bild und Urbild, Injektivität, Surjektivität und Bijektivität einer Funktion kennen, ■ den Graphen einer Funktion anhand einer Wertetabelle erstellen und darin das Wachstums- und Krümmungsverhalten beschreiben können, ■ Verkettungen von Funktionen erkennen und berechnen können, ■ den Ansatz zur Bestimmung einer Umkehrfunktion aufstellen können, ■ Relationen als Verallgemeinerungen des Funktionsbegriffs kennen. 48818_Terveer.indd 50 48818_Terveer.indd 50 18.07.2023 11: 47: 15 18.07.2023 11: 47: 15 <?page no="51"?> 3 Lineare Funktionen Übersicht Ändert sich eine ökonomische Variable x , so ist dies in der Regel auch für eine hiervon funktional abhängige Variable y = f ( x ) der Fall. Lineare Funktionen beschreiben Situationen, in denen die Änderungen in x und y proportional sind. Das bedeutet bei einem konkreten linearen Zusammenhang: Ändert sich der Wert der Variable x von x 0 zu x 1 , so beträgt die Änderung zwischen y 1 = f ( x 1 ) und y 0 = f ( x 0 ) y 1 − y 0 = f ( x 1 ) − f ( x 0 ) = a ( x 1 − x 0 ) Dabei ist a ∈ R ein für den Zusammenhang zwischen x und y pauschal gegebener Wert. Es gilt also für beliebiges x und y = f ( x ) y − y 0 = a ( x − x 0 ) ⇒ y = y 0 + a ( x − x 0 ) = ax + ( y 0 − ax 0 ) Lineare Funktionen haben einen Funktionsterm der Form y = ax + b . Sie werden z.B. als Kostenfunktionen verwendet, wenn es nur fixe und proportionale Kosten gibt: Beispiel 3.1 Bei einer Produktion von Computerbauteilen fallen fixe Kosten in Höhe von 20.000 e an, die Produktion eines einzelnen Bauteils kostet 0,45 e . Unterstellt man hier einen proportionalen Anstieg der Kosten, so berechnen sich die Kosten in Abhängigkeit von der Produktionszahl x mittels einer Funktion f mit dem Funktionsterm y = f ( x ) = 0 , 45 x + 20000. In diesem Beispiel können für x im Sachzusammenhang zwar nur die Werte 0 , 1 , 2 , . . . eingesetzt werden, allerdings wird bei der Modellierung oft gleich ganz R oder ein Intervall wie [0; ∞ [ verwendet, weil es mathematisch möglich ist, beliebige reell Zahlen für x einzusetzen. Außerdem dienen lineare Funktionen als Modelle für Nachfragefunktionen (bei linear fallendem Verlauf) vgl. Beispiel 3.15, S. 59 , für Angebotsfunktionen (bei linear steigendem Verlauf) vgl. S. 59 oder für Trendfunktionen bzw. -folgen in der Zeitreihenanalyse vgl. Beispiel 7.1, S. 125 . Mit b = 0 werden direkt proportionale Zusammenhänge erfasst, z.B. der Zusammenhang zwischen Absatzmenge und Erlös vgl. Unterabschnitt 8.6.1, S. 208 oder zwischen Produktionsfaktor und Produktionsoutput: Beispiel 3.2 Aus 1 Liter Milch stellt eine Molkerei 0,04 kg (ungesalzene) Butter her. Die Produktionsfunktion hierzu lautet f : [0; ∞ [ → R, f ( x ) = 0 , 04 x . Lineare Funktionen stellen auch die „Approximation“ eines eigentlich nichtlinearen Zusammenhangs dar. Diesen Sachverhalt werden wir in der Differentialrechnung (Kapitel 8) noch genauer beleuchten. 48818_Terveer.indd 51 48818_Terveer.indd 51 18.07.2023 11: 47: 15 18.07.2023 11: 47: 15 <?page no="52"?> 52 3 Lineare Funktionen 3.1 Normalform linearer Funktionen Definition 3.1 ! Eine Funktion f : D → R, mit D ⊆ R und dem Funktionsterm f ( x ) = a · x + b , wobei a, b reelle Zahlen sind, heißt (affin-)lineare Funktion. Diese Darstellung einer linearen Funktion wird Normalform genannt. Der Definitionsbereich D einer linearen Funktion kann aus mathematischer Sicht die Menge R aller reellen Zahlen sein, in ökonomischen Anwendungen handelt es sich meist um die Menge [0; ∞ [ der nichtnegativen reellen Zahlen oder ein Intervall [ a ; b ]. Unterstellt man im Beispiel mit den Computerbauteilen etwa, dass im betrachteten Zeitraum, für den die fixen Kosten veranschlagt werden, höchstens 80000 Bauteile hergestellt werden können, so wird man als Definitionsbereich das Intervall [0; 80000] (bzw. nur die ganzen Zahlen innerhalb dieses Intervalls) annehmen. 3.1.1 Interpretation des Faktors a der Normalform Der Parameter a der Normalform kann aus zwei beliebigen verschiedenen Punkten P ( x 1 | y 1 ), Q ( x 2 | y 2 ) des Graphen von f zurückgewonnen werden, es gilt nämlich y 2 − y 1 x 2 − x 1 = ax 2 + b − ( ax 1 + b ) x 2 − x 1 = ax 2 − ax 1 x 2 − x 1 = a ( x 2 − x 1 ) x 2 − x 1 = a Der Koeffizient a misst demnach den Zuwachs im Funktionswert relativ zum Zuwachs des Argumentes. Der Ausdruck y 2 − y 1 x 2 − x 1 = f ( x 2 ) − f ( x 1 ) x 2 − x 1 wird als Differenzenquotient bezeichnet. Den Zuwachs nennt man auch Steigung von f . Je größer diese Steigung betragsmäßig ist, desto steiler verläuft der Graph der Funktion f . Ist a positiv, so ist f streng monoton wachsend, für negatives a ist f streng monoton fallend. Beispiel 3.3 In Beispiel 3.1 vgl. S. 51 ist die Steigung 0 , 45 die Änderung der Gesamtkosten bei Erhöhung der Produktion um ein Computerbauteil. Dabei handelt es sich gleichzeitig um die variablen Kosten. 3.1.2 Interpretation des Summanden b der Normalform Der Koeffizient b ist der Ordinatenabschnitt von f , es gilt also f (0) = b . Beispiel 3.4 In Beispiel 3.1 beschreibt der Koeffizient b die fixen Kosten bei der Produktion der Computerbauteile. 3.1.3 Nullstellen linearer Funktionen Falls a ̸ = 0 ist, so schneidet der Graph von f ( x ) = ax + b die Abszisse in genau einem Punkt, diese Nullstelle errechnet sich zu − b a . 48818_Terveer.indd 52 48818_Terveer.indd 52 18.07.2023 11: 47: 15 18.07.2023 11: 47: 15 <?page no="53"?> 3.1 Normalform linearer Funktionen 53 Abbildung 3.1: Festlegung einer linearen Funktion durch zwei Punkte; Steigung und Achsenabschnitte einer linearen Funktion Beispiel 3.5 Die Nullstelle (der Abszissenabschnitt) der Funktion f ( x ) = − 2 x + 5 errechnet sich aus − 2 x + 5 = 0 ⇔ − 2 x = − 5 ⇔ x = 52 . Der Ordinatenabschnitt ist 5. 3.1.4 Bestimmung der Normalform einer linearen Funktion aus zwei Punkten Sind P ( x 1 | y 1 ) , Q ( x 2 | y 2 ) zwei Punkte mit x 1 ̸ = x 2 , so lässt sich die Normalform der Geraden, die durch diese Punkte geht, bestimmen vgl. Abbildung 3.1 ■ Die Steigung ergibt sich als a = y 2 − y 1 x 2 − x 1 vgl. Abschnitt 3.1.1 . ■ Den Ordinatenabschnitt erhält man durch Einsetzen eines Punktes, z.B. Q ( x 2 | y 2 ) und Umstellen von y 2 = ax 2 + b zu b = y 2 − x 2 a = y 2 − x 2 y 2 − y 1 x 2 − x 1 . Beispiel 3.6 Von einer linearen Funktion sei bekannt, dass sie durch die Punkte P ( − 2 | 1) und Q (1 | − 5) verläuft. Ihre Steigung berechnet sich dann als: a = ( − 5) − 1 1 − ( − 2) = − 2. Der Ordinatenabschnitt ergibt sich durch Einsetzen z.B. des Punktes Q (1 |− 5) zu f (1) = − 5 ⇔ ( − 2) · 1 + b = − 5 ⇔ b = − 3. Die Normalform lautet also f ( x ) = − 2 x − 3. Durch Einsetzen des anderen Punktes P erhält man dasselbe Ergebnis. Übungen zu Abschnitt 3.1 ? 1. Berechnen Sie für in der folgenden Tabelle jeweils angegebenen Punkte P , Q die Normalform f ( x ) = ax + b derjenigen linearen Funktion, deren Graph durch P und Q läuft. Prüfen Sie auch jeweils, ob die Funktion Nullstellen hat, und berechnen Sie diese. P Q a) (1 | 1) ( − 1 | 5) b) ( 12 | − 2) ( 15 | 12 ) c) ( − 1 | 7) (0 | 7) P Q d) (0 | t ) ( − 2 | 3 t ) e) ( s | t ) ( s + 2 | t + 4) f) ( − 3 | t t − 1 ) (2 | t 2 t − 1 ) 2. Der Preis eines Produktes in Abhängigkeit von der nachgefragten Menge sei von der Form f ( x ) = ax + 100 dabei sei a < 0. Berechnen Sie die Nullstelle von f und erläutern Sie deren Bedeutung im ökonomischen Kontext. 3. Eine Maschine im Wert von 28000 e soll innerhalb von fünf Jahren linear abgeschrieben werden, d.h. jedes Jahr soll derselbe Wertanteil steuerlich geltend gemacht weden. Finden Sie eine Funktion f : D → R, mit der der Restwert f ( x ) nach x Jahren beschrieben wird. 48818_Terveer.indd 53 48818_Terveer.indd 53 18.07.2023 11: 47: 16 18.07.2023 11: 47: 16 <?page no="54"?> 54 3 Lineare Funktionen 4. Ein Pkw-Fahrer steht mit laufendem Motor in einem Autobahnstau. Der Bordcomputer des Wagens zeigt eine zurückgelegte Strecke von 75 km, einen Tankinhalt von 15 Litern und 6,7 l/ 100km Durchschnittsverbrauch an. Nach 10 Minuten wird ein Durchschnittsverbrauch von 7,2 l/ 100km angezeigt. Wie lange könnte der Fahrer den Motor noch im Leerlauf eingeschaltet lassen? 3.2 Punkt-Steigungsform linearer Funktionen Sind hingegen nur ein beliebiger Punkt P ( x 0 | f ( x 0 )) auf dem Graphen von f und die Steigung a von f vorgegeben, so ergibt sich der Funktionswert an einem beliebigen anderen Punkt aus der Steigungsformel a = f ( x ) − f ( x 0 ) x − x 0 , indem man diese Formel nach f ( x ) umstellt und ohne dass man a ( x − x 0 ) ausmultipliziert, in die Form f ( x ) = f ( x 0 ) + a ( x − x 0 ) bringt. Diese Darstellung heißt Punkt-Steigungsform. Daraus erhält man auch wieder die Normalform f ( x ) = a · x + b mit b = f ( x 0 ) − ax 0 . Beispiel 3.7 Von einer linearen Funktion sei bekannt, dass sie durch den Punkt P (2 | 4) verläuft und die Steigung a = 3 hat. Ihre Punkt-Steigungsform ist dann f ( x ) = 4 + 3( x − 2). Die Normalform ergibt sich durch Ausmultiplizieren und Zusammenfassen zu f ( x ) = 4 + 3 x − 3 · 2 = 3 x − 2. Bei differenzierbaren Funktionen f kann die Punkt-Steigungsform als Ansatz zur Tangentengleichung y = ax + b in einem Punkt ( x 0 | y 0 )verwendet werden vgl. Unterabschnitt 8.3.4, S. 183 . Mit a = f ′ ( x 0 ) ist y = a ( x − x 0 ) + y 0 = ax + ( y 0 − ax 0 ) = ax + b , wobei b = y 0 − ax 0 . Das vermeidet die Berechnung von b durch Auflösen von ax 0 + b = y 0 . Übungen zu Abschnitt 3.2 ? 5. Wie lauten jeweils die Punkt- Steigungsform und die Normalform der Funktion, die mit der angegebenen Steigung a durch den angegebenen Punkt P ( x 0 | y 0 ) verläuft? a) b) c) d) a 2 − 3 45 − 2 P (1 | − 1) ( − 3 | 4) (5 | 6) ( − 1 | − 1) 6. Wie lautet die Punkt-Steigungsform der Funktion f : R → R , f ( x ) = 3 x + 2 im Punkt P ( t 2 | f ( t 2 )), wobei t ∈ R? 7. Ein Energieversorger bietet folgenden Stromtarif an: Bei einem Arbeitspreis von 20,29 Cent je kWh werden für einen Jahresverbrauch von 3250 kWh insgesamt 933 Euro in Rechnung gestellt. Stellen Sie - bei gleichbleibendem Grund- und Arbeitspreis - die lineare Kostenfunktion K : D → R in Abhängigkeit vom Jahresverbrauch auf (Punkt-Steigungsform). Geben Sie die Normalform an und erläutern Sie die Bedeutung des konstanten Gliedes darin. 3.3 Koordinatenform linearer Funktionen Eine lineare Funktion kann auch durch eine Geradengleichung, d.h. eine lineare Gleichung der Form a 1 x + a 2 y = c mit a 1 , a 2 , c ∈ R und a 2 ̸ = 0 beschrieben werden. Diese 48818_Terveer.indd 54 48818_Terveer.indd 54 18.07.2023 11: 47: 16 18.07.2023 11: 47: 16 <?page no="55"?> 3.4 Umkehrfunktion und Normale einer linearen Funktion 55 Darstellung wird Koordinatenform genannt. Man erhält dann die Normalform, indem man nach y auflöst: f ( x ) = − a 1 a 2 x + c a 2 . Die Darstellung mittels Geradengleichung ist nicht eindeutig. Bei Multiplikation der Gleichung mit einer beliebigen Konstanten ̸ = 0 ergibt sich dieselbe Gerade. Zur Normalform f ( x ) = ax + b gehört z.B. die Geradengleichung − ax + y = b . Beispiel 3.8 Die Normalform y = 2 x − 3 lässt sich z.B. in die Geradengleichung 2 x − y = 3 überführen. Zur Geradengleichung − 4 x +12 y = 10 lautet die Normalform y = 13 x + 56 . Durch eine Geradengleichung a 1 x + a 2 y = b mit a 2 = 0 und a 1 ̸ = 0 kann zudem eine vertikale Gerade beschrieben werden, allerdings handelt es sich dann bei der Gerade nicht mehr um den Graphen einer Funktion. Übungen zu Abschnitt 3.3 ? 8. Die Gerade mit der Koordinatenform 2 x − 7 y = 15 habe Punkt-Steigungsform f ( x ) = a ( x − 5) + b . Berechnen Sie a, b . 9. Eine Gerade hat die zwei Darstellungen 3 x + sy = 11 und y = tx + 11 2 . Bestimmen Sie s und t . 3.4 Umkehrfunktion und Normale einer linearen Funktion Aus Geraden werden durch Spiegelung und Rotation wieder Geraden. Zwei wichtige Spezialfälle seien hier besprochen. 3.4.1 Die Umkehrfunktion einer linearen Funktion Spiegelt man den Funktionsgraph an der Gerade x → y = x , also der 45-Grad-Achse der Zahlenebene, so erhält man die Umkehrfunktion sofern der erhaltene Graph auch eine Funktion repräsentiert vgl. Abschnitt 2.4 . Rechnerisch erhält man den Funktionsterm, indem man die Funktionsgleichung y = f ( x ) = ax + b nach x umstellt. Für a ̸ = 0, d.h. eine nichtkonstante lineare Funktion ist dies möglich: y = ax + b ⇔ ax = y − b ⇔ x = 1 a y − b a Nach Vertauschen von x und y erhält man für a ̸ = 0 die Umkehrfunktion mit dem Funktionsterm f − 1 ( x ) = 1 a x − b a erhalten. Beispiel 3.9 Die Umkehrfunktion zu f ( x ) = 3 x − 2 erhalten Sie wie folgt: [1] Stellen Sie die Gleichung y = 3 x − 2 auf. [2] Lösen Sie die Gleichung nach x auf: x = 13 y + 2 3 . [3] Vertauschen Sie die Variablen: y = 13 x + 23 . [4] Die Umkehrfunktion lautet f − 1 ( x ) = 13 x + 23 . 48818_Terveer.indd 55 48818_Terveer.indd 55 18.07.2023 11: 47: 17 18.07.2023 11: 47: 17 <?page no="56"?> 56 3 Lineare Funktionen Abbildung 3.2: Die Normale einer linearen Funktion f in P ( x 0 | f ( x 0 )) 3.4.2 Die Normale einer linearen Funktion Eine weitere mit einer nichtkonstanten linearen Funktion f ( x ) = ax + b verbundene lineare Funktion ist die Normale zu einem vorgegebenen Punkt P ( x 0 | f ( x 0 )); sie ist diejenige lineare Funktion h ( x ) = ˜ ax + ˜ b , deren Graph wie in Abbildung 3.2 ■ senkrecht zum Graphen von f ■ durch den Punkt P ( x 0 | f ( x 0 )) verläuft. Für die Steigung der Normalen gilt: ˜ a = − 1 a , denn die Normale h entsteht durch eine 90-Grad-Drehung um den Punkt P aus f , so dass Steigungsdreiecke von f und h einfach ihre Katheten mit umgekehrtem Vorzeichen vertauschen; damit erhält man ihre Punkt-Steigungsform h ( x ) = f ( x 0 ) − 1 a ( x − x 0 ). Beispiel 3.10 Zur linearen Funktion f ( x ) = 3 x − 2 bestimmt man die Normale im Punkt P (2 | 4), indem man den negativen Kehrwert der Steigung, also ˜ a = − 13 bildet und die Punkt- Steigungsform h ( x ) = − 13 ( x − 2) + 4 aufstellt. Die Normalform dazu ist h ( x ) = − 13 x + 14 3 . Übungen zu Abschnitt 3.4 ? 10. Ermitteln Sie rechnerisch die Umkehrfunktionen von f : a) f ( x ) = 2 x + 2 b) f ( x ) = − 13 x − 14 c) f ( x ) = x d) f ( x ) = x t + ( t − 1) 11. Berechnen Sie die Normale zur Funktion f im Punkt P : a) f ( x ) = 3 x + 2, P (2 | 8) b) f ( x ) = − 18 x + 12, P ( − 16 | 14) c) f ( x ) = 23 x + 7, P (3 | 9) 12. Die Funktion f sei als Gerade durch die Punkte P, Q erklärt. Berechnen Sie falls möglich jeweils die Umkehrfunktion und die Normale von f durch P. a) P (5 | 7), Q (8 | 3) b) P (0 | 5), Q (7 | 5) c) P ( a | 2), Q ( a + 1 | b ), dabei seien a, b ∈ R 13. Für t ∈ R sei f t ( x ) = t ( x − 3) − 1. Bestimmen Sie eine Zahl a ∈ R und die Schar ( g t ) t ∈ R aller Funktionen g t ( x ) = ax + t , die senkrecht zu f 13 stehen. 14. Gibt es eine lineare Funktion f ( x ) = a ( x − x 0 ) + y 0 (mit a ̸ = 0), deren Umkehrfunktion mit der Normalen im Punkt P ( x 0 | y 0 ) übereinstimmt? 48818_Terveer.indd 56 48818_Terveer.indd 56 18.07.2023 11: 47: 17 18.07.2023 11: 47: 17 <?page no="57"?> 3.5 Schnittpunkte linearer Funktionen 57 Abbildung 3.3: Schnittpunkte von Geraden: f 1 (grau) und f 2 (gestrichelt) haben unendlich viele Schnittpunkte; f 1 und f 3 haben keine Schnittpunkte; f 1 und f 4 haben genau einen Schnittpunkt. 3.5 Schnittpunkte linearer Funktionen Beispiel 3.11 Sie wollen am Wochenenden mal wieder Ihre reiche Patentante besuchen, um sich ihr in Erinnerung zu rufen. Als (noch) nicht wohlhabender Student müssen Sie dazu ein Auto mieten. Für welches der beiden folgenden Angebote entscheiden Sie sich? Anbieter Grundgebühr Kilometerpauschale KARO 20 e 0,05 e NAVIS 35 e 0,02 e Modelliert man die Angebote mittels linearer Funktionen f ( x ) = ax + b (KARO) und g ( x ) = cx + d (NAVIS), wobei x die tatsächliche Kilometerzahl der Fahrt bezeichnet, so sucht man zunächst eine Kilometerzahl x 1 , für die beide Angebote zur selben Miete ax 1 + b = y 1 = cx 1 + d führen. Aus mathematischer Sicht sucht man einen Schnittpunkt ( x 1 | y 1 ) von f und g , der in der Ökonomie auch Break-Even-Punkt. heißt. Grundsätzlich gilt: Ein Schnittpunktproblem ist stets ein Gleichsetzungsproblem. Es ist also die Gleichung f ( x ) = g ( x ) aufzustellen und nach x aufzulösen. Gemäß Abbildung 3.3 gibt es für lineare Funktionen f, g drei Fälle: ■ Falls a = c und b = d , gibt es unendlich viele Schnittpunkte ■ Falls a = c und b ̸ = d , gibt es keinen Schnittpunkt (parallele Geraden) ■ Falls a ̸ = c , gibt es genau einen Schnittpunkt: ax 1 + b = cx 1 + d ⇔ x 1 = d − b a − c Beispiel 3.12 In Beispiel 3.11 lauten die beiden Funktionen f ( x ) = 0 , 05 x + 20 und g ( x ) = 0 , 02 x + 35. Für ihren Schnittpunkt setzt man an: f ( x ) = g ( x ) ⇔ 0 , 05 x + 20 = 0 , 02 x + 35 ⇔ 0 , 03 x = 15 und damit x = 500. Weil die Steigung von f größer ist als die von g , gilt f ( x ) < g ( x ) für x < 500 und f ( x ) > g ( x ) für x > 500. Bei einer Gesamtstrecke unter 500 km ist deshalb KARO günstiger, ab 500 km sollten Sie sich für NAVIS entscheiden. 48818_Terveer.indd 57 48818_Terveer.indd 57 18.07.2023 11: 47: 18 18.07.2023 11: 47: 18 <?page no="58"?> 58 3 Lineare Funktionen Übungen zu Abschnitt 3.5 ? 15. Bestimmen Sie die Lage nachfolgender Geraden/ linearer Funktionen zum Graphen der Funktion f ( x ) = − 35 x + 75 : a) g ( x ) = 2 x − 4, b) tx + 5 y = 10 − t , c) 6 x + ty = t 16. Gegeben sind die Punkte A ( − 3 | − 2), B (5 | − 1), C (1 | 6) und D ( − 7 | 5). a) Bestimmen Sie die Gleichungen der Geraden durch A und B , B und C , C und D sowie D und A , so dass ein Viereck entsteht. b) Stellen Sie die Geradengleichungen der Diagonalen dieses Vierecks auf und berechnen Sie ihren Schnittpunkt. c) Von welcher Art ist das Viereck? Berechnen Sie seinen Flächeninhalt. 17. Ein Wagen fährt auf der Bundesstraße von Neustadt nach Althausen mit einem konstanten Tempo von 75 Stundenkilometern. 2 Minuten, nachdem der Wagen in Neustadt losgefahren ist, startet ein weiterer Wagen auf derselben Strecke und fährt mit konstanten 80 Stundenkilometern. Er überholt den zuerst gestarteten Wagen noch vor Althausen. Wie weit sind Neustadt und Althausen mindestens voneinander entfernt? 18. Für t ∈ R seien die Funktionen f t , g t : R → R gegeben durch f t ( x ) = − ( t 2 + 1) x − ( t + 1) und g t ( x ) = ( t 2 + 1) x + t − 1. a) Berechnen Sie den Schnittpunkt P ( x t | y t ) von f t und g t . b) Berechnen Sie den Flächeninhalt des Dreiecks, welches von P und den Schnittpunkten von f t und g t mit der Abszisse bestimmt wird. Für welches t wird dieser Flächeninhalt maximal? 3.6 Ökonomische Anwendungen linearer Funktionen Typische lineare Funktionen in ökonomischen Anwendungen sind Kostenfunktionen, Nachfragefunktionen und Angebotsfunktionen. Eine Kostenfunktion beschreibt den Zusammenhang zwischen der produzierten Menge x eines Gutes - auch Produktionsertrag genannt - und den durch die Herstellung verursachten Kosten K ( x ). Die Kosten teilen sich auf in Fixkosten und variable Kosten. Dabei beinhalten die Fixkosten diejenigen Kosten, die für die Bereitstellung von Maschinen, Arbeitskraft, Mieten, etc. anfallen, ohne dass dabei schon produziert wird. Die variablen Kosten erfassen alle Auslagen, die in Abhängigkeit von der produzierten Menge variieren können. Eine lineare Kostenfunktion K ( x ) = ax + b berücksichtigt Fixkosten b > 0 und Stückkosten a > 0 je hergestellter Einheit des Produktes. Beispiel 3.13 Die Ikebau-GmbH stellt Massivholzregale der Marke „Bill“ her. Durch den Einsatz von Personal und Maschinen fallen Fixkosten in Höhe von 1000 e an. Die Materialkosten betragen 30 e pro hergestelltem Regal. Das Unternehmen rechnet mit der linearen Kostenfunktion K ( x ) = 30 x + 1000. Variable Kosten müssen nicht immer proportional sein etwa wenn man bei der Beschaffung von Rohstoffen Rabatteffekte berücksichtigen kann oder die Entsorgung von besonders umfangreichen Produktionsabfällen mit Strafkosten belegt wird. 48818_Terveer.indd 58 48818_Terveer.indd 58 18.07.2023 11: 47: 18 18.07.2023 11: 47: 18 <?page no="59"?> 3.6 Ökonomische Anwendungen linearer Funktionen 59 Beispiel 3.14 Im Mietwagenbeispiel 3.11 setzen Sie abhängig von der zurückgelegten Kilometerzahl x folgende stückweise lineare Planungskostenfunktion an: K ( x ) = min { 0 , 05 x + 20 , 0 , 02 x + 35 } = { 0 , 05 x + 20 falls x < 500 0 , 02 x + 35 falls x ≥ 500 Die fixen kilometerunabhängigen Kosten sind hier 20. Die variablen Kosten werden durch die Funktion K 1 ( x ) = K ( x ) − 20 = min { 0 , 05 x , 0 , 02 x + 14 } beschrieben und sind nicht proportional zu der zurückgelegten Kilometerzahl. Eine Nachfragefunktion beschreibt - aus der Sicht eines Produzenten - den Zusammenhang zwischen dem Absatz x > 0 eines Produktes und dem Stückpreis p ( x ), bei dem diese Nachfrage durch die Konsumenten zustande kommt. Lineare Nachfragefunktionen ergeben sich meist durch die Angabe des Prohibitivpreises und einer Absatzbegrenzung, z.B. in Form einer Produktionskapazität. Dabei versteht man unter dem Prohibitivpreis denjenigen maximalen Preis, ab dem das Produkt am Markt nicht mehr abgesetzt werden kann bzw. der Absatz nicht höher als die so genannte Sockelnachfrage ist, also diejenige Mindestmenge des Produktes, die beispielsweise aufgrund „elementarer Bedürfnisse“ der Konsumenten in jedem Fall abgesetzt wird. Beispiel 3.15 (Fortsetzung von Beispiel 3.13) In der Produktionssituation der Firma Ikebau wird angenommen, dass maximal 2000 Regale pro Absatzperiode produziert werden können. Diese können zum Herstellungspreis von 30 e vollständig abgesetzt werden. Durch Marktbefragungen hat Ikebau herausgefunden, dass der Prohibitivpreis 160 e beträgt. Zu diesen Informationen gehört die lineare Nachfragefunktion p ( x ) = ax + b , die durch die beiden Punkte P (2000 | 30) und Q (0 | 160) läuft. Man berechnet hieraus die Normalform wie in Beispiel 3.6 zu p ( x ) = − 0 , 065 x + 160. Für den Anbieter ist in der Planungsphase die umgekehrte Relation wichtiger. Er möchte an einem konkreten Stückpreis seine Produktionsplanung ausrichten. Dazu bildet man zur Nachfragefunktion die Umkehrfunktion x ( p ) = − 15 , 38 p − 2461 , 48. Wir schreiben die Umkehrfunktion p − 1 ( x ) hier explizit als Funktion x von p , um die Abhängigkeit des Absatzes x vom Preis p deutlich zu machen. Eine Angebotsfunktion beschreibt den Zusammenhang zwischen der am Markt angebotenen Menge x eines Produktes und dem Marktpreis p , zu dem dieses Angebot zustande kommt. Werden insgesamt x Einheiten zum Preis p angeboten, so ergibt sich dieses Angebot durch diejenigen Produzenten, deren variable Produktionskosten unterhalb des Preises p liegen. Eine lineare Angebotsfunktion A ( x ) = ax + b mit b > 0 lässt sich so interpretieren, dass unterhalb des Preises b kein Anbieter für das Produkt gefunden werden kann. Die zu einem Preis p angebotene Menge x lässt sich über die Umkehrfunktion A − 1 ( p ) = 1 a p − b a bestimmen. Oberhalb des Preises b nimmt das Angebot also proportional zum Preis zu. 48818_Terveer.indd 59 48818_Terveer.indd 59 18.07.2023 11: 47: 18 18.07.2023 11: 47: 18 <?page no="60"?> 60 3 Lineare Funktionen Übungen zu Abschnitt 3.6 ? 19. Ein Paketbote braucht für die Auslieferung von 200 Paketen 5 Stunden und 30 Minuten, am Folgetag 8 Stunden für 300 Pakete . Ermitteln Sie eine lineare Funktion f ( x ) in Normalform, welche für x Pakete die Gesamt-Auslieferungszeit f ( x ) angibt. Welche Bedeutung haben die Koeffizienten der Normalform, welche Annahmen muss man hierzu an die Workload des Boten stellen? 20. Eine Kunstschmiede stellt Außenlampen her. Durch den Einsatz von Personal und Maschinen fallen wöchentliche Fixkosten in Höhe von 4500 e an. Die Materialkosten betragen 120 e pro hergestellter Lampe. Die Kunstschmiede erzielt einen Preis von 650 e pro Lampe. Wie viele Lampen muss die Kunstschmiede verkaufen, damit der Erlös die Kosten deckt? Zusammenfassung Lineare Funktionen sind die einfachsten Modelle für den Zusammenhang zwischen ökonomischen Größen und häufig Grundbausteine einer komplexeren Modellierung. Nach Bearbeitung des vorangegangenen Kapitels sollten Sie künftig in der Lage sein, ■ lineare Zusammenhänge in ökonomischen Situationen zu erkennen. ■ Koeffizienten einer linearen Funktion - im Sachzusammenhang - zu interpretieren, ■ Darstellungsformen auseinander oder aus Steckbriefen herzuleiten. ■ Umkehrfunktionen und Normale zu gegebenen linearen Funktion zu bestimmen. ■ Schnittpunkte linearer Funktionen - im Sachzusammenhang - zu berechnen. Dabei sollten Sie grundsätzlich auch Kurvenscharen (lineare Funktionen mit Parametern) behandeln können. Übungen zur Vertiefung von Kapitel 3 ? 21. Vervollständigen Sie die Aussagen: Die Gerade durch P (2 | 4), Q (5 | 3) hat a) Normalform f ( x ) = . . . b) Punkt-Steigungsform f ( x ) = . . . c) Koordinatenform ax + by = 1 mit a = . . . , b = . . . 22. Für t ∈ R sei F t die Gerade durch die Punkte P t ( t +1 | t − 2) und Q t ( − 3 − t | 4 − t ). a) Berechnen Sie die Normalform der linearen Funktion f t : R → R, mit dem Graphen F t (zu welchen t ∈ R existiert eine solche Funktion? ). b) Berechnen Sie die Achsenabschnitte von f t . Für welches t ∈ R liegt der Ursprung (0 | 0) auf dem Graphen von f t ? c) Es sei a ∈ R. Gibt es eine Funktion f t , welche die Steigung a hat? Wenn ja, berechnen Sie das zu a gehörige t . d) Zeigen Sie, dass die Graphen der Funktionen f t einen gemeinsamen Punkt N haben, und berechnen Sie dessen Koordinaten. e) Es sei G t die zu F t senkrechte Gerade durch N . Berechnen Sie - falls möglich - die Normalform der zugehörigen Funktion g t . f) Für welche t wird durch G t , F t und die Abszisse ein Dreieck D t festgelegt? Für welches t hat dieses Dreieck minimalen Flächeninhalt? 48818_Terveer.indd 60 48818_Terveer.indd 60 18.07.2023 11: 47: 19 18.07.2023 11: 47: 19 <?page no="61"?> 4 Quadratische Funktionen Übersicht Nach den linearen Funktionen bilden die quadratischen Funktionen den einfachsten Typ zur Darstellung von Zusammenhängen in der Ökonomie. Bei linearer Nachfragefunktion ist die Erlösfunktion quadratisch; wenn dann auch noch die Kostenfunktion linear (oder quadratisch) ist, so erhält man auch eine quadratische Gewinnfunktion. Daneben können quadratische Funktionen aber auch unmittelbar zur Modellierung nichtlinearer Nachfragefunktionen verwendet werden. Falls mit einer ökonomischen Entscheidung ein Verlust verbunden ist, so wird dieser ebenfalls oft durch eine quadratische Funktion modelliert. Schließlich treten quadratische Funktionen auch als Grenzertragsfunktionen (Ableitungen von Ertragsfunktionen) in der ertragsgesetzlichen Produktion auf. Mit quadratischen Funktionen kann man zudem nichtlineare Zusammenhänge besser annähern als bei alleinigem Rückgriff auf lineare Funktionen. Anwendungssituationen in der Ökonomie, in denen mit quadratischen Funktionen gearbeitet wird, erfordern meist die Angabe der Hoch- oder Tiefpunkte, die bei quadratischen Funktionen Scheitelpunkte heißen. Im Gegensatz zu den meisten anderen noch zu besprechenden Funktionstypen lassen sich diese ohne Differentialrechnung direkt aus dem Funktionsterm mittels quadratischer Ergänzung bestimmen. Wir besprechen zunächst die verschiedenen Darstellungsformen quadratischer Funktionen. 4.1 Normalform quadratischer Funktionen Die einfachste quadratische Funktion ist gegeben durch f : R → R , f ( x ) = x 2 Sie wird - genau wie ihr Graph - als Normalparabel bezeichnet und nimmt jeden Wert y > 0 an. Die positive Lösung der Gleichung x 2 = y heißt Quadratwurzel und wird mit √ y bezeichnet. Die zweite Lösung dieser Gleichung ist dann −√ y , vgl. Abbildung 4.1. Der Ausdruck unter dem Wurzelzeichen heißt Radikand. Die Gleichung x 2 = 0 hat genau die Lösung x = 0, d.h. x = 0 ist die einzige Nullstelle von f . Für y < 0 ist die Gleichung x 2 = y mit reellen Zahlen nicht lösbar. Insgesamt hat die Normalparabel den Wertebereich Bild ( f ) = [0; ∞ [= { y ∈ R : y ≥ 0 } . Der Tiefpunkt der Normalparabel ist der Ursprung (0 | 0), er wird Scheitelpunkt genannt. Außerdem ist die Normalparabel achsensymmetrisch (zur Ordinate), d.h. für alle x ∈ R gilt f ( x ) = f ( − x ). Jede quadratische Funktion geht aus der Normalparabel durch Verschiebung des Scheitelpunktes, Spiegelung und/ oder Dehnung (bzw. Stauchung) hervor. Ihr Funktionsterm besitzt die sogenannte Normalform f ( x ) = ax 2 + bx + c mit a, b, c ∈ R, a ̸ = 0 48818_Terveer.indd 61 48818_Terveer.indd 61 18.07.2023 11: 47: 19 18.07.2023 11: 47: 19 <?page no="62"?> 62 4 Quadratische Funktionen Abbildung 4.1: Graph der Normalparabel mit Urbildverhalten Dehnung Stauchung Öffnung nach oben 0 < a < 1 a > 1 Öffnung nach unten − 1 < a < 0 a < − 1 Abbildung 4.2: Öffnung quadratischer Funktionen f ( x ) = ax 2 ; die gestrichelte Kurve ist jeweils die Normalparabel. Der Graph einer quadratischen Funktion heißt Parabel; oft werden quadratische Funktionen ebenfalls als Parabeln bezeichnet. Die Parameter a, b, c in der Normalform legen die Gestalt bzw. die Abweichungen von der Normalparabel fest: ■ Parameter a : Die Multiplikation der Normalparabel mit einem Faktor a bewirkt eine Dehnung ( a > 1 oder a < − 1) bzw. Stauchung ( − 1 < a < 1) und gegebenenfalls eine vertikale Spiegelung der Normalparabel ( a < 0), vgl. Abbildung 4.2 . Wenn gleichzeitig b = c = 0 gilt, so bleibt der Scheitelpunkt in (0 | 0), und das Symmetrieverhalten ändert sich ebenfalls nicht. ■ Parameter c : Die Addition von c bewirkt die vertikale Verschiebung der Parabel ax 2 um den Wert c . Die Parabel hat ihren Scheitelpunkt also in (0 | c ). Sie behält ihr Symmetrieverhalten. ■ Parameter b : Wenn die Parabel einen Linearterm bx mit b ̸ = 0 hat, verschiebt sich die Symmetrieachse; der Scheitelpunkt ist horizontal und vertikal verschoben. Übungen zu Abschnitt 4.1 ? 1. Auf welchen Parabeln f ( x ) = ax 2 bzw. g ( x ) = x 2 + c liegt jeweils der angegebene Punkt P ( x 0 | y 0 )? Beschreiben Sie verbal die Lage der Parabeln verglichen mit der einer Normalparabel: a) P (2 | 7), b) P (6 | − 12), c) P (2 | t ), d) P ( t | 2), e) P ( t | 2 t ) 2. Auf welcher Parabel f ( x ) = ax 2 + c mit a, c ∈ R liegen jeweils die angegebenen Punkte P ( x 0 | y 0 ) und Q ( x 1 | y 1 )? 48818_Terveer.indd 62 48818_Terveer.indd 62 18.07.2023 11: 47: 19 18.07.2023 11: 47: 19 <?page no="63"?> 4.2 Scheitelpunktform quadratischer Funktionen 63 a) P (1 | 0), Q (2 | 3), b) P (3 | 2), Q ( − 1 |− 2), c) P (1 | 2), Q (2 | t ), d) P ( s | t ), Q (2 s | 2 t ), e) P ( x 0 | y 0 ), Q ( x 1 | y 1 ) mit x 0 ̸ = x 1 3. Auf welcher Parabel f ( x ) = ax 2 + bx + c mit a, b, c ∈ R liegen jeweils die angegebenen Punkte P ( x 0 | y 0 ), Q ( x 1 | y 1 ) und R ( x 2 | y 2 ). a) P (0 | 1), Q (1 | 2), R (3 | 10), b) P (1 | 1), Q (2 | 2), R (3 | 1), c) P (1 | t ), Q (2 | 4 t ), R (4 | t ), d) P (1 | 0), Q ( − 1 | 4), R (3 | t ), e) P ( t | 0), Q (2 | 1), R ( − 2 | 1), 4.2 Scheitelpunktform quadratischer Funktionen Der Funktionsterm einer quadratischen Funktion lässt sich immer in die Form f ( x ) = a ( x − x s ) 2 + y s bringen, und aus dieser Form kann man den Scheitelpunkt S ( x s | y s ) direkt ablesen. Für a > 0 (bzw. a < 0) erkennt man an diesem Term, dass die Funktion nur Werte ≥ y s (bzw. ≤ y s ) annehmen kann und dass der Extremwert genau für x = x s angenommen wird. Definition 4.1 ! Die Darstellung f ( x ) = a ( x − x s ) 2 + y s heißt Scheitelpunktform. Für die Überführung einer quadratischen Funktion aus der Normalform in die Scheitelpunktform verwendet man die sogenannte quadratische Ergänzung. Dieser Begriff rührt daher, dass der Term so mit einem quadratischen Summanden ergänzt wird, dass sich im nächsten Schritt die erste oder zweite binomische Formel anwenden lässt. Die binomischen Formeln lauten bekanntlich: erste binomische Formel: ( a + b ) 2 = a 2 + 2 ab + c 2 zweite binomische Formel: ( a − b ) 2 = a 2 − 2 ab + c 2 dritte binomische Formel: ( a + b )( a − b ) = a 2 − b 2 Verwendet man die binomischen Formeln von links nach rechts, so beschreiben sie, wie man die betreffenden Quadrate bzw. Produkte „ausmultipliziert“, wobei man die Klammern beseitigt. Allerdings können sie auch von rechts nach links gelesen werden. Die ersten beiden binomischen Formeln werden dann vor allem im Zusammenhang mit der quadratischen Ergänzung ausgenutzt. Dabei wird ein Ausdruck so ergänzt, dass man das Muster a 2 ± 2 ab + b 2 erkennt und dann die erste oder zweite Binomische Formel anwendet: Beispiel 4.1 In den folgenden Beispielen wird ein unvollständiger binomischer Ausdruck ergänzt: ■ x 2 + 2 x = x 2 + 2 x + 1 − 1 = ( x + 1) 2 − 1 ■ x 2 − 7 x = 2 2 − 2 · 72 x + ( 72 ) 2 − ( 72 ) 2 = ( x − 72 ) 2 − 49 4 Die dritte binomische Formel stellt dann eher den Fall dar, dass der lineare Term fehlt: 48818_Terveer.indd 63 48818_Terveer.indd 63 18.07.2023 11: 47: 20 18.07.2023 11: 47: 20 <?page no="64"?> 64 4 Quadratische Funktionen Beispiel 4.2 Im Ausdruck x 2 − 25 fehlt ein linearer Term. Hier ergibt die dritte binomische Formel: x 2 − 25 = x 2 − 5 2 = ( x − 5)( x + 5) Generell lassen sich die binomischen Formeln bei der Berechnung von Nullstellen quadratischer Funktionen und bei der Bestimmung der Scheitelpunktform einer quadratischen Funktion verwenden. Für die Scheitelpunktform kann die Normalform mit quadratischer Ergänzung wie folgt umgeformt werden: f ( x ) = ax 2 + bx + c = a ( x 2 + b a x ) + c = a ( x 2 + b a x + b 2 4 a 2 ) + c − b 2 4 a (quadratische Ergänzung) = a ( x + b 2 a ) 2 + ( c − b 2 4 a ) (erste binomische Formel) Daraus ergibt sich der Scheitelpunkt S ( x s | y s ) = S ( − b 2 a | c − b 2 4 a ). ■ Für a > 0 liegt im Scheitelpunkt ein Tiefpunkt (global) vor. Die Funktion f ist auf ] − ∞ ; x s ] streng monoton fallend und auf [ x s ; ∞ [ streng monoton wachsend. ■ Für a < 0 liegt im Scheitelpunkt ein Hochpunkt (global) vor. Die Funktion f ist auf ] − ∞ ; x s ] streng monoton wachsend und auf [ x s ; ∞ [ streng monoton fallend. Beispiel 4.3 Wir berechnen die Scheitelpunktform der Funktion f ( x ) = 2 x 2 − 10 x + 14 . Im Gegensatz zur Herleitung oben wird hier die zweite binomische Formel angewandt, da der Koeffizient des linearen Terms negativ ist: 2 x 2 − 10 x + 14 = 2( x 2 − 5 x ) + 14 = 2( x 2 − 2 · 52 x + 25 4 ) + 14 − 2 · 25 4 = 2( x − 52 ) 2 − 49 4 Der Scheitelpunkt ist damit der Punkt ( 5 2 | − 49 4 ) (beachten Sie hier die Vorzeichen! ). Dort liegt ein absoluter Tiefpunkt der Funktion vor - die Parabel ist nämlich nach oben geöffnet, denn der Koeffizient von x 2 in der Normalform ist positiv. Übungen zu Abschnitt 4.2 ? 4. Berechnen Sie die Scheitelpunktform: a) f ( x ) = − 2 x 2 + 5 x + 1 b) g ( x ) = 6 x 2 − 12 c) h ( x ) = x ( x + 3) 5. Wie lautet die Scheitelpunktform? a) f ( x ) = − 3 x 2 + 5 x b) f ( x ) = x 2 − 4 tx + t 2 c) f ( x ) = tx 2 + 2 t 2 x − 2 t 6. Bestimmen Sie anhand der Graphen die Scheitelpunktformen der zugehörigen quadratischen Funktionen: 48818_Terveer.indd 64 48818_Terveer.indd 64 18.07.2023 11: 47: 21 18.07.2023 11: 47: 21 <?page no="65"?> 4.3 Nullstellen und Schnittpunkte quadratischer Funktionen 65 4.3 Nullstellen und Schnittpunkte quadratischer Funktionen Wir betrachten zunächst eine Parabel der Form f ( x ) = x 2 + px + q . Eine Nullstelle der Funktion f ist Lösung der Gleichung x 2 + px + q = 0. Aus dieser quadratischen Gleichung wird mit Hilfe der quadratischen Ergänzung p 2 4 die äquivalente Gleichung x 2 + px + p 2 4 = p 2 4 − q bzw. ( x + p 2 ) 2 = p 2 4 − q . Durch Wurzelziehen ergibt sich die p q -Formel, die auch als Mitternachtsformel bekannt ist: Abhängig von der Diskriminante D = p 2 / 4 − q hat die Funktion f ( x ) = x 2 + px + q [1] zwei Nullstellen x 1 , 2 = − p/ 2 ± √ D , falls D > 0, [2] eine Nullstelle x = − p/ 2, falls D = 0, [3] keine Nullstelle (in R), falls D < 0. Beispiel 4.4 Wir wenden die p q -Formel für die Funktion f ( x ) = x 2 + 5 x − 14 an. Hier gilt also p = 5 und q = − 14. Demzufolge erhält man die Nullstellen: x 1 , 2 = − 52 ± √ 5 2 4 − ( − 14) = − 52 ± √ 25 4 + 14 = − 52 ± √ 81 4 = − 52 ± 92 Damit lauten die Nullstellen − 52 − 92 = − 7 und − 52 + 92 = 2. Dasselbe Ergebnis erhalten Sie, wenn Sie die Nullstellen über die quadratische Ergänzung bestimmen: x 2 + 5 x − 14 = 0 ⇔ x 2 + 5 x = 14 ⇔ x 2 + 5 x + 25 4 = 14 + 25 4 ⇔ ( x + 52 ) 2 = 81 4 ⇔ x + 52 = ± 92 Auch hier ergeben sich also die Lösungen x 1 , 2 = − 5 2 ± 92 . Beispiel 4.5 Bei der Funktion f ( x ) = x 2 + 5 x + 14 stellen wir fest, dass ihre Diskriminante D = 25 4 − 14 = − 31 4 negativ ist, und daher die Gleichung x 2 + 5 x + 14 = 0 keine Lösungen in R hat, d.h. die Funktion f hat keine Nullstellen. Beispiel 4.6 Hingegen hat die Funktion f ( x ) = x 2 + 5 x + 25 4 nur die Nullstelle x = − 52 , denn die Diskriminante ist D = 0. Für eine quadratische Funktion f ( x ) = ax 2 + bx + c mit beliebigem a ̸ = 0 ergeben sich die Nullstellen von f durch eine Verallgemeinerung der p q -Formel, indem wir die Nullstellen der Funktion g ( x ) = x 2 + b a x + c a berechnen. Diese stimmen wegen f ( x ) = ag ( x ) mit denen der Funktion f überein. Die Funktion f ( x ) = ax 2 + bx + c mit der Diskriminante D = b 2 / (4 a 2 ) − c/ a hat [1] zwei Nullstellen x 1 , 2 = − b/ (2 a ) ± √ D , falls D > 0, [2] eine Nullstelle x = − b/ (2 a ), falls D = 0, [3] keine Nullstelle (in R), falls D < 0. 48818_Terveer.indd 65 48818_Terveer.indd 65 18.07.2023 11: 47: 22 18.07.2023 11: 47: 22 <?page no="66"?> 66 4 Quadratische Funktionen Beispiel 4.7 Betrachten wir die Funktion f ( x ) = 2 x 2 − 10 x − 11 2 = ax 2 + bx + c mit a = 2, b = − 10 und c = − 11 2 , so erhält man als Diskriminante D = b 2 4 a 2 − c a = ( − 10) 2 4 · 2 2 − ( − 11 2 ) / 2 = 9 und damit die Nullstellen x 1 = − b 2 a − √ D = − − 10 2 · 2 − √ 9 = 52 − 3 = − 12 und x 2 = 52 + 3 = 11 2 . In folgenden Fällen können Sie sich das Rechnen aber erleichtern: Fehlender Linearterm: Für f ( x ) = ax 2 + c können Sie durch Umstellen und anschließendes direktes „Wurzelziehen“ die Nullstellen berechnen: Beispiel 4.8 Bei f ( x ) = 3 x 2 − 27 löst man die Gleichung f ( x ) = 0 so: 3 x 2 − 27 = 0 ⇔ 3 x 2 = 27 ⇔ x 2 = 9 ⇔ x 1 , 2 = ±√ 9 = ± 3, d.h. die Nullstellen sind x = − 3 und x = 3. Fehlendes konstantes Glied: Für f ( x ) = ax 2 + bx können Sie die Variable x faktorisieren, d.h. multiplikativ ausklammern. In diesem Fall ist x = 0 eine der Nullstellen. Beispiel 4.9 Für f ( x ) = 3 x 2 + 7 x gilt: 3 x 2 + 7 x = x (3 x + 7). Gelöst wird dann so: x (3 x + 7) = 0 ⇔ x = 0 ∨ 3 x + 7 = 0 ⇔ x = 0 ∨ x = − 73 . Nullstellen sind x = 0 und x = − 73 . Mit der Nullstellenformel für quadratische Funktionen lassen sich nun auch Schnittpunkte von quadratischen Funktionen f ( x ) = ax 2 + bx + c , g ( x ) = ux 2 + vx + w (mit a ̸ = 0 und b ̸ = 0) bestimmen. Die Gleichung f ( x ) = g ( x ) wird dazu in die Gleichung ( a − q ) x 2 + ( b − v ) x + ( c − w ) = 0 überführt. Hier erkennt man nun verschiedene Fälle: [1] Für a = u und b = v sind f und g zueinander vertikal verschoben. Abgesehen vom Fall c = w , bei dem f und g übereinstimmen, haben sie keinen Schnittpunkt. [2] Falls a = u , aber b ̸ = v so haben f und g dieselbe Öffnung. Die sich ergebende Gleichung ( b − v ) x + ( c − w ) = 0 ist linear und hat genau eine Lösung. [3] Falls a ̸ = u , so ist die Gleichung ( a − u ) x 2 + ( b − v ) x + ( c − w ) = 0 wieder quadratisch und kann je nach Wert der Diskriminante D = ( b − v ) 2 / (4( a − u ) 2 ) − ( c − w ) / ( a − u ) keine, eine oder zwei Lösungen haben. [a] Für D < 0 hat die Gleichung keine Lösung, es gibt keine Schnittpunkte. [b] Für D = 0 hat die Gleichung genau eine Lösung, der zugehörige Schnittpunkt wird auch Berührpunkt genannt, denn die beiden Parabeln „tangieren“ sich im Schnittpunkt lediglich. [c] Für D > 0 hat die Gleichung zwei Lösungen, es gibt zwei Schnittpunkte. Schnittpunkte einer quadratischen Funktion f ( x ) = ax 2 + bx + c (mit a ̸ = 0) und einer linearen Funktion g ( x ) = qx + r lassen sich anhand der Diskriminante D = ( b − q ) 2 / (4 a 2 ) + ( c − r ) / a anhand von drei Lagefällen vgl. Abbildung 4.3 bestimmen: [1] Für D < 0 haben die Gerade und die Parabel keine gemeinsamen Schnittpunkte. Man nennt die Gerade dann eine Passante der Parabel. [2] Für D = 0 haben die Gerade und die Parabel genau einen Schnittpunkt. Die Gerade heißt dann Tangente an die Parabel. [3] Für D > 0 gibt es zwei Schnittpunkte der Parabel mit der Geraden. Dann nennt man die Gerade eine Sekante zur Parabel. Diese Begriffe werden entsprechend auch in der Geometrie des Kreises verwendet, woher sie Ihnen vielleicht auch bekannt sind. In der Differentialrechnung werden wir später wieder auf Sekanten und Tangenten an Funktionsgraphen zurückkommen. 48818_Terveer.indd 66 48818_Terveer.indd 66 18.07.2023 11: 47: 23 18.07.2023 11: 47: 23 <?page no="67"?> 4.4 Linearform quadratischer Funktionen 67 Abbildung 4.3: Passante, Tangente und Sekante an eine Parabel Übungen zu Abschnitt 4.3 ? 7. Lösen Sie die folgenden Gleichungen: a) x 2 + 8 x − 9 = 0 b) 4 x − 2 − 2 x (3 x − 4) = 4 c) (2 x − 3) 2 = ( x − 1)( x − 4) − 9 x d) x 2 + tx + t + 54 = 0 e) − x 2 + ( t + 2) x − ( t + 2) = 0 8. a) Berechnen Sie Nullstellen der folgenden Funktionen a1) f ( x ) = − 2 x 2 + 5 x + 1 a2) g ( x ) = 6 x 2 − 12 a3) h ( x ) = x ( x + 3) b) Berechnen Sie, welche Schnittpunkte je zwei der Funktionen in a) haben. 9. Welche Schnittpunkte haben die Funktionen f und g ? Beschreiben Sie auch jeweils die Lage der Funktionen zueinander. a) f ( x ) = 12 x 2 + x − 1, g ( x ) = 2 x + 3 b) f ( x ) = 2 t x 2 − 3 x + t , g ( x ) = 12 x − t 4 10. Welche Funktion g ( x ) = 14 x + t ist Tangente zu f ( x ) = 1 2 x 2 − 2 x + 1? 11. Berechnen Sie zur angegebenen Funktion f diejenige Gerade g ( x ) = ax + b , welche mit f den Berührpunkt P ( x 0 | f ( x 0 )) gemeinsam hat. a) f ( x ) = x 2 , x 0 = 1 b) f ( x ) = x 2 − 4 x + 7, x 0 = 4 c) f ( x ) = − 2 x 2 − 8 x − 5, x 0 = − 3 d) f ( x ) = 4 x 2 + tx + 2, x 0 = 2 e) f ( x ) = − x 2 − x + 1, x 0 = t f) f ( x ) = tx 2 − 2 x − 5, x 0 = − t 12. Bestimmen Sie die auf g ( x ) = 2 x + 3 senkrecht stehende Tangente von f ( x ) = 12 x 2 + x − 1. 4.4 Linearform quadratischer Funktionen Die Faktorisierung quadratischer Funktionen wie in Beispiel 4.9 vgl. S. 66 ist eine besonders elegante Art, um Nullstellen möglichst schnell zu erfassen. Gelingt es nämlich, die quadratische Funktion in der sogenannten Linearform f ( x ) = ( x − x 1 )( x − x 2 ) zu schreiben, so kann man die Nullstellen x 1 und x 2 der Funktion direkt ablesen, denn ein Produkt ist genau dann gleich Null, wenn mindestens einer der Faktoren gleich Null ist. Der Satz von Viëta sagt, welche Gestalt die Linearfaktoren dann haben müssen: 48818_Terveer.indd 67 48818_Terveer.indd 67 18.07.2023 11: 47: 23 18.07.2023 11: 47: 23 <?page no="68"?> 68 4 Quadratische Funktionen Satz von Viëta: Jede quadratische Funktion f ( x ) = x 2 + px + q mit wenigstens einer Nullstelle lässt sich faktorisieren als f ( x ) = ( x − x 1 )( x − x 2 ), wobei x 1 , 2 = − p 2 ± √ p 2 / 4 − q . Es gilt dann p = − ( x 1 + x 2 ) und q = x 1 x 2 . Der Satz von Viëta liefert kein Konstruktionsverfahren zur Nullstellenbestimmung, er ist aber dennoch zur Nullstellenermittlung geeignet, wenn p, q ganze Zahlen sind und man ganzzahlige Nullstellen vermutet. Beispiel 4.10 Für die Funktion f ( x ) = x 2 − 4 x − 21 gilt p = − 4 und q = − 21. Vermutet man ganzzahlige Nullstellen x 1 , x 2 , so müssen diese Teiler von q = 21 sein. Hier kommen nur die Teilerpaare ± 1 , ∓ 21 und ± 3 , ∓ 7 in Frage. Die verschiedenen Möglichkeiten, Teiler und Vorzeichen zu kombinieren, sind schnell durchgespielt: Schreibt man q als Produkt der Teiler − 3 und 7, bestimmt also x 1 , x 2 zu x 1 = − 3 und x 2 = 7, so gilt q = x 1 · x 2 = ( − 3) · 7 = − 21 und p = − ( x 1 + x 2 ) = − ( − 3+7) = − 4. Man kann f daher auch in der Form f ( x ) = ( x + 3)( x − 7) schreiben und erhält als Nullstellen der Funktion x = − 3 und x = 7. Übungen zu Abschnitt 4.4 ? 13.Bestimmen Sie die Linearform: a) f ( x ) = x 2 − 5 x + 6 b) g ( x ) = 2 x 2 + 34 x + 144 c) h ( x ) = x ( x + 3) − 70 d) f ( x ) = x 2 − 6 x − 8 e) f ( x ) = x 2 − 7 f) f ( x ) = x 2 + 5 x g) f ( x ) = 7 x 2 + 105 x + 392 h) f ( x ) = x 2 + ( t + 4) x + 4 t 14. Es sei t > 0. Eine quadratische Funktion f habe als Graph eine nach oben geöffnete Parabel, die Nullstellen t und 3 t sowie den Ordinatenabschnitt y 0 = f (0) = 12 t . Bestimmen Sie die Normalform von f . 4.5 Umkehrung quadratischer Funktionen Wie bei den linearen Funktionen interessiert auch bei einer quadratischen Funktion die Umkehrung dieser Funktion. Hier trifft man schon bei der Funktion f ( x ) = x 2 auf Schwierigkeiten, denn es muss die Gleichung x 2 = y nach x aufgelöst werden. Für y > 0 gibt es aber jeweils zwei Lösungen x = −√ y und x = √ y . Es gibt also nicht - wie zu fordern wäre - pauschal eine Möglichkeit der Umkehrung, sondern zwei. Man kann daher nicht von der Umkehrfunktion sprechen, sondern eine Umkehrung ist nur nach Einschränkung des Definitionsbereiches möglich. Man erhält also die möglichen Umkehrungen g 1 : [0; ∞ [ → [0; ∞ [ , g 1 ( x ) = √ x und g 2 : [0; ∞ [ → ] − ∞ ; 0] , g 2 ( x ) = −√ x . Dieser Sachverhalt gilt für jede quadratische Funktion f . Sobald diese in der Scheitelpunktform f ( x ) = a ( x − x s ) 2 + y s vorliegt, kann man wie bei der Normalparabel die beiden möglichen Umkehrungen leicht bestimmen. Beispiel 4.11 Die Funktion f ( x ) = 2( x − 3) 2 − 7 hat den Definitionsbereich D = R und den Wertebereich W = [ − 7; ∞ [. Für y ≥ − 7 löst man die Gleichung y = 2( x − 3) 2 − 7 ⇔ 48818_Terveer.indd 68 48818_Terveer.indd 68 18.07.2023 11: 47: 24 18.07.2023 11: 47: 24 <?page no="69"?> 4.6 Ökonomische Anwendungen quadratischer Funktionen 69 Abbildung 4.4: Teilweise Umkehrung einer quadratischen Funktion 2( x − 3) 2 = y +7 ⇔ ( x − 3) 2 = y +7 2 . Es ergeben sich die Lösungen x = 3+ √ ( y + 7) / 2 und x = 3 − √ ( y + 7) / 2. Für y = − 7 stimmen die Lösungen überein. Vertauscht man die Variablen x und y , so hat man die möglichen Umkehrfunktionen g 1 : [ − 7; ∞ [ → [3; ∞ [ , g 1 ( x ) = 3 + √ ( y + 7) / 2 und g 2 : [ − 7; ∞ [ → ] − ∞ ; 3] , g 2 ( x ) = 3 − √ ( y + 7) / 2. Genau wie im vorangegangenen Beispiel hat im allgemeinen Scheitelpunkt-Fall die Gleichung y = a ( x − x s ) 2 + y s die beiden Lösungen x = x s ± √ y − y s a , falls der Radikand als nichtnegativ angenommen wird. Bei z.B. nach oben geöffneter Parabel, d.h. für a > 0 gibt es abhängig von der Wahl des Definitionsbereiches zwei Umkehrfunktionen: ■ Mit D = [ x s ; ∞ [ ist der Term der Umkehrfunktion g 1 ( x ) = x s + √ ( x − y s ) / a ■ Mit D =] − ∞ ; x s ] ist der Term der Umkehrfunktion g 2 ( x ) = x s − √ ( x − y s ) / a Diese beiden Möglichkeiten sind in Abbildung 4.4 dargestellt. Eine quadratische Funktion in Normalform wird zunächst in Scheitelpunktform gebracht, anschließend lässt sich wie gerade beschrieben die teilweise Umkehrung durchführen. Übungen zu Abschnitt 4.5 ? 15. Wie klein darf man x s ∈ R wählen, damit die Funktion f : [ x s ; ∞ [ → R eine Umkehrfunktion f − 1 hat? Bestimmen Sie diese und ihren Definitionsbereich: a) f ( x ) = x 2 + 2 b) f ( x ) = x 2 − 4 x c) f ( x ) = − 3( x + 2) 2 + 4 d) f ( x ) = x 2 + tx − 2 4.6 Ökonomische Anwendungen quadratischer Funktionen Wir erläutern den Nutzen quadratischer Funktionen anhand zweier Anwendungssituationen. In der ersten ergibt sich eine quadratische Gewinnfunktion aus einem linearen Ansatz für die Nachfrage in einem Monopol. Die zweite Situation arbeitet modellhaft mit einer quadratischen Nachfragefunktion im gleichen Sachzusammenhang. 4.6.1 Quadratische Gewinnfunktionen bei linearer Nachfragefunktion Wir nehmen Beispiel 3.13 vgl. S. 58 auf: Die Ikebau-GmbH stellt Massivholz-Regale der Marke „Bill“ her. Wie viele Regale muss das Unternehmen absetzen, damit Umsatz bzw. Gewinn maximal wird? 48818_Terveer.indd 69 48818_Terveer.indd 69 18.07.2023 11: 47: 24 18.07.2023 11: 47: 24 <?page no="70"?> 70 4 Quadratische Funktionen Abbildung 4.5: Kosten, Gewinn, Erlös und Cournotpunkt in Beispiel 3.13 Eine Umsatzfunktion bzw. Erlösfunktion beschreibt den Zusammenhang zwischen abgesetzter Menge x > 0 eines Gutes und dem hieraus erzielten Umsatz y (in Geldeinheiten). Der Umsatz berechnet sich als Produkt aus Absatzmenge und Stückpreis. Die Umsatzfunktion ist daher allgemein E ( x ) = x · p ( x ), wobei p ( x ) die Nachfragefunktion ist. Für Ikebau wurde schon die Nachfragefunktion zu p ( x ) = − 0 , 065 x + 160 bestimmt. Die Erlösfunktion wird damit durch die Funktion E ( x ) = x · ( − 0 , 065 x + 160) = − 0 , 065 x 2 + 160 x beschrieben. Allgemein ergibt sich bei linearer Nachfragefunktion wie hier stets eine quadratische Erlösfunktion. Mittels quadratischer Ergänzung erhält man die Scheitelpunktform der Erlösfunktion E ( x ) = − 13 200 x 2 + 160 x = − 13 200 ( x 2 − 32000 13 x ) = − 13 200 ( x 2 − 2 · 16000 13 x ) = − 13 200 ( x − 16000 13 ) 2 + 13 200 16000 2 13 2 = − 13 200 ( x − 16000 13 ) 2 + 1600 2 26 Der maximale Erlös liest sich aus dem Scheitelpunkt ab. Er beträgt 1600 2 26 ≈ 98461 , 54 e und wird bei Produktion von 16000 13 ≈ 1230 , 76 Regalen erzielt. Weil nur ganzzahlige Regalmengen hergestellt werden können, muss man jetzt die benachbarten Lösungen x = 1230 und x = 1231 vergleichen. Wegen f (1231) ≈ 98461 , 535 > 98461 , 5 = f (1230) ergibt Produktion und Absatz von 1231 Regalen maximalen Erlös. Der Gewinn bestimmt sich als Erlös E abzüglich Kosten K und wird damit durch die Funktion G ( x ) = E ( x ) − K ( x ) beschrieben. Man spricht von der Gewinnfunktion. Mit der schon bekannten Kostenfunktion K ( x ) = 30 x +1000 ergibt sich für den Gewinn von Ikebau hier auch eine quadratische Funktion, die Sie sofort in Scheitelpunktform bringen können: G ( x ) = E ( x ) − K ( x ) = − 0 , 065 x 2 + 160 x − (30 x + 1000) = − 0 , 065 x 2 + 130 x − 1000 = − 0 , 065( x − 1000) 2 + 64000 Aus dem Scheitelpunkt der Gewinnparabel liest man ab: Bei einer abgesetzten Menge von 1000 Stück beträgt der maximale Gewinn 64000 e . Für die 1000 abgesetzten Regale errechnet sich ein Stückpreis von p (1000) = 95 e . Der zum gewinnmaximalen Absatz x ∗ gehörende Punkt C (1000 | 95) auf dem Graphen 48818_Terveer.indd 70 48818_Terveer.indd 70 18.07.2023 11: 47: 25 18.07.2023 11: 47: 25 <?page no="71"?> 4.6 Ökonomische Anwendungen quadratischer Funktionen 71 der Nachfragefunktion p ( x ) heißt Cournotscher Punkt. Er wird also rechnerisch durch die Bestimmung eines Hochpunktes der Gewinnfunktion mit anschließendem Einsetzen in die Nachfragefunktion berechnet. Dieser Vorgang kann auch zeichnerisch näherungweise vollzogen werden, wenn die Graphen von Gewinn- und Nachfragefunktion so übereinander abgebildet werden, dass auf beiden Abszissen die Absatzmenge in gleichem Maßstab eingetragen wird vgl. Abbildung 4.5 . Wo die vertikale Linie durch den Scheitelpunkt der Gewinnparabel den Graphen der Nachfragefunktion schneidet, liegt der Cournotsche Punkt. Beachten Sie, dass die Graphen der Kosten-, Erlös- und Gewinnfunktion - mit Division durch 800 - skaliert werden mussten, damit sie mit der Nachfragefunktion gemeinsam dargestellt werden können. Weiterhin stellt sich die Frage nach der Gewinnzone, d.h. für welche Absatzmenge der Gewinn überhaupt positiv ist. Bei nach unten geöffneter Gewinnparabel ist die Gewinnzone das durch die beiden Nullstellen festgelegte Intervall; die kleinere Nullstellen heißt Gewinnschwelle, die größere Nullstelle heißt Gewinngrenze. Für die Ikebau GmbH berechnet sich die Gewinnzone z.B. mit der p q -Formel: G ( x ) = 0 ⇔ − 0 , 065 x 2 + 130 x − 1000 = 0 ⇔ x 2 − 2000 x − 200000 13 = 0 ⇔ x 1 , 2 = 1000 ± √ 10 6 − 200000 13 ⇔ x 1 = 7 , 72 ∨ x 2 = 1992 , 27 Weil Ikebau nur ganzzahlige Regalmengen herstellen kann, liegt die Gewinnzone der hergestellten Regale zwischen Gewinnschwelle 8 und Gewinngrenze 1992. 4.6.2 Modellierung von Nachfragesituationen durch quadratische Funktionen Im Fall der Firma Ikebau sind wir gerade von einer linearen Nachfragefunktion p ( x ) = − 0 , 065 x + 160 ausgegangen, wodurch eine mathematisch besonders einfache Lösung des Gewinnproblems durch Untersuchung der quadratischen Gewinnfunktion G ( x ) = − 0 , 065 x 2 + 130 x − 1000 möglich wird. Ob die Nachfragefunktion aber tatsächlich linear modelliert werden darf, ist zumindest diskussionswürdig. Mit dem linearen Verlauf einer Nachfragefunktion nimmt man ja eine proportionale Änderung des Preises in Abhängigkeit von der Nachfrageänderung an. Man geht also im Fall der Firma Ikebau durch Verwendung der Nachfragefunktion p ( x ) = − 0 , 065 x +160 davon aus, dass eine Änderung einer Nachfrage um beispielsweise 10 Regale stets zu einer Preisänderung von 10 · 0 , 065 = 0 , 65 e führt, also z.B. sowohl im unteren Bereich bei einer Nachfrageänderung von 0 auf 10 Regale als auch im oberen Bereich bei einer Änderung des Absatzes von 1990 auf 2000 Stück. In der Statistik spricht man von einer gleichverteilten Nachfrage über dem Absatzbereich. In der Realität würde man aber eine variable Preisänderung (bei gleicher Nachfrageänderung) vermuten, was gegen eine lineare Nachfragefunktion spricht. Quadratische Funktionen als flexiblere, aber gleichzeitig noch handhabbare Alternative bieten sich hier an, allerdings muss dabei berücksichtigt werden, dass eine wachsende Nachfrage sich aus einem geringeren Preis erklärt, d.h. eine Nachfragefunktion wird als (streng) monoton fallend angenommen - dass in der Ökonomie auch nicht monoton fallende Nachfragefunktionen vorkommen können, sei hier nur am Rande erwähnt. Quadratische Funktionen sind daher nicht auf ihrem gesamten Definitionsbereich zur Modellierung geeignet, weil sie links und rechts des Scheitelpunktes unterschiedliches 48818_Terveer.indd 71 48818_Terveer.indd 71 18.07.2023 11: 47: 25 18.07.2023 11: 47: 25 <?page no="72"?> 72 4 Quadratische Funktionen Abbildung 4.6: Graphen quadratischer Nachfragefunktionen (links,rechts). Auf den gepunkteten Kurven kann der Scheitelpunkt S eines Parabelstücks durch die Punkte P und Q liegen. Monotonieverhalten haben. Dies ist zudem der Normalform nicht unbedingt anzusehen. Um beide Probleme bei der Nachfragemodellierung in den Griff zu bekommen, können Sie gleich mit der Scheitelpunktform p : D → R, p ( x ) = a ( x − x s ) 2 + y s beginnen. Eine Nachfragefunktion dieser Form kann auf zwei Arten sinnvoll erklärt werden vgl. Abbildung 4.6 : ■ a > 0 und D ⊆ ] − ∞ ; x s ]. Dann besteht der Graph der Nachfragefunktion aus dem links des Scheitelpunktes liegenden Teil vgl. Abbildung 4.6 , links. ■ a < 0 und D ⊆ ] x s ; ∞ [. Dann besteht der Graph der Nachfragefunktion aus dem rechts des Scheitelpunktes liegenden Teil vgl. Abbildung 4.6 , rechts. Sobald hingegen der Scheitelpunkt im Innern des Definitionsbereiches liegt, ist die Teil- Parabel nicht als Nachfragefunktion geeignet, da sie auf einer Seite des Scheitelpunktes streng monoton wachsend ist. In Abbildung 4.6, Mitte, ist diese Situation dargestellt. Beispiel 4.12 Wir betrachten nun speziell die Modellierung der Nachfragefunktion im Beispiel des Regalbaus und setzen die Nachfragefunktion als spezielles Parabelsegment an: ■ Die Parabel soll nach oben geöffnet sein mit Scheitelpunkt im rechten Randpunkt S = P (2000 | 30), hat also die Form p ( x ) = a · ( x − 2000) 2 + 30 mit geeignetem a > 0. ■ Auch wird der Prohibitivpreis von 160 e angenommen. Hiermit wird a bestimmt: p (0) = 160 ⇔ a (0 − 2000) 2 + 30 = 160 ⇔ a = 130 2000 2 = 0 , 0000325 Dann ist p ( x ) = 0 , 0000325( x − 2000) 2 + 30 = 0 , 0000325 x 2 − 0 , 13 x + 160 die Nachfragefunktion. Ihren Graphen finden Sie in Abbildung 4.7. Möchte man wie zuvor die ökonomischen Gewinnbetrachtungen durchführen, so stellt sich ein neues Problem, denn sowohl die zugehörige neue Erlösfunktion als auch die Gewinnfunktion sind nun keine quadratischen Funktionen mehr, sondern gehören zu einer anderen Funktionenklasse: E ( x ) = x · p ( x ) = 0 , 0000325 x 3 − 0 , 13 x 2 + 160 x und G ( x ) = E ( x ) − K ( x ) = 0 , 0000325 x 3 − 0 , 13 x 2 + 130 x − 1000. Derartige ganzrationale Funktionen betrachten wir im folgenden Kapitel. Zu Gewinnmaximum, Cournot- Punkt und Gewinnzone vgl. Unterabschnitt 8.6.2, S. 210 . 48818_Terveer.indd 72 48818_Terveer.indd 72 18.07.2023 11: 47: 26 18.07.2023 11: 47: 26 <?page no="73"?> 4.6 Ökonomische Anwendungen quadratischer Funktionen 73 Abbildung 4.7: Graph der quadratischen Nachfragefunktion p ( x ) = 0 , 0000325 x 2 − 0 , 13 x + 160 im Intervall [0 , 2000] 4.6.3 Kleinste-Quadrate-Methode Auch in der Statistik spielen quadratische Funktionen eine wichtige Rolle, beispielsweise wenn optimale Kennzahlen für Daten gefunden werden sollen. Beispiel 4.13 Ein Unternehmen machte in 2004 folgende monatlichen Umsätze (in Mio. US-Dollar): Monat 1 2 3 4 5 6 7 8 9 10 11 12 Umsatz 1,25 0,95 0,8 1,3 1,5 1,42 1,1 1,6 1,72 1,73 1,85 1,82 Gesucht ist nun eine einzelne Kennzahl x , die diesen Datensatz möglichst gut beschreibt. Bei der „Methode der kleinsten Quadrate“ werden quadratische Abweichungen zwischen x und den einzelnen Daten gebildet, summiert und für diesen Ausdruck dann ein minimierendes x gesucht. Die Summe der Abweichungsquadrate ist hier f ( x )= ( x − 1 , 25) 2 + ( x − 0 , 95) 2 + · · · + ( x − 1 , 82) 2 = 12 x 2 − 2(1 , 25 + · · · + 1 , 82) x + (1 , 25 2 + · · · + 1 , 82 2 ) = 12 x 2 − 34 , 08 x + 25 , 5176 Für diese quadratische Funktion wird jetzt die Scheitelpunktsform ermittelt: f ( x ) = 12( x 2 − 2 · 1 , 42 x + 1 , 42 2 ) + 25 , 5176 − 12 · 1 , 42 2 = 12( x − 1 , 42) 2 + 1 , 3208. Aus der Scheitelpunktform erkennt man, dass f minimal wird für x = 1 , 42. Dieser Wert stellt also eine im Sinne kleinster Quadrate optimale Beschreibung des Datensatzes mittels einer einzigen Kennzahl dar. 1,42 ist das arithmetische Mittel ¯ x der Daten. Der Scheitelwert 1 , 3208 stellt eine Kennzahl dar, welche die Schwankung der Umsätze um dieses Mittel beschreibt. Teilt man ihn durch 12 − 1 = 11, so erhält man etwa 0 , 12. Dieser Wert wird als Stichprobenvarianz des Datensatzes bezeichnet, die Wurzel daraus, d.h. etwa 0 , 347 heißt Standardabweichung. Übungen zu Abschnitt 4.6 ? 16. Berechnen Sie eine lineare Nachfragefunktion durch P, Q und zu variablen Kosten c 0 den Cournot-Punkt C . a) P (100 | 120), Q (1500 | 36), c 0 = 36 b) P (0 | 64), Q (1500 | 36), c 0 = 50 c) P (0 | t ), Q (20 | c 0 ), 0 < c 0 < t 17. Berechnen Sie in Beispiel 4.12 eine quadratische Nachfragefunktion durch P (0 | 160) und Q (2000 | 30) mit Scheitelpunkt in P sowie die die Gewinnfunktion? 18. Ergänzen Sie den Steckbrief jeweils so, dass er eine quadratische Funktion f beschreibt, auf deren Graphen die Punk- 48818_Terveer.indd 73 48818_Terveer.indd 73 18.07.2023 11: 47: 26 18.07.2023 11: 47: 26 <?page no="74"?> 74 4 Quadratische Funktionen te P ( x 0 | y 0 ) und Q ( x 1 | y 1 ) liegen und die in S ( x s | y s ) ihren Scheitelpunkt hat. Wann gibt es keine solche Funktion? a) P (1 | 1), Q (0 | ? ), S (2 | − 1) b) P (2 | 3), Q (6 | ? ), S (4 | 1) c) P (0 | 1), Q (1 | 0), S (2 | ? ) d) P (0 | − 1), Q (3 | 5), S (? | − 3) e) P (0 | 1), Q (1 | 0), S ( t | ? ) f) P (2 | 3), Q (6 | 3), S ( t | ? ) 19. Gegeben sei ein Satz x 1 , . . . , x n ∈ R von n Beobachtungsdaten. Zeigen Sie: f ( x ) = ( x − x 1 ) 2 + · · · + ( x − x n ) 2 wird genau dann minimal, wenn x = x 1 + ··· + x n n . Zusammenfassung Quadratische Funktionen sind in der Ökonomie die wichtigsten nichtlinearen Ansätze zur Darstellung funktionaler Abhängigkeiten. Nach Bearbeitung des vorangegangenen Kapitels sollten Sie in der Lage sein, ■ Aussagen über die Normalform einer quadratischen Funktionen anhand ihres Graphen und umgekehrt über den Graphen anhand der Normalform zu machen sowie quadratische Funktionen für gegebene Steckbriefe zu bestimmen, ■ die Scheitelpunktform einer quadratischen Funktion aus der Normalform mittels quadratischer Ergänzung und aus der graphischen Darstellung zu bestimmen, ■ Nullstellen quadratischer Funktionen mit Hilfe der quadratischen Ergänzung und der p q -Formel zu berechnen und diese Technik auf die Berechnung von Schnitt- und Berührpunkten zwischen quadratischen und linearen Funktionen anzuwenden, ■ in Spezialfällen den Satz von Viëta anzuwenden, um die Faktordarstellung und damit die Nullstellen schneller zu erkennen, ■ die teilweise Umkehrung quadratischer Funktionen durchzuführen, ■ quadratische Gewinnfunktionen auf Grundlage linearer Nachfragefunktionen aufzustellen, den Cournot-Punkt zu bestimmen sowie quadratische Modelle für Nachfragefunktionen mit Scheitelpunkt in den Intervallrändern aufzustellen. Weil quadratische Funktionen oft von weiteren Parametern abhängig sein werden, sollten Sie sich an den Gebrauch solcher Parameter z.B. in Kurvenscharen gewöhnt haben. 48818_Terveer.indd 74 48818_Terveer.indd 74 18.07.2023 11: 47: 26 18.07.2023 11: 47: 26 <?page no="75"?> 5 Rationale Funktionen Übersicht In vielen ökonomischen Anwendungssituationen kann man nicht mehr nur auf lineare oder quadratische Funktionen zurückgreifen, sondern muss die Modelle komplexer aufstellen, um Eckdaten der realen Situation zu erfassen. Ganzrationale Funktionen sind hier oft gut geeignet oder ergeben sich zwangsläufig aus der grundlegenden Modellierung. So haben wir schon im letzten Abschnitt den Gewinn aus der Regalproduktion der Firma Ikebau bei quadratischer Nachfragefunktion als ganzrationale Funktion dritten Grades berechnet. Ein weiteres Beispiel stellt das sogenannte (klassische) Ertragsgesetz dar. Man versteht darunter den funktionalen Zusammenhang zwischen einem speziellen Produktionsfaktor und dem Ertrag aus der Produktion, wenn alle weiteren Produktionsfaktoren unverändert bleiben („ceteris paribus“). Beispielsweise könnte eine solche Funktion den landwirtschaftlichen Ertrag in Abhängigkeit vom Einsatz eines Düngemittels beschreiben. Ein solches Ertragsgesetz hat oft die in Abbildung 5.1 dargestellte Form. ■ Bei Steigerung einer geringen Dosierung des Düngers steigt der Ertrag zunächst überproportional an (Phase I), ■ in der sich anschließenden Phase II ist die Ertragssteigerung nahezu proportional zur Änderung des Düngemitteleintrages. ■ Mit dem maximalen Durchschnittsertrag beginnt Phase III des Ertragsgesetzes. ■ Ab einer gewissen Menge wirkt der Dünger eher ertragsmindernd. Dieser Bereich, der bis zur Ertragslöschung führt, macht die Phase IV des Ertragsgesetzes aus. Dieser Verlauf lässt sich nicht mehr mit einer quadratischen Funktion, sondern mit einer ganzrationalen Funktion dritten Grades f ( x ) = ax 3 + bx 2 + cx + d modellieren, man nennt diesen Funktionstyp daher „ertragsgesetzlich“, selbst wenn es nicht mehr unbedingt um Erträge geht. So werden ertragsgesetzliche Funktionen zur Modellierung von nichtlinearen variablen Kosten eingesetzt, sie lassen sich aber auch zur Darstellung von Produkt-Lebenszyklen in Abhängigkeit von der Zeit verwenden. Gebrochen rationale Funktionen werden außerdem zur Beschreibung relativer Größen herangezogen, beispielsweise beim bereits angesprochene Durchschnittsertrag h ( x ) = f ( x ) x zu einer ganzrationalen Ertragsfunktion f . Auch Durchschnittskosten zu ertragsgesetzlichen Kostenfunktionen führen zu gebrochen rationalen Funktionen. Andere Beispiele gebrochen-rationaler Funktionen treten im Rahmen der Elastizitätsrechnung - einem auf dem Ableitungsbegriff basierenden Konzept für relative Änderungen ökonomischer Größen - und im Zusammenhang mit der geometrischen Reihe auf. Im vorangegangenen Kapitel ist Ihnen bereits eine gebrochen-rationale Funktion begegnet: die Menge der möglichen Scheitelpunkte einer quadratischen Nachfragefunktion durch zwei gegebene Punkte ist durch den Graphen einer gebrochen-rationalen Funktion gegeben, wie Sie beispielhaft in Aufgabe 18.e) vgl. S. 73 des vorangegangenen Kapitels gesehen haben. 48818_Terveer.indd 75 48818_Terveer.indd 75 18.07.2023 11: 47: 27 18.07.2023 11: 47: 27 <?page no="76"?> 76 5 Rationale Funktionen Abbildung 5.1: Graphische Darstellung des Ertragsgesetzes und seiner Phasen. Gestrichelt: Durchschnittsertrag. 5.1 Potenzen und Monome Polynome bauen sich aus Potenzen einer Variablen x auf. Für a ∈ R und n ∈ N versteht man unter der Potenz a n den Ausdruck a · a · · · a mit insgesamt n Faktoren. Dabei wird a als Basis und n als Exponent bezeichnet. Es gelten die Potenzregeln: Satz 5.1 (Potenzregeln für ganzzahlige Exponenten) Für a, b ∈ R und n, m ∈ N gilt [1] a n + m = a n a m , [2] a n − m = a n a m falls a ̸ = 0 und n > m , [3] ( a n ) m = a nm , [4] ( ab ) n = a n b n . Für a ̸ = 0 mit a 0 : = 1 lässt sich die Potenz mittels a − n : = 1 a n sinnvoll auf negative Exponenten erweitern, und die genannten Regeln lassen sich auf n, m ∈ Z übertragen. Die obigen Regeln beschreiben die Verträglichkeit von Potenzen und Produkte in Termen. Für die mühsamere Umformung von Potenzen aus Summen, d.h. von ( a + b ) n ist die binomische Formel zuständig, die für n ≤ 4 wie folgt lautet: Satz 5.2 (Wichtige Spezialfälle der binomischen Formel) [1] binomische Formel für n = 2: ( a + b ) 2 = a 2 + 2 ab + b 2 [2] binomische Formel für n = 3: ( a + b ) 3 = a 3 + 3 a 2 b + 3 ab 2 + b 3 [3] binomische Formel für n = 4: ( a + b ) 4 = a 4 + 4 a 3 b + 6 a 2 b 2 + 4 ab 3 + b 4 Für n = 2 gilt etwa ( a + b ) 2 = ( a + b )( a + b ) = ( a + b ) a + ( a + b ) b = a 2 + ba + ab + b 2 = a 2 + 2 ab + b 2 Für n = 3 gilt entsprechend ( a + b ) 3 = ( a + b ) 2 ( a + b ) = ( a 2 + 2 ab + b 2 )( a + b ) = ( a 2 + 2 ab + b 2 ) a + ( a 2 + 2 ab + b 2 ) b = a 3 + 2 a 2 b + b 2 a + a 2 b + 2 ab 2 + b 3 = a 3 + 3 a 2 b + 3 ab 2 + b 3 Es wird also so lange ausmultipliziert, bis nur noch Ausdrücke der Form a k b j auftauchen und anschließend werden Summanden mit übereinstimmenden Potenzen a k b j zusammengefasst. Auf diese Weise erhält man Summanden zu den Potenzprodukten a n b 0 = a n , a n − 1 b, a n − 2 b 2 , . . . , a 2 b n − 2 , ab n − 1 , a 0 b n = b n . Die auftretenden Produkte zeichnen sich dadurch aus, dass ihre Exponenten k , j in der Summe stets k + j = n ergeben, d.h. es gilt j = n − k . Die durch Zusammenfassen erhaltenen Vorfaktoren heißen Binomialkoeffizienten. Mit ( n k ) wird der Binomialkoeffizient zur Potenz 48818_Terveer.indd 76 48818_Terveer.indd 76 18.07.2023 11: 47: 27 18.07.2023 11: 47: 27 <?page no="77"?> 5.1 Potenzen und Monome 77 n = 0 1 n = 1 1 1 n = 2 1 2 1 n = 3 1 3 3 1 n = 4 1 4 6 4 1 n = 5 1 5 10 10 5 1 Abbildung 5.2: Binomialkoeffizienten im Pascal’schen Dreieck a k b n − k bezeichnet. Der Begriff Binomialkoeffizient gründet sich auf der binomischen Formel, zur geschlossenen Form vgl. Satz 5.4. Die Binomialkoeffizienten werden im Pascalschen Dreieck gemäß Abbildung 5.2 zusammengefasst. Offenbar ergibt sich ein Binomialkoeffizient stets als Summe der beiden in der darüber liegenden Zeile unmittelbar benachbarten Binomialkoeffizienten: Satz 5.3 (Additionseigenschaft der Binomialkoeffizienten) Für alle n ∈ N und k ∈ { 1 , . . . , n } gilt ( n +1 k ) = ( n k − 1 ) + ( n k ) Denn ( n +1 k ) ist der Koeffizient zur Potenz a k b n +1 − k im Ausdruck ( a + b ) n +1 . Mit ( a + b ) n +1 = ( a + b ) n ( a + b ) = a ( a + b ) n + b ( a + b ) n . hat man eine Zerlegung in zwei Summanden, die ebenfalls den Term a k b n +1 − k enthalten, wie im folgenden schraffiert hervorgehoben: a ( a + b ) n = a (( n 0 ) a 0 b n + · · · + ( n k − 1 ) a k − 1 b n − ( k − 1) + ( n k ) a k b n − k + · · · + ( n n ) a n b 0 ) = ( n 0 ) a 1 b n + · · · + ( n k − 1 ) a k b n − k +1 + ( n k ) a k +1 b n − k + · · · + ( n n ) a n +1 b 0 b ( a + b ) n = b (( n 0 ) a 0 b n + · · · + ( n k − 1 ) a k − 1 b n − ( k − 1) + ( n k ) a k b n − k + · · · + ( n n ) a n b 0 ) = ( n 0 ) a 0 b n +1 + · · · + ( n k − 1 ) a k − 1 b n − k +2 + ( n k ) a k b n − k +1 + · · · + ( n n ) a n b 1 und genau die beiden hervorgehobenen Summanden enthalten Potenzen a k b n +1 − k . Die darin auftretenden Koeffizienten ( n k − 1 ) und ( n k ) müssen also zusammen ( n +1 k ) ergeben. Binomialkoeffizienten lassen sich mittels der Fakultät darstellen. Für eine natürliche Zahl n ∈ N ist n ! (sprich “ n Fakultät“) erklärt als n ! : = 1 · 2 · · · ( n − 1) · n (mit der Vereinbarung 0! : = 1). Binomialkoeffizienten haben dann die Form: Satz 5.4 Für alle n ∈ N 0 und k ∈ { 0 , . . . , n } ist ( n k ) = n ! k ! ( n − k )! Der folgende Nachweis dieser Darstellung kann beim ersten Lesen übersprungen und später noch einmal gelesen werden, wenn das Beweisprinzip der vollständigen Induktion erarbeitet wurde vgl. S. 129. Gemäß der Vereinbarung, dass 0! = 1, ist die Darstellung richtig für k = 0 und beliebiges n , denn ( n 0 ) gibt die Anzahl der Summanden für a 0 b n = b n wieder. Hiervon gibt es genau einen, bei allen anderen Summanden a k b j ist der Grad j < n . Damit ist die Aussage auch für n = 0 richtig, weil hier nur der Fall k = 0 auftritt. Der übrige und wesentliche Teil der Aussage wird durch Induktion nach n ∈ N bewiesen: Induktionsanfang n = 1: Es gilt ( a + b ) 1 = ( 1 0 ) a + ( 1 1 ) b = 1 · a + 1 · b , so dass offensichtlich ( 1 k ) = 1 = 1! k ! (1 − k )! für k = 0 , 1 gilt. Im Induktionsschritt wird angenommen, dass die Aussage richtig ist für ein n ∈ N und alle k ∈ { 0 , . . . , n } (Induktionsvoraussetzung). Im Induktionsschritt ist für n +1 und k ∈ { 0 , . . . , n +1 } 48818_Terveer.indd 77 48818_Terveer.indd 77 18.07.2023 11: 47: 28 18.07.2023 11: 47: 28 <?page no="78"?> 78 5 Rationale Funktionen Abbildung 5.3: Graphen der Monomfunktionen f ( x ) = x n und der zugehörigen Wurzelfunktionen g ( x ) = n √ x (gestrichelt) von links nach rechts für n = 2 , 3 , 4. Eingezeichnet ist auch (hellgrau) der Graph der Identitätsfunktion id ( x ) = x . nachzurechnen, dass ( n +1 k ) = ( n +1)! k ! ( n +1 − k )! . Für k = 0 ist dies richtig (s.o.), für k ≥ 1 gilt: ( n +1 k ) = ( n k − 1 ) + ( n k ) (1) = n ! ( k − 1)! ( n +1 − k )! + n ! k ! ( n − k )! (2) = n ! ( k − 1)! ( n − k )! ( n +1 − k ) + n ! ( k − 1)! ( n +1 − k )! k = n ! ( k − 1)! ( n − k )! · ( 1 ( n +1 − k ) + 1 k ) = n ! ( k − 1)! ( n − k )! · k +( n +1 − k ) k ( n +1 − k ) = n ! ( k − 1)! ( n − k )! · n +1 k ( n +1 − k ) = ( n +1)! k ! ( n +1 − k )! Schritt (1) entspricht der Additionseigenschaft (Satz 5.3), in Schritt (2) wird die Induktionsvoraussetzung angewendet, d.h. es gilt ( n k − 1 ) = n ! ( k − 1)! ( n − ( k − 1))! = n ! ( k − 1)! ( n +1 − k )! und ( n k ) = n ! k ! ( n − k )! . Bei den weiteren Schritten wird n ! ( k − 1)! ( n − k )! ausgeklammert und anschließend vereinfacht. Der Induktionsschritt ist somit abgeschlossen. Insgesamt folgt die Aussage. Der Binomialkoeffizient wird üblicherweise mit der Formel aus Satz 5.4 definiert bzw. mit kombinatorischen Überlegungen aus einem Urnenmodell hergeleitet. Die binomische Formel wird dann mit vollständiger Induktion bewiesen. In der binomischen Formel haben wir bereits Potenzen der Form a k gesehen. Fasst man diesen Ausdruck als Funktion in a auf, so spricht man von einem Monom: Definition 5.1 ! Ein Monom in der Variablen x ist eine Potenz x n mit einem vorgegebenen n ∈ N 0 . Eine Funktion f : D → R mit f ( x ) = x n und n ∈ N 0 heißt Monomfunktion. Maximaler Definitionsbereich der Monomfunktionen ist R. Die Graphen der drei Monomfunktionen zu den Monomen x 2 , x 3 , x 4 zusammen mit den zugehörigen Wurzelfunktionen (s.u.) sind in Abbildung 5.3 angegeben. Für gerades n ist die Monomfunktion achsensymmetrisch zur Ordinate, d.h. es gilt f ( x ) = f ( − x ) für alle x ∈ R. Solche Funktionen heißen dann auch gerade Funktionen. Für Monomfunktionen gilt: Die Funktion ist genau dann gerade, wenn der Exponent n gerade ist. Für ungerades n ist die Monomfunktion punktsymmetrisch zum Ursprung, d.h. es gilt f ( − x ) = − f ( x ) für alle x ∈ R. Solche Funktionen heißen dann auch ungerade Funktionen. Für Monomfunktionen gilt: Die Funktion ist genau dann ungerade, wenn der Exponent ungerade ist. Monomfunktionen sind nicht automatisch umkehrbar, denn alle geraden Monomfunktionen haben wie bereits die Normalparabel immer zwei Urbilder. Erst bei Beschränkung des Definitionsbereiches auf D = [0; ∞ [ lassen sie sich umkehren. 48818_Terveer.indd 78 48818_Terveer.indd 78 18.07.2023 11: 47: 29 18.07.2023 11: 47: 29 <?page no="79"?> 5.1 Potenzen und Monome 79 Definition 5.2 ! Die positive Lösung der Gleichung x n = y , y ≥ 0, heißt n -te Wurzel von y . Als Symbol wird x = n √ y verwendet. Die Berechnung einer ( n -ten) Wurzel wird als Radizieren bezeichnet, wie bei Quadratwurzeln heißt der Term unter dem Wurzelzeichen Radikand. Beim Rechnen mit Wurzeln gibt es ein paar grundlegende Regeln: Satz 5.5 (Regeln für den Umgang mit n -ten Wurzeln) Für alle x, y > 0 und n, m ∈ Z gilt [1] n √ x n = n √ x n = x und n √ x m = n √ x m [2] n √ m √ x = nm √ x , [3] n √ xy = n √ x n √ y . Alle bisherigen Rechenregeln für Potenzen und Wurzeln lassen sich für Potenzen zu allgemeinen reellen Exponenten vereinheitlichen vgl. S. 110 . Die Wurzel(-funktion) g : [0; ∞ [ → [0; ∞ [, g ( x ) = n √ x ist die Umkehrfunktion der Monomfunktion f : [0; ∞ [ → [0; ∞ [, f ( x ) = x n . Monome werden oft mit einem Vorfaktor a ∈ R versehen und auch dann als solche bezeichnet. Der Exponent n eines Monoms ax n heißt auch Grad des Monoms. Bei ungeradem Exponenten n hat die Gleichung x n = y auch für y < 0 eine Lösung . Dieser Wert wird ebenfalls als n -te Wurzel (einer negativen Zahl) bezeichnet und mit dem Symbol n √ y dargestellt, aus unserer Sicht eine unglückliche Begriffsbildung, weil sie einen sehr isolierten Spezialfall der später noch behandelten allgemeinen Potenz darstellt, bei der die Basis stets nichtnegativ zu sein hat. Man sollte die Lösung für y < 0 als − n √− y oder mit Betragsstrichen vgl. S. 119 als − n √ | y | schreiben. Übungen zu Abschnitt 5.1 ? 1. Berechnen Sie ( a + b ) 4 = a 4 + 4 a 3 b + 6 a 2 b 2 + 4 ab 3 + b 4 durch Ausmultiplizieren und Sortieren nach Potenzen a j b k . 2.Vereinfachen Sie die folgenden Ausdrücke so weit wie möglich mit Hilfe der Potenz- und Wurzelregeln: a) 3 33 b) (2 n ) 3 · √ 4 für n ∈ N c) ( ab 2 ) 2 n ( ba 2 ) n für n ∈ N , a ̸ = 0 , b ̸ = 0 3. Vereinfachen Sie die folgenden Terme so weit wie möglich: a) (8 a 3 )(4 ab 2 ) + (2 a 2 b )( − 5 a 2 b ) b) u − 2 v 2 w 4 − u 2 ( vw 2 ) 2 c) ( x − 5 + 5 x )( x − 5 − 5 x ) d) x 5 ( x − 2 − x − 1 ) 2 e) a 2 n − 18 a n + 81 f) 3 x 4 y 2 − 6 x 3 y 3 + 12 x 2 y 4 − 24 xy 5 g) ab 2 (2 a 2 − b ) 3 − a (8( a 3 b ) 2 − b 5 ) 4. Vereinfachen Sie so weit wie möglich: a) √ 18 − 4 √ 8 b) 3 √ 7 3 − 2 √ 7 2 + 5 √ 7 5 c) 5 √ 96 x 10 d) 3 √ 4 a 5 b 3 − b a e) √ u 4 − 15 √ u 3 v + 75 √ u 2 v 2 − 125 √ uv 3 f) 3 √ t 2 8 √ t 24 √ t 6 √ t 48818_Terveer.indd 79 48818_Terveer.indd 79 18.07.2023 11: 47: 29 18.07.2023 11: 47: 29 <?page no="80"?> 80 5 Rationale Funktionen 5. Setzen Sie ein und vereinfachen Sie anschließend so weit wie möglich. a) t = √ 2 in t 2 − 2 t t − 1 b) t = √ 32 in t 3 − t 2 t 2 − 1 c) t = √ 3 a in t ( t 3 − t ) + 2( a 2 − a ) d) t = x ( x + 1) in t − x t e) y = √ st 2 in 2 y s + 5 y t f) y = √ 1 − x 2 in 1 − y 4 1 − y 2 5.2 Polynome und ganz-rationale Funktionen Ein Term, der als (gewichtete) Summe von Monomen verschiedenen Grades, d.h. als a n x n + a n − 1 x n − 1 + · · · + a 1 x + a 0 geschrieben werden kann, heißt Polynom (in x ). Die darin auftretenden Faktoren a 0 , . . . , a n ∈ R heißen Koeffizienten des Polynoms. Eine ganzrationale Funktion ist dann eine Funktion f mit Polynom-Funktionsterm. Wenn keine Missverständnisse zu befürchten sind, wird für diese Funktion ebenfalls der Begriff Polynom verwendet. Auch wenn die Reihenfolge der Glieder natürlich keine Rolle spielt, so werden aus Gründen der Übersichtlichkeit Polynome meist mit gliedweise absteigender oder gliedweise aufsteigender Monom-Potenz dargestellt - falls nicht anders beschrieben, gehen wir im Folgenden von absteigenden Potenzen aus. Falls in der obigen Darstellung a n ̸ = 0, so heißt die Zahl n Grad des Polynoms f , und man schreibt n = grad ( f ). Die Summanden eines Polynoms vom Grad n nennt man auch Glieder des Polynoms. Der Summand a 0 = a 0 x 0 heißt konstantes Glied, die weiteren Summanden a 1 x , a 2 x 2 , a 3 x 3 werden als lineares, quadratisches und kubisches Glied bezeichnet. Der Koeffizient a n eines Polynoms vom Grad n wird Leitkoeffizient genannt. Ein Polynom mit Leitkoeffizient 1 heißt auch normiertes Polynom. Beispiel 5.1 f ( x ) = − 7 x 4 + 2 x 3 − x 2 + 5 x − 72 ist ein Polynom vom Grad 4. ■ Sein Leitkoeffizient ist − 7. ■ Die weiteren Koeffizienten sind 2 (kubisches Glied), − 1 (quadratisches Glied), 5 (lineares Glied) und − 72 (konstantes Glied). g ( x ) = − 17 f ( x ) = x 4 − 27 x 3 + 17 x 2 − 57 x + 12 hat Leitkoeffizient 1, ist also normiert. Der Graph eines Polynoms p ( x ) der obigen Form vom Grad n folgt für „ große“Werte von x dem Graphen des Monoms q ( x ) = a n x n . In einem „Zwischenbereich“ kann das Polynom zusätzliche Nullstellen, Extrema und Wendepunkte aufweisen. Mit Techniken der Differentialrechnung ergibt sich folgender Sachverhalt: Satz 5.6 Ein Polynom vom Grad n hat maximal n Nullstellen, n − 1 lokale Extrema und n − 2 Wendestellen. 48818_Terveer.indd 80 48818_Terveer.indd 80 18.07.2023 11: 47: 30 18.07.2023 11: 47: 30 <?page no="81"?> 5.2 Polynome und ganz-rationale Funktionen 81 Abbildung 5.4: Polynomfunktion p ( x ) = x 3 − 3 x 2 − 85 x + 14 5 (schwarz) und Monomfunktion q ( x ) = x 3 (gestrichelt). Links Darstellung im Intervall [ − 4; 4], rechts im Intervall [ − 10; 10]. Beispiel 5.2 p ( x ) = x 3 − 3 x 2 − 85 x + 14 5 hat drei Nullstellen, zwei lokale Extrema und eine Wendestellen, vgl. Abbildung 5.4 links (wie man diese Stellen bestimmt, soll an dieser Stelle noch offen bleiben). Im links dargestellten Intervall [ − 4; 4] ist der Verlauf deutlich verschieden zum Monom q ( x ) = x 3 . Vergrößert man den Ausschnitt, so gleichen sich die Verläufe von p und q für große und kleine Werte von x an, vgl. Abbildung 5.4 rechts. Symmetrieeigenschaften eines Polynoms p ( x ) = a n x n + · · · + a 1 x + a 0 kann man an den Koeffizienten des Polynoms erkennen: Satz 5.7 (Symmetrie von Polynomen) [1] p ist eine (zur Ordinate) achsensymmetrische Funktion genau dann, wenn a k = 0 für alle ungeraden k (d.h. das Polynom enthält nur gerade Potenzen). [2] p ist eine (zum Ursprung) punktsymmetrische Funktion genau dann, wenn a k = 0 für alle geraden k (d.h. das Polynom enthält nur ungerade Potenzen). Da bei achsenbzw. punktsymmetrischen Polynomen ausschließlich gerade bzw. ausschließlich ungerade Potenzen auftreten, nennt man achsensymmetrische Polynom- Funktionen auch gerade Funktionen und punktsymmetrische Polynom-Funktionen auch ungerade Funktionen. Diese Begriffe werden aber nicht nur bei Polynomen, sondern auch bei anderen Typen von Funktionen verwendet. Beispiel 5.3 f ( x ) = 3 x 4 − 4 x 2 + 2 ist eine gerade Funktion, f ( x ) = − x 5 + x eine ungerade Funktion. Zur einfachen Berechnung von Funktionswerten ganzrationaler Funktionen bietet sich das sogenannte Horner-Schema an (auch Ruffini-Regel genannt). Bei diesem ist die Anzahl der Multiplikationen, die zur Berechnung erforderlich sind, deutlich geringer als bei der schlichten Auswertung eines Polynomausdrucks nach den Vorrangregeln „Punktrechnung vor Strichrechnung“. Die Rechenschritte des Horner-Schemas ergeben sich, indem man so weit wie möglich x ausklammert. Bei einem konstanten Glied im Polynom geht das natürlich nur für den links vom konstanten Glied stehenden Term. 48818_Terveer.indd 81 48818_Terveer.indd 81 18.07.2023 11: 47: 30 18.07.2023 11: 47: 30 <?page no="82"?> 82 5 Rationale Funktionen Beispiel 5.4 Beim Polynom f ( x ) = 2 x 3 − 3 x 2 − 4 x + 8 klammert man wie folgt aus: 2 x 3 − 3 x 2 − 4 x + 8 = (2 x 2 − 3 x − 4) · x + 8 = ((2 x − 3) · x − 4) · x + 8 Sie sehen, dass die Koeffizienten des Polynoms mit absteigendem Grad von innen nach außen in die Klammern eingehen. In dieser Reihenfolge gehen sie dann auch in die Berechnung ein. Anhand der Bestimmung von f (7) sei dies erläutert: Man beginnt mit dem inneren Ausdruck, multipliziert 2 mit x = 7 (Ergebnis 14), subtrahiert 3 (Ergebnis 11), multipliziert das Ergebnis mit x = 7 (Ergebnis 77), subtrahiert 4 (Ergebnis 73), multipliziert dann wieder mit x = 7 (Ergebnis 511) und addiert zum Schluss 8. Der gesuchte Funktionswert ist dann f (7) = 519. Diese Rechnung kann auch tabellarisch durchgeführt werden: Man beginnt mit einer zweizeiligen Tabelle, Spaltenüberschriften sind die Koeffizienten mit absteigendem Grad. Zeilenbeschriftung der ersten Zeile ist der Wert von x , für den p ( x ) berechnet werden soll. In die erste Spalte, erste Zeile trägt man zunächst den Wert Null ein: Beispiel 5.5 Für die Funktion aus dem vorangegangenen Beispiel lautet die Start-Tabelle zur Berechnung von f (7) also 2 − 3 − 4 8 7 0 Die Spalten werden nun von links nach rechts gefüllt, wobei die Auswertungen des geklammerten Ausdrucks nacheinander eingetragen werden. Das bedeutet, dass der unterste Eintrag einer Zeile stets durch Addition der darüber liegenden Einträge berechnet wird (Spaltensaldo). Ist eine Spalte dann voll, so wird der oberste zu füllende Eintrag in der nächsten Spalte rechts berechnet, indem man den zuletzt berechneten Spaltensaldo mit dem Wert von x multipliziert, für den der Polynomwert berechnet werden soll. Anschließend folgt wieder Spaltensaldierung, dann Multiplikation usw. Auswertung Tabelle Einzelschritt f (7)=((2 · 7 − 3) · 7 − 4) · 7 + 8 2 − 3 − 4 8 7 02 2 + 0 = 2 = ((14 − 3) · 7 − 4) · 7 + 8 2 − 3 − 4 8 7 0 14 2 2 · 7 = 14 = (11 · 7 − 4) · 7 + 8 2 − 3 − 4 8 7 0 14 2 11 − 3 + 14 = 11 = (77 − 4) · 7 + 8 2 − 3 − 4 8 7 0 14 77 2 11 11 · 7 = 77 = 73 · 7 + 8 2 − 3 − 4 8 7 0 14 77 2 11 73 − 4 + 77 = 73 = 511 + 8 2 − 3 − 4 8 7 0 14 77 511 2 11 73 73 · 7 = 511 = 519 2 − 3 − 4 8 7 0 14 77 511 2 11 73 519 8 + 511 = 519 48818_Terveer.indd 82 48818_Terveer.indd 82 18.07.2023 11: 47: 31 18.07.2023 11: 47: 31 <?page no="83"?> 5.3 Teilbarkeit von Polynomen und Polynomdivision 83 a n a n − 1 a n − 2 · · · a 0 x 0 a n x ( a n x + a n − 1 ) x · · · ˜ f ( x ) x 0 · x + a n = a n a n x + a n − 1 ( a n x + a n − 1 ) x + a n − 2 · · · ˜ f ( x ) x + a 0 = f ( x ) Tabelle 5.2: Tabellarische Darstellung des Horner-Schemas zur Auswertung eines Polynoms f ( x ) = a n x n + a n − 1 x n − 1 + · · · + a 1 x + a 0 Beim Übertrag eines Wertes aus einer Spalte der Tabelle in die rechts davon befindliche Spalte wird dieser Wert also mit 7 multipliziert, anschließend wird durch Summation der Spalte der unterste Wert errechnet. Der zuletzt ganz rechts unten stehende Wert 519 ist der gesuchte Funktionswert. Die allgemeine Durchführung des Horner-Schemas erfolgt wie in Tabelle 5.2. Der in der letzten Spalte eingesetzte Ausdruck ˜ f ( x ) ist der Term, der sich durch Ausklammern von x aus f ( x ) − a 0 ergibt. Da das Horner-Schema nur in dem schrittweisen Aufbau der zuletzt angegebenen Tabelle besteht, ist es sehr einfach umzusetzen. Auch wenn das Verfahren unnötig erscheint angesichts der Tatsache, dass moderne Taschenrechner Funktionswerttabellen ohne händische Rechnung erstellen, so sei schon jetzt darauf hingewiesen, dass das Horner-Schema auch zur Polynomdivision genutzt wird, und dort eine erhebliche Vereinfachung der Notation bedeutet. Übungen zu Abschnitt 5.2 ? 6. Erstellen Sie mit dem Horner- Schema für die Funktion f ( x ) eine Wertetabelle mit den Funktionswerten f (0) , f ( ± 1) , f ( ± 2) , f ( ± 3) und für c) auch f ( t ), f ( 1 √ t ): a) f ( x ) = − x 3 + 2 x 2 − x + 7, b) f ( x ) = 3 x 4 − x 2 + x − 10, c) f ( x ) = tx 3 − 2 x + t 7. Berechnen Sie für das Polynom f ( x ) = x 3 − 12 x 2 + 45 x − 54 mit dem Horner- Schema den Wert h ( x ) = f ( x + 3), x ∈ R. Erläutern Sie an einem Schaubild, in welchem Zusammenhang die Funktionen f und h zueinander stehen. Bestimmen Sie alle Nullstellen von f , indem Sie zunächst die Nullstellen von h berechnen. 8. Eine Funktion f heißt symmetrisch zur Gerade x = x 0 , wenn g ( x ) = f ( x + x 0 ) eine gerade Funktion ist. Sie heißt punktsymmetrisch zum Punkt P ( x 0 | f ( x 0 )), wenn g ( x ) = f ( x + x 0 ) − f ( x 0 ) eine ungerade Funktion ist. Prüfen Sie die folgenden Polynome auf Achsenbzw. Punktsymmetrie zu den gegebenen Achsen bzw. Punkten bzw. berechnen Sie die fehlenden Bestimmungsstücke so, dass die Punkt- oder Achsensymmetrie gegeben ist. a) f ( x ) = 2 x − 5 in P (7 | 9) b) f ( x ) = − 4 x + 7 in x = 3 c) f ( x ) = 3 x 2 + 24 x − 41 in x = 4 d) f ( x ) = − 6 x 2 − 24 x − 9 in x = t e) f ( x ) = x 3 − 12 x 2 + 50 x − 22 in P (4 | 50) f) f ( x ) = − x 3 + 6 x 2 − 2 x + 7 in P ( a | b ) 5.3 Teilbarkeit von Polynomen und Polynomdivision Werden zwei Polynome addiert oder multipliziert, so erhält man wieder ein Polynom. Bei der Addition sind einfach jeweils die Koeffizienten derjenigen Glieder zu addieren, 48818_Terveer.indd 83 48818_Terveer.indd 83 18.07.2023 11: 47: 32 18.07.2023 11: 47: 32 <?page no="84"?> 84 5 Rationale Funktionen die übereinstimmende Potenzen x k aufweisen: Beispiel 5.6 Wir addieren p ( x ) = 2 x 4 − 3 x 2 + 5 x + 1 und q ( x ) = 3 x 4 − 5 x 3 − x − 7: p ( x ) + q ( x ) = (2 x 4 − 3 x 2 + 5 x + 1) + (3 x 4 − 5 x 3 − x − 7) = (2 x 4 + 0 x 3 − 3 x 2 + 5 x + 1) + (3 x 4 − 5 x 3 + 0 x 2 − x − 7) = (2 + 3) x 4 + (0 − 5) x 3 + ( − 3 + 0) x 2 + (5 − 1) x + (1 − 7) = 5 x 4 − 5 x 3 − 3 x 2 + 4 x − 6 Bei der Multiplikation müssen Sie gemäß Distributivgesetz jedes Glied des einen Polynoms mit jedem Glied des anderen Polynoms multiplizieren. Die entstehenden Monome sind dem Grad nach zu sortieren und Koeffizienten zu Monomen gleichen Grades schließlich zusammenzufassen: Beispiel 5.7 Wir multiplizieren p ( x ) = x 4 − 1 und q ( x ) = x 2 − 3 x − 4: p ( x ) q ( x ) = ( x 4 − 1)( x 2 − 3 x − 4) = x 4 ( x 2 − 3 x − 4) + ( − 1)( x 2 − 3 x − 4) = ( x 6 − 3 x 5 − 4 x 4 ) + ( − x 2 + 3 x + 4) = x 6 − 3 x 5 − 4 x 4 − x 2 + 3 x − 4 Die Nullstellen von Polynomen lassen sich in der Regel nicht exakt und vollständig ermitteln. Ein möglicher Ansatz ist, die Rechnung in Beispiel 5.7 umzukehren, d.h. für ein Polynom f eine Darstellung f ( x ) = p ( x ) · q ( x ) mit Polynomen p, q zu finden. Man spricht dann von einer Faktorisierung von f , und die Nullstellen der Polynome p und q stellen genau die Nullstellen von f dar gemäß folgenden Grundsatz: Ein Produkt ist genau dann Null, wenn (wenigstens) einer der Faktoren Null ist. Das bedeutet: x 0 ist Nullstelle von f ( x ) = p ( x ) · q ( x ) genau dann, wenn x 0 Nullstelle von p oder von q ist. Sind die Grade von p, q größer als Null und kleiner als Grad f , so ist es generell einfacher, deren Nullstellen zu berechnen. Das Faktorisieren von Polynomen entspricht in seinem Grundgedanken dem Faktorisieren natürlicher Zahlen, entsprechend überträgt sich auch der Teilbarkeitsbegriff in N. Ein Polynom g ( x ) heißt Teiler eines Polynoms f ( x ), wenn es ein weiteres Polynom q ( x ) gibt, so dass gilt f ( x ) = p ( x ) q ( x ). Wenn dabei grad ( q ) ≥ 1 oder gleichwertig grad ( p ) < grad ( f ), so heißt p ( x ) auch echter Teiler. Falls es für ein Polynom f keinen echten Teiler gibt, so heißt dieses Polynom irreduzibel bzw. Primpolynom. Beispiel 5.8 In Beispiel 5.7 haben wir ( x 4 − 1)( x 2 − 3 x − 4) = x 6 − 3 x 5 − 4 x 4 − x 2 + 3 x − 4 gesehen. Das rechts stehende Polynom hat also die echten Teiler p ( x ) = x 4 − 1 und q ( x ) = x 2 − 3 x − 4. Wie man zudem nachrechnen kann, ist q ( x ) = x 2 − 3 x − 4 = ( x + 1)( x − 4). Die (linearen) Polynome q 1 ( x ) = x + 1 und q 2 ( x ) = x − 4 sind daher auch echte Teiler von f , es gilt f ( x ) = p ( x ) q 1 ( x ) q 2 ( x ). Die Faktorisierung kann hier auch noch fortgesetzt werden, denn es gilt p ( x ) = x 4 − 1 = ( x 2 − 1)( x 2 + 1) = ( x − 1)( x + 1)( x 2 + 1), wobei zwei Mal die dritte binomische Formel angewendet 48818_Terveer.indd 84 48818_Terveer.indd 84 18.07.2023 11: 47: 32 18.07.2023 11: 47: 32 <?page no="85"?> 5.3 Teilbarkeit von Polynomen und Polynomdivision 85 wurde. Insgesamt gilt x 6 − 3 x 5 − 4 x 4 − x 2 + 3 x − 4 = ( x 2 + 1)( x − 1)( x + 1) 2 ( x − 4). Mit Ausnahme des ersten Faktors haben alle auftretenden Polynome Grad 1. Das Polynom x 2 + 1 lässt sich nicht weiter faktorisieren. Grad-1-Teilerpolynome eines Polynoms heißen Linearfaktoren. In Beispiel 5.8 sind q 1 und q 2 Linearfaktoren von f . Linearfaktoren sind immer Primpolynome, denn sie können keinen Teiler haben, dessen Grad kleiner als 1 und gleichzeitig größer als 1 ist. Im letzten Beispiel wurde ein Faktor x 2 + 1 hergeleitet. Dieser lässt sich unter Verwendung reeller Zahlen nicht weiter faktorisieren, er stellt ebenfalls einen Primfaktor dar. Hingegen konnte der Faktor x 2 − 3 x − 4 weiter zu ( x + 1)( x − 4) faktorisiert werden. Es gibt also offensichtlich Polynome vom Grad 2, die faktorisierbar sind und andere, die nicht faktorisiert werden können. Dahinter steckt folgende Regel: Ein Polynom vom Grad 2, welches keine (reelle) Nullstelle hat, ist nicht weiter faktorisierbar. Unter einer Faktorisierung eines Polynoms f ( x ) versteht man eine Darstellung f ( x ) = p 1 ( x ) · · · p k ( x ) mit Polynomen p j ( x ), die echte Teiler sind. Damit ein Polynom p ( x ) „echter“ Teiler eines Polynoms f ( x ) ist, muss es zumindest einen geringeren Grad haben als f . Das allein reicht jedoch noch nicht aus. Wie bei ganzen Zahlen kann auch bei der Division von Polynomen ein Rest auftreten: Satz 5.8 Für zwei Polynome f, g mit grad ( g ) < grad ( f ) gibt es genau ein Polynom p und genau ein Polynom r mit grad ( r ) < grad ( g ) und f ( x ) = p ( x ) g ( x ) + r ( x ) ⇔ f ( x ) g ( x ) = p ( x ) + r ( x ) g ( x ) Falls r ( x ) = 0, dann ist das Polynom p ein Teiler des Polynoms f . Die Polynomdivision führt zur Bestimmung von g ( x ) und r ( x ), vergleichbar zur schriftliche Division von Zahlen; die Monome in einem Polynom haben dabei die gleiche Rolle wie die Zehnerpotenzen in der Dezimaldarstellung einer Zahl. Die einzelnen Schritte der Polynomdivision ergeben Monome fallenden Grades. Beispiel 5.9 Berechnet wird (2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4) : (2 x 4 − 5 x +1). Im ersten Schritt teilt man die jeweils (grad-)höchsten Glieder der beiden Polynome durcheinander, das ergibt 2 x 6 : 2 x 4 = x 2 . Der vollständige erste Schritt der Polynomdivision lautet dann (2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4): (2 x 4 − 5 x + 1)= x 2 − (2 x 6 − 5 x 3 + x 2 ) − 6 x 5 − 8 x 4 +15 x 2 +17 x − 4 Der geklammerte Ausdruck in der zweiten Zeile ist x 2 (2 x 4 − 5 x + 1), ausmultipliziert und unter die passenden Glieder des Polynoms f ( x ) gesetzt. Achten Sie auf die Klammern in der zweiten Zeile und das Minuszeichen vor der Klammer. Die Einträge in der dritten Zeile ergeben sich durch gliedweise Zusammenfassung, dabei das Minuszeichen vor der Klammer berücksichtigten! Man liest ab: 48818_Terveer.indd 85 48818_Terveer.indd 85 18.07.2023 11: 47: 33 18.07.2023 11: 47: 33 <?page no="86"?> 86 5 Rationale Funktionen 2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4 2 x 4 − 5 x +1 = x 2 + − 6 x 5 − 8 x 4 +15 x 2 +17 x − 4 2 x 4 − 5 x +1 Der Grad des Zählerpolynoms hat sich um Eins verringert, er ist allerdings noch nicht kleiner als der Grad des Nennerpolynoms. Deshalb wird das Verfahren jetzt wiederholt. Die Glieder zum (grad-)höchsten Koeffizienten werden dividiert: − 6 x 5 2 x 4 = − 3 x . Damit wird das Schema der Polynomdivision um zwei weitere Zeilen ergänzt: (2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4): (2 x 4 − 5 x + 1)= x 2 − 3 x − (2 x 6 − 5 x 3 + x 2 ) − 6 x 5 − 8 x 4 +15 x 2 +17 x − 4 − ( − 6 x 5 +15 x 2 − 3 x ) − 8 x 4 +20 x − 4 Daraus liest man jetzt ab: 2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4 2 x 4 − 5 x +1 = x 2 − 3 x + − 8 x 4 +20 x − 4 2 x 4 − 5 x +1 Immer noch ist der Grad des resultierenden Zählerpolynoms zu hoch, es wird daher ein letzter Divisionsschritt ausgeführt. − 8 x 4 2 x 4 = − 4 und damit (2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4): (2 x 4 − 5 x + 1)= x 2 − 3 x − 4 − (2 x 6 − 5 x 3 + x 2 ) − 6 x 5 − 8 x 4 +15 x 2 +17 x − 4 − ( − 6 x 5 +15 x 2 − 3 x ) − 8 x 4 +20 x − 4 − ( − 8 x 4 +20 x − 4) 0 Die Polynomdivision ergibt: 2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +17 x − 4 2 x 4 − 5 x +1 = x 2 − 3 x − 4 + 0 2 x 4 − 5 x +1 . Sie können an der zuletzt im Schema auftretenden Zahl 0 erkennen, dass die Division ohne Rest möglich ist, d.h. das Polynom 2 x 4 − 5 x +1 ist ein (echter) Teiler des Polynoms 2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 + 16 x 2 + 17 x − 4. Beispiel 5.10 Im folgenden Beispiel ergibt sich bei der Division ein Rest: (12 x 5 − 38 x 4 +42 x 3 − 50 x 2 +24 x − 8): (2 x 2 − 5 x + 1)=6 x 3 − 4 x 2 +8 x − 3 − (12 x 5 − 30 x 4 +6 x 3 ) − 8 x 4 +36 x 3 − 50 x 2 +24 x − 8 − ( − 8 x 4 +20 x 3 − 4 x 2 ) 16 x 3 − 46 x 2 +24 x − 8 − (16 x 3 − 40 x 2 +8 x ) − 6 x 2 +16 x − 8 − ( − 6 x 2 +15 x − 3) x − 5 Somit gilt 12 x 5 − 38 x 4 +42 x 3 − 50 x 2 +24 x − 8 2 x 2 − 5 x +1 = 6 x 3 − 4 x 2 + 8 x − 3 + x − 5 2 x 2 − 5 x +1 Wenn das Divisor-Polynom linear und normiert ist, d.h. p ( x ) = x − b , so liefert das von uns schon vorgestellte Horner-Schema neben dem Funktionswert f ( b ) auch das Rest-Polynom r ( x ) bei der Division f ( x ) / p ( x ). Beispiel 5.11 Für die Polynome f ( x ) = 2 x 3 − 3 x 2 − 4 x + 8 und p ( x ) = x − 7, vgl. Beispiel 5.5 vgl. S. 82 , stellen wir Division und Horner-Schema schrittweise nebeneinander dar: 48818_Terveer.indd 86 48818_Terveer.indd 86 18.07.2023 11: 47: 34 18.07.2023 11: 47: 34 <?page no="87"?> 5.3 Teilbarkeit von Polynomen und Polynomdivision 87 (2 x 3 − 3 x 2 − 4 x +8) : ( x − 7) = 2 x 2 − (2 x 3 − 14 x 2 ) 11 x 2 2 − 3 − 4 8 7 0 14 2 11 (2 x 3 − 3 x 2 − 4 x +8) : ( x − 7) = 2 x 2 +11 x − (2 x 3 − 14 x 2 ) 11 x 2 − 4 x − (11 x 2 − 77 x ) 73 x 2 − 3 − 4 8 7 0 14 77 2 11 73 (2 x 3 − 3 x 2 − 4 x +8) : ( x − 7) = 2 x 2 +11 x +73 − (2 x 3 − 14 x 2 ) 11 x 2 − 4 x − (11 x 2 − 77 x ) 73 x +8 (73 x − 511) 519 2 − 3 − 4 8 7 0 14 77 511 2 11 73 519 Sie sehen, dass das Horner-Schema neben dem Funktionswert f (7) = 519 auch die Koeffizienten des Polynoms q ( x ) = 2 x 2 + 11 x + 73 der Polynomdivision f ( x ) p ( x ) = q ( x ) + r ( x ) p ( x ) liefert. Das Restpolynom ist hier r ( x ) = 519. Während sich die Polynomdivision f ( x ) p ( x ) auch für allgemeine lineare Polynome p ( x ) = ax + b durchführen lässt, ist das Horner-Schema zur Polynomdivision nur für Polynome mit Leitkoeffizient 1, d.h. für Polynome der Form p ( x ) = x − b geeignet. Wollen Sie das Horner-Schema auch im allgemeinen Fall ausführen, so müssen Sie zunächst den Leitkoeffizienten von p ( x ) ausklammern. Beispiel 5.12 Es ist 2 x 3 − 3 x 2 − 4 x +8 2 x +4 = 12 2 x 3 − 3 x 2 − 4 x +8 x +2 . Die Polynomdivision lässt sich jetzt mit dem Horner-Schema durchführen: 2 − 3 − 4 8 − 2 0 − 4 14 − 20 2 − 7 10 − 12 Also gilt 2 x 3 − 3 x 2 − 4 x + 8 2 x + 4 = 1 2 2 x 3 − 3 x 2 − 4 x + 8 x + 2 = 1 2 (2 x 2 − 7 x + 10 − 12 x + 2 ) = x 2 − 72 x + 5 − 6 x + 2 Für normierte Divisor-Polynome p ( x ) höheren Grades lässt sich das Horner-Schema verallgemeinern. Dabei wird für jeden „zusätzlichen Grad“ von p ( x ) eine weitere Zeile in der Tabelle angefügt und mit einem Dreiecksschema von Nullwerten von links begonnen. In jeder Zeile wird mit einem mit ( − 1) multiplizierten Koeffizienten von p ( x ) gearbeitet, von oben nach unten mit aufsteigendem Grad des Monoms. Sobald eine Spalte vollständig ist, wird diese addiert. Das Ergebnis wird jeweils „diagonal“ mit den negativen Koeffizienten von p multipliziert. Das Verfahren endet, sobald die letzte Spalte erreicht ist; das noch unausgefüllte Zahlendreieck oberhalb der letzten Zeile wird mit Nullwerten ergänzt, die letzten Einträge der unteren Zeile werden schließlich durch Saldieren bestimmt. 48818_Terveer.indd 87 48818_Terveer.indd 87 18.07.2023 11: 47: 34 18.07.2023 11: 47: 34 <?page no="88"?> 88 5 Rationale Funktionen Beispiel 5.13 Mit f ( x ) = 2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 + 16 x 2 + 19 x − 11 und p ( x ) = x 2 − 2 x − 3 lautet das Horner-Schema zur Berechnung von f ( x ) / p ( x ): 2 − 6 − 8 − 5 16 19 − 11 3 0 0 6 − 6 − 18 − 69 − 144 2 0 4 − 4 − 12 − 46 − 96 0 2 − 2 − 6 − 23 − 48 − 146 − 155 Dabei werden die nicht schraffierten Werte vorab eingetragen, die Kopfzeile enthält die Koeffizienten von f , die Zeilenbeschriftung besteht aus den negativen Koeffizienten von p mit Ausnahme des Leitkoeffizienten 1. Die Null-Einträge in der Tabelle initialisieren das Horner-Schema. Die erste Spalte wird summiert, welches den dunkel schraffierten Eintrag 2 ergibt. Die diagonal nach oben weisenden Einträge 4 und 6 werden durch Multiplikation von 2 mit den Zeilenbeschriftungen 3 und 3 ermittelt. Nun kann die zweite Spaltensumme ermittelt werden − 6 + 0 + 4 = − 2. Die diagonal fortführenden hell schraffierten Einträge werden wieder duch Multiplikation von − 2 mit den Zeilenbeschriftungen 3 und 2 berechnet usw. Die Befüllung der Tabelle endet mit der letzten Spaltensumme, d.h. − 11 + − 144 + 0 = − 155. Es ist demnach f ( x ) = p ( x ) q ( x ) + r ( x ) mit q ( x ) = 2 x 4 − 2 x 3 − 6 x 2 − 23 x − 48 und r ( x ) = − 146 x − 155. Zur Kontrolle führen wir die Division schriftlich aus: (2 x 6 − 6 x 5 − 8 x 4 − 5 x 3 +16 x 2 +19 x − 11) : ( x 2 − 2 x − 3) − (2 x 6 − 4 x 5 − 6 x 4 ) =2 x 4 − 2 x 3 − 6 x 2 − 23 x − 48 − 2 x 5 − 2 x 4 − 5 x 3 − ( − 2 x 5 +4 x 4 +6 x 3 ) − 6 x 4 − 11 x 3 +16 x 2 − ( − 6 x 4 +12 x 3 +18 x 2 ) − 23 x 3 − 2 x 2 +19 x − ( − 23 x 3 +46 x 2 +69 x ) − 48 x 2 − 50 x − 11 − ( − 48 x 2 +96 x +144) − 146 x − 155 Polynomdivisionen mit Divisoren p ( x ) und grad ( p ) > 2 treten in ökonomischen Anwendungen relativ selten auf, wir gehen deshalb hier auch nicht weiter darauf ein. Übungen zu Abschnitt 5.3 ? 9. Schreiben Sie Summe f ( x ) + g ( x ) und Produkt f ( x ) g ( x ) als Polynom: a) f ( x ) = 4 x 2 − 5 x + 2, g ( x ) = x 2 − x b) f ( x ) = 3 x 3 − 7, g ( x ) = x 4 + 2 c) f ( x ) = ( x − 1)( x + 3), g ( x ) = ( x − 2) 2 ( x − 3) d) f ( x ) = ( x − t )( x +2), g ( x ) = tx 3 − 2 x +7 10. Gegeben seien die Polynome: f 2 ( x ) = x 3 − 8 x 2 + 17 x − 10, f 3 ( x ) = x 5 + 3 x 4 − 13 x 3 − 39 x 2 + 36 x + 108, f 4 ( x ) = x 4 + 5 x 3 + (4 − t ) x 2 − 5 tx − 4 t , g 1 ( x ) = x − 5, g 2 ( x ) = x − 1, g 3 ( x ) = x − t , g 4 ( x ) = x 2 − 6 x + 5, g 5 ( x ) = x 2 − t Berechnen Sie die folgenden Quotienten und prüfen Sie, ob das jeweilige Nennerpolynom ein Teiler des Zählerpolynoms ist. 48818_Terveer.indd 88 48818_Terveer.indd 88 18.07.2023 11: 47: 35 18.07.2023 11: 47: 35 <?page no="89"?> 5.4 Nullstellen von Polynomen 89 a) f 1 ( x ) g 1 ( x ) und f 1 ( x ) g 2 ( x ) b) f 2 ( x ) g 1 ( x ) und f 2 ( x ) g 2 ( x ) und f 2 ( x ) g 4 ( x ) c) f 3 ( x ) g 2 ( x ) und f 3 ( x ) g 4 ( x ) d) f 1 ( x ) g 3 ( x ) und f 2 ( x ) g 3 ( x ) und f 2 ( x ) g 5 ( x ) e) f 4 ( x ) g 2 ( x ) und f 4 ( x ) g 5 ( x ) 11. Sind die Nullstellen von p auch Nullstellen von f ? Ist p Teiler von f ? a) f ( x ) = 2 x 5 +4 x 4 − 20 x 3 − 2 x 2 +44 x − 48, p ( x ) = x 2 + 2 x − 8 b) f ( x ) = x 3 − 3 x 2 − 4 x + 12, p ( x ) = x 2 − 6 x + 9 c) f ( x ) = x 4 − tx 3 + tx 2 − t 2 x , p ( x ) = x 2 − xt d) f ( x ) = x 4 + 2 x 3 + 2 x 2 + 2 x + 1, p ( x ) = x 3 + x 2 + 2 x + 2 5.4 Nullstellen von Polynomen Viele ökonomische Fragestellungen (z.B. Gleichgewichte, Bedingungen für Extremwerte,. . . ) lassen sich in der Ökonomie auf das Lösen von Gleichungen zurückführen. Die Lösungen dieser Gleichungen lassen sich direkt oder durch Umstellen oft als Nullstellen von Funktionen finden; die Funktionen, die dabei zum Einsatz kommen, sind vielfach Polynome. Eine zentrale Aufgabe im Zusammenhang mit Polynomen ist daher die Suche nach deren Nullstellen, die man auch Wurzeln nennt. Ein Polynom n -ten Grades hat maximal n verschiedene Nullstellen (für den Spezialfall einer quadratischen Funktion sind das bekanntlich maximal zwei Nullstellen). Aber nur in wenigen Spezialfällen gibt es explizite Formeln zur Bestimmung von Nullstellen: ■ Für Polynome zweiten Grades, also quadratische Funktionen, berechnen sich die Nullstellen über die p q -Formel. ■ Für Polynome dritten und vierten Grades werden die Wurzeln mit den so genannten Cardano-Formeln dargestellt; diese Lösungsformeln sind aber sehr aufwändig und setzen die Kenntnis komplexer Zahlen voraus. Für Polynome höheren Grades als vier gibt es keine allgemein verwendbaren expliziten Nullstellenformeln, sondern generell muss man die Nullstellen numerisch ausrechnen, worauf wir im Rahmen der Differentialrechnung noch genauer eingehen werden. Darüber hinaus gibt es nur noch einige wenige Heuristiken zum Erraten von Nullstellen. Sie haben eine solche Heuristik bereits im Satz von Viëta vgl. S. 68 kennengelernt: Bei quadratischen Funktionen ist das konstante Glied Produkt der Nullstellen, der Koeffizient des linearen Gliedes ist die negative Summe der Nullstellen. Eine ähnliche Aussage gilt auch für Polynome, die in Linearfaktoren zerfallen: Satz 5.9 Ein normiertes Polynom f ( x ) = x n + a n − 1 x n − 1 + · · · + a 1 x + a 0 vom Grad n , das sich in die Form f ( x ) = ( x − x 1 )( x − x 2 ) · · · ( x − x n ) bringen lässt, hat folgende Eigenschaften: [1] − a n − 1 = x 1 + x 2 + · · · + x n , d.h. − a n − 1 ist die Summe der Nullstellen. [2] Für gerades n ist a 0 = x 1 · · · x n , für ungerades n ist a 0 = − x 1 · · · x n , d.h. a 0 oder − a 0 ist Produkt der (mit Vielfachheit gezählten) Nullstellen. Wenn man bei einem normierten Polynom, dessen konstantes Glied a 0 ganzzahlig ist, vermutet, dass es vollständig in Linearfaktoren zerfällt und alle seine Nullstellen ebenfalls ganzzahlig sind, müssen diese also Teiler von a 0 sein. 48818_Terveer.indd 89 48818_Terveer.indd 89 18.07.2023 11: 47: 36 18.07.2023 11: 47: 36 <?page no="90"?> 90 5 Rationale Funktionen Beispiel 5.14 Das Polynom f ( x ) = x 4 − 6 x 3 + 8 x 2 + 6 x − 9 ist normiert und hat das ganzzahlige konstante Glied − 9. Das Polynom könnte als ganzzahlige Nullstellen einen oder mehrere der Teiler von − 9 haben, also ± 9 , ± 3 und ± 1. Einsetzen der möglichen Kandidaten zeigt, dass in der Tat 3, 1 und − 1 Nullstellen von f sind. Die Teiler können auch durch eine kaskadierte Form des Horner-Schemas gefunden werden: Nullstelle 1 − 6 8 6 − 9 x 4 − 6 x 3 + 8 x 2 + 6 x − 9 3 0 3 − 9 − 3 9 1 − 3 − 1 3 0 = ( x − 3)( x 3 − 3 x 2 − x + 3) 3 0 3 0 − 3 1 0 − 1 0 = ( x − 3) 2 ( x 2 − 1) 1 0 1 1 1 1 0 = ( x − 3) 2 ( x − 1)( x + 1) Im ersten Schritt wird geprüft, ob x = 3 Nullstelle ist. Mit dem Horner-Schema ergibt sich f (3) = 0. Die letzte Zeile des Horner-Schemas gibt dann gleich das Quotientenpolynom g ( x ) = f ( x ) / ( x − 3) = x 3 − 3 x 2 − x + 3. Für dieses wird nochmal geprüft, ob 3 eine Nullstelle ist. Dies ergibt das zweite kürzere Horner-Schema und das Quotientenpolynom h ( x ) = x 2 − 1. Man sieht, dass 3 keine Nullstelle von h ist (gegebenenfalls führt man eine weitere Stufe der Kaskade mit x = 3 aus, die nicht erfolgreich ist) und probiert einen weiteren Teiler von − 9, hier etwa x = 1. Es bleibt das finale lineare Quotientenpolynom r ( x ) = x + 1, dessen Nullstelle − 1 ist. Es ergeben sich somit x = 3 (doppelte Nullstelle) und x = ± 1 als Nullstellen von f . Hat man also durch Raten eine Nullstelle x 0 eines Polynoms f ( x ) gefunden so untersucht man das Quotientenpolynom f ( x ) / ( x − x 0 ), welches einen Grad weniger hat, auf Nullstellen. Erst prüft man, ob dieses Polynom ebenfalls die Nullstelle x 0 hat. Falls ja, spaltet man erneut mit Polynomdivision den Faktor ( x − x 0 ) ab; das wiederholt man so oft, bis das Quotientenpolynom q ( x ) schließlich x 0 nicht mehr als Nullstelle hat. Die letzte Zeile eines Hornerschemas zur Polynomdivision kann dabei gleichzeitig als Kopfzeile des nächsten Hornerschemas dienen. Falls q ( x ) nur noch Grad 2 hat, bestimmt man die letzten Nullstellen über die p q - Formel, anderenfalls ist eine weitere Nullstelle zu raten und das Abspalten von Nullstellen beginnt von vorne. Satz 5.10 Sind x 1 , . . . , x m die verschiedenen Nullstellen eines Polynoms f , so gibt es eine Darstellung f ( x ) = ( x − x 1 ) n 1 ( x − x 2 ) n 2 · · · ( x − x m ) n m h ( x ) bei der h ( x ) = c 0 + c 1 x + · · · + c k x k ein Polynom vom Grad k = n − n 1 − · · · − n m ohne Nullstellen ist. n 1 , n 2 , . . . , n m heißen Vielfachheiten bzw. Ordnungen der Nullstellen. Beispiel 5.15 Das Polynom p ( x ) = x 3 − 6 x 2 + 3 x + 10 könnte ganzzahlige Nullstellen haben, welche Teiler von 10 sind, also ± 1, ± 2, ± 5 und ± 10. Man errät als erste Nullstelle x 1 = 2. 48818_Terveer.indd 90 48818_Terveer.indd 90 18.07.2023 11: 47: 36 18.07.2023 11: 47: 36 <?page no="91"?> 5.4 Nullstellen von Polynomen 91 Polynomdivision liefert dann x 3 − 6 x 2 + 3 x + 10 = ( x 2 − 4 x − 5 ) ( x − 2) Das verbleibende quadratische Polynom x 2 − 4 x − 5 hat die Nullstellen x 2 = − 5 und x 3 = − 1 (z.B. mit Viëta). Beispiel 5.16 Das Polynom p ( x ) = x 3 − 5 x 2 − 2 x + 10 kann ebenfalls als ganzzahlige Nullstellen die Teiler von 10 haben. In diesem Fall errät man die Nullstelle 5 und mit Polynomdivision die Darstellung x 3 − 5 x 2 − 2 x + 10 = ( x 2 − 2)( x − 5) Die verbleibenden Nullstellen sind ±√ 2, also nicht ganzzahlig. Beispiel 5.17 Das Polynom p ( x ) = x 3 − 5 x 2 + 2 x − 10 kann ebenfalls als ganzzahlige Nullstellen die Teiler von 10 haben. Wieder errät man die Nullstelle 5 und leitet jetzt mit Polynomdivision die Darstellung x 3 − 5 x 2 + 2 x − 10 = ( x − 5)( x 2 + 2) her. In diesem Fall ist 5 die einzige Nullstelle des Polynoms p ( x ) in den reellen Zahlen. Beispiel 5.18 Das Polynom p ( x ) = x 4 − 6 x 3 + 6 x 2 − 7 x + 10 könnte nach Satz 5.6 vgl. S. 80 bis zu vier ganzzahlige Nullstellen haben, die jeweils Teiler von 10 sind. Man errät die Nullstelle x 1 = 5 und leitet mit Polynomdivision die Darstellung x 4 − 6 x 3 + 6 x 2 − 7 x + 10 = ( x − 5) ( x 3 − x 2 + x − 2 ) her. Das verbleibende Polynom dritten Grades könnte ganzzahlige Nullstellen haben, welche Teiler von 2 sind, d.h. ± 1 und ± 2. Keine dieser Zahlen stellt sich beim Einsetzen jedoch als Nullstelle heraus. Mit der vorgeschlagenen Heuristik kommt man hier also nicht weiter, vielmehr sollten Sie sich spätestens jetzt den Funktionsgraphen des Restpolynoms x 3 − x 2 + x − 2 ansehen vgl. Abbildung 5.5 . An diesem erkennt man, dass es nur noch eine weitere Nullstelle zwischen 1 , 3 und 1 , 4 geben kann. Die Nullstelle kann mit dem Newton-Verfahren angenähert werden vgl. Unterabschnitt 8.5.1, S. 192 . Beispiel 5.19 Das Polynom f ( x ) = x 5 − 2 x 4 + x − 2 hat die Nullstelle x = 2. Nach Polynomdivision ergibt sich f ( x ) / ( x − 2) = x 4 + 1. Dieses Polynom zerlegt sich in quadratische Polynome: x 4 + 1 = ( x 2 − √ 2 x + 1)( x 2 + √ 2 x + 1), hat aber keine reelle Nullstelle. 48818_Terveer.indd 91 48818_Terveer.indd 91 18.07.2023 11: 47: 37 18.07.2023 11: 47: 37 <?page no="92"?> 92 5 Rationale Funktionen Abbildung 5.5: Graph des Restpolynoms x 3 − x 2 + x − 2 in Beispiel 5.18 Beispiel 5.20 Lassen Sie uns abschließend eine typische ökonomische Anwendung zur Nullstellenbestimmung besprechen. Bei einem Unternehmen fallen für die Produktion von x Werkstücken (ausschließlich) variable Kosten an, die durch die kubische Funktion K ( x ) = 1 1000 x 3 − x 2 + 360 x beschrieben werden können. Je Werkstück erzielt das Unternehmen einen Erlös von 200 e . Der Gewinn des Unternehmens ist dann mit der Funktion G ( x ) = 200 x − K ( x ) = − 1 1000 x 3 + x 2 − 160 x anzugeben. Wir möchten nun wissen, für welche Stückzahlen der Gewinn des Unternehmens positiv ist (Gewinnzone). Dazu bestimmen wir zunächst die Nullstellen der Gewinnfunktion: G ( x ) = 1 1000 ( − x 3 + 1000 x 2 − 160000 x ) = − x 1000 ( x 2 − 1000 x + 160000) = − x 1000 ( x − 800)( x − 200) Die Nullstellen lauten x = 0, x = 200 und x = 800. Weitere Nullstellen hat G nicht, und das Vorzeichenverhalten zwischen zwei benachbarten Nullstellen ist einheitlich (das ist eine Konsequenz des Zwischenwertsatzes 8.13 vgl. S. 175 ). Speziell ist G (100) = − 7000, G (300) = 15000 und G (900) = − 63000. Im Intervall ]200; 800[ ist der Gewinn also strikt positiv, ansonsten kleiner oder gleich Null. Gewinnzone ist [200; 800]. Übungen zu Abschnitt 5.4 ? 12. Faktorisieren Sie mit dem kaskadierten Horner-Schema: a) p ( x ) = x 5 − 7 x 4 + 9 x 3 + 9 x 2 + 8 x + 16 mit Nullstellen 1 und 4, b) p ( x ) = x 5 + 11 x 4 + 10 x 3 − 106 x 2 + 133 x − 49 mit Nullstellen 1 und − 7. 13. Ermitteln Sie jeweils alle Nullstellen der angegebenen Polynome p ( x ) und geben Sie in a)-g) die Faktorisierung an. a) 5 − 2 x − 20 x 2 + 8 x 3 b) 24 − 5 x − 25 x 2 + 5 x 3 + x 4 c) 14 x 5 − 14 x 4 − 92 x 3 + 25 2 x 2 − 47 4 x + 15 4 d) 2( x 2 + 32 x − 7)( x − 4) e) 5 x 5 + 35 x 4 − 40 x 3 f) 35 + 5 x + 42 x 2 + 6 x 3 + 7 x 4 + x 5 g) 4 x 6 − 104 x 3 − 108 h) 12 x 4 − 2 tx 2 + 52 5.5 Interpolation durch Polynome Mit den ganzrationalen Funktionen steht Ihnen eine umfangreiche Klasse von Funktionen zur Verfügung, mit denen viele reale Sachverhalte zwischen (ökonomischen) Va- 48818_Terveer.indd 92 48818_Terveer.indd 92 18.07.2023 11: 47: 38 18.07.2023 11: 47: 38 <?page no="93"?> 5.5 Interpolation durch Polynome 93 riablen zumindest annäherungsweise dargestellt werden können. In vielen Fällen liegen Informationen über den funktionalen Zusammenhang in Form einer - mehr oder weniger umfangreichen - Wertetabelle, d.h. in Form von n + 1 Punkten ( x 0 | y 0 ) , . . . , ( x n | y n ) auf dem Graphen von f mit x i ̸ = x j vor. Es gibt dann genau ein Polynom n -ten Grades p ( x ), auf dessen Graphen die vorgegebenen n + 1 Punkte liegen, d.h. für das gilt p ( x i ) = y i für alle i ∈ { 0 , . . . , n } . Die vorgegebene Tabelle wird dann auch als „Steckbrief“ des Polynoms bezeichnet (andere Steckbriefe, etwa in Form von Steigungs- und Krümmungsinformationen, werden später behandelt). Für zwei Punkte ( x 0 | y 0 ) , ( x 1 | y 1 ) hatten Sie bereits gesehen, wie man die eindeutige lineare Funktion findet, auf deren Graphen die beiden Punkte liegen (Normalform bzw. Punkt-Steigungsform) vgl. S. 53f. Für drei Punkte findet man eine eindeutig bestimmte quadratische Funktion, wie an folgendem Beispiel illustriert wird: Beispiel 5.21 Gesucht ist eine quadratische Funktion p ( x ) = ax 2 + bx + c , d.h. ihre Koeffizienten a, b, c , wenn bekannt ist, dass p (1) = 4, p (2) = 9, p (3) = 20. Setzt man die Werte 1, 2, 3 in den allgemeinen Parabelterm ein, so ergeben sich drei Gleichungen in den (noch) Unbekannten a, b, c a + b + c = 4 , 4 a + 2 b + c = 9 , 9 a + 3 b + c = 20 Das Gleichungssystem kann auf verschiedene Arten gelöst werden. Weil alle Gleichungen den Term + c enthalten, kann man durch Auflösen nach c und anschließendes Gleichsetzen über c zwei Gleichungen in den Unbekannten a, b erhalten: c = 4 − a − b, c = 9 − 4 a − 2 b, c = 20 − 9 a − 3 b Setzt man jeweils zwei der rechten Seiten der drei Gleichungen gleich, ergibt sich 4 − a − b = 9 − 4 a − 2 b, 9 − 4 a − 2 b = 20 − 9 a − 3 b und durch Zusammenfassen passender Terme 3 a + b = 5 , 5 a + b = 11. Jetzt kann man beide Gleichungen beispielsweise nach der Variablen b auflösen: 5 − 3 a = b = 11 − 5 a , und durch Gleichsetzen nach b erhält man 5 − 3 a = 11 − 5 a . Diese Gleichung löst man nach a auf: 2 a = 6 ⇔ a = 3. Setzt man dieses nun in eine der Gleichungen für b ein, so gewinnt man beispielsweise b = 5 − 3 a = 5 − 3 · 3 = − 4. Schließlich können die Werte für a und b in eine der anfänglich nach c aufgelösten Gleichungen eingesetzt werden, es ergibt sich beispielsweise c = 4 − a − b = 4 − 3 − ( − 4) = 5 Die gesuchte quadratische Funktion hat also Koeffizienten a = 3, b = − 4, c = 5, sie lautet p ( x ) = 3 x 2 − 4 x + 5. Bei der Lösung dieser Steckbriefaufgabe wurde ein so genanntes lineares Gleichungssystem (LGS) in drei Unbekannten a, b, c aufgestellt und aufgelöst. Je mehr Punkte im Steckbrief vorgegeben sind, desto mehr Gleichungen und Unbekannte hat das zu lösende Gleichungssystem. Techniken zur Lösung werden in Kapitel 10 behandelt. Die folgende Methode zur Lösung des Steckbriefs kommt aber ohne diese aus: 48818_Terveer.indd 93 48818_Terveer.indd 93 18.07.2023 11: 47: 38 18.07.2023 11: 47: 38 <?page no="94"?> 94 5 Rationale Funktionen Beispiel 5.22 Gesucht ist eine lineare Funktion p mit den Eigenschaften („Steckbrief“) p (1) = 4 und p (3) = 20. Hat man zwei lineare Funktionen p 0 ( x ), p 1 ( x ) mit den Eigenschaften p 0 (1) = 1 und p 0 (3) = 0 sowie p 1 (1) = 0 und p 1 (3) = 1 gefunden, so ist p ( x ) = 4 p 0 ( x ) + 20 p 1 ( x ) die gesuchte lineare Funktion, denn p ist als Summe linearer Funktionen linear und p (1) = 4 p 0 (1) + 20 p 1 (1) = 4 sowie p (3) = 4 p 0 (3) + 20 p 1 (3) = 20. p 0 und p 1 erhält man durch „Normierung“ der Linearfaktoren x − 3 und x − 1: ■ p 0 ( x ) = x − 3 1 − 3 = − 12 x + 32 gehört zum Steckbrief p 0 (1) = 1, p 0 (3) = 0. ■ p 1 ( x ) = x − 1 3 − 1 = 1 2 x − 12 gehört zum Steckbrief p 1 (1) = 0, p 1 (3) = 1. Die Summe p ( x ) = 4 p 0 ( x ) + 20 p 1 ( x ) = 4( − 12 x + 32 ) + 20( 12 x − 12 ) = 8 x − 4 ist dann Lösung zu dem gesuchten Steckbrief. Diese Vorgehensweise lässt sich auf umfangreichere Steckbriefen für Polynome höheren Grades übertragen: Jeder Punkt ( x i | y i ) des Steckbriefes legt ein Polynom p i fest, das an der zugehörigen Stelle x i den Funktionswert 1 hat, während alle anderen Stellen des Steckbriefes Nullstellen des Polynoms sind. Diese Lagrange-Polynome werden zum gesuchten Polynom „zusammengesetzt “. Lösung von Steckbriefen mit Lagrange-Polynomen Gegeben sei der Steckbrief p ( x 0 ) = y 0 , . . . , p ( x n ) = y n : [1] Setzen Sie q ( x ) = ( x − x 0 ) · · · · · ( x − x i − 1 ) · ( x − x i ) · ( x − x i +1 ) · · · · · ( x − x n ). [2] Für jede Stelle x i des Steckbriefes stellen Sie das Polynom q i ( x ) = q ( x ) x − x i = ( x − x 0 ) · · · · · ( x − x i − 1 ) · ( x − x i +1 ) · · · · · ( x − x n ) und sowie das Lagrange- Polynom p i ( x ) = q i ( x ) q i ( x i ) auf. [3] Das gesuchte Polynom ist p ( x ) = y 0 p 0 ( x ) + · · · + y n p n ( x ) Beispiel 5.23 Betrachten Sie noch einmal den Steckbrief p (1) = 4, p (2) = 9, p (3) = 20 aus Beispiel 5.21 vgl. S. 93 . Sie berechnen zunächst die Lagrange-Polynome für ■ x 0 = 1: q 0 ( x ) = ( x − 1)( x − 2)( x − 3) x − 1 = ( x − 2)( x − 3) p 0 ( x ) = q 0 ( x ) q 0 (1) = ( x − 2)( x − 3) (1 − 2)(1 − 3) = x 2 − 5 x +6 2 ■ x 1 = 2: q 1 ( x ) = ( x − 1)( x − 2)( x − 3) x − 2 = ( x − 1)( x − 3) p 1 ( x ) = q 1 ( x ) q 0 (2) = ( x − 1)( x − 3) (2 − 1)(2 − 3) = x 2 − 4 x +3 − 1 ■ x 2 = 3: q 2 ( x ) = ( x − 1)( x − 2)( x − 3) x − 3 = ( x − 1)( x − 2) p 2 ( x ) = q 2 ( x ) q 2 (1) = ( x − 1)( x − 2) (3 − 1)(3 − 2) = x 2 − 3 x +2 2 Das gesuchte Polynom ist p ( x ) = 4 p 0 ( x ) + 9 p 1 ( x ) + 20 p 2 ( x ) = 2( x 2 − 5 x + 6) − 9( x 2 − 4 x + 3) + 10( x 2 − 3 x + 2) = 3 x 2 − 4 x + 5 x . Beispiel 5.24 Gesucht ist eine quadratische Funktion p mit dem Ordinatenabschnitt p (0) = 24 und den Nullstellen x 1 = 2 und x 2 = 4. Es gilt also p (2) = 0 und p (4) = 0. Wir erhalten 48818_Terveer.indd 94 48818_Terveer.indd 94 18.07.2023 11: 47: 39 18.07.2023 11: 47: 39 <?page no="95"?> 5.6 Gebrochen-rationale Funktionen 95 zur Stelle x 0 = 0 das Lagrange-Polynom p 0 ( x ) = ( x − 2)( x − 4) (0 − 2)(0 − 4) = 18 ( x − 2)( x − 4). Die anderen beiden Lagrange-Polynome p 1 ( x ) und p 2 ( x ) müssen wir gar nicht berechnen, weil sie in der Schlussrechnung mit p (2) = 0 und p (4) = 0 multipliziert werden und deshalb „verschwinden“. Wir erhalten das Polynom p ( x ) = p (0) p 0 ( x ) + p (2) p 1 ( x ) + p (4) p 2 ( x ) = 24 · 18 ( x − 2)( x − 4) = 3( x − 2)( x − 4). Dasselbe Ergebnis hätten wir mit einer Linearform p ( x ) = a · ( x − 2)( x − 4) als Ansatz erhalten, wobei aus p (0) = 24 folgt: a · (0 − 2)(0 − 4) = 24, d.h. a = 3. Übungen zu Abschnitt 5.5 ? 14. Berechnen Sie mittels Lagrange- Polynomen ein Polynom minimalen Grades, welches durch die Punkte P, Q , bzw. P, Q, R bzw. (sofern S gegeben ist) P, Q, R, S läuft (dabei sei t ∈ R): a) P (0 | 5), Q (1 | 2), R (3 | 2), S (2 | 7) b) P (3 | 4), Q (7 | 3), R ( − 2 | 10), S ( − 3 | − 3 2 ) c) P ( t | 0), Q (0 | t ), R (1 | 0), S ( − 1 | 0) d) ( t − 1 | t ) P , Q ( t + 1 | t − 1), R ( t + 3 | t − 2) e) P (2 | t ), Q (5 | 1 − t ), R ( − 1 | 1 − t ) 5.6 Gebrochen-rationale Funktionen Der vorangegangene Abschnitt mag Ihnen den Eindruck vermittelt haben, dass mit Hilfe von Polynomen ausreichend viele Möglichkeiten zur Modellierung realer Sachverhalte zur Verfügung stehen, und keine weiteren Typen von Funktionen benötigt werden. Scheinbar braucht man lediglich einen geeigneten Steckbrief mit - hinreichend vielen - „Stützstellen“ z.B. mit Hilfe der Lagrange-Interpolation zu lösen. Mit wachsender Anzahl von Stützstellen werden die Interpolations-Polynome allerdings sehr unhandlich und „außerhalb“ der angepassten Punkte ist die Annäherung zumeist nicht sehr zufriedenstellend. Daher müssen Sie auch mit anderen Typen von Funktionen arbeiten. Eine Erweiterung der Polynomfunktionen, die zum Einsatz kommt, sind die gebrochenrationalen Funktionen. Es handelt sich dabei um Funktionen der Form f ( x ) = p ( x ) q ( x ) , wobei p, q Polynome sind. Ist q ( x ) konstant, so ist f wieder ein Polynom. In den Wirtschaftswissenschaften treten gebrochen-rationale Funktionen nicht so sehr im Rahmen der Modellierung, sondern eher bei der Analyse ökonomischer Sachverhalte auf, z.B. indem einer ökonomischen Funktion eine Durchschnittsfunktion zugeordnet wird: Beispiel 5.25 (Fortsetzung von 3.13 vgl. S. 58 ) Für die Herstellung des Regals Bill haben wir lineare Kosten K ( x ) = 30 x + 1000 in Abhängigkeit von der produzierten Menge x angenommen. Je Regal errechnen sich dann durchschnittliche Kosten ¯ K ( x ) = K ( x ) x = 30 x +1000 x . Bei Annahme einer (affin) linearen Nachfragefunktion hatten wir zudem die quadratische Gewinnfunktion G ( x ) = − 0 , 065 x 2 + 130 x − 1000 hergeleitet vgl. S. 69f. . Der durchschnittliche Gewinn ist dann von der Form ¯ G ( x ) = G ( x ) x = − 0 , 065 x 2 +130 x − 1000 x . Bei einer quadratischen Nachfragefunktion mit Scheitelpunkt S (2000 | 30) ist der Gewinn G ( x ) = 0 , 0000325 x 3 − 0 , 13 x 2 +130 x − 1000 vgl. S. 72 und der durchschnittliche Gewinn ist ¯ G ( x ) = G ( x ) x = 0 , 0000325 x 3 − 0 , 13 x 2 +130 x − 1000 x . Andere Anwendungen, in denen gebrochen-rationale Funktionen auftreten, sind Elastizitäten von Polynomfunktionen sowie finanzmathematische Formeln. Gebrochen-rationale Funktionen haben Definitionslücken in Nullstellen des Nenners. 48818_Terveer.indd 95 48818_Terveer.indd 95 18.07.2023 11: 47: 40 18.07.2023 11: 47: 40 <?page no="96"?> 96 5 Rationale Funktionen Abbildung 5.6: Graph der Funktion f ( x ) = x ( x − 1) 10( x − 1)( x − 2)( x − 3) 2 Beispiel 5.26 Wir betrachten f ( x ) = 1 10 · x 2 − x x 4 − 9 x 3 +29 x 2 − 39 x +18 = x ( x − 1) 10( x − 1)( x − 2)( x − 3) 2 . Das Nennerpolynom hat die Nullstellen 1, 2 und 3, welche grundsätzlich nicht eingesetzt werden dürfen und daher Definitionslücken darstellen. Die Nullstelle 1 ist Nullstelle erster Ordnung sowohl im Zähler als auch im Nenner des Bruches. Man könnte daher den Term ( x − 1) kürzen, d.h. es gilt f ( x ) = x 10( x − 2)( x − 3) 2 . Bei allen weiteren Untersuchungen muss man dann die Definitionslücke weiter berücksichtigen. In diesem Zusammenhang wird x = 1 als hebbare Definitionslücke von f bezeichnet. Andere Nullstellen des Nenner-Polynoms, die nicht bzw. nicht vollständig durch Kürzen entfernt werden können, werden als Polstellen von f bezeichnet. Allgemein spricht man in diesem Fall auch von einer nicht hebbaren Definitionslücke. Ist ihre Ordnung nach Kürzen ungerade, so spricht man von einer Polstelle mit Vorzeichenwechsel, bei gerader Ordnung von einer Polstelle ohne Vorzeichenwechsel. Beispiel 5.27 Im vorangegangenen Beispiel stellen die beiden anderen Nullstellen x = 2 und x = 3 „echte“ nicht hebbare Definitionslücken dar. x = 2 ist Polstelle von f mit Vorzeichenwechsel, x = 3 ist Polstelle von f ohne Vorzeichenwechsel. Nahe von nicht hebbaren Polstellen ungerader Ordnung nimmt eine gebrochen-rationale Funktion beliebig große bzw. beliebig kleine Funktionswerte an. Bei einer Polstelle gerader Ordnung nimmt die Funktion entweder beliebig große oder beliebig kleine Funktionswerte an. Am Graphen der Funktion in Beispiel 5.26 kann man dieses Verhalten gut erkennen vgl. Abbildung 5.6 ; wir gehen später genauer ein vgl. S. 170 . Die Analyse gebrochen-rationaler Funktionen erfolgt meistens im Rahmen von Kurvendiskussionen vgl. S. 203 . Zuweilen treten diese Funktionen auch bei Aufgaben der Integralrechnung auf, die später behandelt werden. Im Moment sollten Sie lediglich wissen, dass es insbesondere bei der Integration von gebrochen-rationalen Funktionen f = p ( x ) / q ( x ) wichtig ist, eine möglichst einfache Darstellung zu finden. Vorbereitung gebrochen-rationaler Funktionen: Für eine gebrochen-rationale Funktion f ( x ) = p ( x ) q ( x ) zur Zerlegung einer oder mehrere der folgenden Schritte ausgeführt: [1] Gemeinsame Linearfaktoren von Zähler- und Nennerpolynom werden aus dem 48818_Terveer.indd 96 48818_Terveer.indd 96 18.07.2023 11: 47: 41 18.07.2023 11: 47: 41 <?page no="97"?> 5.6 Gebrochen-rationale Funktionen 97 Bruch gekürzt. f hat jetzt die Form f ( x ) = ˜ p ( x ) ˜ q ( x ) . [2] Wenn grad (˜ p ) ≥ grad (˜ q ), so wird durch eine Polynomdivision die Darstellung ˜ p ˜ q = p 0 + p 1 ˜ q mit grad ( p 1 ) < grad (˜ q ) gewonnen. [3] Eine gebrochen-rationale Funktion mit grad ( p ) < grad ( q ) wird mittels Partialbruchzerlegung vereinfacht. Das Auffinden von Teilern eines Polynoms und die Durchführung der Polynomdivision ist in den vergangenen Abschnitten bereits besprochen worden. Zur Partialbruchzerlegung besprechen wir ein repräsentatives Beispiel: Beispiel 5.28 Betrachten Sie f ( x ) = 5 x +2 x 2 +2 x − 8 = 5 x +2 ( x +4)( x − 2) mit dem maximalen Definitionsbereich D = R \ {− 4 , 2 } . Die Partialbruchzerlegung zielt jetzt auf eine Darstellung der Form f ( x ) = A x +4 + B x − 2 . Um die Koeffizienten A und B zu ermitteln, machen Sie die Aufspaltung zunächst rückgängig, indem Sie beide Brüche in einem Bruch mit dem Hauptnenner ( x + 4) ( x − 2) zusammenfassen: A x +4 + B x − 2 = A ( x − 2)+ B ( x +4) ( x +4)( x − 2) . Die gesuchten Koeffizienten A und B müssen also die Eigenschaft haben, dass für alle x ∈ D gilt 5 x +2 ( x +4)( x − 2) = A ( x − 2)+ B ( x +4) ( x +4)( x − 2) . Da wir hier angenommen haben, dass x ∈ D, d.h. x ̸ = − 4 und x ̸ = 2, dürfen Sie diese Bruchgleichung durch Multiplikation mit ( x + 4) ( x − 2) vereinfachen. Für alle x ∈ D gilt daher 5 x + 2 = A ( x − 2) + B ( x + 4). Es gibt nun mehrere Möglichkeiten, A und B zu bestimmen: [1] Koeffizientenvergleich und Lösen eines linearen Gleichungssystems: Die rechte Seite wird nach Ausdrücken in x sortiert: 5 x + 2 = ( A + B ) x + ( − 2 A + 4 B ). Da beide Terme übereinstimmen, müssen ihre Koeffizienten übereinstimmen, d.h. A + B = 5 und − 2 A + 4 B = 2 ⇔ B = 5 − A und eingesetzt in die zweite Gleichung − 2 A + 4(5 − A ) = 2, d.h. − 6 A + 20 = 2 ⇒ A = 3. Daraus folgt B = 5 − A = 2. [2] Einsetzen zweier verschiedener Werte für x in die Gleichung 5 x + 2 = A ( x − 2) + B ( x + 4) ergibt zwei Bestimmungsgleichungen für A und B . Beispielsweise ergibt sich mit x = 0 die Gleichung 2 = − 2 A + 4 B und mit x = 1 die Gleichung 7 = − A + 5 B . Dieses lineare Gleichungssystem könnte man wie folgt lösen: Die erste Gleichung wird durch 2 geteilt, es folgt 1 = − A + 2 B ⇔ A = 2 B − 1 und eingesetzt in die zweite Gleichung 7 = − (2 B − 1) + 5 B ⇔ 3 B = 6 ⇔ B = 2. Schließlich folgt A = 2 B − 1 = 3. [3] Durch geschickte Wahl der einzusetzenden Werte kann dieser Aufwand verringert werden. Man setzt nämlich einfach die ursprünglich verbotenen Werte x = − 4 und x = 2 ein. Denn die Gleichung 5 x + 2 = A ( x − 2) + B ( x + 4) ist selbstverständlich nicht nur für ∈ R \ {− 4 , 2 } , sondern für alle x ∈ R gültig (Prinzip der stetigen Ergänzung). Jeder der beiden Koeffizienten taucht dann ausschließlich in einer der beiden Gleichungen auf, die sich deshalb leichter lösen lassen: Mit x = − 4 ergibt sich − 18 = A · ( − 6) + B · 0 ⇒ A = 3. Mit x = 2 ergibt sich 12 = A · 0 + B · 6 ⇒ B = 2 Die Partialbruchzerlegung lautet also f ( x ) = 3 x +4 + 2 x − 2 Rechenweg [3] kann man bei verschiedenen Linearfaktoren im Nenner verallgemeinern: 48818_Terveer.indd 97 48818_Terveer.indd 97 18.07.2023 11: 47: 42 18.07.2023 11: 47: 42 <?page no="98"?> 98 5 Rationale Funktionen Verfahren der Partialbruchzerlegung Eine Funktion f ( x ) = p ( x ) q ( x ) = p ( x ) ( x − x 1 ) ··· ( x − x m ) mit paarweise verschiedenen x 1 , . . . , x m , grad ( p ) < m und p ( x i ) ̸ = 0, i = 1 , . . . , m , wird wie folgt zerlegt: [1] Sie setzen an: p ( x ) q ( x ) = A 1 x − x 1 + · · · + A m x − x m = A 1 q 1 ( x )+ ··· + A n q n ( x ) q ( x ) , wobei q i ( x ) = q ( x ) x − x i wegen q ( x ) = ( x − x 1 ) · · · ( x − x m ) zu einem Polynom gekürzt werden kann. [2] Da die beiden Brüche links und rechts übereinstimmen und identischen Nenner haben, stimmen auch die Zähler überein, d.h. p ( x ) = A 1 q 1 ( x ) + · · · + A m q m ( x ). [3] Dies gilt dann auch für alle x = x i (Prinzip der stetigen Ergänzung). A i ergibt sich aus der Gleichung p ( x i ) = A i · ( x i − x 1 ) · · · ( x i − x i − 1 )( x i − x i +1 ) · · · ( x i − x m ). Partialbruchzerlegungen sind auch bei mehrfachen Nullstellen ( x − x i ) n i im Nenner möglich. Dann braucht man im Ansatz den Term A i 0 x − x i + A i 1 ( x − x i ) 2 + · · · + A ini ( x − x i ) ni auf. Die Koefizienten A ij kann man jetzt aber nicht mehr ausschließlich durch Einsetzen der „verbotenen“ Werte x i gewinnen, es müssen auch andere Werte verwendet werden. Hierdurch wird die Berechnung etwas aufwändiger. Beispiel 5.29 Betrachten Sie die Funktion f ( x ) = 3 x 2 − 13 x +12 ( x − 1) 3 = (3 x − 4)( x − 3) ( x − 1) 3 . Der Ansatz zur Partialbruchzerlegung lautet hier f ( x ) = A x − 1 + B ( x − 1) 2 + C ( x − 1) 3 = A ( x − 1) 2 + B ( x − 1)+ C ( x − 1) 3 . Der Zählervergleich ergibt A ( x − 1) 2 + B ( x − 1) + C = 3 x 2 − 13 x + 12 für alle x ̸ = 1, dann aber auch für x = 1. A, B, C lassen sich auf mehrere Arten bestimmen: [1] Koeffizientenvergleich: links wird ausmultipliziert und nach Potenzen von x sortiert, das ergibt A ( x − 1) 2 + B ( x − 1) + C = Ax 2 + ( B − 2 A ) x + A − B + C . Der Koeffizientenvergleich mit dem Polynom 3 x 2 − 13 x + 12 ergibt A = 3 und B − 2 A = − 13 ⇒ B = − 13+2 A = − 7 und A − B + C = 12 ⇒ C = 12 − A + B = 2. Hier ist die Bestimmung des Leitkoeffizienten A besonders einfach. [2] Einsetzen verschiedener Werte für x und Herleitung linearer Gleichungen für A, B, C . Zum einen kann man wieder den eigentlich verbotenen Wert x = 1 einsetzen, muss aber noch weitere Werte verwenden. Dabei könnte man, um noch einigermaßen einfache Gleichungen zu erhalten, auf den Wert x = 0 und eine der Nullstellen des Zählerpolynoms 3 x 2 − 13 x + 12 = (3 x − 4) ( x − 3) zurückgreifen, etwa mit x = 1 ergiibt sich C = 3 · 1 2 − 13 · 1 + 12 = 2, mit x = 3 ergibt sich 4 A + 2 B + C = 0 und mit x = 0 ergibt sich A − B + C = 12. Setzt man C = 2 in die zweite und dritte Gleichung ein und formt die dritte Gleichung nach A um, so erhält man 4 A + 2 B = − 2 und A = B + 10. Setzt man jetzt aus der zweiten Gleichung den Wert für A in die erste Gleichung ein, so folgt 4( B + 10) + 2 B = − 2 ⇔ 6 B = − 42 ⇔ B = − 7. Schließlich folgt A = B + 10 = 3. Hier ist die Bestimmung von C besonders einfach. [3] Man könnte die ersten beiden Ansätze kombinieren, d.h. wie in [1], ohne dass eine ausführliche Rechnung nötig ist, A = 3 schließen und dann wie in [2] die Gleichung 3 x 2 − 13 x +12 = 3( x − 1) 2 + B ( x − 1)+ C durch Einsetzen des „verbotenen“Wertes x = 1 zu C = 2 lösen. Für B nimmt man dann entweder einen weiteren Wert, also z.B. x = 0 und schließt dann 12 = 3 · (0 − 1) 2 + B · ( − 1)+2 ⇒ B = 3+2 − 12 = − 7. 48818_Terveer.indd 98 48818_Terveer.indd 98 18.07.2023 11: 47: 43 18.07.2023 11: 47: 43 <?page no="99"?> 5.6 Gebrochen-rationale Funktionen 99 Oder man setzt den Koeffizientenvergleich mit 3 x 2 − 13 x + 12 an, vereinfacht die rechte Seite mit den bereits bekannten Werten A = 3, C = 2 und sortiert nach x - Potenzen: 3( x − 1) 2 + B ( x − 1)+2 = 3 x 2 − 6 x +3+ Bx − B +2 = 3 x 2 +( B − 6) x +5 − B . Dann schließt man dann entweder über B − 6 = − 13 oder 5 − B = 12 auf B = − 7. f hat also die Partialbruchzerlegung 3 x 2 − 13 x +12 ( x − 1) 3 = 3 x − 1 − 7 ( x − 1) 2 + 2 ( x − 1) 3 . Bei mehreren Nullstellen im Nenner wird für jede der vorige Ansatz gemacht. Beispiel 5.30 Für f ( x ) = 8 x 2 − 17 x +5 ( x − 2)( x − 1) 2 setze A x − 1 + B ( x − 1) 2 + C ( x − 2) = A ( x − 1)( x − 2)+ B ( x − 2)+ C ( x − 1) 2 ( x − 2)( x − 1) 2 an, also 8 x 2 − 17 x + 5 = A ( x − 1)( x − 2) + B ( x − 2) + C ( x − 1) 2 . Einsetzen von drei Werten ergibt: ■ für x = 1 die Gleichung 8 · 1 2 − 17 · 1 + 5 = − B ⇒ B = 4, ■ für x = 2 die Gleichung C = 3 und ■ z.B. für x = 0 die Gleichung 5 = 2 A − 2 B + C ⇒ A = B − 12 C + 52 = 5 und damit 8 x 2 − 17 x +5 ( x − 2)( x − 1) 2 = 5 x − 1 + 4 ( x − 1) 2 + 3 x − 2 . Alternativ könnte man mit Koeffizientenvergleich lineare Bestimmungsgleichungen für A, B, C herleiten. Lässt sich das Nennerpolynom nicht vollständig mit Linearfaktoren darstellen, so treten Faktoren der Form x 2 + px + q ohne reelle Nullstellen auf. In der Partialbruchzerlegung wird diesen als Summand ein Bruch mit einem linearen Term in x als Zähler zugewiesen: Beispiel 5.31 Für die Funktion f ( x ) = 4 x +2 ( x − 1)( x 2 +1) wird der Ansatz 4 x +2 ( x − 1)( x 2 +1) = A x − 1 + Bx + C x 2 +1 gewählt. Wird wieder auf einen Bruch zusammengeführt, so ergibt sich 4 x +2 ( x − 1)( x 2 +1) = A ( x 2 +1)+( Bx + C )( x − 1) x 2 +1 und die Zähler müssen wieder für alle x ∈ R übereinstimmen, d.h. 4 x + 2 = A ( x 2 + 1) + ( Bx + C )( x − 1). Es lassen sich nun wieder die gleichen Techniken zur Bestimmung von A, B, C anwenden wie in den vorigen Beispielen, etwa [1] Mit dem „verbotenen“ Wert x = 1 folgt 6 = A · (1 2 + 1) = 2 A ⇒ A = 3. [2] Mit dem Wert x = 0 ergibt sich 2 = A + ( B · 0 + C )(0 − 1) = A − C , also C = A − 2 = 1 [3] Da auf der linken Seite gar kein quadratischer Term auftaucht, muss der quadratische Koeffizient (nach Sortieren) auf der rechten Seite Null sein. Dieser Koeffizient ist, wie man schnell erkennt von der Form A + B , denn beim Ausmultiplizieren von ( Bx + C )( X − 1) entsteht Bx 2 , aus dem ersten Summanden bekommt man Ax 2 , zusammen also ( A + B ) x 2 . Es folgt A + B = 0, also B = − A = − 3 Die Partialbruchzerlegung lautet insgesamt 4 x +2 ( x − 1)( x 2 +1) = 3 x − 1 + − 3 x +1 x 2 +1 . 48818_Terveer.indd 99 48818_Terveer.indd 99 18.07.2023 11: 47: 43 18.07.2023 11: 47: 43 <?page no="100"?> 100 5 Rationale Funktionen Übungen zu Abschnitt 5.6 ? 15. Stellen Sie folgenden Ausdrücke jeweils als gebrochen rationale Terme p ( x ) / q ( x ) mit Polynomen p, q dar; erläutern Sie jeweils auch, für welche x das möglich ist: a) x x − 1 / x 2 x 2 − 1 b) 5 x 2 x − 7 + 4 x − 2 c) 2 4 − 3 · x − 1 x − 2 16. Führen Sie die Partialbruchzerlegung an p ( x ) / q ( x ) aus für a) p ( x ) = 3 x + 7, q ( x ) = ( x − 1)( x − 2) b) p ( x ) = 3 x + 7, q ( x ) = ( x − 1) 2 c) p ( x ) = 2 x 2 − 4 x + 1, q ( x ) = ( x − 1) 3 17. Führen Sie für die folgenden gebrochen-rationalen Funktionen eine Partialbruchzerlegung aus (bereiten Sie diese gegebenenfalls mit einer Polynomdivision vor): a) f ( x ) = x +8 x 2 − 5 x − 6 b) f ( x ) = 8 x − 16 x 2 − 16 c) f ( x ) = 2 x − 3 t − 3 x 2 − ( t − 3) x − 3 t d) f ( x ) = 2 x − 11 x 2 − 6 x +9 e) f ( x ) = x 2 − 18 x +5 3 x 3 − 7 x 2 +5 x − 1 f) f ( x ) = 2 x 3 +5 x 2 − 9 x − 2 x 2 − x Zusammenfassung Mit den rationalen Funktionen bekommen Sie Klassen von Funktionen, mit denen funktionale Sachverhalte oft besser angepasst werden als mit den bisherigen Klassen. Nach Bearbeitung des vorangegangenen Kapitels sollten Sie in der Lage sein, ■ mit den elementaren Rechenregeln für Potenzen und Wurzeln zu arbeiten, ■ Polynomberechnungen und Polynomdivisionen (zumindest für lineare Teiler) auszuführen, etwa mit dem Horner-Schema, ■ Nullstellen von Polynomen gezielt zu raten, auch durch Abspalten von Linearfaktoren, ■ Polynome an einfache Steckbriefe in Form vorgegebener Punkte anzupassen, ■ gebrochen-rationale Funktionen durch Partialbruchzerlegung zu vereinfachen. Übungen zur Vertiefung von Kapitel 5 ? 18. Skizzieren Sie Schaubilder der angegebenen Funktionen und berechnen Sie alle Achsenschnittpunkte: a) f ( x ) = 5 x 3 − 80 x b) f ( x ) = − 2 x 2 + 6 x 2 − 52 x c) f ( x ) = 2 x 3 + 6 x 2 − 4 d) f ( x ) = 12 x 4 − 32 x 2 e) f ( x ) = x 4 − 3 x 3 + 4 x f) f ( x ) = 15 + 7 x − 62 x 2 − 28 x 3 + 8 x 4 19. Bestimmen Sie die Gleichung einer ungeraden ganzrationalen Funktion dritten Grades (bzw. einer geraden ganzrationalen Funktion vierten Grades), welche durch die Punkte P und Q (bzw. P und Q und R ) verläuft: a) P (2 | 0), Q (1 | − 2), R ( − 3 | 10) b) P (2 | 0), Q (1 | t ), R ( − 3 | t ) 20. Gegeben sei f ( x ) = x 3 + x 2 − 2 tx . a) Welches sind die Achsenschnittpunkte von f (in Abhängigkeit von t )? b) Berechnen Sie alle Schnittpunkte von f mit der Geraden g ( x ) = − tx + t . 21. Es seien x, y > 1. Welche der nachstehenden Ausdrücke ist am größten, welcher am kleinsten? a) x y +1 , b) x y − 1 , c) 2 x 2 y − 1 , d) 2 x 2 y +1 , e) 3 x 3 y − 1 48818_Terveer.indd 100 48818_Terveer.indd 100 18.07.2023 11: 47: 44 18.07.2023 11: 47: 44 <?page no="101"?> 6 Spezielle Funktionen Übersicht Mit den rationalen Funktionen hat man zwar bereits ein vielseitiges Repertoire an ökonomisch interessanten Funktionstypen. Aber gerade in der Modellierung und Analyse von zeitlichen Veränderungen ökonomischer Größen (Wachstumsvorgänge, Zeitreihen,. . . ) reichen diese Funktionen in aller Regel nicht aus. Außerdem waren - mit Ausnahme der gebrochen-rationalen Funktionen - alle bisherigen Typen sehr „ glatt“, was mit der realen Situationen oft nicht zu vereinbaren ist. Viele der in diesem Kapitel behandelten Funktionstypen bzw. die entsprechenden Operationen wie Exponentiation oder Logarithmieren sind mit elementaren Rechenschritten nicht mehr durchführbar, die entsprechenden Rechnungen sind nur numerisch möglich. Diese numerischen Möglichkeiten können erst in Kapitel 7 erklärt werden. In diesem Kapitel geht es deshalb nur um charakteristische Eigenschaften und Rechenregeln. Die Anwendungen der behandelten Funktionsklassen sind vielfältig: Mit der Exponentialfunktion werden viele Wachstums- und Zerfallsvorgänge dargestellt; Logarithmen werden benötigt, um besonders stark anwachsende ökonomische Größen sichtbar zu machen und multiplikative in additive Vorgänge zu überführen. Potenzfunktionen werden beispielsweise in der Produktionstheorie verwendet. Sinus, Cosinus und Tangens sind trigonometrische Funktionen, mit denen periodische Phänomene modelliert werden können. Schließlich betrachten wir noch stückweise definierte Funktionen. 6.1 Exponentialfunktionen Die Exponentialfunktion findet Anwendung bei vielen Wachstumsprozessen der Ökonomie, die sich nicht mit rationalen Funktionen beschreiben lassen: Beispiel 6.1 Angenommen, zu Ihrem Schulabschluss mit 18 Jahren erhalten Sie Geldgeschenke im Gesamtwert von 2000 e , welche Sie Ende Juni sofort auf ein neues Sparkonto übertrugen; das Kapital auf diesem Konto wird mit jährlich 4% verzinst. Nehmen wir an, Sie belassen das Kapital inklusive der Zinsen für einige Jahre auf dem Konto. Eine typische Frage ist dann die nach der Verdoppelungszeit, d.h. der Bestimmung eines Zeitpunktes, zu dem sich das Kapital auf den Konto verdoppelt haben wird. Zinsen werden zum Jahresende dem Konto gutgeschrieben und in den Folgejahren mitverzinst. Am Ende des ersten Jahres findet zunächst eine halbjährliche Verzinsung zu zum halben Zinssatz 2% statt, d.h. mit den anfallenden Zinsen in Höhe von 2 100 · 2000 = 40 e wächst das das Kapital am Ende des ersten Jahres auf 2040 e . Danach erhöht sich das Kapital zum Ende eines Jahres stets um das 0 , 04-fache des Wertes am Ende des Vorjahres, d.h. es wächst auf das 1 , 04-fache dieses Wertes. 48818_Terveer.indd 101 48818_Terveer.indd 101 18.07.2023 11: 47: 45 18.07.2023 11: 47: 45 <?page no="102"?> 102 6 Spezielle Funktionen Am Ende des zweiten Jahres ist das Kapital durch die Zinsen dann auf 2040 + 2040 · 0 , 04 = 2040 · 1 , 04 = 2121 , 60 e angewachsen. Am Ende des dritten Jahres beträgt es gerundet 2121 , 60 · 1 , 04 = 2040 · 1 , 04 2 ≈ 2206 , 46 e . Nach 10 Jahren wird man über 2040 · 1 , 04 9 ≈ 2903 , 56 e verfügen. Allgemein wird das Kapital nach x Jahren einen Umfang von 2040 · 1 , 04 x e haben. Für die Verdoppelungszeit stellen Sie eine Tabelle mit Werten für verschiedene x auf: x 2040 · 1 , 04 x − 1 2 2121 , 6 3 2206 , 46 4 2294 , 72 5 2386 , 51 x 2040 · 1 , 04 x − 1 6 2481 , 97 7 2581 , 25 8 2684 , 5 9 2791 , 88 x 2040 · 1 , 04 x − 1 10 2903 , 56 11 3019 , 7 12 3140 , 49 13 3266 , 11 x 2040 · 1 , 04 x − 1 14 3396 , 75 15 3532 , 62 16 3673 , 92 17 3820 , 88 x 2040 · 1 , 04 x − 1 18 3973 , 72 19 4132 , 67 20 4297 , 97 21 4469 , 89 Die Tabelle besagt, dass am Ende des neunzehnten Jahres erstmals mehr als der doppelte Wert des Startkapitals vorliegen wird. Kann man innerhalb des 19. Jahres einen Zeitpunkt festlegen, zu dem das Kapital sich exakt verdoppelt haben wird? Diese letzte Frage zielt darauf, für a > 0 der ganzzahligen Potenz a n eine Bedeutung zu geben, wenn n ∈ N 0 durch ein beliebiges x ∈ R ersetzt wird, oder anders ausgedrückt den Funktionsterm einer Funktion f : R → R mit dem Steckbrief f ( n ) = a n für alle n ∈ N 0 anzugeben. Dazu reicht es im Wesentlichen anzunehmen, dass sich die Eigenschaft a n + m = a n a m von Monomen auf f überträgt: Definition 6.1 ! Die allgemeine Exponentialfunktion zur Basis a > 0 ist eine Funktion f : R → R mit folgenden Eigenschaften: ■ Es ist a = f (1). ■ Die Funktionalgleichung: f ( x + y ) = f ( x ) f ( y ) gilt für alle x, y ∈ R. Aus der Festlegung der Exponentialfunktion folgt unmittelbar: Satz 6.1 [1] Die Exponentialfunktion hat keine Nullstellen. [2] Für alle m ∈ N und x 1 , . . . , x m ∈ R gilt f ( x 1 + · · · + x m ) = f ( x 1 ) · . . . · f ( x m ). [3] f ( m · x ) = f ( x ) m für alle x ∈ R und m ∈ N. [4] f ( x/ m ) = f ( x ) 1 / m für alle x ∈ R und m ∈ N Zu [1]: Anderenfalls gäbe es eine Zahl x ∈ R mit f ( x ) = 0. Dies ergäbe mit der Funktionalgleichung den Widerspruch 0 < a = f (1) = f (1 − x + x ) = f (1 − x ) · f ( x ) = f (1 − x ) · 0 = 0. Zu [2]: Das folgt durch wiederholte Anwendung der Funktionalgleichung, z.B f ( x 1 + x 2 + x 3 ) = f ( x 1 ) f ( x 2 + x 3 ) = f ( x 1 ) f ( x 2 ) f ( x 3 ). Eine präzise Begründung könnte mit vollständiger Induktion vgl. S. 129 erfolgen. [3] ist ein Spezialfall von [2] mit x 1 = · · · = x m = x Zu [4]: f ( x ) = f ( m · x/ m ) = f ( x/ m ) m , also f ( x/ m ) = ( f ( x )) 1 / m Die Exponentialfunktion ist eine der grundlegenden nicht-elementaren Funktionen, d.h. sie ist anders als beispielsweise Polynomfunktionen nicht mit endlich vielen Additions- und Multiplikationsschritten aus der Variablen x darstellbar. Dass es tatsächlich eine Funktion gibt, welche die Funktionalgleichung erfüllt, ist von vorneherein nicht klar, so dass die folgenden Abschnitte unter diesem Vorbehalt zu lesen sind. Erst durch die Verbindung zwischen Exponentialfunktion und Exponentialreihe vgl. Beispiel 8.39, S. 190 wird diese „Unsicherheit“ abschließend beseitigt. 48818_Terveer.indd 102 48818_Terveer.indd 102 18.07.2023 11: 47: 45 18.07.2023 11: 47: 45 <?page no="103"?> 6.1 Exponentialfunktionen 103 6.1.1 Die Schreibweise f ( x ) = a x für die Exponentialfunktion Für rationale Argumente x = m n ist die Schreibweise f ( x ) = a x gerechtfertigt, wie im Folgenden erläutert werden soll. Wir beginnen mit x = m ∈ N 0 und x = 1 n mit n ∈ N. Satz 6.2 Die Exponentialfunktion f zur Basis a > 0 hat folgendes Werteverhalten für x ∈ Q : [1] f (0) = a 0 = 1. [2] f ( n ) = a n für n ∈ N. [3] f ( − n ) = a − n = 1 / a n für alle n ∈ N. [4] f (1 / n ) = a 1 / n = n √ a für alle n ∈ N. Zu [1]: Wegen der Funktionalgleichung gilt: a = f (1) = f (1 + 0) = f (1) · f (0) = a · f (0), also a = a · f (0). Dividiert man auf beiden Seiten durch a > 0, dann folgt f (0) = 1. Zu [2]: Es gilt f (1) = a = a 1 , f (2) = f (1 + 1) = f (1) f (1) = a · a = a 2 und f (3) = f (2 + 1) = f (2) f (1) = a 2 · a = a 3 usw. Formal lässt sich die Formel mittels vollständiger Induktion zeigen. Zu [3]: Es gilt 1 = f (0) = f ( n + ( − n )) = f ( n ) · f ( − n ), also f ( − n ) = 1 f ( n ) = 1 a n = a − n . Zu [4]: Es gilt: a = f (1) = f ( 1 n + · · · + 1 n ) = ( f ( 1 n )) n . Dabei wird die Funktionalgleichung Also ist f ( 1 n ) Lösung der Gleichung x n = a und damit gilt f ( 1 n ) = a 1 / n = n √ a . Für x = m n mit m ∈ Z und n ∈ N gibt es unter Verwendung von Satz 6.1[3],[4] zwei Möglichkeiten f ( x ) zu berechnen: ■ f ( m n ) = f ( m · 1 n ) = f ( 1 n ) m = ( a 1 / n ) m , ■ f ( m n ) = f ( m/ n ) = f ( m ) 1 / n = ( a m ) 1 / n . Es ist also egal, ob zuerst potenziert oder die Wurzel gezogen wird. Dies wird durch die Schreibweise f ( m/ n ) = a m/ n ausgedrückt, welche im folgenden bei rationalem Argument x von f ( x ) zum Einsatz kommt; für beliebige x ∈ R schreibt man dann ebenfalls a x anstelle von f ( x ) und bezeichnet a x als Exponential bzw. als allgemeine Potenz mit Basis a und Exponent x . Der Vorgang des Potenzierens ist aber für irrationale Exponenten ein Grenzwertvorgang; für die Euler’sche Exponentialfunktion vgl. Satz 8.24, S. 190 . 6.1.2 Das Monotonieverhalten der Exponentialfunktion Die Basis a einer Exponentialfunktion legt fest, welches Monotonieverhalten die Funktion hat. Nimmt man als Basis a = 1, so ergibt sich für beliebiges x ∈ R der Exponentialterm als 1 x = 1, die Exponentialfunktion zur Basis a = 1 ist also konstant. Für alle anderen Werte von a liegt folgendes Monotonieverhalten vor vgl. Beispiel 8.43, S. 194 : Satz 6.3 Die Exponentialfunktion f ( x ) = a x ist für a > 1 streng monoton wachsend und für 0 < a < 1 streng monoton fallend. Der Term a x kann mit Basis a > 1 Wachstumsvorgänge, für 0 < a < 1 hingegen Zerfallsvorgänge in der Zeit darstellen. In Abbildung 6.1 sind die Graphen verschiedener Exponentialfunktionen dargestellt. Je größer a bzw. 1 a ist, desto steiler verläuft der Graph von f . Weil a 0 = 1, verlaufen alle Exponentialfunktionen durch (0 | 1). Wir fassen die wichtigsten Eigenschaften der Exponentialfunktion zusammen: 48818_Terveer.indd 103 48818_Terveer.indd 103 18.07.2023 11: 47: 46 18.07.2023 11: 47: 46 <?page no="104"?> 104 6 Spezielle Funktionen Abbildung 6.1: Links: Funktionsgraphen von Exponentialfunktionen x → a x für verschiedene Werte a > 1 (schwarz) und 0 < a < 1 (grau); rechts: Graphen der Exponentialfunktionen f 2 ( x ) = 2 x (gestrichelt), f ( x ) = e x (durchgezogen) und f 4 ( x ) = 4 x (gepunktet) sowie von g ( x ) = 1 + x (grau) ■ a x ist in x streng monoton wachsend für a > 1. ■ a x ist in x streng monoton fallend für a < 1. ■ Für alle a > 0 gilt a 0 = 1 ■ a x + y = a x a y für x, y ∈ R. ■ ( a x ) y = a xy für x, y ∈ R. Die letzte Regel ist für rationale Werte x = m 1 / n 1 und y = m 2 / n 2 (d.h. mit natürlichen Zahlen m 1 , n 1 , m 2 , n 2 ) über den Zusammenhang zur n -ten Wurzel nachzurechnen: ( a x ) y = ( a m 1 n 1 ) m 2 n 2 = n 2 √ ( a m 1 n 1 ) m 2 = n 2 √ a m 2 m 1 n 1 = a m 2 m 1 n 1 n 2 = a m 1 n 1 · m 2 n 2 = a xy 6.1.3 Die Eulersche Exponentialfunktion Durch die Basis a wird die Exponentialfunktion bzw. ihr Verhalten festgelegt. Streng genommen gibt es zu jedem a > 0 eine eigene Exponentialfunktion, d.h. wir haben es mit einer Schar von Funktionen f a : R → R , f a ( x ) = a x zu tun. Es gibt in allen wissenschaftlichen Bereichen die Neigung, mit einer speziellen Exponentialfunktion zu arbeiten. Üblich und anerkannt ist die Verwendung der so genannten e -Funktion exp( x ), genauer gesagt, der Exponentialfunktion zur Basis e . Man kann diese Funktion wie folgt motivieren - ein exakter Nachweis ist hier allerdings nicht möglich: Beim Vergleich der allgemeinen Exponentialfunktion a x (zu positiver Basis a > 0) mit der linearen Funktion g ( x ) = 1+ x fällt auf, dass beide den gemeinsamen Punkt (0 | 1) haben. Es gibt jedoch offenbar genau eine Basis a > 1, für die (0 | 1) der einzige Schnittpunkt der beiden Funktionsgraphen ist, vgl. Abbildung 6.1 rechts. Diese Basis wird mit dem Symbol e bezeichnet. Die Exponentialfunktion zur Basis e liegt vollständig „oberhalb“ des Graphen von g , d.h. es gilt e x ≥ 1 + x für alle x ∈ R. Aus Abbildung 6.1, rechts, geht hervor, dass e ∈ [2; 4]. e ist eine irrationale Zahl; man nennt sie Eulersche Zahl. Für den genauen Wert e = 2 , 7182818 . . . gibt es verschiedene Näherungsmethoden vgl. S. 137 vgl. S. 148 . Wir halten fest: 48818_Terveer.indd 104 48818_Terveer.indd 104 18.07.2023 11: 47: 47 18.07.2023 11: 47: 47 <?page no="105"?> 6.2 Logarithmusfunktionen 105 Satz 6.4 Die Eulersche e -Funktion erfüllt die Ungleichung e x ≥ 1 + x für alle x ∈ R. Übungen zu Abschnitt 6.1 ? 1. Vergleichen Sie das Monotonieverhalten von f 1 ( x ) = (0 , 5) x , f 2 ( x ) = 2 x und f 3 ( x ) = 3 x mit dem der e -Funktion. 2. Stellen Sie die Funktionen graphisch dar. Welche Graphen liegen symmetrisch zueinander (rechnerische Begründung)? a) f 1 ( x ) = 3 x b) f 2 ( x ) = ( 13 ) x c) f 3 ( x ) = − 3 x d) f 4 ( x ) = − ( 13 ) x 3. Gegeben sei die Funktion f ( x ) = 2 x . a) Zeigen Sie f ( x + 1) = 2 f ( x ) ∀ x ∈ R. b) Leiten Sie entsprechende Formeln für g ( x ) = 5 x und h ( x ) = 0 , 3 x her. c) Verallgemeinern Sie die berechneten Formeln für die allgemeine Exponentialfunktion f a ( x ) = a x mit a > 0. 4. Bestimmen Sie eine Funktion f ( x ) = c · a x (d.h. passende a, c > 0) derart, dass jeweils folgende Punkte P, Q auf dem Graphen von f liegen. a) P (1 | 6) und Q (0 | 2) b) P (0 , 5 | 1) und Q (2 | 27) c) P (2 | t ) und Q (1 | 2) mit t > 0 d) P ( s | t ) und Q (0 | 2) mit s, t > 0 5. Ein Kapital von 10.000 e soll zur Finanzierung eines Neuwagens so angelegt werden, dass es nach 5 Jahren auf 15.000 e angewachsen ist. Wie hoch muss der Jahreszinssatz der Geldanlage sein, damit man dieses Ziel erreicht? 6. Bestimmen Sie a > 0 jeweils derart, dass für alle x ∈ R gilt: a) a x ≥ 1 + 2 x , b) a x ≥ 1 − 2 x 6.2 Logarithmusfunktionen Häufig müssen Exponentialgleichungen nach ihren Exponenten aufgelöst werden, d.h. die Lösung einer Gleichung der Form a x = y durch Auflösen nach x gefunden werden. Aus Sicht der Mathematik wird also nach der Umkehrung der Exponentiation, d.h. nach einer Umkehrfunktion der Exponentialfunktion gesucht. Das ist für a > 0 und a ̸ = 1 stets möglich, weil die allgemeine Exponentialfunkton x → a x zur Basis a > 0 dann streng monoton ist. Die Umkehrung wird als Logarithmieren (von y ) bezeichnet, die Umkehrfunktion selber heißt Logarithmusfunktion: Definition 6.2 ! Für a > 0 , y > 0 heißt x Logarithmus von y zur Basis a , in Zeichen x = log a ( y ), genau dann, wenn y die x -te Potenz von a ist, d.h. wenn y = a x ist. Beispiel 6.2 Es ist 2 3 = 8, also ist 3 der Logarithmus von 8 zur Basis 2, in Formeln log 2 (8) = 3. Der Graph der Logarithmusfunktion ergibt sich aus dem Graphen der allgemeinen Exponentialfunktion durch Spiegelung an der Diagonale y = x vgl. Abbildung 6.2 . Für spezielle Basen gibt es abkürzende Schreibweisen. 48818_Terveer.indd 105 48818_Terveer.indd 105 18.07.2023 11: 47: 48 18.07.2023 11: 47: 48 <?page no="106"?> 106 6 Spezielle Funktionen Abbildung 6.2: Graph der Logarithmusfunktion (grau) als Umkehrfunktion der allgemeinen Exponentialfunktion (schwarz) ■ Der dekadische Logarithmus, d.h. der Logarithmus zur Basis 10 wird mit lg, der dyadische Logarithmus, d.h. der Logarithmus zur Basis 2 wird mit ld bezeichnet. ■ Im wissenschaftlichen Bereich wird meist der natürliche Logarithmus ln( x ) = log e ( x ) verwendet, dessen Basis die Eulersche Zahl e ist. Die Logarithmusfunktionen zu verschiedenen Basen unterscheiden sich jeweils nur um eine spezifische multiplikative Konstante vgl. Satz 6.2 [4] vgl. S. 107 ; zeichnet man also zwei Logarithmusfunktionen in zwei verschiedene Schaubilder, so sehen die Graphen bei geeigneter Ordinatenskala gleich aus. Manchmal wird das Logarithmus-Symbol log( x ) ganz ohne Angabe der Basis verwendet, worunter man dann meist den natürlichen Logarithmus versteht, oder es werden dann nur Eigenschaften der Logarithmusfunktionen verwendet, die unabhängig von der Basis sind. Die Notation wie auch die Nutzung des Logarithmus ist gewöhnungsbedürftig, aber Sie werden ohne seine grundlegende Kenntnis in Ihrem Studium vermutlich nicht auskommen. Betrachten wir eine konkrete Anwendungssituation aus der Statistik: In den Wirtschaftswissenschaften besteht ein großer Bedarf an Methoden zur genauen Vorhersage von ökonomischen Größen aufgrund von Vergangenheitswerten: ■ Mit guten Nachfrageprognosen für ein Produkt kann ein Unternehmen die die produktionstechnischen und logistischen Abläufe ebenso wie die Bereitstellung der für eine Dienstleistung erforderlichen Ressourcen kostengünstig gestalten. ■ Eine Volkswirtschaft kann mit Prognosen von Zahlen zur wirtschaftlichen Entwicklung mit finanzpolitischen Maßnahmen negative Entwicklungen mildern. Beispiel 6.3 In Abbildung 6.3, links, sind die monatlichen internationalen Flugpassagierzahlen (in 1000 Flugpassagieren) in den Jahren 1949 bis 1960 dargestellt erhältlich sind diese Zahlen beispielsweise als Datensatz airpass im frei verfügbaren Statistik-Paket R , vgl. http: / / www.r-project.org. Auf der Abszisse sind die fortlaufenden Monate x seit Januar 1949, auf der Ordinate die Passagierzahlen y in 1000 abgetragen. Bei der Betrachtung des Schaubildes fällt innerhalb eines Jahres ein saisonaler Effekt (Schwankung) auf, der im Lauf der Jahre immer stärker ausfällt. Gleichzeitig ist ein - saisonbereinigter - Anstieg der Flugpassagierzahlen im Laufe der Jahre zu 48818_Terveer.indd 106 48818_Terveer.indd 106 18.07.2023 11: 47: 49 18.07.2023 11: 47: 49 <?page no="107"?> 6.2 Logarithmusfunktionen 107 12 24 36 48 60 72 84 96 108 120 132 144 100 200 300 400 500 600 Monate 1000 Passagiere 12 24 36 48 60 72 84 96 108 120 132 144 0.4 0.8 1.2 1.6 2 2.4 2.8 Monate lg(1000 Passagiere) Abbildung 6.3: Monatliche Passagiere auf internationalen Flügen zwischen Januar 1949 und Dezember 1960, links Ausgangsdaten, rechts logarithmierte Werte beobachten. Wollte man nun sowohl das saisonale Verhalten als auch den Jahreszuwachs für kommende Jahre aus den gegebenen Daten verlässlich prognostizieren, so reichte ein linearer Trend nicht aus. Beispielsweise hat die nach der so genannten Kleinste-Quadrate-Methode bestimmte beste Ausgleichsgerade (Trendgerade) vgl. Satz 12.13, S. 317 für den Zusammenhang zwischen Monat x und Flugpassagierzahl y die Form y = 2 , 65718 x + 87 , 65278 . Zeichnet man diese Trendgerade in das Schaubild der Flugpassagiere, so erkennt man in Abbildung 6.3 links, dass die Trendgerade zur Prognose ungeeignet sein dürfte, sie unterschätzt in der Mehrzahl der Fälle die tatsächlichen Passagierzahlen. Es muss also sowohl die zunehmende Schwankung als auch der leicht gekrümmte Verlauf des Jahrestrends bei der Vorhersage berücksichtigt werden. Transformiert man allerdings die Zahlen mit dem (dekadischen) Logarithmus d.h. geht von einer Zahl y zu z = lg( y ) über, so ergeben sich die in Abbildung 6.3, rechts, eingetragenen Werte. Diese lassen sich recht gut durch eine Trendgerade z = 0 , 0044 x + 2 , 091 beschreiben, sie liegt ziemlich genau in der Mitte des saisonalen „Ausschlags“ der logarithmierten Daten. Mit Hilfe dieser Trendgerade sind die originalen Flugpassagierzahlen zu prognostizieren, indem man die Funktion y = e z = e 0 , 0044 x +2 , 091 verwendet. Wir wollen abschließend die wichtigsten Rechenregeln für Logarithmen auflisten. Jede dieser Rechenregeln gehört zu einer entsprechenden Rechenregel für Exponentiale und folgt auch aus dieser. Deshalb werden diese Regeln denen des Logarithmus gegenübergestellt. Rechenregeln für Logarithmus- und Exponentialfunktion Für alle x, y, a > 0, r ∈ R gilt: [1] log a (1) = 0 und log a ( a ) = 1 [2] log a ( x · y ) = log a ( x ) + log a ( y ) [3] log a ( x r ) = r log a ( x ) [4] log b ( x ) = log a ( x ) log a ( b ) [1] a 0 = 1 und a 1 = a [2] a x + y = a x · a y [3] ( a x ) r = a r · x , [4] a x · log a ( b ) = b x Regel [2] wird Funktionalgleichung genannt. Aus Regel [4] ergibt sich insbesondere, dass sich jede Logarithmusfunktion und jede Exponentialfunktion mit natürlichem Logarithmus und e -Funktion darstellen lässt: 48818_Terveer.indd 107 48818_Terveer.indd 107 18.07.2023 11: 47: 49 18.07.2023 11: 47: 49 <?page no="108"?> 108 6 Spezielle Funktionen p 2 3 5 7 11 13 17 19 23 29 ln( p ) 0,6931 1,0986 1,6094 1,9459 2,3979 2,5649 2,8332 2,9444 3,1355 3,3673 Tabelle 6.1: Primzahl-Logarithmen, auf vier Nachkommastellen gerundet. ■ Für a > 0 und alle x ∈ R gilt a x = e x ln( a ) . ■ Für alle a, x > 0 gilt log a ( x ) = ln( x ) ln( a ) Beispielsweise lässt sich so folgern, dass zur Berechnung der Logarithmen log a ( x ) von rationalen Zahlen x zu rationalen Basen a nur die natürlichen Logarithmen von Primzahlen vgl. Tabelle 6.1 erforderlich sind. Beispiel 6.4 Mit Tabelle 6.1 ergibt sich ln(120) = ln(2 3 · 3 · 5) als 3 · ln(2)+ln(3)+ln(4)+ln(5) ≈ 3 · 0 , 6931+1 , 0986+1 , 6094 = 4 , 7873. Der tatsächliche Wert von ln(120) ist 4 , 78749 . . . , die Näherungsrechnung liefert das Ergebnis also auf drei Nachkommastellen genau. Übungen zu Abschnitt 6.2 ? 7. Berechnen Sie die folgenden Logarithmen ohne Taschenrechner: a) log 3 ( 1 81 ), b) log 2 (64), c) log 0 , 1 (10), d) log 14 (1), e) log 9 (243), f) log t 3 ( t a ) mit t > 0 8. Bestimmen Sie mit Tabelle 6.1 Näherungswerte; vergleichen Sie anschließend mit Taschenrechnerwerten: a) ln(35) b) ln(180) c) ln(5 , 5) d) ln(0 , 03) e) ln(10 , 24) f) log 3 / 5 (2 / 3) 9. Es seien a, y > 0 und r ̸ = 0. Welche der folgenden Ausdrücke stimmen überein? a) log a r ( y ), b) log a ( y r ), c) log a ( y ) / r , d) log a ( y 1 / r ), e) log a ( y ) r , f) log a 1 / r ( y ) 10. Für alle a > 0 und x, y ∈ R gilt a x = a y ⇔ x = y . Lösen Sie die folgenden Gleichungen durch Anwendung dieser Aussage und geben Sie die Lösung auch in Logarithmus-Schreibweise an: a) 3 x = 27, b) 0 , 1 x = 0 , 0001, c) 196 x = 14, d) 4 x +7 = 256, e) 5 · 1 , 8 x = 29 , 16 11. Lösen Sie die folgenden Gleichungen und Ungleichungen in der Variablen x ∈ R: a) 4 x = 2 10 b) 4 x 3 x ≥ 16 9 12.Zeigen Sie: Die Summe der Lösungen von 5 x − ( √ 5) x +2 + 6 = 0 ist log 5 (36). 13. Bestimmen Sie eine Logarithmusfunktion f ( x ) = log a ( x ) , d.h. eine Basis a > 0, so dass der Punkt P ( x | y ) auf dem Graphen von f liegt: a) P (100 | 2), b) P (0 , 125 | 3), c) P ( t | t 2 ) mit t > 0 14. Bestimmen Sie für die folgenden Exponentialfunktionen jeweils eine Konstante c ∈ R mit f ( x ) ≥ 1 + cx . a) f ( x ) = 2 x , b) f ( x ) = ( 12 ) x , c) f ( x ) = a x mit a > 0 15. Nach wie vielen Jahren verdoppelt sich ein Kapital K beim Jahreszins 2 , 5%? 6.3 Potenzfunktionen Sie haben bereits die Monom-Funktion x → x n sowie (für x > 0) ihre Umkehrfunktion x → n √ x = x 1 n kennengelernt. Betrachtet man sowohl Monomfunktionen wie schon Wurzelfunktionen nur auf dem Definitionsbereich ]0; ∞ [, so lassen sich beide als Spezialfälle der allgemeinen Potenzfunktion zum Exponent a ∈ R, a ̸ = 0, auffassen, d.h. von f a : [0; ∞ [ → [0; ∞ [ , f a ( x ) = x a . Zwei typische Situationen sollen Anwendungsbereiche in der Ökonomie verdeutlichen. 48818_Terveer.indd 108 48818_Terveer.indd 108 18.07.2023 11: 47: 50 18.07.2023 11: 47: 50 <?page no="109"?> 6.3 Potenzfunktionen 109 Abbildung 6.4: Graphen der allgemeinen Potenzfunktion x → x a . Links Rechts schwarz durchgezogen a = 1 a = − 1 schwarz gestrichelt a = 32 a = − 32 schwarz gepunktet a = 3 a = − 3 grau gestrichelt a = 23 a = − 23 grau gepunktet a = 13 a = − 13 Graphen eines Schaubildes mit identischem Strichmuster stellen paarweise die Umkehrfunktionen zueinander dar. Beispiel 6.5 Eine Cobb-Douglas-Funktion in einer Variablen ist eine Funktion f : [0; ∞ [ → R, f ( x ) = c · x a , mit geeigneten c > 0 , a ∈ R; sie erklärt die produzierte Menge f ( x ) eines Gutes in Abhängigkeit von der eingesetzten Menge x eines Rohstoffes (allgemeiner: eines Produktionsfaktors). Hier ist zunächst die Annahme a = 1 obligatorisch, d.h. bei einer Vervielfachung der Menge des eingesetzten Rohstoffes vervielfacht sich auch die Produktionsmenge entsprechend. Zwischen Faktoreinsatz x und Produktionsmenge liegt also ein proportionaler (linearer) Zusammenhang der Form vor. Dies berücksichtigt jedoch nicht den in vielen Produktionen auftretenden „Schwund“ z.B. durch Verringerung der Qualität infolge von Überbeanspruchung des Fertigungsweges. Daher wird man in vielen Fällen eine „unterproportionale“ Produktion ansetzen wollen. Dies kann man z.B. durch eine Cobb-Douglas-Funktion x → cx a mit einem Exponenten 0 < a < 1 erreichen. Eine überproportionale Produktion x → cx a mit a > 1 ist eher selten, sie kann z.B. dann vorliegen, wenn der eingesetzte Produktionsfaktor - innerhalb fester Grenzen - katalytische Eigenschaften hat, d.h. wenn sein zunehmender Einsatz die Verarbeitung der übrigen benötigten Rohstoffe begünstigt. Beispiel 6.6 Bei der Analyse ökonomischer Daten wie z.B. der Fluggastzahlen aus Beispiel 6.3 verwendet man neben der bereits angesprochenen Logarithmus-Transformation auch die Box-Cox-Transformationsfunktion x → ( x + c ) a − 1 a mit a > 0 und c ≥ 0. Mit c wird vermieden, dass ggf. negative Datenwerte beim Einsetzen in x Rechenprobleme verursachen. Nach der Regel von L’Hospital vgl. Satz 8.27, S. 195 stimmt diese für a ≈ 0 näherungsweise mit der Logarithmustransformation x → log( x + c ) überein. Für a > 0 haben die Graphen der Potenzfunktionen einen streng monoton wachsenden Verlauf vgl. Abbildung 6.4 links . Für a < 0 ist der Verlauf streng monoton fallend vgl. Abbildung 6.4 rechts . Die Umkehrfunktion von f a ist f 1 a , d.h. es gilt f − 1 a ( x ) = x 1 a . Diese schreibt man auch mit dem Wurzel-Symbol, d.h. für x > 0, a ̸ = 0 ist die a -te Wurzel erklärt als a √ x : = x 1 a . 48818_Terveer.indd 109 48818_Terveer.indd 109 18.07.2023 11: 47: 51 18.07.2023 11: 47: 51 <?page no="110"?> 110 6 Spezielle Funktionen Wir fassen noch einmal die wichtigsten Rechenregeln für (allgemeine) Potenzen und Wurzeln zusammen. Sie erweitern die in Satz 5.1 vgl. S. 76 angegebenen Potenzregeln: Satz 6.5 (Regeln für allgemeine Potenzen und Wurzeln) Für alle x, y > 0 und a, b ∈ R gilt: [1] x 0 = 1. [2] ( xy ) a = x a · y a [3] a √ xy = a √ x · a √ y für a ̸ = 0. [4] x a + b = x a · x b . [5] x − a = 1 x a [6] − a √ x = 1 a √ x für a ̸ = 0. [7] ( x a ) b = ( x b ) a = ( x ) ab [8] a √ b √ x = b √ a √ x = ab √ x für a, b ̸ = 0. [9] b √ x a = 1 / a √ x 1 b = x a b für a, b ̸ = 0. Übungen zu Abschnitt 6.3 ? 16. Vereinfachen Sie so weit wie möglich, dabei seien x, y, z > 0 a) x 3 , 5 ( x 2 ) − 1 , 5 b) ( xy ) 3 / 7 ( xz ) 2 / 7 ( yz ) − 1 / 7 c) ( x 1 / 2 + x 3 / 2 )( x 1 / 2 − x 3 / 2 ) 17. Werden bei der Herstellung eines Produktes 2550 Einheiten eines Rohstoffes eingesetzt, so erhält man 850 Einheiten des Produktes. Bei Erhöhung des Rohstoffeinsatzes um 600 Einheiten steigt der Ertrag um 150 Einheiten. a) Mit welcher Cobb-Douglas-Funktion ist der Sachverhalt modellierbar? b) Um wie viele Einheiten würde der Ertrag bei der genannten Erhöhung des Rohstoffeinsatzes steigen, wenn die Cobb-Douglas-Produktionsfunktion linear wäre? 6.4 Trigonometrische Funktionen Mit den trigonometrischen Funktionen werden Zusammenhänge zwischen Winkeln und Seiten im rechtwinkligen Dreieck beschrieben. In der Ökonomie werden trigonometrische Funktionen als technische Hilfsfunktionen unter anderem in der Zeitreihenanalyse, einer statistischen Technik zur Analyse zeitlich abhängiger Daten verwendet, sie finden aber auch Gebrauch in der Theorie der Differentialgleichungen, die man in der Ökonomie benötigt, wenn Trendänderungen einer ökonomischen Variablen zur Variable oder einer anderen Variablen in Beziehung gesetzt werden sollen. 6.4.1 Geometrische Festlegung der trigonometrischen Funktionen Die trigonometrischen Funktionen haben als Argumente Winkelmaße, die auf unterschiedliche Weisen erhoben werden, vgl. Abbildung 6.5 ■ Gradmaß: Hier wird die Größe eines Winkels von 0 ◦ bis 360 ◦ gemessen, was einem Vollkreis entspricht. Diese Einteilung hat wohl historisch-kalendarischen Ursprung, ist aus mathematischer Sicht aber als eher willkürlich anzusehen. ■ Bogenmaß: Die in den Wissenschaften heute übergreifend anerkannte und verwendete Möglichkeit der Normierung besteht darin, die Länge des Kreisbogens über 48818_Terveer.indd 110 48818_Terveer.indd 110 18.07.2023 11: 47: 52 18.07.2023 11: 47: 52 <?page no="111"?> 6.4 Trigonometrische Funktionen 111 Abbildung 6.5: Gradmaß, Bogenmaß und trigonometrische Funktionen Gradmaß 30 ◦ 45 ◦ 60 ◦ 90 ◦ 180 ◦ 270 ◦ 360 ◦ Bogenmaß 16 π 14 π 13 π 12 π π 32 π 2 π Tabelle 6.2: Gegenüberstellung von Winkeln im Gradmaß und im Bogenmaß dem Winkel α als Maß für den Winkel zu verwenden, da er proportional zu der Größe des Winkels ist. Verwendet man einen Kreis mit Radius 1 (Einheitskreis), so liegen die Bogenlängen eines Kreissegmentes zwischen 0 und dem Kreisumfang 2 π . Im Bogenmaß liegt der Winkel also im Intervall [0; 2 π ]. Die Zuordnung von Gradmaß zu Bogenmaß ist in Abbildung 6.5 dargestellt, typische Winkel im Gradmaß und deren Bogenmaß sind in Tabelle 6.2. Winkel α > 2 π werden so interpretiert, dass der Winkel über den Vollkreis hinaus entsprechend weiter gedreht wird, d.h. z.B. der Winkel 3 π wird mit dem Winkel 3 π − 2 π = π identifiziert. Winkel können auch mit einem Vorzeichen versehen werden. Positive Werte von α entsprechen der Berechnung eines Winkels zwischen zwei Schenkeln gegen den Uhrzeigersinn (mathematisch positiver Drehsinn), negative Werte entsprechend im Uhrzeigersinn (mathematisch negativer Drehsinn). Die trigonometrischen Funktionen Sinus, Cosinus und Tangens (bzw. Cotangens) ergeben sich aus dem folgenden Sachverhalt: bei zwei ähnlichen Dreiecken (d.h. Dreiecken, deren Innenwinkel übereinstimmen) stehen vergleichbare Seiten der beiden Dreiecke stets im gleichen Verhältnis zueinander. Zwei rechtwinklige Dreiecke sind zueinander ähnlich, wenn sie (zusätzlich zu dem rechten Winkel) in einem weiteren Winkel - im Folgenden mit α bezeichnet - übereinstimmen, vgl. Abbildung 6.6. Aufgrund der Ähnlichkeit stimmen alle Verhältnisse entsprechender Seiten der Dreiecke a a ′ = b b ′ = c c ′ überein. Durch Umstellen erhält man die Gleichungen a c = a ′ c ′ , b c = b ′ c ′ , a b = a ′ b ′ . Da a die dem Winkel gegenüber liegende Kathete des rechtwinkligen Dreiecks ist, bezeichnet man sie als Gegenkathete (zu α ). Entsprechend ist b die Ankathete. Definition 6.3 ! Im rechtwinkligen Dreieck sind Sinus, Cosinus und Tangens von α erklärt als: [1] Verhältnis von Gegenkathete zur Hypotenuse: sin( α ) : = a c = Gegenkathete Hypotenuse 48818_Terveer.indd 111 48818_Terveer.indd 111 18.07.2023 11: 47: 52 18.07.2023 11: 47: 52 <?page no="112"?> 112 6 Spezielle Funktionen Abbildung 6.6: Sinus, Kosinus und Tangens bei ähnlichen rechtwinkligen Dreiecken Abbildung 6.7: Genese der Sinusfunktion aus dem Einheitskreis [2] Verhältnis von Ankathete zur Hypotenuse: cos( α ) : = b c = Ankathete Hypotenuse [3] Verhältnis von Gegenkathete zur Ankathete tan( α ) : = a b = Gegenkathete Ankathete Aufgrund der oben angestellen Ähnlichkeitsüberlegungen weiß man, dass diese definierten Werte unabhängig von den konkreten Abmessungen des Dreiecks sind. Sinus und Cosinus sind eng miteinander verwandt, denn man kann das Verhältnis von Ankathete des Winkels α zur Hypotenuse auch als Verhältnis der Gegenkathete des dritten Winkels β = π 2 − α zur Hypotenuse auffassen. Also gilt sin( α ) = cos( π 2 − α ) bzw. cos( α ) = sin( α + π 2 . Man sagt, Cosinus und Sinus entstehen auseinander durch eine Phasenverschiebung um π 2 . Der Kehrwert des Tangens wird als Cotangens (Symbol: cot) bezeichnet, denn er entsteht aus dem Tangens durch genau die gleiche Phasenverschiebung: cot( π 2 − α ) = 1 tan( π 2 − α ) = cos( π 2 − α ) sin( π 2 − α ) = sin( α ) cos( α ) = tan( α ) Bisher haben wir Sinus, Cosinus und Tangens nur über rechtwinklige Dreiecke mit einem Innenwinkel α ∈ [0; π 2 [ erklärt - der Fall α = 0 entspricht dabei einem „entarteten“ Dreieck. Jedoch lassen sich diese Größen auch auf beliebige Winkel α ∈ [0; 2 π [ und darüber hinaus übertragen. Es sei dies im Folgenden für den Sinus beschrieben. 48818_Terveer.indd 112 48818_Terveer.indd 112 18.07.2023 11: 47: 53 18.07.2023 11: 47: 53 <?page no="113"?> 6.4 Trigonometrische Funktionen 113 Dazu betrachten wir im Einheitskreis vier Fälle, vgl. Abbildung 6.7, bei denen der Ursprung den einen Endpunkt und ein Punkt ( x | y ) auf dem Einheitskreis den anderen Endpunkt der Hypotenuse beschreibt. [1] 0 ≤ α < π 2 : Das betrachtete rechtwinklige Dreieck liegt im ersten Quadranten. Es gilt per Definition sin( α ) = y > 0. [2] π 2 ≤ α < π : Das betrachtete rechtwinklige Dreieck liegt im zweiten Quadranten. Es gilt dann: sin( α ) = sin( π − α ) = y > 0. [3] π ≤ α < 3 π 2 : Das betrachtete rechtwinklige Dreieck liegt im dritten Quadranten. Es gilt dann: sin( α ) = − sin( 3 π 2 − α ) = y < 0. [4] 3 π 2 ≤ α < 2 π : Das betrachtete rechtwinklige Dreieck liegt im vierten Quadranten. Es gilt dann: sin( α ) = − sin(2 π − α ) = y < 0. Im Fall [3] und [4] wird die Länge der Gegenkathete mit einem negativen Wert abgelesen. Für Winkel α ≥ 2 π setzen wir die Drehung des Punktes ( x | y ) auf dem Einheitskreis im mathematisch positiven Drehsinn einfach fort und erklären damit den Sinus, je nachdem in welchen der vier Quadranten der Punkt ( x | y ) fällt. Für Winkel α < 0 liegt entsprechend eine Drehung im mathematisch negativen Drehsinn vor. Auf die gleiche Weise kann man die „Fortsetzung“ des Cosinus vornehmen. Tangens und Cotangens ergeben sich dann wieder als Quotienten; da aber Division durch Null vermieden werden muss, ist die Festlegung von tan( α ) für α = (2 k +1) π 2 und von cot( α ) für α = kπ (wobei k eine beliebige ganze Zahl ist) nicht möglich. Unter Berücksichtigung dieser Ausnahmen lassen sich Sinus, Cosinus, Tangens und Cotangens als Funktionen mit Definitionsbereich R auffassen, wobei man sie dann als Funktionen von x schreibt - die Interpretation des Argumentes als Winkel α tritt dabei in den Hintergrund. Definition 6.4 ! x → sin( x ), x → cos( x ), x → tan( x ), x → cot( x ) heißen trigonometrische Funktionen. Mit den obigen Überlegungen ergeben sich einige Eigenschaften dieser Funktionen: [1] Definitionsbereich: ■ Sinusfunktion und Cosinusfunktion haben Definitionsbereich R. ■ Die Tangensfunktion hat Definitionsbereich { x ∈ R : x ̸ = (2 k +1) π 2 , k ∈ Z } . ■ Die Cotangensfunktion hat Definitionsbereich { x ∈ R : x ̸ = kπ, k ∈ Z } . [2] Wertebereich: ■ Sinusfunktion und Cosinusfunktion haben den Wertebereich [ − 1; 1]. ■ Tangens- und Cotangensfunktion haben den Wertebereich R. [3] Periodizität: Alle trigonometrischen Funktionen sind 2 π -periodisch, d.h. es gilt f ( x + 2 π ) = f ( x ) für alle x im Definitionsbereich von f . Alle Werte in den genannten Bereichen werden unendlich oft angenommen. [4] Symmetrieeigenschaften: Cosinus ist gerade, d.h. cos( − x ) = cos( x ), Sinus, Tangens und Cotangens sind ungerade, d.h. z.B. sin( − x ) = − sin( x ). Die Graphen der trigonometrischen Funktionen sind in Abbildung 6.8 dargestellt. Einige typische Funktionswerte finden Sie in Tabelle 6.3. 48818_Terveer.indd 113 48818_Terveer.indd 113 18.07.2023 11: 47: 54 18.07.2023 11: 47: 54 <?page no="114"?> 114 6 Spezielle Funktionen Abbildung 6.8: Graphen der trigonometrischen Funktionen Sinus, Cosinus (grau), links, und Tangens, Cotangens (grau), rechts x 0 π 4 π 3 π 2 2 π 3 3 π 4 π 5 π 4 4 π 3 3 π 2 5 π 3 7 π 4 2 π sin( x ) 0 1 √ 2 √ 3 2 1 √ 3 2 1 √ 2 0 − 1 √ 2 − √ 3 2 − 1 − √ 3 2 − 1 √ 2 0 cos( x ) 1 1 √ 2 12 0 − 12 − 1 √ 2 − 1 − 1 √ 2 − 12 0 1 2 1 √ 2 1 tan( x ) 0 1 √ 3 −√ 3 − 1 0 1 √ 3 −√ 3 − 1 0 Tabelle 6.3: Wichtige Funktionswerte trigonometrischer Funktionen Beispiel 6.7 Exemplarisch soll der Wert sin( π 3 ) berechnet werden. Hierzu betrachten wir die Planskizze in Abbildung 6.9, links. Das Dreieck ∆ABC sei gleichseitig mit Seitenlänge 1. Das Dreieck ∆BCD ist rechtwinklig und mit den Streckenlängen a = BD, b = CD und c = BC gilt nach dem Satz des Pythagoras sin( π 3 ) = b c = b √ 1 2 − (1 / 2) 2 = √ 3 / 4 = √ 3 2 Weitere Funktionswerte von Sinus und Cosinus erhalten Sie aus dieser Tabelle beispielsweise über die Zusammenhänge cos( π 2 − x ) = sin( x ) bzw. sin( x + π 2 ) = cos( x ). Anhand der Graphen der trigonometrischen Funktionen ist erkennbar, dass diese in bestimmten Intervallen streng monoton verlaufen. Über diesen Intervallen können die Funktionen daher umgekehrt werden; die Umkehrfunktionen heißen Arcus-Funktionen. Satz 6.6 ■ Die Funktion f : [ − π 2 ; π 2 ] → [ − 1; 1], f ( x ) = sin( x ) ist streng monoton wachsend. Ihre Umkehrfunktion arcsin : [ − 1; 1] → [0; π ] heißt Arcussinus. ■ Die Funktion f : [0 : π ] → [ − 1; 1], f ( x ) = cos( x ) ist streng monoton fallend. Ihre Umkehrfunktion arccos : [ − 1; 1] → [0; π ] heißt Arcuscosinus. ■ Die Funktion f : ] − π 2 ; π 2 [ → R, f ( x ) = tan( x ) ist streng monoton wachsend. Ihre Umkehrfunktion arctan : R → ] − 1; 1[ heißt Arcustangens. ■ Die Funktion f : ]0; π [ → R, f ( x ) = cot( x ) ist streng monoton fallend. Ihre Umkehrfunktion arccot : R → ]0; π [ heißt Arcuscotangens. Die Arcuscosinusfunktion findet Verwendung bei einer alternativen Darstellung von Punkten ( x | y ) des kartesischen Koordinatensystems. Im Falle ( x | y ) ̸ = (0 | 0) entsprechen diesen kartesischen Koordinaten gemäß Abbildung 6.9, Mitte, nämlich ein eindeutiger Drehwinkel ϕ ∈ [0; 2 π [ beginnend bei der positiven x -Achse und der Abstand r ≥ 0 des Punktes ( x | y ) vom Ursprung. Das Paar ( r | ϕ ) wird als Polarkoordinaten 48818_Terveer.indd 114 48818_Terveer.indd 114 18.07.2023 11: 47: 55 18.07.2023 11: 47: 55 <?page no="115"?> 6.4 Trigonometrische Funktionen 115 Abbildung 6.9: Planskizzen zur Berechnung von sin( π/ 3) (links), Polarkoordinaten (Mitte) und Additionstheorem (rechts) von ( x | y ) bezeichnet. Aus ϕ und r kann über die Definition von Sinus und Cosinus das Koordinatenpaar ( x | y ) rekonstruiert werden, es gilt x = r · cos( ϕ ) und y = r · sin( ϕ ). Umgekehrt lassen sich auch die Polarkoordinaten ( r | ϕ ) aus den kartesischen Koordinaten ( x | y ) ermitteln. Im ersten Qudranten, d.h. für den Fall x, y > 0 beispielsweise gilt gemäß Abbildung 6.9, Mitte, nach dem Satz des Pythagoras r 2 = x 2 + y 2 also r = √ x 2 + y 2 . Nach Definition des Cosinus ist außerdem cos( ϕ ) = x r , also ϕ = arccos( x r ) = arccos( x/ √ x 2 + y 2 ). Dies kann auch auf die anderen Quadranten der Anschauungsebene übertragen werden. Polarkoordinaten ersetzen überall dort die kartesischen Koordinaten, wo die Verwendung von trigonometrischen Funktionen in der Geometrie einen Vorteil liefert. Anwendungen von Polarkoordinaten sind beispielsweise die Eigenschaften komplexer Zahlen (diese lassen sich als Punkte der Anschauungsebene, verbunden mit speziellen Anweisungen zur Addition und Multiplikation, auffassen), Integraltransformationen in mehreren Variablen oder eine Simulationsmethode für die Standardnormalverteilung in der Wahrscheinlichkeitsrechnung. 6.4.2 Rechenregeln für trigonometrische Funktionen Unter den Regeln im Umgang mit trigonometrischen Funktionen f gehören die Additionstheoreme zu den wichtigsten, weil sie eine Möglichkeit bieten, trigonometrische Ausdrücke zu x ± y auf solche zu x und y zurückzuführen: Satz 6.7 (Additionstheoreme) Für alle x, y ∈ R gilt: [1] cos( x + y ) = cos( x ) cos( y ) − sin( x ) sin( y ) [2] sin( x + y ) = sin( x ) cos( y ) + cos( x ) sin( y ) [3] sin 2 ( x ) + cos 2 ( x ) = 1 Dabei folgt [3] aus [1] mit y = − x . Wir wollen [1] mit Winkeln α = x > 0, β = y > 0 und spitzem Winkel α + β < π/ 2 nachweisen (Für [2]) sei auf eine folgende Übungsaufgabe verwiesen). In der Planskizze der Abbildung 6.9, rechts, seien die Winkel α , β am Punkt O in einem Viertelkreis mit Radius 1 gegeben. Dann gilt: ■ Die rechtwinkligen Dreiecke ∆OKP und ∆QRP sind ähnlich, denn ∆OKP und ∆Q’R’P gehen durch eine zentrische Streckung und ∆Q’R’P und ∆QRP durch eine Drehung auseinander hervor. Deshalb ist der Winkel an Q in ∆OKP ebenfalls α . Für die Strecken p, t im Dreieck ∆PQR gilt p = t sin( α ). Außerdem gilt t = sin( β ) im Dreieck ∆OPQ. Es folgt p = sin( α ) sin( β ). ■ Für die Strecke OP gilt OP = cos( β )im Dreieck ∆OPQ und p 1 = cos( α )OP im Dreieck ∆OSP, also p 1 = cos( α ) cos( β ). 48818_Terveer.indd 115 48818_Terveer.indd 115 18.07.2023 11: 47: 56 18.07.2023 11: 47: 56 <?page no="116"?> 116 6 Spezielle Funktionen Abbildung 6.10: Planskizzen zum Cosinussatz, spitzer Fall (links) und stumpfer Fall (rechts) ■ Schließlich gilt cos( α + β ) = y 1 im Dreieck ∆OTQ. Insgesamt folgt sin( α ) sin( β ) = p = p 1 − y 1 = cos( α ) cos( β ) − cos( α + β ), d.h. sin( α ) sin( β ) = cos( α ) cos( β ) − cos( α + β ). Nach Umstellen folgt das Additionstheorem. Eine weitere Formel verallgemeinert den bekannten Satz des Pythagoras für rechtwinklige Dreiecke, indem der rechte Winkel durch einen beliebigen anderen Winkel γ ersetzt wird. Mit den Bezeichnungen aus Abbildung 6.10 gilt: Satz 6.8 (Cosinussatz) Für die Seiten im Dreieck ∆ABC gilt: a 2 + b 2 − 2 ab cos( γ ) = c 2 Die Rechnung wird für den Fall eines spitzen Winkels γ durchgeführt, der stumpfe Fall ist Gegenstand einer Übungsaufgabe weiter unten. Gemäß der Planskizze in Abbildung 6.10, links, gilt nach dem klassischen Satz des Pythagoras c 2 − ( b − p ) 2 = h 2 = a 2 sin 2 ( γ ). Dabei ist p = a cos( γ ). Insgesamt folgt a 2 sin 2 ( γ ) = c 2 − ( b − a cos( γ )) 2 = c 2 − b 2 + 2 ab cos( γ ) − a 2 cos 2 ( γ ). Mit sin 2 ( γ ) + cos 2 ( γ ) = 1 vereinfacht sich die Gleichung zu a 2 = c 2 − b 2 + 2 ab cos( γ ), was durch Umstellen den Cosinussatz ergibt. 6.4.3 Anwendungen trigonometrischer Funktionen Wir wollen auf zwei Anwendungen der trigonometrischen Funktionen hinweisen. Zum einen lässt sich die Steigung bei einer linearen Funktion mit Hilfe des Tangens beschreiben, vgl. Abbildung 3.1 vgl. S. 53 . Zeichnet man im Graphen von f zu beliebigen Stellen x 1 und x 2 ein rechtwinkliges Dreieck, dessen Katheten die Zuwächse in x und y darstellen, so ergibt sich der Tangens des Winkels α als Verhältnis von Gegenkathete zu Ankathete, also als Steigung tan( α ) = f ( x 2 ) − f ( x 1 ) x 2 − x 1 = a . Die zweite Anwendung betrifft die Modellierung realer zeitlich-periodischer Vorgänge: ■ physikalische Schwingungen (Pendel, Tonfrequenzen), ■ astronomische Vorgänge (Sonnenscheindauer, Gezeiten) , ■ saisonale Effekte in ökonomischen Zeitreihen Hier muss die technisch vorgegebene 2 π -Periodizität von Sinus und Cosinus mit Hilfe linearer Transformationen angepasst werden. Weil Cosinus und Sinus über Phasenverschiebung zusammenhängen, greift man lediglich auf die Sinusfunktion zurück. 48818_Terveer.indd 116 48818_Terveer.indd 116 18.07.2023 11: 47: 57 18.07.2023 11: 47: 57 <?page no="117"?> 6.4 Trigonometrische Funktionen 117 12 24 36 48 60 72 84 96 108 120 132 144 1.6 2 2.4 2.8 Monate lg(1000 Passagiere) Abbildung 6.11: Prognose von Flugpassagierzahlen mit trigonometrischer Saisonkomponente Satz 6.9 Für alle a, b > 0 und c, d ∈ R gilt: die Funktion x → f ( x ) = a sin( bx + c ) + d [1] ist eine 2 π b -periodische Funktion, d.h. f ( x + 2 π b ) = f ( x ) für alle x ∈ R. [2] hat den y -Achsenabschnitt a sin( c ) + d [3] hat die Extremwerte d ± a . Der Faktor a heißt Amplitude von f . Durch geeignete Wahl von a, b, c, d lässt sich so die Sinusfunktion an sachlogische Periodizitäten anpassen. Beispiel 6.8 (Fortsetzung von Beispiel 6.3 vgl. S. 106 ) In den logarithmierten monatlichen Flugpassagierzahlen ist einerseits ein linearer Trend, andererseits eine 12-monatige Periodizität zu erkennen. Beides zusammen lässt sich mit einer Funktion f ( x ) = a sin( bx + c ) + d + ex darstellen, wobei der Term a sin( bx + c ) + d den periodischen Bestandteil und der Term ex den Trendbestandteil angibt. In Abbildung 6.11 ist eine solche Anpassung mit a = 0 , 11, b = π 6 , c = − π 2 , d = 2 , 09, e = 0 , 0044 vorgenommen worden. Die Saisonkomponente lässt sich natürlich noch besser anpassen, dies ist eine der Aufgaben, welche in der Zeitreihenanalyse behandelt wird. Übungen zu Abschnitt 6.4 ? 18. Berechnen Sie anhand geeigneter rechtwinkliger Dreiecke folgende Werte aus Tabelle 6.3: a) tan( π 3 ) b) cos( π/ 4) 19. Berechnen Sie a) sin( π 6 ) und b) cos( 5 π 6 ) mit den Additionstheoremen und Tabelle 6.3 vgl. S. 114 . 20. Berechnen Sie sin( x ) und cos( x ) für x ∈ { π 6 , 5 π 6 , 7 π 6 , 11 π 6 } . Verwenden Sie die Eigenschaft sin( x ) = cos( x + π 2 − x ), cos( x ) = sin( π 2 − x ), Werte aus Tabelle 6.3 und die Symmetrieeigenschaften von Cosinus und Sinus. 21. Zeigen Sie das Additionstheorem für den Sinus, d.h. sin( α + β ) = sin( x ) cos( x )+ cos( x ) sin( y ) für x, y ∈ R, indem Sie dieses mittels der Phasenverschiebung, d.h. cos( α − π 2 ) = sin( α ) auf das Additionstheorem für den Cosinus zurückführen. 22. Begründen Sie das Additionstheorem sin 2 ( x )+cos 2 ( x ) = 1 mittels der Lage von sin( x ), cos( x ) im Einheitskreis. 23. Rechnen Sie den Cosinussatz a 2 + b 2 − 2 ab cos( γ ) = c 2 nach für den Fall, dass γ ein stumpfer Winkel ist, Verwenden Sie dabei die Planskizze in Abbildung 6.10, rechts, vgl. S. 116 . 24. Ein Bürogebäude wurde aus der Entfernung vermessen. 48818_Terveer.indd 117 48818_Terveer.indd 117 18.07.2023 11: 47: 58 18.07.2023 11: 47: 58 <?page no="118"?> 118 6 Spezielle Funktionen Gemessen wurden: t 1 = 10 m , t 2 = 50 m , α 1 = 68 o , α 2 = 72 , 38 o , α 3 = 57 , 43 o . Berechnen Sie die Höhe h des Gebäudes. Hinweise: (1) Setzen Sie den Kosinussatz an für die Dreiecke ∆ A 1 A 2 F und ∆ A 1 A 3 F mit γ = ∠ A 2 A 1 F und setzen Sie über 2 ℓ 1 cos( α ) gleich. (2) Höhen-Winkel an F sind rechte Winkel. 25. Bestimmen Sie zu den folgenden Gleichungen alle Lösungen x ∈ [0; 2 π [. Greifen Sie dabei auf die (ggf. mit Aufgabe 20 vervollständigte) Tabelle 6.3 zurück. a) − sin 2 ( x ) + sin( x ) − 14 = 0, b) sin 2 ( x ) − cos 2 ( x ) = sin( x ), c) 1 − sin( x ) = cos( x ) 26. Ermitteln Sie für folgende Graphen Funktionsterme a) einer linear transformierten Sinusfunktion f ( x ) = a sin( bx + c ) + d b) einer linear transformierten Cosinusfunktion g ( x ) = a sin( bx + c ) + d 27. Welche Funktion f ( x ) = a + bx + sin(2 x ) verläuft durch die Punkte P ( π 2 | π ) und Q ( π | 4 π )? 6.5 Stückweise definierte Funktionen Meistens lässt sich ein ökonomischer Sachverhalt mit einer der bisher genannten Funktionen nur innerhalb gewisser „Gültigkeitsbereiche“ des Definitionsbereiches modellieren. In anderen Bereichen muss man die Definition der Funktion abändern; es entsteht eine stückweise definierte Funktion. Oft handelt es sich bei den verwendeten Teilfunktionen um - affin - lineare Funktionen. Dies ist etwa dann der Fall, wenn für eine Dienstleistung oder ein Produkt abhängig vom Leistungsumfang oder der gelieferten Menge der günstigste der zur Verfügung stehenden Tarife zur Anwendung kommt: Beispiel 6.9 Im Oktober 2008 ergaben sich im Erdgastarif „Münster-Minimal“ der Stadtwerke Münster für einen Kunden mit Jahres-Verbrauch x in kWh Gesamtkosten gemäß der folgenden stückweise linearen Funktion f : [0; 10000] → R: f ( x ) = 27 , 12 + 0 , 1211 x = f 1 ( x ) , 0 < x ≤ 1033 48 , 72 + 0 , 1002 x = f 2 ( x ) , 1033 < x ≤ 3142 125 , 28 + 0 , 0759 x = f 3 ( x ) , 3142 < x ≤ 10000 Der Graph ist in Abbildung 6.12, links, dargestellt. Es kommen hier drei Tarif- Funktionen f 1 , f 2 , f 3 zum Einsatz, die unterschiedliche Grundpreise und Verbrauchspreise je kWh beschreiben. Die Fallunterscheidung ist so festgelegt, dass die tatsächlichen Kosten jeweils den kleinsten der drei berechneten Kosten f 1 ( x ) , f 2 ( x ) , f 3 ( x ) entsprechen, d.h. f ( x ) = min( f 1 ( x ) , f 2 ( x ) , f 3 ( x )). Stückweise lineare Funktionen kommen bei Steuermodellen mit Stufentarifen vor sowie 48818_Terveer.indd 118 48818_Terveer.indd 118 18.07.2023 11: 47: 59 18.07.2023 11: 47: 59 <?page no="119"?> 6.5 Stückweise definierte Funktionen 119 Abbildung 6.12: Links: Tariffunktion in Beispiel 6.9. Rechts: Betragsfunktion Monat i 1 2 3 4 5 6 7 8 9 10 11 12 x i 1,25 0,95 0,8 1,3 1,5 1,42 1,1 1,6 1,72 1,73 1,85 1,82 x ( i ) 0,8 0,95 1,1 1,25 1,3 1,42 1,5 1,6 1,72 1,73 1,82 1,85 Summen 0,8 1,75 2,85 4,1 5,4 6,82 8,32 9,92 11,64 13,37 15,19 17,04 Tabelle 6.4: Daten, sortierte Daten und Abschnittssummen aus Beispiel 6.10 bei Bewegungsmodellen, in denen die Geschwindigkeit stückweise konstant ist und sich der insgesamt zurückgelegte Weg als stückweise lineare Funktion schreiben lässt. 6.5.1 Die Betragsfunktion Die wichtigste stückweise lineare Funktion von allgemeinem Interesse ist die Betragsfunktion bzw. Absolutbetrags-Funktion abs : R → [0; ∞ [ f ( x ) = abs( x ) = | x | : = { − x x < 0 x x ≥ 0 } = max( x, − x ) Der Absolutbetrag ist eine konvexe (nicht streng konvexe) Funktion. Ihr Graph ist in Abbildung 6.12, rechts, dargestellt. Für x, y ∈ R gilt: ■ | x | = √ x 2 ■ | xy | = | x | · | y | ■ Dreiecksungleichung: | x + y | ≤ | x | + | y | Der Absolutbetrag dient zur Abstandsmessung zwischen Zahlen, aber auch zwischen Vektoren vgl. Abschnitt 12.5 . Er wird bei allen Konzepten der Analysis als Werkzeug eingesetzt. Wir illustrieren ihn an einer Anwendung der deskriptiven Statistik, nämlich der Festlegung einer Lagekennzahl von Daten x 1 , . . . , x n . Während wir in Beispiel 4.13 vgl. S. 73 gesehen haben, dass sich das arithmetische Mittel ¯ x als optimale Lösung ergibt, wenn man ( x − x 1 ) 2 + · · · + ( x − x n ) 2 minimiert, so erhält man eine andere Lösung, wenn man die Abweichungsquadrate durch absolute Abweichungen ersetzt, d.h. das Minimum der Funktion f ( x ) = | x − x 1 | + · · · + | x − x n | bestimmt. Beispiel 6.10 (Fortsetzung von Beispiel 4.13) Ein Unternehmen machte 2004 die in Tabelle 6.4 angegebenen n = 12 monatlichen Umsätze x 1 , . . . , x 12 , ausgedrückt in Mio. US-Dollar. Wir betrachten die oben erklärte Funktion f für die Daten. Diese werden zunächst der Größe nach angeordnet, 48818_Terveer.indd 119 48818_Terveer.indd 119 18.07.2023 11: 48: 00 18.07.2023 11: 48: 00 <?page no="120"?> 120 6 Spezielle Funktionen Abbildung 6.13: Links: Zielfunktion aus Beispiel 6.10, Mitte: Vorzeichenfunktion, rechts: Ganzzahlfunktion die geordneten Werte werden mit x (1) < · · · < x ( n ) bezeichnet und sind ebenfalls in Tabelle 6.4 eingetragen. Die Summe kann nun nach den aufsteigenden Werten umsortiert werden und man erhält die Darstellung f ( x ) = | x − x (1) | + | x − x (2) | + · · · + | x − x ( n − 1) | + | x − x ( n ) | . Diese Darstellung wird nun fallweise aufgelöst, je nachdem in welchem Datenintervall sich x befindet. Für x ∈ [ x ( k ) ; x ( k +1) [ sind gilt x ( j ) ≤ x für j ≤ k und x ( j ) ≥ x für j ≥ k + 1. Deshalb ist | x − x ( j ) | = x − x ( j ) für j ≤ k und | x − x ( j ) | = − ( x − x ( j ) ) = x ( j ) − x für j ≥ k + 1. Es folgt f ( x ) = ( x − x (1) ) + · · · + ( x − x ( k ) ) + ( x ( k +1) − x ) + · · · + ( x ( n ) − x ) = (2 k − n ) x − ( x (1) + · · · + x ( k ) ) + ( x ( k +1) + · · · + x ( n ) ) = (2 k − n ) x + ( x (1) + · · · + x ( n ) ) − 2( x (1) + · · · + x ( k ) ) Dies ist auch für x < x (1) und x ≥ x ( n ) richtig. Man benötigt zur Darstellung die Abschnittssummen x (1) + · · · x ( k ) , mit denen die obige Tabelle vervollständigt wird: Damit ergibt sich f ( x ) = − 12 x +17 , 04 − 2 · 0 = − 12 x +17 , 04 falls x < 0 , 8 − 10 x +17 , 04 − 2 · 0 , 8 = − 10 x +15 , 44 falls x ∈ ]0 , 8; 0 , 95] − 8 x +17 , 04 − 2 · 1 , 75 = − 8 x +13 , 54 falls x ∈ ]0 , 95; 1 , 1] − 6 x +17 , 04 − 2 · 2 , 85 = − 6 x +11 , 34 falls x ∈ ]1 , 1; 1 , 25] − 4 x +17 , 04 − 2 · 4 , 1 = − 4 x +8 , 84 falls x ∈ ]1 , 25; 1 , 3] − 2 x +17 , 04 − 2 · 5 , 4 = − 2 x +6 , 24 falls x ∈ ]1 , 3; 1 , 42] 0 x +17 , 04 − 2 · 6 , 82 = 0 x +3 , 4 falls x ∈ ]1 , 42; 1 , 5] 2 x +17 , 04 − 2 · 8 , 32 = 2 x +0 , 4 falls x ∈ ]1 , 5; 1 , 6] 4 x +17 , 04 − 2 · 9 , 92 = 4 x − 2 , 8 falls x ∈ ]1 , 6; 1 , 72] 6 x +17 , 04 − 2 · 11 , 64 = 6 x − 6 , 24 falls x ∈ ]1 , 72; 1 , 73] 8 x +17 , 04 − 2 · 13 , 37 = 8 x − 9 , 7 falls x ∈ ]1 , 73; 1 , 82] 10 x +17 , 04 − 2 · 15 , 19 = 10 x − 13 , 84 falls x ∈ ]1 , 82; 1 , 85] 12 x +17 , 04 − 2 · 17 , 04 = 12 x − 17 , 04 falls x ≥ 1 , 85 Die Funktion ist in Abbildung 6.13 skizziert. Man erkennt, dass f minimal wird, wenn x zwischen den beiden „mittleren“ Datenwerten 1 , 42 und 1 , 5 liegt. Eine übliche Wahl ist das arithmetische Mittel dieser beiden Datenwerte ˜ x = 1 , 42+1 , 5 2 = 1 , 46. Dieses wird als Median der Daten bezeichnet. Bei ungerader Anzahl von Daten markiert ein einziger Datenwert die Mitte; dieser ist dann der Median. Mit dem Absolutbetrag verbunden sind Positivteil- und Negativteil-Funktion, g ( x ) = x + : = max( x, 0) und h ( x ) = x − : = − min( x, 0). Sie hängen mit x bzw. dem Absolutbetrag | x | wie folgt zusammen: x + − x − = x und x + + x − = | x | . Insbesondere gilt | x | = x − , falls x ≤ 0, und | x | = x + , falls x ≥ 0. Die Betragsfunktion in Abbildung 6.12 ist also für x ≥ 0 die Positivteil- und für x ≤ 0 die Negativteilfunktion. 48818_Terveer.indd 120 48818_Terveer.indd 120 18.07.2023 11: 48: 02 18.07.2023 11: 48: 02 <?page no="121"?> 6.5 Stückweise definierte Funktionen 121 6.5.2 Exkurs: Die Indikatorfunktion Eine weitere stückweise erklärte Funktion ist die so genannte Indikatorfunktion. Sie stellt die Schnittstelle zwischen Mengenoperationen und arithmetischen Operationen dar und ist deshalb ein wichtiges Werkzeug der Wahrscheinlichkeitsrechnung. Streng genommen, gibt es nicht die eine Indikatorfunktion, sondern für jede Menge A ⊆ R ist eine eigene Indikatorfunktion erklärt. Sie wird mit dem Symbol 1 A bezeichnet und ist definiert als 1 A : R → { 0 , 1 } , 1 A ( x ) = { 1 falls x ∈ A 0 sonst (also falls x / ∈ A ) In der Wahrscheinlichkeitsrechnung beschreibt die Indikatorfunktion das Eintreten (1 A = 1) bzw. Nichteintreten (1 A = 0) eines Ereignisses A . Die folgenden Rechenregeln für die Indikatorfunktion machen klar, dass sie Mengenoperationen wie z.B. Vereinigung und Schnitt von Mengen in algebraische Operationen überführt: ■ 1 A ∪ B = max(1 A , 1 B ) = 1 A + 1 B − 1 A ∩ B ■ 1 A ∩ B = min(1 A , 1 B ) = 1 A · 1 B ■ 1 A c = 1 − 1 A Weitere stückweise definierte Funktionen sind die Treppenfunktionen. Sie stellen sich grundsätzlich als gewichtete Summen von Indikatorfunktionen dar und finden in der Integralrechnung Anwendung, indem Flächen unter Kurven durch Flächen unter Treppenfunktionen, welche Annäherungen der Kurve sind, approximiert werden, vgl. Abschnitt 9.2. Zwei wichtige Treppenfunktionen sind die Vorzeichenfunktion sgn : R → R, sgn( x ) = x | x | für x ̸ = 0 und sgn(0) = 0 und die Ganzzahlfunktion h : R → R , h ( x ) = k ∈ Z , wenn k ≤ x < k + 1, vgl. Abbildung 6.13. Mit der Vorzeichenfunktion stellt sich jede Zahl als Produkt aus Vorzeichen und Absolutbetrag dar, d.h. x = sgn( x ) · | x | , was in der Datenanalyse eine gewisse Rolle spielt, in der das Vorzeichen und der Betrag eines Datenwertes als separate Informationen interpretiert werden. Die Ganzzahlfunktion entspricht dem Abrundungsvorgang, der auch mit der Schreibweise ⌊ x ⌋ dargestellt wird entsprechend gibt es auch Funktionen, die das Aufrunden in der Notation ⌈ x ⌉ bzw. das generelle Runden beschreiben. Übungen zu Abschnitt 6.5 ? 28. Eine Stückweise lineare Funktion läuft durch folgende Punkte: P (3 | 5), Q (5 | 7), R (8 | 7), S (10 | 6). Bestimmen Sie einen möglichst einfachen Funktionsterm. 29. Im Jahr 2010 bezahlte man als Taxigast in Münster je Fahrt zwischen 22: 00 Uhr und 6: 00 Uhr eine Pauschale von 2 , 50 e zuzüglich 1 , 60 e für jeden angefangenen Kilometer Wegstrecke. In Dortmund kostete zur gleichen Zeit der erste gefahrene Kilometer 1 , 75 e und jeder weitere 1 , 45 e bei 3 , 00 e Pauschale. a) Stellen Sie beide Taxi-Tarife als stückweise definierte Funktionen dar. b) Für welche Streckenlängen ist die Beförderung in Münster günstiger? 30. Sei f t ( x ) = { x/ t falls x ≤ t 2 t falls x > t 2 , t > 0 a) Zeigen Sie f t ( x ) ≤ √ x ∀ x ≥ 0. 48818_Terveer.indd 121 48818_Terveer.indd 121 18.07.2023 11: 48: 03 18.07.2023 11: 48: 03 <?page no="122"?> 122 6 Spezielle Funktionen b) Der Graph von f t und der Graph der Quadratwurzelfunktion haben genau zwei gemeinsame Punkte. Welche? c) Der Graph von f t ist abschnittsweise linear. Für welches t beträgt der Winkel zwischen den Teilabschnitten 3 π 4 ? 31. Schreiben Sie die nachfolgenden Funktionen abschnittsweise ohne Verwendung von Betragsstrichen: a) f ( x ) = | x + 3 | , b) g ( x ) = | x | + 3, c) h ( x ) = | x | + x 32. Zeigen Sie für x ∈ R: a) x + − x − = x b) x + + x − = | x | 33. Lösen Sie die folgenden Ungleichungen in x : a) | x + 3 | < 2 x , b) x + 3 < | 2 x | , c) | x + 3 | < | 2 x | , d) | x 2 + 3 x | > 4 34. Berechnen Sie den Flächeninhalt des Dreiecks, welches von den Graphen der Funktionen f ( x ) = | 3 x − 5 | und g ( x ) = x − 1 begrenzt wird. 35. Für zwei Mengen A, B ⊆ R ist A ∩ B : = { x ∈ R : x ∈ A und x ∈ B } die Schnittmenge von A und B . Zeigen Sie: 1 A ∩ B ( x ) = 1 A ( x )1 B ( x ) für alle x ∈ R. Zusammenfassung Nach den rationalen Funktionen stellen Exponential-, Logarithmus- und Potenzsowie trigonometrische Funktionen weitere wichtige Funktionstypen dar, auf die in ökonomischen Anwendungen zurückgegriffen wird. Sie sollten nach Bearbeitung dieses Kapitels und der darin befindlichen Übungsaufgaben in der Lage sein, ■ grundlegende Rechenregeln für Potenzen, Wurzeln und Logarithmen anzuwenden, ■ die Graphen dieser Funktionen zu erkennen, ■ Funktionsgleichungen, in denen diese Funktionstypen auftreten, aufzulösen, ■ das periodische Verhalten von ökonomischen Größen mit einfachen trigonometrischen Funktionen zu beschreiben, ■ in einfachen ökonomischen Sachzusammenhängen stückweise definierte Funktionen zur Modellierung einzusetzen, insbesondere Betragsrechnungen durchzuführen. Übungen zur Vertiefung von Kapitel 6 ? 36. Für t ∈ R sei G t der Graph der Funktion f t ( x ) = (1 − x ) e tx 2 + t (1 − t ) x − t 2 . a) Berechnen Sie die Schnittpunkte von G t mit der Abszisse und der Ordinate. b) Skizzieren Sie die Graphen G − 5 , G − 1 , G − 1 10 , G 0 , G 12 und G 5 . c) Welche Punkte sind allen G t gemein? 37. Für t ̸ = 0 sei f t ( x ) = t sin( x ) − t 2 . a) Welche Schnittpunkte haben die Funktionsgraphen von f t und f − t ? b) Angenommen, die beiden Graphen von f s und f t schneiden sich in einem Punkt P ( x | y ), dabei sei s, t ̸ = 0 , s ̸ = t . In welcher Beziehung stehen s und t ? 38. Es seien A, B Teilmengen von R. Stellen Sie mit Hilfe der Indikatorfunktionen f = 1 A und g = 1 B dar: a) h 1 ( x ) = 1 A c ( x ). b) h 2 ( x ) = 1 A ∪ B ( x ). c) h 3 ( x ) = 1 A \ B ( x ). d) h 4 ( x ) = 1 A ∆ B ( x ). Dabei ist A ∆ B = ( A ∪ B ) \ ( A ∩ B ) die symmetrische Differenz von A und B (d.h. die Menge aller Zahlen, die in genau einer der Mengen A , B auftreten). 48818_Terveer.indd 122 48818_Terveer.indd 122 18.07.2023 11: 48: 04 18.07.2023 11: 48: 04 <?page no="123"?> Analysis in einer Variablen 48818_Terveer.indd 123 48818_Terveer.indd 123 19.07.2023 09: 08: 45 19.07.2023 09: 08: 45 <?page no="124"?> 48818_Terveer.indd 124 48818_Terveer.indd 124 18.07.2023 11: 48: 04 18.07.2023 11: 48: 04 <?page no="125"?> 7 Folgen und Reihen Übersicht Dieses Kapitel soll mit grundlegenden Begriffen im Zusammenhang mit dem mathematischen Folgenkonzept vertraut machen, welches im Rahmen der Schulmathematik oftmals nicht oder in zu geringem Umfange behandelt wird. Der Grenzwertbegriff hat viele Nutzungsmöglichkeiten: Mit ihm Grenzwertbegriff wird die Vorstellung von der „marginalen“, d.h. der „unendlich kleinen“ Größe präzisiert. Deshalb er einen Zugang zum Verständnis der Begriffe Stetigkeit und Differenzierbarkeit von Funktionen. Außerdem werden Idealrechnungen für ökonomische Größen, die einer diskreten zeitlichen Entwicklung unterliegen, erst mit der Formulierung von Grenzwerten wirklich präzise. Schließlich lassen sich nahezu alle prominenten Funktionen wie Exponential- und Logarithmusfunktionen, aber auch trigonometrische Funktionen nur auf der Grundlage bestimmter konvergenter Reihen numerisch berechnen. In Abschnitt 7.2 vgl. S. 127 werden verschiedene Darstellungsformen von Folgen besprochen. Es schließt sich die Beschreibung des Grenzwerts einer Folge und seiner Berechnungsmöglichkeiten in Abschnitt vgl. Abschnitt 7.3, S. 132 an. Im folgenden Abschnitt vgl. Abschnitt 7.4, S. 143 behandeln wir das Konzept der Summenfolge und ihres Grenzwertes, der unendlichen Reihe. Als ökonomische Anwendungen implizit erklärter Folgen werden abschließend Gleichgewichtspreise vgl. Abschnitt 7.5, S. 152 und finanzmathematische Folgen eingeführt vgl. Abschnitt 7.6, S. 155 . 7.1 Folgen in der Ökonomie Beginnen wollen wir mit einigen Beispielen und dem grundlegenden Folgenbegriff. Beispiel 7.1 Printmedien benötigen zur Planung von Auflagen verlässliche Prognosen über den Absatz ihrer Produkte, beispielsweise über Abonnentenzahlen. Für die in Münster erscheinende Zeitschrift Landlust liegen bei der Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern (www.ivw.de) die Quartalsabonnements der Landlust für den Zeitraum 03/ 2006 ( n = 1) bis 01/ 2023 ( n = 67) vor vgl. Abbildung 7.1 . Zur Prognose könnte man versuchen, für jeden Wert von n (mindestens aber ab n = 68) einen Term a n = a + b · n mit geeigneten Koeffizienten a, b ∈ R zu ermitteln. Solch ein Term beschreibt einen linearen Trend. Mit der Methode der kleinsten Quadrate vgl. Satz 12.13, S. 317 lässt sich a n = 180 , 28 + 3 . 97 n bestimmen (Zur Berechnung wurde das Statistikprogramm R verwendet). Man könnte versuchen, dies für n > 67 zur Prognose zu verwenden, also beispielsweise für n = 68, d.h. das zweite Quartal 2023 den Wert a 68 = a n = 180 , 28 + 3 . 97 · 68 ≈ 450 , 34 (in 1000) anzugeben. Es ist klar, dass dieser Wert durch das anfänglich starke Ansteigen der Zahlen begründet ist; die Prognose mit einem linearen Trend ist hier zu optimistisch. 48818_Terveer.indd 125 48818_Terveer.indd 125 18.07.2023 11: 48: 04 18.07.2023 11: 48: 04 <?page no="126"?> 126 7 Folgen und Reihen 0 100 200 300 400 20063(1) 20073(5) 20083(9) 20093(13) 20103(17) 20113(21) 20123(25) 20133(29) 20143(33) 20153(37) 20163(41) 20173(45) 20183(49) 20193(53) 20203(57) 20213(61) 20223(65) 20231(67) Quartal Abos in 1000 Abbildung 7.1: Quartalsabonnements der Landlust und Ausgleichsgerade bzw. -polynom dritten Grades nach der KQ-Methode In Abbildung 7.1 ist auch noch ein mit der KQ-Methode den Daten angepasstes kubisches Polynom eingetragen (ebenfalls mit R ermittelt). Dieses liefert aktuell eine gute Vorhersage, allerdings ist wohl eher von einer Sättigung der Nachfrage auszugehen, während ein Polynom dritten Grades künftig wieder ansteigende Zahlen prognostizieren würde. Beispiel 7.2 Der Preis eines Produktes werde mit p bezeichnet, kann aber im Zeitverlauf variieren. Selbst bei zeitkontinuierlicher Erfassung des Preises gibt es zumeist einen kleinsten Zeitraum, innerhalb dessen sich die Größe allerdings nicht ändert; daher ist oft eine zeitdiskrete Modellierung möglich. Erfasst wird die Variation zwischen diesen Zeiträumen dann durch die Verwendung eines Index n , der die jeweilige Zeitperiode angibt, für welche der Preis konstant bleibt. Es wird also p ( n ) oder p n statt p geschrieben, wobei n ∈ N 0 die Anzahl der Zeitperioden seit Erfassung der Preisentwicklung bezeichnet. Die Entwicklung lässt sich durch die Angabe aller p n für n ∈ N 0 beschreiben; für den Zeitindex gibt es keine aktuelle Obergrenze, wenn noch nicht feststeht, wie lange der Preis protokolliert werden soll. Definition 7.1 ! Eine Folge ( a n ) n ∈ N 0 ordnet jedem n ∈ N 0 ein a n ∈ R zu. Oft ist a n ein expliziter mathematischer Ausdruck in Abhängigkeit von n und wird deshalb als Folgenterm bezeichnet. Die Schreibweise ( a n ) n ∈ N 0 suggeriert, dass es sich hierbei um ein „unendlich langes“ Tupel ( a 0 , a 1 , a 2 , . . . ) handelt. Die Einträge a 0 , a 1 , . . . darin heißen Folgenglieder und n heißt Folgenindex. In der genannten Definition beginnt eine Folge mit dem Glied a 0 . Das kann bei der Umsetzung im Sachkontext oft umständlich sein, wenn der Folgenindex mit einem bestimmten Zeitpunkt, z.B. dem n -ten Tag eines Aktienkurses o.ä. verbunden ist und der Wert n = 0 oder aber die ersten Werte für n noch keine Bedeutung haben. Deshalb werden wir oft auch mit Folgen der Form ( a n ) n ≥ k arbeiten, bei denen die Folge mit a k beginnt, beispielsweise bei ( a n ) n ∈ N , wenn a 1 das Startglied der Folge ist. In der Zeitreihenanalyse spielen sogar Folgen ( a n ) n ∈ Z eine Rolle, bei denen es gar kein Startglied 48818_Terveer.indd 126 48818_Terveer.indd 126 18.07.2023 11: 48: 05 18.07.2023 11: 48: 05 <?page no="127"?> 7.2 Explizite und implizite Folgen 127 gibt, sondern angenommen wird, dass die Folge auch für die gesamte „Vergangenheit“ (d.h. für negative Folgenindizes) erklärt ist. Bei der Auswahl der Bezeichnung einer Folge wird das Folgenglied oft durch einen kontextbezogenen Buchstaben bezeichnet oben etwa a für die Abonnements und p p für den Preis, während der Folgenindex meist einer der Buchstaben i , j , k , n oder m ist. Ohne einen solchen weiteren Kontext - z.B. in allgemeinen Aussagen - werden Folgenglieder regelmäßig mit a , b , c ,. . . , im Falle von Summenfolgen oft s , jeweils mit einem Folgenindex versehen dargestellt. In vielen ökonomischen Bereichen werden zeitliche Abhängigkeiten durch Folgen modelliert und beschrieben: ■ Aktienmarkt: Kurse, Indizes ■ Unternehmen: Umsätze, Gewinne ■ Staatsökonomie: Geldmenge, BSP ■ Versicherungen: Schadensmeldungen ■ Finanzmärkte: Zahlungsreihen Für Preisentwicklungen vgl. Abschnitt 7.5, S. 152 und finanzmathematische Zahlungsreihen vgl. Abschnitt 7.6, S. 155 können derartige Gesetze detailliert angegeben werden, während sie in den übrigen genannten Situationen von geeignet zu modellierenden Zufallseffekten überlagert werden. Deren Modelle wiederum lassen sich oft mittels geeigneter Folgen, z.B. in Form von Markoff-Ketten und deren Zustands- und Übergangswahrscheinlichkeiten vgl. Unterabschnitt 13.7.2, S. 356 darstellen. 7.2 Explizite und implizite Folgen Eine Folge ( a n ) n ∈ N 0 lässt sich auf verschiedene Arten beschreiben: ■ konkret durch Angabe hinreichend vieler Folgenglieder: Für Daten wie Aktienkurse, Umsätze ist dies zunächst die einzige Darstellungsmöglichkeit. Andererseits kann man zuweilen schon aufgrund einer geringen Anzahl von Folgengliedern ein Bildungsschema erkennen - eine Standardaufgabe von Intelligenztests. ■ explizit durch Angabe des Bildungsgesetzes als Folgenterm. Durch Einsetzen des Index kann das Folgenglied unmittelbar berechnet werden. ■ implizit bzw. rekursiv durch Festlegung der Folge mit allgemeinen Gleichungen, in denen jeweils mehrere sukzessive Folgenglieder auftreten. Beispiel 7.3 (Arithmetische Folge) Wächst ein Gut periodisch um den Wert d ∈ R an, so wird die Wertentwicklung als arithmetische Folge bezeichnet. Man spricht auch vom „Sparen ohne Zinsen“. Als konkretes Beispiel betrachten wir ausgehend von a 0 = 3 eine regelmäßige Erhöhung um d = 4. Dann lauten die verschiedenen Darstellungsformen: ■ konkrete Form: a 0 = 3, a 1 = 7, a 2 = 11, a 3 = 15 usw. ■ explizite Form: a 0 = 3, a 1 = 7 = 3 + 4, a 2 = 11 = 3 + 4 · 2, a 3 = 15 = 3 + 4 · 3. Man erkennt das explizite Bildungsgesetz a n = 3 + 4 · n . Im allgemeinen Fall mit Zuwachs d hat das Bildungsgesetz ausgehend vom Startwert a 0 die Form a n : = a 0 + d · n . Beginnt die Folge mit dem Anfangsglied a 1 , so 48818_Terveer.indd 127 48818_Terveer.indd 127 18.07.2023 11: 48: 06 18.07.2023 11: 48: 06 <?page no="128"?> 128 7 Folgen und Reihen lautet das explizite Gesetz a n = a 1 + ( n − 1) · d . ■ implizite Form: a 1 = 7 = 3 + 4 = a 0 + 4, a 2 = 11 = 7 + 4 = a 1 + 4, a 3 = 15 = 11+5 = a 2 +4 usw. Man erkennt a n : = a n − 1 +4 bei gegebenem Startwert a 0 = 4. Im allgemeinen Fall wird einer arithmetischen Folge implizit durch a n = a n − 1 + d zusammen mit einem geeigneten Startwert a 0 angegeben. Beispiel 7.4 (Geometrische Folge) Wird ein Kapital sukzessiv aufbzw. abdiskontiert, so ergibt sich eine geometrische Folge. Solche Folgen treten z.B. bei der wiederholten Verzinsung eines Kapitals auf. In der Finanzmathematik entsteht auch der Barwert einer Zahlung durch „Rückverzinsung auf den Anfang“ als spezielles Glied einer geometrischen Folge. Als konkretes Beispiel nehmen wir an, dass sich der Startwert a 0 = 10 einer Folge von Glied zu Glied halbiert. ■ konkrete Form: a 0 = 10, a 1 = 5, a 2 = 5 2 , a 3 = 54 usw. ■ explizite Form: Im Zahlenbeispiel gilt a 1 = 5 = 10 · 12 , a 2 = 52 = 10 · 14 = 10 · ( 1 2 ) 2 , a 3 = 54 = 10 · 18 = 10 · ( 12 ) 3 usw. Man erkennt a n = 10 · ( 12 ) n für n ∈ N 0 Generell erhält man das explizite Bildungsgesetz a n = a 0 · p n . Beginnt die Folge mit dem Glied a 1 , so lautet das Bildungsgesetz a n = a 1 · p n − 1 . ■ implizite Form: Im Zahlenbeispiel gilt a 1 = 5 = 10 · 12 = a 0 · 12 , a 2 = 52 = 5 · 12 = a 1 · 12 , a 3 = 54 = 52 · 12 = a 2 · 12 usw. Man erkennt a n = a n − 1 · 12 . Generell lautet die implizite Form a n = p · a n − 1 mit p ∈ R und Startwert a 0 (bzw. a 1 ). Beispiel 7.5 (Geometrische Summenfolge) In der Finanzmathematik müssen meist sukzessive mit Zinseszins berechnete Werte saldiert werden. Dies erfordert fast immer die Berechnung einer Summe vom Typ 1 + p + p 2 + · · · + p n oder p + p 2 + p 3 + · · · p n , welche man als geometrische Summe bezeichnet. Hierdurch ist zwar schon eine explizite Form gegeben, allerdings besagt die Formel nur, dass „alle genannten“ Folgeglieder summiert werden müssen, der Berechnungsaufwand wächst mit der Anzahl der Summanden, d.h. mit n . Stattdessen wird möglichst eine explizite geschlossene Form der Summe gesucht. Als konkretes Zahlbeispiel nehmen wir an, dass p = 12 , d.h. wir betrachten die konkrete Folge s 0 = 1, s 1 = 1+ 12 = 32 , s 2 = 1+ 12 +( 12 ) 2 = 74 , s 3 = 1+ 12 +( 12 ) 2 +( 12 ) 3 = 15 8 usw. und suchen nach einer expliziten Formel für s n . Satz 7.1 (Geometrische Summenformel) [1] Für p ̸ = 1 ist s n : = 1 + p + p 2 + · · · + p n = 1 − p n +1 1 − p = p n +1 − 1 p − 1 für alle n ∈ N 0 [2] Für p ̸ = 1 ist p + p 2 + p 3 + · · · + p n = p − p n +1 1 − p = p n +1 − p p − 1 für alle n ∈ N Die Formel [1] ergibt sich aus den zwei Formeln s n − 1 = s n − p n und s n = 1 + p · s n − 1 , die für die implizite Darstellung der geometrische Summe möglich sind. Substitutiert man s n − 1 in der zweiten Gleichung, so ergibt sich s n = 1+ p ( s n − p n ). Löst man dies für p ̸ = 1 nach s n auf, so ergibt sich die geometrische Summenformel. Die Formel [2] lässt sich entweder auf [1] zurückführen oder aber analog zu [1] nachrechnen, vgl. hierzu den folgenden Übungsabschnitt. 48818_Terveer.indd 128 48818_Terveer.indd 128 18.07.2023 11: 48: 08 18.07.2023 11: 48: 08 <?page no="129"?> 7.2 Explizite und implizite Folgen 129 Im obigen Beispiel ergibt sich s n = 1 + 12 + 14 + · · · + ( 12 ) n = 1 − ( 12 ) n +1 1 − 12 = 1 − ( 12 ) n +1 12 = 2 · (1 − ( 12 ) n +1 = 2 − ( 12 ) n In der Ökonomie gibt es etliche Folgen, deren implizite Form sich aus ihrem Änderungsverhalten, d.h. dem Verhalten der Differenzen a n +1 − a n aufeinanderfolgender Folgenglieder ergibt (man spricht dann auch von Differenzengleichungen). Solche Darstellungen ergeben sich oft aus der Problembeschreibung und sind dann im ökonomischen Kontext der Einstieg zur Untersuchung einer Folge. Leider ist die ad-hoc- Bestimmung einzelner Folgenglieder aus der impliziten Form zumeist aufwändig. Zur Rückführung auf die explizite Form im Rahmen der Untersuchung von Differenzengleichungen gibt es allerdings standardisierte Verfahren [Gandolfo, 1997]. Beispiel 7.6 (Differenzengleichung erster Ordnung) Die Folge ( p n ) n ≥ 0 sei implizit durch Startwert p 0 und Rekursion p n +1 = a + bp n erklärt. Dabei seien a, b ∈ R und b ̸ = 1 (der Fall b = 1 stellt eine arithmetische Folge dar vgl. Beispiel 7.3, S. 127 ). Das explizite Bildungsgesetz lässt sich durch sukzessives Einsetzen „erraten“: p n = a + b ( a + bp n − 2 ) = a (1 + b ) + b 2 p n − 2 . Setzt man nun die Rekursion für p n − 2 , d.h. die Gleichung p n − 2 = a + bp n − 3 hier wieder ein und fasst wieder zusammen, so ergibt sich p n = a ( 1 + b + b 2 ) + b 3 p n − 3 . Wird dieses Argument insgesamt n -mal wiederholt, so ergibt sich schließlich mit Hilfe der geometrischen Summe p n = a ( 1 + b + · · · + b n − 1 ) + b n p 0 = a 1 − b n 1 − b + b n p 0 also nach Ausklammern von b n die Formel p n = a 1 − b + ( p 0 − a 1 − b ) b n Formt man die Rekursion um zu p n +1 − p n = a + ( b − 1) p n , so liegt eine lineare Differenzengleichung erster Ordnung mit vielen ökonomischen Anwendungen vor: ■ lineare Spinnwebmodelle nach Ezekiel vgl. Abschnitt 7.5, S. 152 ■ Wachstumsmodelle für Volkseinkommen nach Boulding ■ Multiplikator-Akzelerator-Modelle nach Samuelson ■ Verzinsungsmodelle der Finanzmathematik vgl. Abschnitt 7.6, S. 155 Zur Rekursion gehört ein wichtiges Beweisprinzip der Mathematik, das Prinzip der vollständigen Induktion. Ist eine Aussage A ( n ) wahr für eine konkrete natürliche Zahl n 0 (Induktionsanfang)und ist sie außerdem wahr für n + 1, wenn sie für n wahr ist (Induktionsschritt, so ist A ( n ) wahr alle natürlichen Zahlen n ≥ n 0 . Die Voraussetzung „ A ( n ) wahr für ein n “ im Induktionsschritt heißt Induktionsvoraussetzung (kurz IV). Beispiel 7.7 Anhand der geometrischen Summenformel s n = p 0 + p 1 + · · · + p n = 1 − p n +1 1 − p für p ̸ = 1, vgl. Satz 7.1, soll das Prinzip erläutert werden: 48818_Terveer.indd 129 48818_Terveer.indd 129 18.07.2023 11: 48: 09 18.07.2023 11: 48: 09 <?page no="130"?> 130 7 Folgen und Reihen ■ Induktionsanfang: Die Aussage ist richtig für n = 0, denn s 0 = 1 per Definition (nur der erste Summand p 0 = 1 liegt vor) und die 1 − p 0+1 1 − p ist ebenfalls Eins. ■ Induktionsschritt: Die Aussage s n = p 0 + p 1 + · · · + p n = 1 − p n +1 1 − p sei richtig für ein n ∈ N 0 (IV), d.h. es gelte s n = 1 − p n +1 1 − p . Für n + 1 muss gezeigt werden s n +1 = 1 − p ( n +1)+1 1 − p = 1 − p n +2 1 − p . Hier kann man aufgrund der Rekursion schließen: s n +1 = s n + p n +1 IV = 1 − p n +1 1 − p + p n +1 = 1 − p n +1 +(1 − p ) p n +1 1 − p = 1 − p n +1 + p n +1 − p n +2 1 − p = 1 − p n +2 1 − p . Die Aussage ist also auch richtig für n + 1. Induktive Argumentation ist ein wichtiges Hilfsmittel in der Informatik, z.B. bei Laufzeitberechnungen von Algorithmen und beim rekursiven Aufbau von Datenstrukturen. Das Induktionsprinzip hilft nicht bei der Ermittlung von Sachzusammenhängen, sondern es beschließt die Ermittlung formal, etwa wenn ein Resultat auf heuristischem Wege gefunden wurde. Bei der geometrischen Summenformel war diese Argumentation eigentlich nicht mehr nötig, weil die Formel aufgrund der zwei möglichen Rekursionen ermittelt werden konnte. Beispiel 7.8 (Gauß’sche Summenformel) Dabei handelt es sich um die Formel 1 + 2 + · · · + n = n ( n +1) 2 für alle n ∈ N 0 . Ihr Name rührt von einer mathematischen Anekdote, nach der Gauß im Volksschulalter die Formel 1 + 2 + · · · + 100 = 5050 mit der Umformung 1 + · · · + 100 = (1 + 100) + (2 + 99) + · · · + (50 + 51) = 50 · 101 hergeleitet hatte. In dieser Herleitung steckt schon die Idee für gerades n und könnte entsprechend übertragen werden, während für ungerades n der „mittlere“ Wert separat betrachtet werden muss. Statt dessen könnte man die Formel als korrekt vermuten und induktiv für n ∈ N 0 beweisen: ■ Induktionsanfang: Die Aussage ist richtig für n = 0, beide Seiten der Gleichung sind dann Null. ■ Induktionsschritt: Es gelte die Induktionsvoraussetzung 1 + 2 + · · · + n = n ( n +1) 2 für ein bestimmtes n ∈ N 0 (IV). Zu zeigen ist dann, dass die Aussage auch für n + 1 gilt, d.h. dass gilt 1 + 2 + · · · + ( n + 1) = ( n +1)(( n +1)+1) 2 = ( n +1)( n +2) 2 . Dies lässt sich wie folgt nachrechnen: 1 + 2 + · · · + n +( n + 1) IV = n ( n +1) 2 + n + 1 = n ( n +1)+2( n +1) 2 = n 2 +3 n +2 2 = ( n +1)( n +2) 2 Neben Summenformeln lassen sich noch viele andere Aussagen und Formeln, in denen natürliche Zahlen als Parameter auftreten, induktiv zeigen: Beispiel 7.9 Für alle x ≥ − 1 und n ∈ N gilt die Bernoulli-Ungleichung (1 + x ) n ≥ 1 + n · x . Dies lässt sich induktiv zeigen: ■ Induktionsanfang: Für n = 1 ist (1 + x ) n = (1 + x ) 1 = 1 + x , was die Ungleichung beinhaltet. ■ Induktionsschritt: Die Ungleichung (1 + x ) n ≥ 1 + n · x sei richtig für alle x ≥ − 1 und ein n ∈ N. Zu zeigen ist, dass auch gilt (1 + x ) n +1 ≥ 1 + ( n + 1) · x . Dies ergibt sich aber über die Umformungskette 48818_Terveer.indd 130 48818_Terveer.indd 130 18.07.2023 11: 48: 11 18.07.2023 11: 48: 11 <?page no="131"?> 7.3 Konvergenz von Folgen 131 (1 + x ) n +1 = (1 + x ) n (1 + x ) IV ≥ (1 + nx )(1 + x ) = 1 + ( n + 1) x + nx 2 ≥ 1 + ( n + 1) x Bei der ersten Abschätzung wurde ausgenutzt, dass der Faktor (1 + x ) größer oder gleich Null ist, so dass aus a ≥ b auch a (1 + x ) ≥ b (1 + x ) folgt. Übungen zu Abschnitt 7.1 ? 1. Bestimmen Sie für die angegebenen Folgen das explizite Bildungsgesetz. Welche Folgen sind geometrische/ arithmetische Folgen, welche sind monoton und/ oder beschränkt (zu den Begriffen monoton/ beschränkt vgl. Satz 7.4 vgl. S. 140 )? a) 54 ; 2 12 ; 3 34 ; 5; 25 4 ; ... b) 94 ; 32 ; 1; 23 ; 49 ; ... c) 45 ; − 16 25 ; 64 125 ; − 256 625 ; ... 2. Von einer geometrischen Folge kennt man zwei Glieder a 2 = 160 und a 4 = 102 , 4. Geben Sie a 1 , a 5 und q an. 3. Von einer arithmetischen Folge sind nur a 3 = 25 und a 10 = 81 bekannt. Bestimmen Sie das Bildungsgesetz und geben Sie a 5 und die Summe s 4 an. 4. In der zweiten Woche Ihres Praktikums bei dem Finanzberater „Schnell- Geld“ hören Sie folgendes Gespräch zwischen zwei Mitarbeitern des Unternehmens: „Was hat der Vergleich der degressiven und der linearen Abschreibung für den Firmenwagen des Chefs der Firma Stroh&Partner ergeben? “ „Bei degressiver Abschreibung wäre der Restwert nach zwei Jahren um 2100 e höher als bei linearer Abschreibung. Nach drei Jahren linearer Abschreibung würde der Restwert genau so hoch sein wie nach vier Jahren degressiver Abschreibung.“ Berechnen Sie Anfangswert und jährliche lineare Abschreibung des Wagens, wenn bei degressiver Abschreibung mit dem Faktor 45 abgezinst wird. 5. Berechnen Sie zur Folge ( a n ) n ∈ N 0 mit a n = 3 · 2 n die logarithmierte Folge ( b n ) n ∈ N 0 mit b n = ln( a n ). Was fällt Ihnen auf? 6. In Wiwinesien sei in Periode n ∈ N 0 ■ y n das Volkseinkommen mit y 0 = 1, ■ s n die Sparsumme und ■ i n die Investitionen. Weiter sei s n = 1 10 y n , i n = 15 ( y n +1 − y n ) und i n = s n . Leiten Sie für das Volkseinkommen ( y n ) n ∈ N 0 die explizite Form her. 7. Leiten Sie für die Folge a n = p + p 2 + · · · + p n , n ≥ 1, mit p ̸ = 1 das Bildungsgesetz aus Satz 7.1[2] her. Verfahren Sie dabei entweder a) analog zum Nachweis in Teil [1], indem Sie zwei implizite Bildungsgesetze herleiten und daraus die Lösung berechnen, oder b) indem Sie die Aussage des Satzes direkt nutzen oder c) indem Sie die Formel mit vollständiger Induktion begründen. 8. In Wiwinesien folge der Baumwollpreis p n der Differenzengleichung p n +1 − p n = 1 − 12 p n Dabei sei p 0 = 1. Bestimmen Sie die explizite Form der Folge ( p n ) n ≥ 0 (führen Sie die Folge rekursiv auf p 0 zurück). 9. Gegeben sei die Folge ( a n ) n ∈ N 0 mit a 0 = 0 und a n +1 = a n + 1 ( n +1)( n +2) . Bestimmen Sie ein explizites Bildungsgesetz für a n . Hinweis: Berechnen Sie die ersten Folgenglieder, erraten Sie hieraus ein Bildungsgesetz und überprüfen Sie die explizite Gleichung dann induktiv. 10. Überprüfen Sie die Lösung der Rekursion p n +1 = a + b ˙ p n in Beispiel 7.6, also die Formel p n = a 1 − b + b n ( p 0 − a 1 − b ) induktiv. 48818_Terveer.indd 131 48818_Terveer.indd 131 18.07.2023 11: 48: 12 18.07.2023 11: 48: 12 <?page no="132"?> 132 7 Folgen und Reihen n 0 = 3 ϵ= 0.3 5 15 25 35 45 - 0.2 0.2 0.4 0.6 0.8 1.0 n 0 = 7 ϵ= 0.1 5 15 25 35 45 - 0.2 0.2 0.4 0.6 0.8 1.0 n 0 = 13 ϵ= 0.05 5 15 25 35 45 - 0.2 0.2 0.4 0.6 0.8 1.0 Abbildung 7.2: Veranschaulichung des Konvergenzbegriffes für Folgen 7.3 Konvergenz von Folgen Grenzwerte sind die Grundlage der modernen Analysis. Schon der Übergang von den rationalen zu den reellen Zahlen durch Hinzufügung der irrationalen Zahlen ist ein Grenzwertvorgang, da irrationale Zahlen sich - wenn sie nicht implizit erklärt werden - nur als unendliche, nichtperiodische Dezimalzahlen auffassen lassen und daher beispielsweise als Ergebnis einer unendlichen Summation dargestellt werden können. Ein Grenzwert beschreibt in mathematisch exakter Weise, welchen Wert die Folge „am Ende“ annimmt. Mit dem Grenzwertbegriff für Folgen erweitert sich der mathematische Horizont auf unendlich große (jede Schranke überschreitende) und gleichzeitig auf unendlich kleine (beliebig nahe bei Null liegende) Größen. Beides ist für Ökonomen von Bedeutung: ■ Sachverhalte, in denen man den Begriff „unendlich groß“ verwendet, sind z.B. solche, bei denen im Laufe der Zeit zunehmende Saldi langfristig analysiert werden sollen, etwa durch Verwendung unendlicher Reihen, z.B. der geometrischen Reihe. ■ Betrachtet man das Verhalten einer ökonomischen Größe y in Abhängigkeit von einer anderen y , so werden „unendlich kleine“ (im Sprachgebrauch der Wirtschaftswissenschaften: marginale) Änderungen von x untersucht, d.h. man untersucht das Verhalten von y , wenn x beliebig nahe bei Null liegt. Der Idealfall wird dann durch einen Grenzwertübergang dargestellt, wie etwa beim Ableiten von Funktionen. Der hier verwendete Grenzwertbegriff für Funktionen lässt sich dem Grenzwertbegriff für Folgen durch Darstellung der Änderungen als Nullfolgen unterordnen. Die Konzepte hängen zusammen. Lässt man etwa den Folgenindex n wachsen, so wächst die Folge a n = n über alle Schranken, wird also „unendlich groß“, während die Kehrwertfolge 1 / a n = 1 / n sich Null beliebig annähert, d.h. „unendlich klein“ wird. Zur systematischen Erklärung der Begriffe „Konvergenz“ und „Grenzwert“ stellt man sich die Glieder einer Folge so vor, dass sie wie in Abbildung 7.2 in einem Koordinatensystem dargestellt sind, bei welchem auf der Abszisse die Folgenindizes und auf der Ordinate die Folgenwerte abgetragen werden. Bei einer konvergenten Folge findet eine Stabilisierung um einen festen Wert a (in Abbildung 7.2 ist dies der Wert a = 0 , 6) in dem folgenden Sinne statt: Zeichnet man einen beliebigen horizontalen, symmetrisch zu a liegenden Streifen einer vorgegeben Breite 2 ϵ > 0 (in Abbildung 7.2 ist die halbe Streifenbreite links ϵ = 0 , 3, mittig 48818_Terveer.indd 132 48818_Terveer.indd 132 18.07.2023 11: 48: 13 18.07.2023 11: 48: 13 <?page no="133"?> 7.3 Konvergenz von Folgen 133 ϵ = 0 , 1 und rechts ϵ = 0 , 05), so liegen zwar nicht alle, aber fast alle, d.h. nach endlich vielen a 1 , . . . , a n 0 − 1 alle weiteren Folgenglieder in diesem Streifen (in Abbildung 7.2 ist links n 0 = 3, mittig n 0 = 7 und rechts n 0 = 13). Je näher ϵ bei Null liegt, desto größer muss man n 0 wählen, damit ab diesem Wert alle Folgenglieder a n in dem Streifen liegen. Rechnerisch bedeutet das für alle Folgenglieder a n mit n ≥ n 0 : a − ϵ < a n < a + ϵ d.h. | a n − a | < ϵ Um den Zusammenhang zwischen der Streifenbreite ϵ und dem minimal erforderlichen n 0 rechnerisch genau zu ermitteln, versucht man beispielsweise, | a n − a | < ϵ mittels Äquivalenzumformungen nach n umzustellen, so dass eine Ungleichung der Form n > . . . entsteht. Zu diesem Wert, der in der Regel von ϵ abhängig ist, muss dann noch die nächste natürliche Zahl n 0 oberhalb gefunden werden. Sind keine Äquivalenzumformungen möglich, so leitet man die Aussageform n ≥ n 0 ⇒ | a n − a | < ϵ her, wobei n 0 von ϵ abhängt und nicht unbedingt als kleinstmöglicher Wert gefunden werden muss. Je schmaler der Streifen ist, d.h. je kleiner ϵ > 0 ist, desto größer ist im Allgemeinen der erforderliche Wert n 0 . Definition 7.2 (Konvergenz einer Folge) ! Man sagt, eine (reelle) Zahlenfolge ( a n ) n ≥ k konvergiert gegen a ∈ R, wenn es zu jedem ϵ > 0 ein n 0 = n 0 ( ϵ ) (abhängig von ϵ ) gibt, so dass für alle n ≥ n 0 ( ϵ ), n ≥ k gilt a − ϵ < a n < a + ϵ d.h. | a n − a | < ϵ a heißt dann Grenzwert der Folge ( a n ) n ≥ k . Schreibweisen hierfür sind: lim n →∞ a n = a bzw. a n → a für n → ∞ bzw. a n −→ n →∞ a Konvergiert eine Folge gegen Null, so heißt sie Nullfolge. Eine nicht konvergente Folge nennt man divergent. Man unterscheidet dabei zwischen ■ bestimmt divergenten Folgen, deren Folgenglieder systematisch jede Schranke überschreiten (bzw. unterschreiten). Formal gilt dann: für jedes K ∈ R gibt es ein n 0 , so dass a n ≥ K (bzw. a n ≤ K ) für alle n ≥ n 0 . Man schreibt dann a n → ∞ (bzw. a n → −∞ ), muss sich aber davor hüten, die später angesprochenen Grenzwertsätze auch für divergente Folgen zu verwenden. ■ unbestimmt divergenten Folgen, die z.B. aus mehreren konvergenten Teilfolgen mit unterschiedlichen Grenzwerten zusammengesetzt sind. Um die Stabilisierung zu verdeutlichen, aber vom Grenzwertbegriff zu unterscheiden, spricht man dann von verschiedenen Häufungspunkten einer Folge. Der größte Häufungspunkt einer Folge wird als Limes superior (Notation: lim sup n →∞ a n ), der kleinste als Limes inferior (Notation lim inf n →∞ a n ) bezeichnet. Stimmen beide überein und sind reelle Zahlen, so ist die Folge konvergent. Wir wollen das Konzept von Häufungspunkten nicht genauer behandeln, sondern nur vereinzelt in einfachen Beispielen wie dem folgenden verwenden. Für den exakten Zusammenhang von Häufungspunkten und Grenzwerten vgl. z.B. [Forster, 2011]. Beispiel 7.10 ■ a n = n 2 ist bestimmt divergent, denn für alle K > 0 gilt a n ≥ K ⇔ n ≥ √ K . ■ a n = 1 + ( − 1) n hat Häufungspunkte 0 und 2, ist also unbestimmt divergent. 48818_Terveer.indd 133 48818_Terveer.indd 133 18.07.2023 11: 48: 15 18.07.2023 11: 48: 15 <?page no="134"?> 134 7 Folgen und Reihen Das zweite Beispiel illustriert, dass eine konvergente Folge nicht zwei verschiedene Grenzwerte besitzen kann. Gilt nämlich lim n →∞ a n = a und lim n →∞ a n = b , so folgt: | a − b | = | a − a n + a n − b | ≤ | a − a n | + | a n − b | und da die rechte Seite beliebig klein wird, muss a = b gelten. Beachten Sie, dass wir nicht direkt folgern können a = lim a n = b , weil die Schreibweise lim a n = a zunächst nur eine Umschreibung des „Streifenverhaltens“ von a n und noch nicht als Gleichung im herkömmlichen Sinne zu bewerten ist - dies kann man erst unter Zuhilfenahme der Grenzwertsätze in Satz 7.3 vgl. S. 137 bewerkstelligen. Ob eine Folge konvergent ist, hängt nicht von ihrem Anfangsverhalten ab: Beispiel 7.11 Die drei Folgen a n = √ n + 1000 − √ n , b n = √ n + √ n − √ n , c n = √ n + n 1000 − √ n haben für n < 10 6 das Verhalten a n > b n > c n > 0, aber es ist lim n →∞ a n = 0, lim n →∞ b n = 12 und ( c n ) n ≥ 1 ist (bestimmt) divergent; die Ungleichungen und das Grenzwertverhalten für die erste und dritte Folge ist Thema von Übungsaufgabe 16 vgl. S. 142 , für die zweite Folge wird dies gleich gezeigt. Vorsicht bei „Taschenrechnermathematik“ Die Bestimmung des Grenzwertes allein durch „Augenschein“, wozu auch das Einsetzen von Taschenrechnerwerten gehört, ist in aller Regel kein zuverlässiges Mittel zur Berechnung, nicht einmal zur Vermutung von Grenzwerten. Die Konvergenzgeschwindigkeit der Folge könnte zu langsam sein. 7.3.1 Grenzwertbestimmung bei expliziten Folgen Die mit der Definition des Grenzwertes unmittelbar verbundene Vorgehensweise zur Bestimmung von Grenzwerten besteht darin, ■ den korrekten Grenzwert a zu erraten und ■ für ϵ > 0 beliebig ■ einen Wert n 0 ∈ N 0 zu bestimmen, so dass - | a n − a | < ϵ - für alle n ≥ n 0 Ausgehend von einem vermuteten - Grenzwert a wird dazu zunächst die Ungleichung umgeformt, um daraus einen Wert für n 0 zu bestimmen. Dieser Wert von n 0 wird in der Regel abhängig von ϵ und um so größer sein, je näher ϵ bei Null liegt. Beispiel 7.12 [1] (konstante Folge) Sei c ∈ R und a n = c für n ≥ 0. Es ist naheliegend, dass c dann auch der Grenzwert der Folge ist. Es sei ϵ > 0. Wir betrachten die Ungleichung | a n − c | < ϵ , die gleichbedeutend mit | c − c | < ϵ also mit 0 < ϵ ist. Die Ungleichung ist also wahr für alle n ∈ N 0 , d.h. mit n 0 = 0 wahr für alle n ≥ n 0 . Hier kann also n 0 unabhängig von ϵ gewählt werden. Es gilt also lim n →∞ a n = c . [2] Gegeben a ̸ = 0 sei a n : = 1 an für n ∈ N. Dann gilt lim n →∞ a n = 0. Für ϵ > 0 wird 48818_Terveer.indd 134 48818_Terveer.indd 134 18.07.2023 11: 48: 15 18.07.2023 11: 48: 15 <?page no="135"?> 7.3 Konvergenz von Folgen 135 dazu die Ungleichung | a n − 0 | < ϵ nach n aufgelöst: | a n − 0 | < ϵ ⇔ ∣∣ 1 an ∣∣ < ϵ ⇔ 1 | a | n < ϵ ⇔ n > 1 | a | ϵ Ist also n 0 die kleinste natürliche Zahl, die größer als 1 | a | ϵ ist, so folgt für n ≥ n 0 also n > 1 | a | ϵ und damit nach der obigen Umformung auch | a n − 0 | < ϵ . Die Konvergenz ist daher nachgewiesen. [3] Sei a n = 1 / √ n . Es ist zu vermuten, dass a = 0 der Grenzwert der Folge ist. Wir setzen mit ϵ > 0 an und betrachten die Ungleichung | a n − a | < ϵ , die hier die Form 1 / √ n < ϵ bekommt, was gleichbedeutend mit √ n > 1 / ϵ ⇔ n > 1 / ϵ 2 ist. Ist nun n 0 die kleinste natürliche Zahl größer als 1 / ϵ 2 , so gilt für n ≥ n 0 auch n > 1 / ϵ 2 und demzufolge durch rückwärts Abwickeln der obigen Umformungen schließlich | a n − 0 | < ϵ für alle n ≥ n 0 . Damit ist die Konvergenz nachgewiesen. [4] Mit a, b > 0 sei a n = n + a n + b . Dann gilt lim n →∞ a n = 1. Für a = b ist das sofort ersichtlich, denn dann ist a n = 1 konstant. Für a ̸ = b geben wir wieder ϵ > 0 vor und formen die Ungleichung | a n − 1 | < ϵ so um, dass n dabei freigestellt wird: | n + a n + b − 1 | < ϵ ⇔ | n + a − ( n + b ) n + b | < ϵ ⇔ | a − b | n + b < ϵ ⇔ n > | a − b | ϵ − b Ist n 0 die kleinste natürliche Zahl größer als | a − b | ϵ − b , so folgt für n ≥ n 0 also n > | a − b | ϵ − b und damit | n + a n + b − 1 | < ϵ . Damit ist die Konvergenz nachgewiesen. Bei konkreten Folgen wie im vorigen Beispiel kann die Umformung der Ungleichung zu dem erforderlichen Wert für n 0 führen. Die Grenzwertdefinition kann aber auch bei generischen Folgen verwendet werden, d.h. bei Folgen, die auf anderen konvergenten Hilfsfolgen aufbauen, deren Grenzwerteigenschaft man dann nutzt. Beispiel 7.13 Gegeben sei eine Folge ( a n ) n ≥ 1 mit a n ≥ 0 und lim n →∞ a n = a > 0 ∈ R. Wir vermuten, dass die Wurzelfolge b n = √ a n den Grenzwert lim n →∞ b n = √ a hat. Hierzu stellt man den Term | b n − √ a | mit Hilfe des Ausdrucks | a n − a | dar: | b n − √ a | = |√ a n − √ a | = ∣∣∣ ( √ a n −√ a )( √ a n + √ a ) √ a n + √ a ∣∣∣ = ∣∣∣ a n − a √ a n + √ a ∣∣∣ = | a n − a | |√ a n + √ a | ≤ | a n − a | √ a Dabei wurde √ a n −√ a erst mit √ a n + √ a > 0 erweitert und darauf die 3. binomische Formel angewendet. Die letzte Ungleichung ist korrekt, weil durch Weglassen von √ a n ≥ 0 der Nenner kleiner und der Bruch somit größer wird. Ist nun ϵ > 0, so ist auch ˜ ϵ = ϵ · √ a > 0. Weil ( a n ) n ∈ N 0 konvergiert, gibt es ein n 0 ∈ N derart, dass für alle n ≥ n 0 gilt: | a n − a | < ˜ ϵ . Dann gilt für alle n ≥ n 0 auch | b n − √ a | = |√ a n − √ a | ≤ | a n − a | √ a < ˜ ϵ √ a = ϵ ·√ a √ a = ϵ Die Folge ( b n ) n ∈ N 0 = ( √ a n ) n ∈ N 0 konvergiert also gegen √ a . Mit ein wenig Aufwand lässt sich die Rechnung auf den Fall a = 0 übertragen. Die Aussage lim n →∞ √ a n = √ a besagt, dass die Wurzelfunktion f : [0; ∞ [ → R, f ( x ) = √ x stetig ist. Das Berechnen von Grenzwerten anhand der Definition kann sehr mühsam sein, vor allem setzt es eine (begründete) Vermutung über den Grenzwert voraus. In Anwendun- 48818_Terveer.indd 135 48818_Terveer.indd 135 18.07.2023 11: 48: 17 18.07.2023 11: 48: 17 <?page no="136"?> 136 7 Folgen und Reihen n x Abbildung 7.3: Illustration des Trichterprinzips gemäß Satz 7.2 gen gebräuchlicher sind Verfahren, die gleichzeitig zum Konvergenznachweis auch schon den Grenzwert bestimmen. Diese beruhen auf einer „Formelsammlung“ bestehend aus elementaren Grenzwerten (z.B. für gebrochen-rationale Folgen), welche oft mittels der o.g. Grenzwertdefinition hergeleitet wurden, und generischen Regeln, wie man aus diesen Grenzwerten weitere ermitteln kann. Auf beides wollen wir im Folgenden eingehen und beginnen mit generischen Regeln. Die erste generische Regel ist das Trichterprinzip, welches zu einer gegebenen Folge zwei weitere Folgen erfordert, welche den gleichen Grenzwert haben und oberhalb und unterhalb der gegebenen Folge liegen. Die Ausgangsfolge muss dann in den durch die Einschachtelungsfolgen gegebenen „Trichter“ laufen, d.h. hat den gleichen Grenzwert, wie in Abbildung 7.3 dargestellt. Satz 7.2 (Trichterprinzip) Gilt a n ≤ b n ≤ c n und lim n →∞ a n = lim n →∞ c n = x , so gilt auch lim n →∞ b n = x . Denn für ϵ > 0 findet man ein n 0 ∈ N mit | a n − x | < ϵ und | c n − x | < ϵ für alle n ≥ n 0 . Dann gilt für n ≥ n 0 aber auch | b n − x | ≤ max ( | a n − x | , | c n − x | ) < ϵ . Beispiel 7.14 (geometrische Folge) Für − 1 < p < 1 ist ( p n ) n ≥ 1 eine Nullfolge. Für 0 < p < 1 ist q = 1 p > 1 und dann folgt mittels der Bernoulli-Ungleichung vgl. Beispiel 7.9, S. 130 1 p n = q n = (1 + ( q − 1)) n ≥ 1 + n ( q − 1) > n ( q − 1) > 0 , also 1 p n > n ( q − 1) für alle n ≥ 2. Mit Kehrwertbildung folgt die Einschachtelung 0 < p n < 1 n ( q − 1) der geometrischen Folge durch zwei Nullfolgen (die größere der beiden Folgen ist Nullfolge, wie allgemeiner in Beispiel 7.12[2] nachgerechnet wurde). Die geometrische Folge muss also ebenfalls eine Nullfolge sein. Dies ist auch im allgemeinen Fall − 1 < p < 1 richtig, denn dann gilt | q | n > n ( | q | − 1) und daher − 1 n ( | q |− 1) < p n < 1 n ( | q |− 1) . Beispiel 7.15 Für eine reelle Zahl x > 0 sei a n : = n √ x = x 1 n . Wir zeigen, dass lim n →∞ a n = 1, was für x = 1 sofort ersichtlich ist, weil a n = 1 1 / n = 1 dann konstant ist. Für x > 1 gilt (! ) x = 1 + ( x 1 n − 1) und mit der Bernoulli-Ungleichung folgt x = (1 + ( x 1 n − 1)) n ≥ 1 + n ( x 1 n − 1) ⇒ x − 1 ≥ n ( x 1 n − 1) ⇒ x − 1 n ≥ x 1 n − 1 48818_Terveer.indd 136 48818_Terveer.indd 136 18.07.2023 11: 48: 18 18.07.2023 11: 48: 18 <?page no="137"?> 7.3 Konvergenz von Folgen 137 Daher ist 1 ≤ x 1 n < 1+ x − 1 n = n + x − 1 n ; Die beiden begrenzenden Terme haben Grenzwert 1; nach dem Trichterprinzip ist lim n →∞ x 1 n = 1. Dass die Folge ( n + x − 1 n ) n ∈ N den Grenzwert 1 hat, folgt aus dem Grenzwertverhalten rationaler Folgen vgl. Beispiel 7.17 . Der noch fehlende Fall x < 1 wird in Beispiel 7.18 vgl. S. 138 ) besprochen. Der Grenzwert im nächsten Beispiel wird unter anderem in der Finanzmathematik im Kontext der stetigen Verzinsung verwendet: Beispiel 7.16 Für jede reelle Zahl x gilt lim n →∞ ( 1 + x n ) n = e x . Zentrales Argument dabei ist wieder eine Folgentrichter sowie die Ungleichung e t ≥ 1 + t vgl. Satz 6.4, S. 105 ■ Für t = x n ergibt sich e x n ≥ 1 + x n , daraus folgt e x ≥ ( 1 + x n ) n ■ Für t = − x x + n mit n > − x ist e − x n + x ≥ 1 − x n + x = n n + x , also e x ≤ ( 1 + x n ) n + x Wir erhalten den Folgentrichter e x ≥ ( 1 + x n ) n ≥ e x ( n + x n ) − x . Obere Schranke ist bei festem x die Konstante e x , untere Schranke der Ausdruck e x ( n + x n ) − x = e x · e − x · ln(( n + x ) / n ) . Auch dieser hat als Folge in n bei festem x den Grenzwert e x . Dazu greift man auf die Grenzwertsätze (s.u.), die Stetigkeit von Exponentialfunktion und Logarithmus sowie das Grenzwertverhalten gebrochen rationaler Folgen, hier lim n →∞ n + x n = 1 zurück. Eine weiteres, in den Beispielen bereits angesprochenes Werkzeug zur Zurückführung auf bekannte Grenzwerte sind die Grenzwertsätze. Zur Anwendung muss man meist den vorliegenden Folgenterm durch einige zielgerichtete Umformungen oder Abschätzungen in eine Form bringen, zu der einer oder mehrere der Grenzwertsätze passen. Satz 7.3 (Grenzwertsätze konvergenter Folgen) Seien ( a n ) n ≥ k und ( b n ) n ≥ k konvergente Folgen mit lim n →∞ a n = a , lim n →∞ b n = b . Dann gilt: [1] Die Folge ( c n ) n ≥ k mit c n : = a n + b n , ist konvergent mit Grenzwert a + b , d.h. es ist lim n →∞ ( a n + b n ) = lim n →∞ a n + lim n →∞ b n [2] Die Folge ( c n ) n ≥ k mit c n : = a n · b n , ist konvergent mit Grenzwert a · b , es gilt also lim n →∞ ( a n · b n ) = lim n →∞ a n · lim n →∞ b n = a · b [3] Falls b ̸ = 0, so gibt es ein m ≥ k mit b n ̸ = 0 für alle n ≥ m und die Folge ( c n ) n ≥ m mit c n : = a n b n , ist konvergent mit Grenzwert a b , d.h es ist lim n →∞ ( a n b n ) = lim n →∞ a n lim n →∞ b n Um eine Vorstellung vom Aufwand zu bekommen, mit dem derartige Aussagen begründet werden, geben wir hier die Rechnung für [2] an. Dazu sei ein ϵ > 0 vorgegeben. Die Aussage ergibt sich mit Hilfe der Abschätzung | a n b n − ab | = | a n b n − ab + ab n − ab n | ≤ | a n b n − ab n | + | ab n − ab | . Dabei wurde die Dreiecksungleichung verwendet. Die beiden Terme werden nun abgeschätzt: ■ Die Folge ( b n ) n ∈N 0 ist als konvergente Folge beschränkt, worauf wir in Satz 7.4 vgl. S. 140 genauer eingehen werden. Es gibt also ein M > 0 mit | b n | < M für alle n ∈ N 0 . Weil ( a n ) n ∈N 0 konvergent mit Grenzwert a ist, gibt es zudem ein n 1 ( ϵ ) mit | a n − a | < ϵ 2 M für alle n ≥ n 1 ( ϵ ) und damit | a n b n − ab n | = | b n | · | a n − a | ≤ M · ϵ 2 M = ϵ 2 , d.h. | a n b n − ab n | < ϵ 2 ( ∗ ) ■ Ist a = 0, so ist der zweite Summand oben | ab n − ab | = 0 ≤ ϵ 2 für alle n ≥ n 2 ( ϵ ) = 0. Für a ̸ = 0 gibt es wegen der Konvergenz von ( b n ) n ∈N 0 ein n 2 ( ϵ ) mit | b n − b | < ϵ 2 | a | für alle n ≥ n 2 ( ϵ ) und damit | ab n − ab | = | a | · | b n − b | < | a | ϵ 2 | a | = ϵ 2 ( ∗∗ ) 48818_Terveer.indd 137 48818_Terveer.indd 137 18.07.2023 11: 48: 20 18.07.2023 11: 48: 20 <?page no="138"?> 138 7 Folgen und Reihen Ist nun n 0 ( ϵ ) der größere der beiden Werte n 1 ( ϵ ) und n 2 ( ϵ ), so gelten Ungleichungen ( ∗ ) und ( ∗∗ ) für alle n ≥ n 0 ( ϵ ), d.h es folgt dann | a n b n − ab | ≤ | a n b n − ab n | + | ab n − ab | < ϵ 2 + ϵ 2 = ϵ Die Bildung von Grenzwerten, wenn man konvergente Folgen durch die Grundrechenarten Addition, Multiplikation und Division aus konvergenten Folgen zusammensetzt, ist also verträglich mit diesen Grundrechenarten. Satz 7.3 ist auch für Grenzwerte von Funktionen gültig. Man muss sich aber davor hüten, ihn auch auf die Zusammensetzung bestimmt divergenter Folgen anzuwenden. Neben den genannten generischen Prinzipien (Einschachtelung, Grenzwertsätze) benötigt man aber auch eine gewisse Anzahl von Regeln für mehr oder weniger elementare Grenzwerte. Dazu gehört das Grenzwertverhalten gebrochen-rationaler Folgen, die sich ergeben, wenn man bei gebrochen-rationalen Funktionen das Argument x durch den Folgenindex n ersetzt: Beispiel 7.17 (Gebrochen-rationale Folgen) Eine gebrochen-rationale Folge hat den Folgenterm a n = p ( n ) / q ( n ), dabei sind p ( x ) = α 0 + α 1 x + · · · + α r x r und q ( x ) = β 0 + β 1 x + · · · + β s x s Polynome vom Grad grad ( p ) = r und grad ( q ) = s . Gebrochen-rationale Folgen haben folgendes Grenzwertverhalten: ■ Falls grad ( p ) > grad ( q ), so ist ( a n ) n ∈ N (bestimmt) divergent. ■ Falls grad ( p ) = grad ( q ) = r , so ist ( a n ) n ∈ N konvergent mit Grenzwert α r β r = α r β s . ■ Falls grad ( p ) < grad ( q ), so ist ( a n ) n ∈ N eine Nullfolge. Zur Begründung: Wir betrachten hier nur den Fall r = s . Dann lässt sich aus dem Term p ( n ) / q ( n ) in Zähler und Nenner der Ausdruck n r faktorisieren und anschließend kürzen, der resultierende Term konvergiert nach den Grenzwertsätzen gegen den Quotienten α r / β r der Leitkoeffizienten von p, q : p ( n ) q ( n ) = α 0 + α 1 n + · · · + α r n r β 0 + β 1 n + · · · + β r x r = n r n r α 0 / n r + α 1 / n r − 1 + · · · + α r β 0 / n r + β 1 / n r − 1 + · · · + β r n →∞ −→ α r β r In den anderen beiden Fällen wird jeweils n r bzw. n s faktorisiert abhängig davon, welches Polynom den höheren Grad hat. Danach liest man die Divergenz bzw. Konvergenz ab. Beispiel 7.18 (Fortsetzung von Beispiel 7.15 vgl. S. 136 ) Wir betrachten jetzt die Wurzelfolge a n : = n √ x = x 1 n für den Fall 0 < x < 1. Auch dann hat a n den Grenzwert 1, denn aufgrund der Quotientenregel aus Satz 7.3 und dem in Beispiel 7.15 gerechneten Fall gilt wegen 1 / x > 1 lim n →∞ n √ x = lim n →∞ 1 n √ 1 / x = 1 lim n →∞ n √ 1 / x = 1 1 = 1 Beispiel 7.19 Für die bereits oben genannte Folge b n = √ n + √ n − √ n besteht der Kniff darin, den Folgenterm in einen geeigneten Bruch zu erweitern: √ n + √ n − √ n = (√ n + √ n − √ n ) (√ n + √ n + √ n ) √ n + √ n + √ n = n + √ n − n √ n + √ n + √ n = 1 √ n + √ n n + √ n n = 1 √ 1 + 1 √ n + 1 −→ n →∞ 1 √ 1 + 0 + 1 = 1 2 48818_Terveer.indd 138 48818_Terveer.indd 138 18.07.2023 11: 48: 22 18.07.2023 11: 48: 22 <?page no="139"?> 7.3 Konvergenz von Folgen 139 Beispiel 7.20 (Fortsetzung von Beispiel 7.6 vgl. S. 129 ) Es sei ( p n ) n ≥ 0 die aus der impliziten Gleichung p n = a + bp n − 1 mit Startwert p 0 gewonnene Folge. Wir haben gesehen, dass die explizite Form folgende Form hat p n = a 1 − b + ( p 0 − a 1 − b ) b n Für | b | < 1 folgt aus der Konvergenz der geometrischen Folge und den Grenzwertsätzen lim n →∞ p n = a 1 − b + ( p 0 − a 1 − b ) lim n →∞ b n = a 1 − b + ( p 0 − a 1 − b ) · 0 = a 1 − b 7.3.2 Grenzwertbestimmung bei impliziten Folgen Zur Bestimmung von Grenzwerten sind zunächst nur explizite Folgen geeignet. Falls möglich, wird man daher eine implizit definierte Folge in eine explizite Form überführen und dann den Grenzwert bestimmen. Bei manchen impliziten Folgen kann man aber direkt anhand der Rekursion den Grenzwert bestimmen, sofern man weiß, dass die Folge konvergent ist. Dann lässt sich in der Rekursionsgleichung jedes Auftreten eines Folgengliedes durch den - zunächst unbekannten - Grenzwert ersetzen. Es ergibt sich eine Gleichung mit dem Grenzwert als Variable, nach der man die Gleichung auflöst. Beispiel 7.21 (Fortsetzung von Beispiel 7.6 vgl. S. 129 ) Im rekursiven Modell p n +1 = a + bp n sei − 1 < b < 1 angenommen. Der Grenzwert p ergibt sich auch durch direktes Einsetzen in die Rekursion: p = lim n →∞ p n = lim n →∞ ( a + bp n − 1 ) = a + bp d.h. p = a + bp ⇔ p = a 1 − b Bei dem Einsetzen in die implizite Form ist allerdings Vorsicht geboten. Die Rechnung im vorigen Beispiel ließe sich auch durchführen, wenn z.B. b > 1 ist. Dann aber ist die genannte Folge nicht konvergent und der berechnete Wert a/ (1 − b ) hat keine Bedeutung als Grenzwert. Zwei weitere Beispiele sollen die Problematik ebenfalls illustrieren: Beispiel 7.22 ■ Die Konvergenz der Folge muss gesichert sein. Setzt man z.B. in die Rekursion der Folge a n = 2 a n − 1 + 1 den mutmaßlichen Grenzwert a ein, so würde sich die Gleichung a = 2 a + 1 ergeben, d.h. a = − 1. Das wäre aber nur im Falle a 0 = − 1 der Grenzwert der Folge, weil dann a 1 = a 2 = · · · = − 1. ■ Es sei die Folge a 0 = 0 , a 1 = 1 und a n = a n − 1 + a n − 2 2 . Setzt man den mutmaßlichen Grenzwert x für die Folgenglieder ein, so ergibt sich die Tautologie x = x + x 2 ; der Grenzwert ist also auf diese Weise nicht zu gewinnen, sondern man muss auf die explizite Form zurückgreifen vgl. Übungsaufgabe 19, S. 142 . 7.3.3 Nachweismöglichkeiten für Konvergenz Bei expliziten Folgen ergibt sich häufig durch Umformungen der Folgenterme und Anwendung der Grenzwertsätze sowohl die Konvergenz als auch der Grenzwert selbst. Die 48818_Terveer.indd 139 48818_Terveer.indd 139 18.07.2023 11: 48: 23 18.07.2023 11: 48: 23 <?page no="140"?> 140 7 Folgen und Reihen Grenzwertsätze sind aber nicht unmittelbar auf implizite Folgen anwendbar, weshalb sie zum Konvergenznachweis dann in aller Regel ausscheiden. Aber auch für explizite Folgen sind dieser Vorgehensweise technische Grenzen gesetzt. Manchmal muss die Konvergenz daher auf völlig eigenständigem Wege nachgewiesen werden. Es kann vorkommen, dass der eigentliche Grenzwert dann nur numerisch, z.B. durch Einsetzen hinreichend großer Werte für n in den Folgenterm a n approximativ bestimmbar ist. Also muss man sich zuweilen sowohl bei expliziten als auch impliziten Folgen zunächst Gedanken darüber machen, ob die Folgen überhaupt konvergent sind - Beispiel 7.11 auf Seite 134 zeigt, dass das Einsetzen großer Werte ohne vorherige Konvergenzüberprüfung in die Irre führen kann. Ein häufig möglicher Weg besteht darin, die Monotonie und Beschränktheit der Folge nachzuweisen, denn die Monotonie einer Folge beinhaltet ein Trendverhalten, die Beschränktheit sorgt dafür, dass dieser Trend nicht alle Grenzen über- oder unterschreitet. Das bedeutet Konvergenz der Folge. Satz 7.4 [1] Jede konvergente Folge ( a n ) n ≥ k ist beschränkt, d.h. es gibt ein M > 0 mit | a n | ≤ M für alle n ≥ k . [2] (Konvergenzkriterium für monotone Folgen) Sei ( a n ) n ≥ m eine monotone Folge (d.h. entweder gilt a m ≤ a m +1 ≤ a m +2 ≤ . . . (monoton wachsend) oder a m ≥ a m +1 ≥ a m +2 ≥ . . . (monoton fallend). Dann gilt: ( a n ) n ≥ m ist konvergent ⇐⇒ ( a n ) n ≥ m ist beschränkt Zur Begründung: Die Beschränktheit einer konvergenten Folge ergibt sich z.B. daraus, dass fast alle Folgenglieder den Maximalabstand 1 zu dem Grenzwert a haben, mithin im Intervall ] a − 1; a +1[ liegen. Nimmt man das Minimum m und das Maximum M der endlich vielen Folgenglieder a 1 , . . . , a n 0 − 1 , die nicht in diesem Intervall liegen, hinzu, so liegen alle Folgenglieder im Intervall [min { a − 1 , m } , max { a +1 , M } ], d.h. die Folge ist beschränkt. Ist umgekehrt eine beschränkte Folge zusätzlich monoton wachsend, so besitzt sie eine kleinste obere Schranke a , d.h. alle Folgenglieder liegen unterhalb von a und es gibt keine kleinere Zahl mit dieser Eigenschaft. Genauer gibt es für jedes ϵ > 0 ein n 0 mit a − ϵ < a n 0 < a . Wegen der Monotonie gilt das dann nicht nur für das n 0 -te Folgenglied, sondern auch alle weiteren. Das entspricht genau der Definition von Konvergenz. Beispiel 7.23 (Quadratwurzel-Iteration nach Heron) Gegeben seien a > 0 und x 0 > 0; für n > 0 sei dann x n +1 : = x n + a/ x n 2 . Diese schon den Babyloniern bekannte Iteration ist (z.T. noch) Grundlage der numerischen Berechnung von Quadratwurzeln - etwa in Taschenrechnern -, kann aber nicht explizit gemacht werden. Startet man etwa für a = 2 mit x 0 = 2, so ergeben sich die Werte in Tabelle 7.1. Sie scheinen sich √ 2 anzunähern und legen nahe, dass ( x n ) n ≥ 0 konvergent ist mit lim n →∞ x n = √ a . Wir prüfen die Konvergenz wie in [Forster, 2011], indem wir nachrechnen, dass die Folge monoton und beschränkt ist. Sicher ist zunächst x n ≥ 0 für alle n ≥ 1. Weiter gilt dann: ■ x 2 n ≥ a für n ≥ 1, denn x 2 n − a = ( x n − 1 + a/ x n − 1 2 ) 2 − a = ( x n − 1 − a/ x n − 1 ) 2 4 ≥ 0. Also ist x n nach unten durch √ a beschränkt. 48818_Terveer.indd 140 48818_Terveer.indd 140 18.07.2023 11: 48: 24 18.07.2023 11: 48: 24 <?page no="141"?> 7.3 Konvergenz von Folgen 141 n x n numerisch 0 2 2 1 32 1 , 5 2 17 12 1 , 416 666 67 n x n numerisch 3 577 408 1 , 414 215 69 4 665 857 470 832 1 , 414 213 56 5 886731088897 627013566048 1 , 414 213 56 Tabelle 7.1: Mit dem Heron-Verfahren gewonnene Näherungswerte für √ 2 ■ x n +1 ≤ x n für n ≥ 1, denn x n − x n +1 = x n − x n + a/ x n 2 = x 2 n − a 2 x n ≥ 0. Also ist x n monoton fallend. Der Grenzwert x muss jetzt sicher größer oder gleich √ a , also insbesondere größer als Null sein. Aus den Grenzwertsätzen folgt dann: x = lim n →∞ x n = lim n →∞ ( x n − 1 + a/ x n − 1 2 ) = x + a/ x 2 d.h. wegen x > 0 gilt 2 x = x + a/ x ⇔ x 2 = a ⇔ x = √ a . Es wird also tatsächlich die Quadratwurzel approximiert. An dem Beispiel aus Tabelle 7.1 kann man erkennen, dass die Konvergenz sehr schnell erfolgt, was die Verwendung in Taschenrechnern erklärt. Die Heron-Iteration lässt sich auch aus dem Newton-Verfahren zur Nullstellenbestimmung von f ( x ) = x 2 − 2 herleiten vgl. Beispiel 8.40, S. 192 . Beispiel 7.24 Sei a n : = 1 + ( 12 ) 2 + · · · + ( 1 n ) 2 . ( a n ) n ≥ 1 ist monoton wachsend (entsteht durch sukzessive Addition nichtnegativer Zahlen 11 , 14 , 19 , . . . ) und auch beschränkt. Für n ≥ 2 gilt nämlich: a n = 1 + ( 12 ) 2 + ( 13 ) 2 + · · · + ( 1 n ) 2 ≤ 1 + 1 1 · 2 + 1 2 · 3 + · · · + 1 ( n − 1) · n = 1 + ( 11 − 1 2 ) + ( 12 − 1 3 ) + · · · + ( 1 n − 1 − 1 n ) = 2 − 1 n ≤ 2 Also: | a n | ≤ 2 für alle n ≥ 2 und damit natürlich auch für alle n ≥ 1. ( a n ) n ≥ 1 ist monoton wachsend und beschränkt, also konvergent. Man kann z.B. mittels Fourier- Reihen [Forster, 2011] zeigen, dass lim n →∞ a n = π 2 6 Beschränktheit alleine reicht für die Konvergenz einer Folge nicht aus, wie das Beispiel a n = ( − 1) n zeigt. Diese Folge ist beschränkt und nicht monoton; sie ist außerdem nicht konvergent; sie hat vielmehr die beiden Häufungspunkte − 1 und 1. Die bisher untersuchten Beispielfolgen waren alle konvergent. Zuweilen kommen aber auch divergente Folgen vor. Alle unbeschränkten Folgen gehören dazu und lassen sich anhand der Unbeschränktheit oft identifizieren: Beispiel 7.25 (Fortsetzung von Beispiel 7.14 vgl. S. 136 ) Für die geometrische Folge ( p n ) n ≥ 1 mit | p | > 1 gilt wieder aufgrund der Bernoulli- Ungleichung die Abschätzung | p | n = (1 + ( | p | − 1)) n > n ( | p | − 1). Die geometrische Folge ist für | p | > 1 also unbeschränkt, mithin divergent. 48818_Terveer.indd 141 48818_Terveer.indd 141 18.07.2023 11: 48: 26 18.07.2023 11: 48: 26 <?page no="142"?> 142 7 Folgen und Reihen Beispiel 7.26 (Harmonische Reihe) Die durch sukzessive Summation der Kehrwerte der ersten n natürlichen Zahlen erklärte Folge a n , d.h. a n : = 1 + 12 + · · · + 1 n ist divergent, weil sie unbeschränkt ist. Für alle n ∈ N gilt nämlich | a 2 n − a n | = ∣∣∣∣ 1 + · · · + 1 2 n − ( 1 + · · · + 1 n )∣∣∣∣ = 1 n + 1 + · · · + 1 2 n ≥ n · 1 2 n = 12 Der Wert der Summe erhöht sich also mindestens um 12 , wenn die Anzahl der Summanden verdoppelt wird. Falls K ∈ N, so ist also a n ≥ 1 + K 2 für n ≥ 2 K . Die Folge ist also unbeschränkt. Das letzte Beispiel zeigt, dass man mit unendlich vielen immer näher bei Null liegenden Werten unter Umständen dennoch eine unbeschränkte Summe erzielen kann. Übungen zu Abschnitt 7.2 ? 11. Zeigen Sie lim n →∞ n 2 n 2 +1 = 1 unter Verwendung der Grenzwertdefinition. 12. Zeigen Sie lim n →∞ p n = 0 für | p | < 1 unter Verwendung der Grenzwertdefinition. 13. Berechnen Sie den Grenzwert der Folge a n = an 4 − 2 n +1 5 n 2 + bn 4 abhängig von a, b ∈ R. 14. Prüfen Sie die nachstehenden Folgen auf Konvergenz (dabei sei t > 0): a) a n = tn 3 − 2( t − 1) n 2 +( t +1) n +4 ( t − 1) n 3 − ( t − 1) n 2 + tn − 2 b) a n = ( t 2 + t − 1) n ( t 2 +1) n +1 c) a n = nt n 15. Zeigen Sie den Grenzwertsatz lim n →∞ ( a n + b n ) = lim n →∞ a n + lim n →∞ b n , vorausgesetzt die Grenzwerte lim n →∞ a n = a , lim n →∞ b n = b auf der rechten Seite existieren. Hinweis: Schätzen Sie | a n + b n − ( a + b ) | = | a n − a + b n − b | mit Dreiecksungleichung ab. 16. Zeigen Sie in Beispiel 7.11 : a) a n > b n > c n für n < 10 6 , b) ( a n ) n ≥ 1 ist eine Nullfolge, c) ( c n ) n ≥ 1 ist (bestimmt) divergent. 17. Welchen Grenzwert hat die implizite Folge a 1 = 1, a n +1 = 1 + 1 a n , n > 1? 18. In Duropa lag die Pro-Kopf- Verschuldung im Jahr 2000 bei 20000 Duro, nach 10 Jahren war sie um 5000 Duro gestiegen. Für die Zeitpunkte t n , zu denen die Verschuldung um 5000 n Duro über der von 2000 liegt, gelte ( t n +1 − t n ) = 4 5 ( t n − t n − 1 ). a) In welchem Jahr wird die Pro-Kopf- Verschuldung 50000 Duro übersteigen? b) Bis zu welchem Jahr spätestens muss die Steigerung der Pro-Kopf- Verschuldung gebremst worden sein? 19. Betrachten Sie die implizite Folge a 0 = 0 , a 1 = 1 und a n = a n − 1 + a n − 2 2 . Leiten Sie ein explizites Bildungsgesetz für diese Folge her und bestimmen Sie, falls vorhanden, den Grenzwert. Lässt sich die Rechnung auch auf andere Startglieder a 0 = a , a 1 = b übertragen? 48818_Terveer.indd 142 48818_Terveer.indd 142 18.07.2023 11: 48: 28 18.07.2023 11: 48: 28 <?page no="143"?> 7.4 Summenfolgen und unendliche Reihen 143 7.4 Summenfolgen und unendliche Reihen 7.4.1 Summenfolgen In der Ökonomie werden oftmals Vorgänge behandelt, bei denen Größen fortlaufend saldiert werden müssen, wie z.B. Kapital-, Umsatz- oder Absatzentwicklungen, Produktionszahlen oder Schadensmeldungen. Wenn sich die einzelnen zu saldierenden Größen als eine Folge ( a n ) n ≥ k darstellen lassen, so ist damit die Partialsummenfolge ( s n ) n ≥ k verbunden, die wie folgt dargestellt wird s n = n ∑ i = k a i : = a k + a k +1 + a k +2 + . . . + a n − 1 + a n i heißt Laufindex; er „durchläuft“ alle natürlichen Zahlen von k bis n , wobei die entsprechenden a i aufsummiert werden. Das Summationssymbol wird in mannigfaltigen Situationen benötigt; der Umgang damit sei anhand einiger Beispiele verdeutlicht: Beispiel 7.27 Sei a i = i. Dann ist beispielsweise ■ ∑ 10 i =1 a i = 1 + 2 + · · · + 9 + 10 = 55 ■ ∑ 10 i =1 a n = a n + a n + · · · + a n + a n ︸ ︷︷ ︸ 10 mal = 10 a n = 10 n ■ ∑ 10 k =1 a n + k = ( n + 1) + ( n + 2) + · · · + ( n + 10) = 10 n + 55 Beispiel 7.28 (Indexverschiebung) Es ist ∑ 7 k =3 k 2 = 3 2 +4 2 +5 2 +6 2 +7 2 = 135. Ebenso ist ∑ 8 k =4 ( k − 1) 2 = ∑ 7 k =3 k 2 = 135. Die beiden Summen stimmen überein. Dies wird auch als Indexverschiebung bezeichnet. Allgemein gilt für eine Folge ( a n ) n ≥ k n ∑ i = k a i = n + m ∑ i = k + m a i − m falls m ∈ N 0 , n ≥ k Beispiel 7.29 (Geometrische Summe) Bereits im vorletzten Abschnitt war die geometrische Summe behandelt worden n ∑ k =0 x k = 1 − x n +1 1 − x falls x ̸ = 1 und n ∈ N 0 Beispiel 7.30 (Binomische Formel) Für x, y ∈ R und n ∈ N ist ( x + y ) n = n ∑ i =0 ( n i ) x i y n − i mit dem Binomialkoeffizient ( n i ) : = n ! i ! ( n − i )! und der Fakultät n ! = 1 · 2 · · · n , vgl. S. 77 Eine zur binomischen Formel verwandte Formel ist x n − y n = ( x − y ) n − 1 ∑ i =0 x i y n − 1 − i . Häufig vorkommende Summenfolgen sind die Potenzsummen. Zumindest die ersten drei Potenzsummen sollte man aber kennen: 48818_Terveer.indd 143 48818_Terveer.indd 143 18.07.2023 11: 48: 29 18.07.2023 11: 48: 29 <?page no="144"?> 144 7 Folgen und Reihen Satz 7.5 Für alle n ∈ N gilt: n ∑ j =1 j = n ( n +1) 2 , n ∑ j =1 j 2 = n ( n +1)(2 n +1) 6 , n ∑ j =1 j 3 = n 2 ( n +1) 2 4 . Sie erkennen, dass Potenzsummen sich zu Polynomfolgen vereinfachen, d.h. der Folgenterm ein Polynom in n ist. Wir wollen hier eine Heuristik besprechen, mit der man die Formeln herleiten kann. Für die zweite Potenzsumme fragen wir uns, welche Form eine Funktion s : R → R haben muss, damit ihre Funktionswerte s (0) , s (1) , s (2) , s (3) . . . gerade 0 2 , 0 2 + 1 2 , 0 2 + 1 2 + 2 2 = 5 , 1 2 + 2 2 + 3 3 = 14 , . . . sind, d.h. damit für alle n ∈ N gilt: s ( n ) = 1 2 + 2 2 + · · · + n 2 . Zunächst ist s ( n ) sicher größer als n 2 , aber s ( n ) ist auch kleiner als n 3 , denn jeder der n Summanden von s ( n ) ist höchstens so groß wie n 2 , d.h. die gesamte Summe kann n · n 2 = n 3 nicht überschreiten. Das legt nahe, für s ( x ) einen Ansatz mit einem Polynom dritten Grades zu versuchen. Wir haben bereits die Methode der Lagrange-Polynome kennen gelernt vgl. S. 93, die wir an dieser Stelle anwenden wollen (man kann allerdings auch diese Steckbriefaufgabe mit Hilfe linearer Gleichungssysteme lösen). Wir müssen hierfür eigentlich vier Lagrange-Polynome zu den Stützstellen (0 | 0), (1 | 1) (2 | 5) und (3 | 14) verwenden, deren erstes aber wegen der Nullstelle s (0) = 0 gar nicht eingesetzt wird. Insgesamt ergibt der schematische Ansatz das Polynom s ( x )=1 · ( x − 0)( x − 2)( x − 3) (1 − 0)(1 − 2)(1 − 3) + 5 · ( x − 0)( x − 1)( x − 3) (2 − 0)(2 − 1)(2 − 3) + 14 · ( x − 0)( x − 1)( x − 2) (3 − 0)(3 − 1)(3 − 2) = 12 ( x 3 − 5 x 2 + 6 x ) − 12 ( x 3 − 4 x 2 + 3 x ) + 16 ( x 3 − 3 x 2 + 2 x ) = 2 x 3 +3 x 2 + x 6 = x ( x +1)(2 x +1) 6 Wenn die Summenformel für die Summe der ersten n Quadratzahlen also ein kubisches Polynom in n ist, so muss sie wie in Satz 7.5 lauten. Die Korrektheit kann man dann induktiv nachrechnen. Beispiel 7.31 In einer TV-Show spielen zwei Spieler 15 Runden gegeneinander. In Runde i erhält der Gewinner i Punkte, der Verlierer 0 Punkte. Gewonnen hat, wer zuerst mehr als die Hälfte der Punkte erzielt. Wieviele Spiele werden mindestens gespielt? Mit der Gauß’schen Summe ergibt sich die Gesamtpunktzahl aus allen 15 Runden als 1 + 2 + · · · + 15 = ∑ 15 k =1 k = 15 · 16 2 = 120. Gewonnen hat also, wer zuerst mehr als 60 Punkte erreicht. Das Spiel endet am schnellsten, wenn genau ein Spieler immer gewinnt. Nach m Punkten beträgt die Gesamtpunktzahl nach m Spielen: ∑ m k =1 k = m ( m +1) 2 Damit diese mindestens 60 ist, muss also gelten m ( m +1) 2 ≥ 60 ⇔ m 2 + m ≥ 120 ⇔ ( m + 12 ) 2 ≥ 120 , 25 ⇔ m + 12 ≥ 10 , 966 . . . ⇔ m ≥ 10 , 466 . . . Es müssen also mindestens 11 Spiele gespielt werden. Von der Summenfolge kommt man auf die einzelnen Summanden zurück durch Differenzenbildung; es gilt a n = ∆ s n : = s n − s n − 1 . Auch dieser Prozess ist bei der Analyse von ökonomischen Daten von Bedeutung. Beispielsweise werden Umsatzentwicklungen durch fortgesetzte Differenzenbildung so lange umgeformt, bis die entstehende Folge - näherungsweise - konstante Glieder hat. Ist hierzu eine k -malige Differenzenbildung erforderlich, so hat die Ausgangsfolge polynomiales Wachstum in der Größenordnung eines Polynoms k -ten Grades. Da sich durch Polynome geeignet hohen Grades viele zeitliche ökonomische Phänomene zumindest näherungsweise erklären lassen, spielt dies in der so genannten Zeitreihenanalyse ökonomischer Daten eine wichtige Rolle. 7.4.2 Unendliche Reihen Als rechnerischer Idealfall wird oft die Anzahl der Summanden einer endlichen Summe beliebig erhöht, so etwa bei Rückzahlungen aus einmaligen Investitionen. Solche Sum- 48818_Terveer.indd 144 48818_Terveer.indd 144 18.07.2023 11: 48: 32 18.07.2023 11: 48: 32 <?page no="145"?> 7.4 Summenfolgen und unendliche Reihen 145 men mit unendlich vielen Summanden erfasst man mathematisch durch Grenzwerte von Partialsummenfolgen. Definition 7.3 (Unendliche Reihen) ! Sei ( a n ) n ≥ m eine Folge, s n : = n ∑ k = m a k für n ≥ m . Falls ( s n ) n ≥ m konvergiert und Grenzwert s = lim n →∞ s n hat, so sagt man: Die Reihe ∞ ∑ k = m a k (bzw. ∑ k ≥ m a k ) konvergiert und hat den Grenzwert s . In Zeichen: ∞ ∑ k = m a k = s Andernfalls sagt man: Die Reihe divergiert. Das Summensymbol lässt sich also auch verwenden, wenn die Anzahl der Summanden gegen unendlich strebt. Der Wert s = ∑ ∞ n = m a n steht bei einer Folge ( a n ) n ≥ m also einerseits für die Partialsummenfolge, andererseits für deren Grenzwert. Gleichzeitig wird so präzisiert, was man unter der Summe „aller“ Folgenglieder versteht. Wenn man geeignete Vorsichtsmaßnahmen ergreift und Umformungen vermeidet, die konvergente in divergente Reihen überführen, kann man mit unendlichen Reihen ähnlich rechnen wie mit endlichen Summen. Die Grenzwerte mancher Reihen lassen sich explizit berechnen. Bei anderen Reihen ist dies nicht möglich, vielmehr werden sie angenähert durch Summation einer geeignet hohen Anzahl ihrer Glieder. Wie bei Folgen ist aber stets der Konvergenznachweis nötig. Beispiel 7.32 (Geometrische Reihe) ∑ ∞ k =0 p k ist divergent für | p | > 1 und hat den Grenzwert 1 1 − p für | p | < 1. Für p ̸ = 1 ergibt nämlich die geometrische Summenformel vgl. Satz 7.1, S. 128 ∑ n k =0 p k = 1 − p n +1 1 − p . Aufgrund der Konvergenzeigenschaften der geometrischen Folge konvergiert die geometrische Reihe also für | p | < 1 und divergiert für | p | > 1. Im Falle p = 1 ergibt sich die divergente Folge ∑ n k =0 p k = n + 1, für p = − 1 hingegen die alternierende divergente Folge ∑ n k =0 p k = ( − 1) n +1 2 . Beispiel 7.33 Die allgemeinen harmonischen Reihen sind von der Form ∑ ∞ k =1 1 k a mit a > 0. Zwei Spezialfälle wurden bereits behandelt: So ist ∑ ∞ k =1 1 k divergent, denn die Partialsummen bilden eine unbeschränkte Folge vgl. Beispiel 7.26, S. 142 . Hingegen ist ∑ ∞ k =1 1 k 2 = π 2 6 vgl. Beispiel 7.24, S. 141 . Es lässt sich zeigen, dass die harmonischen Reihen für a ≤ 1 divergent, für a > 1 hingegen konvergent sind [Forster, 2011], [Heuser, 2009]. Da Reihen nichts anderes als spezielle Summenfolgen sind, kann ihr Konvergenzverhalten grundsätzlich auf dem gleichen Wege wie bei allgemeinen Folgen untersucht werden. Insbesondere die Grenzwertsätze sind z.T. leicht auf den Reihen-Fall übertragbar. Satz 7.6 Seien ( a n ) n ≥ m , ( b n ) n ≥ m Folgen mit konvergenten Reihen ∞ ∑ k = m a k , ∞ ∑ k = m b k . Dann gilt: [1] ∞ ∑ k = m ( a k + b k ) = ∞ ∑ k = m a k + ∞ ∑ k = m b k [2] ∞ ∑ k = m ( ca k ) = c ∞ ∑ k = m a k für c ∈ R. 48818_Terveer.indd 145 48818_Terveer.indd 145 18.07.2023 11: 48: 34 18.07.2023 11: 48: 34 <?page no="146"?> 146 7 Folgen und Reihen Beispiel 7.34 Es gilt: ∑ ∞ n =0 ( ( 12 ) n + 2 · ( 13 ) n ) = ∑ ∞ n =0 ( 12 ) n + 2 · ∑ ∞ n =0 ( 13 ) n = 1 1 − 12 + 2 · 1 1 − 23 = 8 Die Multiplikation konvergenter Reihen ist nicht so einfach handhabbar, d.h. im Allgemeinen gilt ∑ ∞ k =0 ( a k b k ) ̸ = ∑ ∞ k =0 a k · ∑ ∞ k =0 b k . Beispiel 7.35 Die Reihen ∑ ∞ k =0 (1 / 2) k und ∑ ∞ k =0 b k , wobei b k = { 10 falls k = 0 k > 0 , haben die Werte ∑ ∞ k =0 a k = 2 und ∑ ∞ k =0 b k = b 0 = 1, d.h. ∑ ∞ k =0 a k ∑ ∞ k =0 b k = 2. Allerdings ist für diese speziellen Folgen ∑ ∞ k =0 ( a k b k ) = 1. Das Produkt auf der rechten Seite ist vielmehr durch das Produkt zweier endlicher Doppelsummen anzunähern. Nach Ausmultiplizieren erkennt man, dass die Summe auf der linken Seite nicht alle auftretenden Summanden auf der rechten Seite erfasst. Konvergente Reihen werden mit dem Cauchy-Produkt (∑ ∞ k =0 a k ) (∑ ∞ k =0 b k ) = ∑ ∞ k =0 (∑ k n =0 a n b k − n ) multipliziert [Forster , 2011]. Wie für allgemeine Folgen ( a n ) n ≥ m , gibt es auch für Reihen Konvergenzkriterien. Satz 7.7 (Majorantenkriterium) Es sei ∑ ∞ k = m b k eine konvergente Reihe und es gelte b n ≥ 0 für alle n ≥ m . Dann gilt: Falls | a k | ≤ b k für alle k ≥ m , so konvergiert auch ∑ ∞ k = m a k . Beispiel 7.36 ∑ ∞ n =1 1 n · ( 12 ) n ist konvergent. Die Begründung erfolgt mit dem Majorantenkriterium, denn ∣∣ 1 n ( 12 ) n ∣∣ ≤ ( 12 ) n für alle n ≥ 1 und ∑ ∞ n =1 ( 12 ) n ist konvergent (geometrische Reihe). Also ist nach dem Majorantenkriterium die betrachtete Reihe konvergent. Beispiel 7.37 ∑ ∞ n =1 1 n α ist konvergent für jedes α ≥ 2. Die Konvergenz für α = 2 wurde bereits gezeigt. Falls α > 2, so gilt n α ≥ n 2 , d.h. 1 n α ≤ 1 n 2 für alle n ≥ 1. Mit Majorantenkriterium folgt aus der Konvergenz von ∑ ∞ n =1 1 n 2 diejenige von ∑ ∞ n =1 1 n α . Satz 7.8 (Quotientenkriterium) Es gelte a k ̸ = 0 für alle k ≥ m . Weiter gebe es eine Zahl m 0 ≥ m , ein q ∈ ]0; 1[ mit | a k +1 a k | ≤ q für alle k ≥ m 0 . Dann ist ∑ ∞ k = m a k konvergent. Das folgt aus dem Majorantenkriterium mit ∑ ∞ k =0 q k als Vergleichsreihe. Beispiel 7.38 ∑ ∞ n =1 n · ( 12 ) n ist konvergent. Es gilt nämlich a n = n · ( 12 ) n > 0 für alle n ∈ N. Daher ist | a n +1 a n | = n +1 n · 12 ≤ 34 < 1 für n ≥ 2; das Quotientenkriterium ist mit q = 34 erfüllt. Sie werden sich vielleicht fragen, wie man auf einen passenden Wert für q kommen kann. Eine Möglichkeit besteht darin, die Ungleichung | a n +1 / a n | ≤ q mit beliebigem q ∈ ]0; 1[ anzusetzen und nach n aufzulösen. An irgendeiner Stelle wird der Wert von q beeinflussen, ob sich die vorliegende Ungleichung umkehrt oder nicht. In gerade gerechneten Beispiel erhalten wir die Ungleichung 48818_Terveer.indd 146 48818_Terveer.indd 146 18.07.2023 11: 48: 36 18.07.2023 11: 48: 36 <?page no="147"?> 7.4 Summenfolgen und unendliche Reihen 147 n +1 n · 12 ≤ q ⇔ 1 + 1 n ≤ 2 q ⇔ 1 n ≤ 2 q − 1. Im nächsten Schritt müsste die Ungleichung durch Kehrwertbildung zu n ≥ 1 2 q − 1 aufgelöst werden. Dieser Schritt ist aber nur richtig, wenn 2 q − 1 > 0, d.h. q > 12 . Deshalb ist q = 34 hier ausreichend, und es ergibt sich n ≥ 1 / (2 · 34 − 1) = 2. Im Quotientenkriterium darf man q < 1 nicht einfach durch q ≤ 1 ersetzen. Um das Quotientenkriterium nachzurechnen, reicht es also nicht aus, die Ungleichung | a n +1 / a n | < 1 oder | a n +1 / a n | ≤ 1 zu prüfen. Beispiel 7.39 Mit a n = 1 n ist die harmonische Reihe ∑ ∞ n =1 1 n divergent, vgl. Beispiel 7.26. Der Quotient | a n +1 / a n | = 1 n +1 / 1 n = n n +1 ist stets kleiner als 1, er konvergiert aber gegen 1, weshalb er jedes q < 1 stets irgendwann überschreitet. Das Quotientenkriterium ist hier also nicht anwendbar; man darf im Quotientenkriterium auch nicht einfach q < 1 durch q ≤ 1 ersetzen. In den meisten Fällen reicht es, den Grenzwert der Betragsquotienten zu berechnen. Man vermeidet dann, ein passendes q für das Quotientenkriterium zu suchen. Satz 7.9 (Quotientengrenzwertkriterium) Es gelte a k ̸ = 0 für alle k ≥ m und g : = lim n →∞ | a n +1 a n | < 1 (d.h. der Grenzwert existiert insbesondere). Dann ist ∑ ∞ k = m a k konvergent. Denn dann findet man für ein beliebiges q < 1 mit q > g ein n 0 ∈ N mit | a n +1 a n | < q für alle n ≥ n 0 , d.h. das gewöhnliche Quotientenkriterium ist erfüllt. Satz 7.9 ist in der Anwendung meist einfacher als das Quotientenkriterium: Beispiel 7.40 In Beispiel 7.38 gilt | a n +1 a n | = n +1 n · 12 n →∞ −→ 12 < 1. Die Reihe ∑ ∞ n =1 n · ( 12 ) n konvergiert also nach dem Quotientengrenzwertkriterium. Die Rechnung ist offensichtlich bequemer als in Beispiel 7.38, allerdings sieht man auch, dass der hier gefundene Grenzwert 12 kleiner als das in Beispiel 7.38 verwendete q = 34 ist. Generell kann man aus dem Quotientengrenzwertkriterium schließen, dass die Voraussetzungen des Quotientenkriteriums für jedes q ∈ ] g ; 1[ erfüllt sind. Es gibt allerdings auch Fälle, in denen zwar das Quotientenkriterium, nicht aber das Quotientengrenzwertkriterium direkt anwendbar sind: Beispiel 7.41 Es sei a 0 = 12 und für n ≥ 0 gelte a n +1 = 13 · a n , falls n gerade ist, und a n +1 = 12 · a n falls n ungerade ist. Die ersten Glieder dieser Folge sind also a 0 = 1 2 = ( 13 ) 0 · ( 12 ) 1 a 1 = 13 · a 0 = 16 = ( 13 ) 1 · ( 13 ) 1 a 2 = 12 · a 1 = 1 12 = ( 13 ) 1 · ( 12 ) 2 a 3 = 13 · a 2 = 1 36 = ( 13 ) 2 · ( 12 ) 2 Die Reihe ∑ ∞ n =0 a n ist konvergent nach Quotientenkriterium, für alle n ∈ N gilt: ■ Falls n gerade: | a n +1 / a n | = | 13 · a n / a n | = 13 ■ Falls n ungerade: | a n +1 / a n | = | 12 · a n / a n | = 12 48818_Terveer.indd 147 48818_Terveer.indd 147 18.07.2023 11: 48: 39 18.07.2023 11: 48: 39 <?page no="148"?> 148 7 Folgen und Reihen Mit q = 12 < 1 gilt also sicher | a n +1 / a n | ≤ q für alle n ∈ N, d.h. die Reihe ist konvergent nach Quotientenkriterium. Das Quotientengrenzwertkriterium lässt sich hier aber nicht prüfen, weil die Folge der Werte | a n +1 / a n | alternierend mit Werten 12 und 13 ist und deshalb nicht konvergiert. Existiert der Grenzwert der Folge der b n = | a n +1 / a n | nicht, so könnte man statt dessen mit den Häufungspunkten dieser Folge arbeiten. Ist der größte Häufungspunkt H der Folge ( b n ) kleiner als Eins, so konvergiert die Reihe ∑ a n . Dann ist auch die Voraussetzung des allgemeinen Quotientenkriteriums für jedes q > H erfüllt. Ist hingegen der kleinste Häufungspunkt der Folge ( b n ) größer oder gleich Eins, so divergiert die Reihe. Generell ist die Argumentation mit Hilfe von Häufungspunkten nicht unbedingt einfacher als die Rechnung im allgemeinen Quotientenkriterium. Beispiel 7.42 Ist der Grenzwert der Folge der b n = | a n +1 / a n | gleich Eins, so kann man nicht auf Konvergenz oder Divergenz schließen. Das zeigen die harmonischen Reihen: ■ Für die Reihe mit a n = 1 n ist der Grenzwert lim n →∞ b n = lim n →∞ n n +1 = 1, die Reihe ∑ a n divergiert aber. ■ Für die Reihe mit a n = 1 n 2 ist der Grenzwert ebenfalls lim n →∞ b n = n 2 ( n +1) 2 = 1, die Reihe ∑ a n konvergiert aber. Zusammengefasst lässt sich festhalten: ■ Eine Reihe, die das Majorantenkriterium erfüllt, konvergiert. ■ Eine Reihe, die das Quotientenkriterium erfüllt, erfüllt auch das Majorantenkriterium und konvergiert deshalb. Es gibt Reihen, die das Majorantenkriterium, nicht aber das Quotientenkriterium erfüllen. ■ Eine Reihe, die das Quotientengrenzwertkriterium erfüllt, erfüllt auch das Quotientenkriterium und konvergiert deshalb. Es gibt Reihen, die das Quotientenkriterium, nicht aber das Quotientengrenzwertkriterium erfüllen. 7.4.3 Potenzreihen Potenzreihen sind Reihen der Form ∑ ∞ k =0 a k x k mit vorgegebener Folge ( a k ) k ≥ 0 , in denen noch eine Unbekannte x auftritt. Deshalb kann man sie als Funktion dieser Variablen x auffassen. Für die meisten der bisher behandelten Funktionen gibt es eine Darstellung als Potenzreihe, die dann auch die numerische Berechnung (etwa mittels Taschenrechner oder Bibliotheksfunktion einer Programmiersprache) ermöglicht. Beispiel 7.43 [1] Polynomfunktionen: Wenn in der Zahlenfolge ( a k ) k ≥ 0 die Glieder a n +1 , a n +2 , . . . alle = 0 sind, so wird die Reihe zum Polynom a 0 + a 1 x + a 2 x 2 + · · · + a n x n in x . quadratische ( n = 2) Funktionen. [2] Geometrische Reihe: ∑ ∞ k =0 x k = 1 1 − x für alle | x | < 1 (divergent für | x | ≥ 1). [3] Exponentialreihe: ∑ ∞ k =0 x k k ! für alle x ∈ R. Sie konvergiert für alle x ∈ R nach dem Quotientenkriterium; es gilt nämlich für 48818_Terveer.indd 148 48818_Terveer.indd 148 18.07.2023 11: 48: 41 18.07.2023 11: 48: 41 <?page no="149"?> 7.4 Summenfolgen und unendliche Reihen 149 Funktion Reihe allgemeines Glied Index konvergent für exp( x ) 1 + x + x 2 2 + x 3 6 + · · · x n / n ! n ≥ 0 x ∈ R log(1 + x ) x − x 2 2 + x 3 3 ∓ · · · ( − 1) n +1 · x n / n n ≥ 1 − 1 < x ≤ 1 sin( x ) x − x 3 6 + x 5 120 ∓ · · · ( − 1) n · x 2 n +1 / (2 n + 1)! n ≥ 1 x ∈ R cos( x ) 1 − x 2 2 + x 4 24 ∓ · · · ( − 1) n · x 2 n / (2 n )! n ≥ 0 x ∈ R arctan( x ) x − x 3 3 + x 5 5 ∓ · · · ( − 1) n · x 2 n +1 / (2 n + 1) n ≥ 0 − 1 ≤ x ≤ 1 arcsin( x ) x + 12 x 3 3 + 1 · 3 2 · 4 x 5 5 + · · · 1 · 3 ··· (2 n − 1) 2 · 4 ··· (2 n ) · x 2 n +1 / (2 n + 1) n ≥ 0 − 1 ≤ x ≤ 1 sinh( x ) x + x 3 6 + x 5 120 + · · · x 2 n +1 / (2 n + 1)! n ≥ 1 x ∈ R cosh( x ) 1 + x 2 2 + x 4 24 + · · · x 2 n / (2 n )! n ≥ 0 x ∈ R Tabelle 7.2: Wichtige Potenzreihen alle k ≥ 2 x − 1 die Abschätzung | x | k +1 ( k +1)! / | x | k k ! = | x | k +1 ≤ 12 < 1. Die Exponentialreihe ist die Reihendarstellung der Exponentialfunktion d.h. es gilt e x = exp( x ) vgl. Satz 8.24, S. 190 Die Funktionalgleichung exp( x ) exp( y ) = exp( x + y ) ergibt sich mit dem Cauchy-Produkt (im letzten Schritt wird die binomische Formel ausgenutzt) ∞ ∑ k =0 x k k ! ∞ ∑ k =0 y k k ! = ∞ ∑ k =0 k ∑ n =0 x n n ! y k − n ( k − n )! = ∞ ∑ k =0 1 k ! k ∑ n =0 ( k n ) x n y k − n = ∞ ∑ k =0 1 k ! ( x + y ) k [4] Trigonometrische Reihen: ■ Cosinusreihe: ∑ ∞ k =0 ( − 1) k x 2 k (2 k )! ■ Sinusreihe: ∑ ∞ k =0 ( − 1) k x 2 k +1 (2 k +1)! für alle x ∈ R. Dies sind die Reihendarstellungen der Cosinus- und Sinusfunktion. Tabelle 7.2 gibt weitere Beispiele. Eine Potenzreihe ist für x konvergent, wenn ihre Summanden bei „marginaler“ Vergrößerung von x eine beschränkte Folge bilden. Satz 7.10 (Konvergenzkriterium für Potenzreihen) Sei ∑ ∞ k =0 a k x k eine Potenzreihe und x 0 ̸ = 0 eine Zahl, für die ( | a k x k 0 | ) k ≥ 0 beschränkt ist. Dann konvergiert ∑ ∞ k =0 a k x k schon für alle x ∈ ] − | x 0 | ; | x 0 | [. Denn die Summanden können in der Form a k x k = ( a k x k 0 ) · ( x/ x 0 ) k geschrieben werden, d.h. als Produkt der beschränkten Folge a k x k 0 und der geometrischen Folge ( x/ x 0 ) k , deren Reihe ∑ ∞ k =0 ( x/ x 0 ) k wegen | x/ x 0 | < 1 konvergent ist. Die Konvergenz der Potenzreihe folgt dann z.B. mit dem Quotientenkriterium. Beispiel 7.44 (Exponentialreihe) Für jedes x 0 > 0 gibt es ein n ∈ N mit n > x 0 . Dann ist für k > n x k 0 k ! = x n 0 n ! · x 0 n + 1 · x 0 n + 2 · · · · · x 0 k ≤ x n 0 n ! Die letzte Ungleichung folgt, weil die hinteren k − n Faktoren alle kleiner oder gleich Eins sind. Also ist die Summandenfolge für jedes x 0 > 0 beschränkt; die Exponen- 48818_Terveer.indd 149 48818_Terveer.indd 149 18.07.2023 11: 48: 44 18.07.2023 11: 48: 44 <?page no="150"?> 150 7 Folgen und Reihen tialreihe ∑ ∞ k =0 x k k ! konvergiert für alle x ∈ ] − x 0 ; x 0 [. Weil x 0 > 0 beliebig gewählt war, konvergiert die Reihe für alle x ∈ R. 7.4.4 Exkurs: Erzeugende Funktionen Mit Potenzreihen kann man implizite Folgen oft in eine explizite Form überführen. Definition 7.4 ! Die erzeugende Funktion der Folge ( p n ) n ≥ 0 ist die Potenzreihe f ( x ) = ∑ ∞ n =0 p n x n Expliziter Folgenterm mittels erzeugender Funktion [1] Stelle die erzeugende Funktion zur Folge p n schematisch auf. [2] Setze das implizite Bildungsgesetz in der erzeugenden Funktion für p n ein. [3] Leite hieraus eine (implizite) Bestimmungsgleichung für f ( x ) her. [4] Löse die Gleichung nach f ( x ) auf. [5] Schreibe den gewonnenen Ausdruck wieder als Potenzreihe ∑ a n x n . [6] Es gilt p n = a n . Beispiel 7.45 (Fortsetzung von Beispiel 7.6 vgl. S. 129 ) Die Rekursion p n = a + bp n − 1 (mit b ̸ = 0 , b ̸ = 1) lösen wir hier mit Hilfe der erzeugenden Funktion zu den p n : [1] Schema der erzeugenden Funktion: f ( x ) = ∞ ∑ n =0 p n x n = p 0 + ∞ ∑ n =1 p n x n [2] Einsetzen des impliziten Bildungsgesetzes f ( x ) = p 0 + ∞ ∑ n =1 ( a + bp n − 1 ) x n [3] Herleiten einer Bestimmungsgleichung für f ( x ) f ( x ) = p 0 + ax ∑ ∞ n =1 x n − 1 + bx ∑ ∞ n =1 p n − 1 x n − 1 = p 0 + ax ∑ ∞ n =0 x n + bx ∑ ∞ n =0 p n x n = p 0 + a x 1 − x + bxf ( x ) Dabei wurde die geometrische Reihe ∑ ∞ n =0 x n = 1 1 − x und die Darstellung für f ( x ) selbst eingesetzt. Die Bestimmungsgleichung lautet also f ( x ) = p 0 + a x 1 − x + bxf ( x ) [4] Die Gleichung wird nach f ( x ) aufgelöst: f ( x )(1 − bx ) = p 0 + a x 1 − x und schließlich f ( x ) = p 0 1 − bx + ax (1 − x )(1 − bx ) = p 0 1 − bx + a 1 − b · 1 1 − x − a 1 − b · 1 1 − bx Dabei wurde für den zweiten Summanden wegen b ̸ = 1 eine Partialbruchzerlegung durchgeführt mit dem Ansatz ax (1 − x )(1 − bx ) = A (1 − bx )+ B (1 − x ) (1 − x )(1 − bx ) . Durch Zählervergleich und Einsetzen der „verbotenen“ Werte erhält man: [a] Für x = 1 ist A (1 − b ) = a ⇒ A = a 1 − b [b] Für x = 1 / b ist B (1 − 1 b ) = a b ⇒ B = a/ b 1 − 1 / b = a b − 1 = − a 1 − b 48818_Terveer.indd 150 48818_Terveer.indd 150 18.07.2023 11: 48: 46 18.07.2023 11: 48: 46 <?page no="151"?> 7.4 Summenfolgen und unendliche Reihen 151 [5] 1 1 − x und 1 1 − bx werden mittels der geometrischen Reihe dargestellt: 1 1 − x = ∑ ∞ n =0 x n und 1 1 − bx = ∑ ∞ n =0 ( bx ) n = ∑ ∞ n =0 b n x n Diese Reihen konvergieren, wenn | x | < 1 und | x | < | b | . Die Reihendarstellungen werden jetzt in f ( x ) eingesetzt, die einzelnen Reihen zu einer zusammengefasst und x n summandenweise faktorisiert: f ( x ) = p 0 1 − bx + a 1 − b · 1 1 − x − a 1 − b · 1 1 − bx = ∑ ∞ n =0 p 0 b n x n + ∑ ∞ n =0 a 1 − b x n − ∑ ∞ n =0 a 1 − b b n x n = ∑ ∞ n =0 ( p 0 b n + a 1 − b − ab n 1 − b ) x n = ∑ ∞ n =0 ( a 1 − b n 1 − b + b n p 0 ) x n [6] f ( x ) = ∑ ∞ n =0 p n x n stimmt also mit der Potenzreihe ∑ ∞ n =0 ( a 1 − b n 1 − b + b n p 0 ) x n überein, welche für | x | < min { 1 , | b |} , d.h. für mindestens ein x 0 > 0 konvergiert. Es folgt p n = a 1 − b n 1 − b + b n p 0 . Schritt [6] liegt folgender Sachverhalt über den Vergleich von Potenzreihen zugrunde: Satz 7.11 (Identitätssatz, Koeffizientenvergleich bei Potenzreihen) Zwei für x 0 > 0 konvergente Potenzreihen ∑ a k x k und ∑ b k x k stellen genau dann dieselbe Funktion f ( x ) dar, wenn a k = b k für alle k ∈ N 0 . Ob die Potenzreihe tatsächlich konvergent ist, wird erst bei dem abschließenden Entwicklungsschritt [5] klar. Alle vorangehenden Schritte erfolgen unter diesem Vorbehalt. Übungen zu Abschnitt 7.3 ? 20. Berechnen Sie jeweils die Differenzenfolge b n = a n +1 − a n zur Folge ( a n ) n ∈ N 0 mit a) a n = 5 n − 4, b) a n = 3 n 2 +4 n +1 21. Auf einer Community-Plattform zeigt ein Foto angeblich eine quadratische Pyramide aus Bowling-Kugeln, wie im nachfolgenden Schaubild. a) Wie viele Bowling-Kugeln enthält die Pyramide, wenn sie vollständig mit Kugeln gepackt ist? b) Wie viele Bowling-Kugeln enthält die Pyramide, wenn nur die Mantelfläche mit Kugeln bestückt ist? 22. Berechnen Sie die folgenden Reihen und geben Sie auch an, für welche Werte von x die Reihen konvergieren (Hinweis: Rückführung auf die geometrische Reihe): a) 1 x + 1 x 2 + ... b) x + √ x + 1 + 1 √ x + ... c) ∑ ∞ n =1 x 2 n d) 1 + 1 1+ x + 1 (1+ x ) 2 + ... 23. Zeigen Sie mit dem Quotientenkriterium: ∞ ∑ n =0 n 2 · ( 12 ) n ist konvergent. 24.Berechnen Sie ∑ ∞ n =0 a n für die Folge ( a n ) n ≥ 0 aus Beispiel 7.41 vgl. S. 147 . 25. In der Weihnachts-Manufaktur am Nordpol werden für Holzspielzeug ( vgl. S. 473 ) Weihnachtsbäume, Modell Pythagoras, gezogen. Das Wachstum der Bäume ist in folgender Abbildung dargestellt. 48818_Terveer.indd 151 48818_Terveer.indd 151 18.07.2023 11: 48: 49 18.07.2023 11: 48: 49 <?page no="152"?> 152 7 Folgen und Reihen Die Höhe eines Baumes sei die Summe der Quadratseiten, die den Stamm des Baumes bilden (die Dreiecke werden dabei „ignoriert“). Die ersten Quadrate im Baum rechts sind 20 und 18 cm breit. a) Wie „hoch“ ist der rechte Baum? b) Wie „hoch“ könnte der rechte Pythagorasbaum noch werden, wenn man ihn beliebig lange wachsen ließe? 26. Bestimmen Sie zu der Folge in Aufgabe 19 vgl. S. 142 , d.h. a 0 = 0 , a 1 = 1 und a n = a n − 1 + a n − 2 2 das explizite Bildungsgesetz mittels erzeugender Funktionen. 7.5 Exkurs: Gleichgewichte bei Marktpreisen Märkte jeglicher Art definieren sich durch die Bereitschaft von Verkäufern bzw. Produzenten, Produkte zum Verkauf bereit zu stellen und die Bereitschaft von Käufern bzw. Konsumenten, diese Produkte zu erwerben. Jeder der Marktteilnehmer zeigt dabei eine spezifische Preisbereitschaft: ■ Ein Produzent wird sein Produkt in aller Regel mindestens zu dem Preis anbieten wollen, durch den er seine variablen Herstellungskosten ausgleichen kann. ■ Für den Konsumenten spielen abhängig vom Produkt verschiedene Faktoren wie Kaufkraft oder Nutzen des Produktes eine Rolle. Seine Zahlungsbereitschaft kann dabei durch verschiedene statistische Methoden erfasst werden. Wie sich unter diesen Gegebenheiten der Preis eines Produktes entwickeln kann, ist ein Gegenstand der Untersuchung von Gleichgewichtspreisen. Man nimmt an, dass zu Beginn des Untersuchungszeitraums jeder Anbieter für sich einen von ihm minimal geforderten Preis für das Produkt festlegt, während jeder Konsument sich seinen maximal zu zahlenden Preis überlegt. Der Untersuchungszeitraum ist nun in sukzessive Handelsperioden aufgeteilt: Der Einfachheit halber kann während einer Periode jeder Anbieter eine Einheit des Produktes anbieten, während jeder Konsument eine Einheit erwerben kann. Ob Verkauf bzw. Kauf innerhalb einer Periode zustande kommt, hängt vom Marktpreis des Produktes ab, der zu Beginn einer Periode feststeht: ■ Anhand des Preises bieten nur diejenigen Produzenten das Produkt an, deren Preisbereitschaft unterhalb des Marktpreises liegt. Dies setzt voraus, dass die Produzenten auf den Marktpreis kurzfristig innerhalb einer Periode reagieren. ■ Unter Berücksichtigung dieser Angebotsmenge kommen genau die Konsumenten mit der höchsten Zahlungsbereitschaft zum Zuge. Es wird also angenommen, dass sich Vertragsabschlüsse durch einen Vorgang vergleichbar einer Auktion ergeben. Der geringste tatsächlich gezahlte Preis wird zum Marktpreis der nächsten Periode. Beispiel 7.46 Für ein Produkt bestehen innerhalb einer Handelsperiode die in Abbildung 7.4 links darstellten Preisbereitschaften. Der Zusammenhang zwischen Stückpreis und insgesamt nachgefragter bzw. angebotener Menge ist in Abbildung 7.4 rechts grafisch dargestellt. Die Preisbereitschaft der Anbieter liest man darin als wachsende, die der Kunden als fallende Folge von Säulen. Nehmen Sie an, dass zu Beginn der ersten Handelsperiode ein Marktpreis von p 0 = 38 Geldeinheiten feststeht; dann ist eine 48818_Terveer.indd 152 48818_Terveer.indd 152 18.07.2023 11: 48: 50 18.07.2023 11: 48: 50 <?page no="153"?> 7.5 Exkurs: Gleichgewichte bei Marktpreisen 153 Preisbereitschaft Konsumenten Produzenten 11 12 19 20 14 38 20 23 48 62 24 29 67 67 32 41 72 73 43 50 75 76 53 70 81 82 77 80 93 93 93 93 94 96 94 95 97 97 99 100 p = 72. p = 72. p = 38. 0 5 10 15 20 0 20 40 60 80 100 Gehandelte Stückzahl x Stückpreis p Abbildung 7.4: Angebot und Nachfrage in Beispiel 7.46 prinzipielle Nachfrage von d 0 = 17 Stück vorhanden, denn gemäß der Tabelle würden 17 Kunden diesen oder einen höheren Preis zahlen. Gleichzeitig wären aber nur 7 Produzenten bereit, das Produkt zu diesem Preis zu verkaufen, d.h. es werden a 1 = 7 Stücke des Produktes angeboten. Das Angebot ist also knapp, deshalb wird angenommen, dass nur die 7 Kunden mit der höchsten Zahlungsbereitschaft oberhalb von 38 Geldeinheiten das Produkt erwerben werden. Das sind die Kunden mit einer Zahlungsbereitschaft von mindestens p 1 = 82 Geldeinheiten. p 1 = 82 ist gleichzeitig der Marktpreis der zweiten Periode, in welcher nun a 2 = 14 Stück angeboten werden. Damit kommen die Kunden mit den 14 höchsten Preisbereitschaften zum Zuge, so dass der mindestens am Markt gezahlte Preis nun p 2 = 67 Geldeinheiten beträgt. In der dritten Periode werden daher a 3 = 11 Stücke des Produktes angeboten, der mindestens gezahlte Preis für den Absatz dieser Menge beträgt p 3 = 73. Zu diesem Preis bieten die Produzenten in der vierten Periode a 4 = 12 Stücke an, welche genau von den Kunden ab einer Zahlungsbereitschaft von p 4 = 72 Geldeinheiten erworben werden. Ab Periode 5 ändern sich Angebot und Nachfrage nicht mehr, es hat sich das Marktgleichgewicht p ∗ = 72 eingestellt. Die in Abbildung 7.4 oberhalb des Marktgleichgewichts grau schraffierte Fläche stellt die gesamte Ersparnis der zum Zuge gekommenen Konsumenten dar, die ja bereit gewesen sind, einen höheren als den Marktpreis zu zahlen. Die unterhalb der Gleichgewichtslinie dargestellt graue Fläche stellt den über den variablen Kosten der zum Zuge gekommenen Produzenten befindlichen Ertrag, d.h. den gesamten Deckungsbeitrag der Produzenten dar. Die Punkte ( d 0 , p 0 ) = (17 , 38), ( a 1 , p 0 ) = (7 , 38), ( d 1 , p 1 ) = (7 , 82) und ( a 2 , p 1 ) = (14 , 82) = ( d 2 , p 2 ) = · · · , welche die Entwicklung von Marktumfang und Preis im konkreten Fall beschreiben, liegen auf einem spiralförmigen Linienzug ähnlich dem Webmuster eines Spinnennetzes vgl. Abbildung 7.4 . Daher spricht man auch von einem Spinnweb-Modell. Die Preisentwicklung kann durch eine Folge ( p n ) n ≥ 0 beschrieben werden. Sie steht mit den Folgen ( a n ) n ≥ 1 der angebotenen und ( d n ) n ≥ 1 der nachgefragten Mengen über das Gleichgewicht von Angebot und Nachfrage in folgendem Zusammenhang: Der Nachfragepreis D ( x ) zu einer auf dem Markt gehandelten Menge x ist derjenige Preis, den ein Konsument mindestens zahlen muss, um im „Wettbewerb“ mit den anderen Konsumenten nicht leer auszugehen. Der Angebotspreis A ( x ) ist derjenige Preis, zu dem genau die Menge x des Produktes angeboten wird. In Beispiel 7.46 sind A ( x ) und D ( x ) als stückweise konstante monoton wachsende bzw. fallende Funktionen aus den Preisbereitschaften von Anbieter und Konsumenten bestimmt und in Abbildung 7.4 dargestellt. Am Markt bestimmen sich p n , d n und a n aus der Gleich- 48818_Terveer.indd 153 48818_Terveer.indd 153 18.07.2023 11: 48: 51 18.07.2023 11: 48: 51 <?page no="154"?> 154 7 Folgen und Reihen 1 2 3 4 2 4 6 8 10 x p 1 2 3 4 2 4 6 8 10 x p 1 2 3 4 2 4 6 8 10 x p A 1 ( x ) = 2 + 3 x A 2 ( x ) = 2 + 2 x A 3 ( x ) = 2 + 32 x d n = 5 − 12 p n d n = 5 − 12 p n d n = 5 − 12 p n a n +1 = − 23 + 13 p n a n +1 = − 1 + 12 p n a n +1 = − 43 + 23 p n Abbildung 7.5: Stabilisierung und Destabilisierung im linearen Spinnweb-Modell mit D ( x ) = 10 − 2 x , p 0 = 4 gewichtsbedingung a n = d n und den Rekursionen p n = A ( a n +1 ) und p n = D ( d n ). Allgemeiner nimmt man für Angebot und Nachfrage kontinuierliche, im einfachsten Fall lineare D ( x ) = α + βx und A ( x ) = γ + δx mit α, γ, δ > 0, β < 0 an. Dann ist p n = α + βd n ⇔ d n = p n β − α β und p n − 1 = γ + δa n ⇔ a n = p n − 1 δ − γ δ . Aus dem Gleichgewicht a n = d n („Angebot=Nachfrage“) ergibt sich durch Einsetzen der Terme für a n und d n sowie Auflösen nach p n die Rekursion p n = αδ − βγ δ + β δ p n − 1 . Aufgrund von Beispiel 7.6 vgl. S. 129 ist p n = αδ − βγ δ 1 − β δ + ( p 0 − ( αδ − βγ δ 1 − β δ )( β δ ) n = αδ − βγ δ − β + ( p 0 − αδ − βγ δ − β )( β δ ) n Für | β δ | < 1 konvergiert der Ausdruck gegen den Gleichgewichtspreis αδ − βγ β . Im Falle | β δ | ≥ 1 divergiert die Folge der Preise, nur für p 0 = αδ − βγ β ist sie konstant. Beispiel 7.47 Für D ( x ) = 10 − 2 x werden die drei Angebotsgeraden A 1 ( x ) = 2+3 x , A 2 ( x ) = 2+2 x und A 3 ( x ) = 2 + 32 x betrachtet. Zum Eröffnungspreis p 0 = 4 ist die Preisentwicklung angegeben in Abbildung 7.5 von links nach rechts skizziert (links stabilisierender, Mitte oszillierender, rechts explodierender Preisverlauf). Für ein stabiles Gleichgewicht (links) muss die Angebotskurve steiler als die Nachfragekurve sein, d.h. Konsumenten reagieren stärker auf Preisänderungen als Produzenten. Der Gleichgewichtspreis links ergibt sich als Schnittpunkt von Angebots- und Nachfragegerade (Break-Even-Preis). Der Schnittpunkt hier nur dann eine Bedeutung als Marktgleichgewicht, wenn er schon als Eröffnungspreis p 0 vorliegt. Übungen zu Abschnitt 7.4 ? 27. Ein Markt folge dem Spinnwebmodell mit den skizzierten Funktionen. a) Bestimmen Sie p 1 , . . . , p 4 für p 0 = 5. b) Leiten Sie eine explizite Form für die Preisentwicklung ( p n ) n ∈ N 0 her. c) Welchen Grenzwert hat die Folge? . 48818_Terveer.indd 154 48818_Terveer.indd 154 18.07.2023 11: 48: 54 18.07.2023 11: 48: 54 <?page no="155"?> 7.6 Finanzmathematische Folgen und Reihen 155 7.6 Finanzmathematische Folgen und Reihen Wo immer in der Ökonomie Kapital betrachtet wird, liegt den Überlegungen meist zugrunde, dass dieses die Möglichkeit eines Zinsertrages bietet. Auch geliehenes Kapital ist unter Zinsaspekten zu betrachten, da der Darlehensgeber die Vergabe des Darlehens an eine periodische Leihgebühr, die Darlehnszinsen koppelt. Die Entwicklung solcher Kapitalbeträge wird anhand exemplarischer Fragestellungen der Zinseszinsrechnung, Rentenrechnung und Tilgungsrechnung besprochen. Für eine genauere Behandlung der Finanzmathematik sei auf die Literatur verwiesen [Kruschwitz, 2010]. Wir betrachten hier die Entwicklung eines Startkapitals K 0 > 0 durch Zins- und Einzahlungsbzw. Auszahlungseffekte über n gleichartige Perioden. Das Kapital K n am Ende von Periode n erhöht oder erniedrigt sich gegenüber dem Kapital K n − 1 am Ende der Vorperiode um die in Periode n berechneten Zinsen z n , und die Einbzw. Auszahlungen r n , d.h. K n = K n − 1 + z n + r n Wir beschränken uns auf die nachschüssige Rechnung: Mit einem Zinsfuß p n in Periode n betragen die Zinsen je z n = K n − 1 p n 100 Der Zinsfuß soll über den gesamten Berechnungszeitraum stets denselben Wert p ̸ = 0 haben und auch die Einbzw. Auszahlungen betragen in jeder Periode stets den gleichen Wert r ∈ R. Damit lautet die implizite Formel für die Kapitalentwicklung K n = qK n − 1 + r mit Zinsfaktor q = 1 + p 100 . Nach Beispiel 7.6 vgl. S. 129 lautet die Lösung: Satz 7.12 (Kapitalentwicklung unter Verzinsung) Das Kapital K n nach n nachschüssig verzinsten Perioden bei Startkapital K 0 mit konstanter Einbzw. Auszahlung r und konstantem Zinsfaktor q ̸ = 1 beträgt K n = K 0 q n + r · q n − 1 q − 1 Diese Grundformel taucht in verschiedenen Gebieten der Finanzmathematik auf, von denen hier drei exemplarisch angesprochen werden sollen. 7.6.1 Zinseszinsrechnung Im Fall r = 0 (keine Ein-/ Auszahlung) wird in jeder Periode das Kapital verzinst und die Zinsen dem Kapital zugeschlagen, so dass sie in der nächsten Periode mitverzinst werden. Die Grundformel für das Kapital nach n Jahren lautet K n = K 0 (1 + p 100 ) n . Bei unterjähriger Rechnung wird das Jahr in m gleich lange Zeitintervalle unterteilt, in denen der Zinsfuß p m = p m zur Berechnungsgrundlage der Zinsen wird. Gemäß Grundformel mit m Zinsperioden und Zinsfuß p m beträgt das Kapital nach einem Jahr K m = K 0 (1 + 1 m · p 100 ) m Bei unterjähriger Rechnung erhöht sich der Kapitalertrag gegenüber einmaliger jährlicher Verzinsung, denn es wird jeweils ein m -ter Anteil des Kapital einmal, ein 48818_Terveer.indd 155 48818_Terveer.indd 155 18.07.2023 11: 48: 55 18.07.2023 11: 48: 55 <?page no="156"?> 156 7 Folgen und Reihen weiterer zweimal usw. verzinst, was einen höheren Zinsertrag am Ende des Jahres mit sich bringt. Verkleinert man die Zinsperioden immer weiter, so liegt ein Grenzübergang vor. Im Idealfall, der stetigen Verzinsung, beträgt das Kapital nach einem Jahr K = lim m →∞ K m = K 0 lim m →∞ (1 + 1 m p 100 ) m also K = K 0 · e p 100 vgl. Beispiel 7.16, S. 137 wobei e = 2 , 7182818 . . . = exp(1) = 1 + 1 + 12 + 16 + 1 24 + · · · die bereits oben vorgestellte Euler’sche Zahl ist. Es ist also - im Fall von Habenzinsen - rechentechnisch günstig, möglichst kleinteilig unterjährig zu verzinsen. Die Euler’sche Zahl liefert eine Obergrenze für den erzielbaren Kapitalbetrag: Bei einem Zinsfuß von 100% würde das Kapital maximal auf das etwa 2 , 718-fache des Betrages zu Anfang des Jahres anwachsen. Beispiel 7.48 Ein Kapital von 2 . 000 . 000 e wird bei einem Jahreszinssatz von 3% angelegt. ■ Es wird eine vierteljährliche Verzinsung angenommen. Damit beträgt das Kapital nach einem Jahr K 0 · (1 + 0 , 03 / 4) 4 = 2 . 000 . 000 · 1 , 0075 4 ≈ 2 . 060678 , 38 e . ■ Als Obergrenze der unterjährigen Verzinsung ergibt sich K 0 · e 0 , 03 = 2 . 000 . 000 · 1 , 030034 = 2 . 060 . 909 , 68 e ■ Will man mit einmaliger Verzinsung dasselbe Ergebnis wie mit der stetigen Verzinsung erzielen, so muss man das Kapital zum Zinsatz e 0 , 03 − 1 ≈ 3 , 045% verzinsen. 7.6.2 Rentenrechnung In der Rentenrechnung wird ein gegebenes Kapital K 0 durch periodisch anfallende Auszahlungen r > 0 verringert. Gleichzeitig wird das Restkapital wieder zum Zinsfuß p verzinst. Dann ergibt sich das Kapital nach n Perioden zu K n = K 0 q n − r q n − 1 q − 1 Verbunden damit sind folgende Fragestellungen: [1] Vorgegeben sind K 0 und n , d.h. das Kapitel soll nach n Perioden aufgebraucht sein, d.h. es soll K n = 0 gelten. Wie hoch ist die periodische Auszahlung r ? Durch Auflösen der Grundformel nach r erhält man K 0 q n − r q n − 1 q − 1 = 0 ⇔ r q n − 1 q − 1 = K 0 q n ⇔ r = K 0 ( q − 1) q n q n − 1 [2] Vorgegeben sind K 0 und r . Wann ist das Kapital spätestens aufgebraucht? Dazu wird die Gleichung K n = 0 nach n aufgelöst: K 0 q n − r q n − 1 q − 1 = 0 ⇔ ( K 0 − r q − 1 ) q n = − r q − 1 ⇔ q n = 1 1 − K 0 q − 1 r 48818_Terveer.indd 156 48818_Terveer.indd 156 18.07.2023 11: 48: 57 18.07.2023 11: 48: 57 <?page no="157"?> 7.6 Finanzmathematische Folgen und Reihen 157 Damit diese Gleichung nach n auflösbar ist, muss bei Berücksichtigung von r > 0 der Nenner des Bruches größer als Null sein, d.h. es muss gelten 1 − K 0 q − 1 r > 0 ⇔ K 0 q − 1 r < 1 ⇔ K 0 < r q − 1 ⇔ K 0 ( q − 1) < r Der Kapitalzins gleicht dann also die Entnahme von Rentenbeträgen nicht aus. Im Fall K 0 ( q − 1) < r ergibt sich durch Logarithmieren q n = 1 1 − K 0 q − 1 r ⇔ ln( q n ) = ln( 1 1 − K 0 q − 1 r ) ⇔ n = − ln ( 1 + K 0 q − 1 r ) ln( q ) Falls K 0 ≥ r q − 1 , so kann kein solcher Zeitpunkt gefunden werden, das Kapital bleibt also unendlich lange erhalten bzw. vermehrt sich trotz Verrentung. Der Wert r = ( q − 1) K 0 = p 100 K 0 stellt die ewige Rente dar. Diese entspricht genau dem Zins der Anfangsperiode, d.h. das Startkapital verändert sich nicht. [3] Vorgegeben sind n und K n . Welches Kapital K 0 wird für die Auszahlung benötigt? Durch Auflösen der Grundformel nach K 0 ergibt sich K 0 q n − r q n − 1 q − 1 = K n ⇔ K 0 = K n q n + r q n − 1 ( q − 1) q n Soll das Kapital mit Auszahlung der n -ten Rende aufgebraucht werden, d.h. K n = 0 gelten, so entfällt der erste Summand K n / q n , und K 0 heißt Barwert der Rente r . Bei der ewigen Rente ist K 0 = r q − 1 dieser Barwert vgl. Unterabschnitt 7.6.4 . Beispiel 7.49 Ein Kapital von K 0 = 2 . 000 . 000 e wird zur Auszahlung einer jährlichen Rente von 70 . 000 e verwendet. Angenommen ist ein Zinssatz von 3% (d.h. q = 1 , 03). ■ Das Kapital inklusive seiner Erträge reicht ewig, wenn r q − 1 ≤ K 0 . In diesem Fall gilt r q − 1 = 70 . 000 0 , 03 ≈ 2 . 333 . 333 > 2 . 000 . 000, also reicht das Kapital nicht ewig. ■ Das Kapital ist nach spätestens n Jahren aufgebraucht, wobei n ∈ N minimal mit n ≥ − ln(1 − K 0 q − 1 r ) ln( q ) = − ln(1 − 2 . 000 . 000 2 . 333 . 333 ) ln(1 , 03) ≈ 65 , 83 ist. Also ist das Kapital spätestens nach 66 Jahren aufgebraucht. ■ Es sei vereinbart, dass die Rente nur 20 Jahre ausgezahlt werden muss. Sie wird so hoch gewählt, dass das Kapital nach 20 Jahren auf 0 e fällt. Die Rente beträgt r = K 0 q 20 ( q − 1) q 20 − 1 = 2 . 000 . 000 1 , 03 20 · 0 , 03 1 , 03 20 − 1 ≈ 134431 , 41 e 7.6.3 Annuitätenrechnung Bei der Festlegung von Darlehnskonditionen, vor allem bei Immobiliendarlehen kommt die Annuitätentilgung zur Anwendung: ■ Die Restschuld eines Darlehns verringert sich durch regelmäßige und konstante Zahlungen , die Annuitäten (von lat. annus: das Jahr). 48818_Terveer.indd 157 48818_Terveer.indd 157 18.07.2023 11: 48: 58 18.07.2023 11: 48: 58 <?page no="158"?> 158 7 Folgen und Reihen ■ Die Annuität besteht aus einem Zinsanteil für das Darlehn und einem Tilgungsanteil zur Reduktion der Restschuld. Weil die Restschuld sinkt, steigt der Tilgungsanteil von Jahr zu Jahr, das Darlehen ist also in endlicher Zeit zurückgezahlt; der zur ewigen Rente analoge Fall tritt nicht ein. ■ Die Annuität wird bei unterjähriger Rechnung auf monatliche nachschüssige Teilbeträge aufgeteilt. Konkret liegt bei der Annuitätentilgung folgende Situation vor: Der Darlehensnehmer zahlt einen jährlich festen Betrag, eben die Annuität (von lat. annus: das Jahr) in 12 gleich großen monatlichen Beträgen aufgespalten mit unterjähriger Berechnung der Restschuld. Durch Reduzierung des Darlehens verringert sich der in Abzug zu bringende Zinsanteil der Annuität, so dass gegen Ende der Laufzeit eines Annuitätendarlehens nahezu die komplette Annuität zur Tilgung verwendet wird. Bezeichnet K 0 > 0 den Umfang des Darlehens, p den Zinsfuß und r > 0 die konstante Raten je Periode, so gilt wieder die Grundformel K n = K 0 q n − r q n − 1 q − 1 Auch hier lässt sich der Zeitpunkt der Abbezahlung des Darlehens durch Auflösen der Gleichung K n = 0 nach n zu n = − ln ( 1 − K 0 q − 1 r )/ ln( q ) ermitteln. Man erkennt zum einen, dass die periodische Zahlung r den Anfangszinsbetrag K 0 p 100 übersteigen sollte, um das Darlehen überhaupt tilgen zu können. Außerdem ist ersichtlich, dass nicht allein die Höhe der Rate r , sondern auch der Zinsfuß p die Laufzeit des Darlehens beeinflusst. Wenn beispielsweise ein Jahres-Zinssatz p/ 100 und ein Jahres-Tilgungssatz t/ 100 zum Ausgangsdarlehen K 0 vereinbart ist, so entspricht dies einer monatlichen Zahlung r = p + t 12 · 100 K 0 und die Laufzeit (in Monaten) beträgt n = − ln ( 1 − K 0 p 100 1 12 1 100 p + t 12 K 0 )/ ln(1 + p 100 1 12 ) = − ln(1 − p p + t ) ln(1 + p 1200 ) Die Laufzeit ist monoton fallend in p . In Abbildung 7.6 ist sie abhängig von Zins und Tilgung dargestellt. Der Fall p = 0 bedeutet, dass keine Zinsen anfallen und die Restschuld linear mit der Tilgung abnimmt, in diesem Fall ist die Laufzeit 1200 t und sie ergibt sich auch als Grenzwert des obigen Ausdrucks für p → 0, was mit der Regel von l’Hospital vgl. Satz 8.27, S. 195 hergeleitet werden kann 7.6.4 Barwert und Endwert Bei Barbzw. Endwert handelt es sich um finanzmathematische Kennzahlen, die den Wert einer Zahlung zu einem früheren bzw. späteren Zeitpunkt beschreiben als demjenigen, zu dem sie getätigt wurde. Der Endwert einer Gegenwartszahlung r ist der künftige Wert der (nachschüssigen) Gegenwartszahlung r in k Jahren unter der Annahme eines konstanten Jahreszinssatzes p . Weil aufgrund der Nachschüssigkeit der Zahlung das erste Jahr bei der Verzinsung 48818_Terveer.indd 158 48818_Terveer.indd 158 18.07.2023 11: 48: 59 18.07.2023 11: 48: 59 <?page no="159"?> 7.6 Finanzmathematische Folgen und Reihen 159 2 4 6 8 10 Zinsfuß 20 40 60 80 100 Rückzahlung in Jahren Tilgung: 1% Tilgung: 2% Tilgung: 4% Tilgung: 10% Abbildung 7.6: Laufzeit eines Annuitätendarlehns in Abhängigkeit von Zins und Tilgung nicht mitzählt, beträgt der Endwert dann r · q k − 1 , wobei q = 1 + p/ 100. Nimmt man nun an, dass eine Rente r jährlich am Ende eines Jahres ausgezahlt wird, so wird zur Berechnung des Rentenendwertes jede dieser Auszahlungen gemäß der obigen Überlegung verzinst. Das ergibt nach n Jahren RE = n ∑ k =1 r · q k − 1 = r q n − 1 q − 1 = r (1 + p/ 100) n − 1 p/ 100 Will man damit beispielsweise verschiedene Investitionsmöglichkeiten vergleichbar machen, so hat man oft die Schwierigkeit, dass diese keinen gemeinsamen Endzeitpunkt haben. Deshalb ist es eher üblich, auf einen gemeinsamen Anfangszeitpunkt etwa denjenigen, zu dem man die Investion vornehmen möchte - „rückwärts“ zu rechnen. Dies geschieht anhand des Barwertes, welcher den Gegenwartswert P V (engl.: present value) einer künftigen Zahlung r > 0 beschreibt, unter der Annahme, dass diese künftige Zahlung zum gegenwärtigen Zeitpunkt ausgezahlt wird und durch Verzinsung an dem künftigen Zeitpunkt genau dem dann zu tätigenden Zahlungsbetrag r entspricht. Liegt die künftige Zahlung r am Ende des n -ten Jahres, so wird sie aus dem Barwert P V durch r = P V · q n . Durch Umstellung nach P V ergibt sich die Grundformel für den Barwert einer künftigen Zahlung P V = r/ q n Werden jetzt über n Jahre bei konstantem Zinssatz p jährlich Zahlungen r > 0 geleistet, so wird jede von ihnen durch die obige Grundformel mit individueller Anzahl von Jahren auf einen Barwert zurückgerechnet; diese Werte werden dann saldiert. Es ergibt sich der Rentenbarwert ■ der ewigen Rente: P V e = r q + ( r q 2 ) + · · · = r q (1 + r q + ( r q 2 ) + · · · = r q 1 1 − 1 q = r q − 1 , ■ der n -maligen Rente: P V = r q + · · · + r q n = r q 1 − 1 qn 1 − 1 q = r q − 1 (1 − 1 q n ) = P V e (1 − 1 q n ). Beachten Sie, dass beide Formeln bereits in ähnlicher Form in der Rentenrechnung hergeleitet wurden vgl. Abschnitt 7.6.2 . 48818_Terveer.indd 159 48818_Terveer.indd 159 18.07.2023 11: 49: 01 18.07.2023 11: 49: 01 <?page no="160"?> 160 7 Folgen und Reihen Beispiel 7.50 Anstelle einer jährlichen (nachschüssigen) Rente von 60.000 e möchte ein Lotteriegewinner eine sofortige Einmalzahlung erhalten. Diese entspricht dem Rentenbarwert. Wenn beispielsweise bei einem Zinssatz von 3,5% die Rente eine Laufzeit von 20 Jahren haben soll, so errechnet man ■ den Barwert der ewigen Rente P V e = 60 . 000 0 , 035 ≈ 1 . 714 . 285 , 7 e , ■ den Barwert der n -maligen Rente: P V = 60 . 000 0 , 035 (1 − 1 1 , 035 20 ) ≈ 852 . 744 , 19 7.6.5 Kapitalwert Der Kapitalwert N P V („net present value“) ist eine als Barwert angegebene Kennziffer einer Investition I > 0. In ihr werden die Investition selbst, aus ihr resultierende zeitlich nachfolgende Zahlungen/ Rückflüsse r 1 , . . . , r n und der so genannte Liquidationserlös ℓ ≥ 0 zusammengeführt. Es wird angenommen, dass im Zeitraum zwischen zwei (nachschüssigen) Rückflüssen jeweils derselbe Zinssatz p vorliegt. Der Kapitalwert setzt sich dann zusammen aus ■ der Gegenwarts-Investition als Soll − I . ■ den Rückzahlungen r k in Periode k = 1 , . . . , n mit Barwerten r k / q k . ■ dem Liquidationserlös ℓ am Ende von Periode n , der sich aus der Veräußerung der Anlageform ergibt und wie ein Rückfluss in den Barwert ℓ/ q n überführt wird. Die Formel für den Kapitalwert lautet dann N P V : = − I + n ∑ k =1 r k (1 + p 100 ) k + ℓ (1 + p 100 ) n Bei konstanten Zahlungen folgt unter Verwendung der geometrischen Summe: N P V = − I + r · ( q n − 1) q n p 100 + ℓ (1 + p 100 ) n Ist der Kapitalwert einer Investition größer als Null, so lohnt sich die Anlage im Vergleich zu einer Anlage von I mit Zinsatz p , welche ohne weitere Ein/ Auszahlungen auskommt. Eine Investition mit N P V = 0 ist gleichwertig zu einer Anlage von I mit dem vorliegenden Zinsfuß p . Dieser wird dann als interner Zinsfuß bezeichnet. Beispiel 7.51 Aus einer Investition von 400.000 e erhält man über 10 Jahre Erträge von jährlich 30.000 e . Das Objekt wird nach 10 Jahren zu einem Preis von 500.000 e veräußert. Diese Investition hat bei einem Zinssatz von 5 , 5% den Kapitalwert N P V = − 400 . 000 + 30 . 000(1 , 055 10 − 1) 1 , 055 10 · 0 , 055 + 500 . 000 1 , 055 10 = 118 . 844 48818_Terveer.indd 160 48818_Terveer.indd 160 18.07.2023 11: 49: 02 18.07.2023 11: 49: 02 <?page no="161"?> 7.6 Finanzmathematische Folgen und Reihen 161 Ihr interner Zinsfuß ergibt sich durch Nullsetzen des Kapitalwertes als Formel in p − 400 . 000 + 30 . 000( q 10 − 1) q 10 ( q − 1) + 500 . 000 q 10 = 0 ⇔ q 10 − 3 40 q 10 − 1 q − 1 − 5 4 = 0 ⇔ q 11 − 1 , 075 · q 10 − 1 , 25 · q + 2 , 12 = 0 Dies ist eine polynomiale Gleichung 11. Grades, die man z.B. mit dem Newton- Verfahren vgl. Unterabschnitt 8.5.1 näherungsweise lösen kann. Es ergibt sich q ≈ 1 , 09135, also hat die Investition den internen Zinsfuß p ≈ 9 , 14. Übungen zu Abschnitt 7.5 ? 28. Berechnen Sie die Formel der Kapitalentwicklung bei konstantem Zins, wenn eine konstante Einzahlung jeweils vorschüssig (zu Beginn des Jahres) erfolgt. 29. Es wird ein Bausparvertrag mit Zinssatz 2 , 4% abgeschlossen, der bei Fälligkeit in 12 Jahren ein Guthaben von 40000 e aufweisen soll. Wie hoch müssen nachschüssige Einzahlungen sein, wenn sie a) einmal am Ende jedes Jahres, b) 4-mal jährlich am Ende jedes Quartals, c) 12-mal jährlich am Monatsende erfolgen? Tipp: b),c) unterjährig rechnen. 30. Ein Kapital von 10000 e wächst stetig verzinst binnen Jahresfrist um 360 e an. a) Welcher Jahreszinssatz liegt zugrunde? b) Wie hoch ist der Barwert eines Kapitals, welches bei vierteljährlicher Verzinsung mit dem berechneten Jahreszinssatz nach einem Jahr den gleichen Endwert hat wie das oben stetig verzinste Kapital? 31. Eine Rente von 1250 e soll über 20 Jahre monatlich ausgezahlt werden. a) Welches Kapital muss hierfür zu Beginn bereit stehen, wenn von einem Jahreszinssatz von 3 , 5% ausgegangen werden kann? b) Welches Kapital braucht man bei diesem Zinssatz für die ewige Rente? 32. Sie wollen 400.000 e investieren und können dabei zwischen zwei Objekten mit den folgenden Rückflüssen wählen: Jahr Objekt 1 Objekt 2 1 50.000 400.000 2 100.000 100.000 3 500.000 50.000 Kalkulationszinssatz ist 8%. Der Liquidationserlös ist im Rückfluss des 3. Jahres enthalten. Vergleichen Sie die beiden Investitionsmöglichkeiten jeweils anhand ihres Kapitalwertes und anhand ihres internen Zinsfußes. 33. Bei einer Investition ergeben sich über 20 Jahre Rückflüsse von jährlich 20.000 e und am Ende des 20. Jahres ein Liquidationserlös von 150 . 000 e . Wie hoch ist die Investition bei einem internen Zinsfuß von 7%? Zusammenfassung Folgen sind ein wichtiges Hilfsmittel zur Beschreibung real in der Zeit ablaufender Vorgänge, der mit ihnen verbundene Grenzwertbegriff ist die Grundlage der Differentialrechnung. Für Saldierungsvorgänge werden Partialsummenfolgen und ihre Grenzwerte, 48818_Terveer.indd 161 48818_Terveer.indd 161 18.07.2023 11: 49: 04 18.07.2023 11: 49: 04 <?page no="162"?> 162 7 Folgen und Reihen die unendlichen Reihen benötigt. Letztere erlauben als Potenzreihen die numerische Berechnung der meisten Funktionen abseits von Polynomen. Mit der geometrischen Reihe und deren Partialsumme werden viele finanzmathematische Fragestellungen behandelt. Nach Bearbeitung dieses Kapitels können Sie ■ Folgen in ihrer expliziten und impliziten Darstellung aus konkreten Sachverhalten herleiten, insbesondere mittels arithmetischer und geometrischer Folgen, und die Darstellungen ineinander überführen, ■ das Grenzwertkonzept zur Berechnung von Grenzwerten in einfacheren Situationen umsetzen, ■ Grenzwerte von Folgen anhand von Grenzwertsätzen und eine Formelsammlung von Standard-Grenzwerten berechnen, ■ Partialsummen und deren Grenzwerte zu gegebenen Folgen berechnen und unendliche Reihen mit Majoranten- und Quotientenkriterium auf Konvergenz prüfen, insbesondere, wenn es sich dabei um Potenzreihen handelt, ■ grundlegende Entwicklungsszenarien für Kapital unter Ein- und Auszahlung im Sachzusammenhang erkennen und Bar- und Endwert von Zahlungsreihen ermitteln sowie für Investitionen Kapitalwert und internen Zinsfuß bestimmen und zur Beurteilung heranziehen. 48818_Terveer.indd 162 48818_Terveer.indd 162 18.07.2023 11: 49: 04 18.07.2023 11: 49: 04 <?page no="163"?> 8 Differentialrechnung in einer Variablen Mit Sicherheit hat kein anderes mathematisches Konzept einen solch starken Einfluss in Mathematik und anderen Wissenschaften gehabt wie die Ableitung. Von der Extremwertrechnung bis zur Modellierung dynamischer Prozesse findet sie sich in nahezu allen quantitativen Anwendungen, und nicht zuletzt auch in der Ökonomie. Neben den Fundamenten, d.h. dem Konzept des Funktionsgrenzwertes, dem eigentlichen Ableitungskonzept für Funktionen einer Variablen und dem damit verbundenen Kalkül werden wir auf die Anwendungen der Ableitung in der Ökonomie z.B. in Form der Marginalanalyse (Kurvendiskussion) und in der Extremwertrechnung eingehen. 8.1 Funktionsgrenzwerte Die Analysis beschäftigt sich mit der mathematischen Erfassung des „unendlich Kleinen“ und „unendlich Großen“ und fußt im Wesentlichen auf dem Konzept des Grenzwertes. Das fängt schon mit dem grundsätzlichen Verständnis an, was man unter einer reellen Zahl versteht. Ohne den Grenzwertbegriff lässt sich die Zahlbereichserweiterung von den rationalen auf die reellen Zahlen nur unvollständig durchführen; es bleibt bei Beispielen wie √ 2 oder anderen so genannten algebraischen Zahlen (Nullstellen ganzrationaler Funktionen, die rationale Zahlen als Koeffizienten haben), während die prominentesten in den quantitativen Wissenschaften verwendeten Zahlen π , e usw. sich einem genaueren Verständnis entziehen. Grenzwerte unterstützen die Konzepte der Analysis konzeptionell: ■ Stetigkeit wird anhand von Funktionsgrenzwerten beschrieben. ■ Differenzierbarkeit lässt sich anhand der Tangentensteigung als Grenzwert von Sekantensteigungen einer Funktion behandeln. ■ Integrale als Flächeninhalte unter Funktionen ergeben sich als Grenzwerte durch Ausschöpfung - beispielsweise mittels Rechteckssummen. 8.1.1 Von Folgengrenzwerten zu Funktionsgrenzwerten Zu Funktionsgrenzwerten gibt es im Wesentlichen zwei Ansätze: unter Verwendung von Folgengrenzwerten und mittels ε − δ -Formulierung. Als Einstieg verwendet man meist die Folgengrenzwerte. Dazu betrachtet man Folgen n → ( x n | f ( x n )) auf dem Graphen einer Funktion f , bei denen die Argumentfolgen n → x n gegen einen Grenzwert x 0 konvergieren, vgl. Abbildung 8.1. 48818_Terveer.indd 163 48818_Terveer.indd 163 18.07.2023 11: 49: 05 18.07.2023 11: 49: 05 <?page no="164"?> 164 8 Differentialrechnung in einer Variablen Abbildung 8.1: Illustration des Grenzwertes bei Funktionen Definition 8.1 ! Für eine Funktion f : D → R und ein x 0 ∈ R heißt eine Zahl y ∈ R Grenzwert von f ( x ) für x gegen x 0 , wenn für jede Folge ( x n ) n ∈ N in D mit x n ̸ = x 0 für n ∈ N und lim n →∞ x n = x 0 gilt lim n →∞ f ( x n ) = y 0 . Man schreibt dann lim x → x 0 f ( x ) = y 0 und sagt: f ( x ) konvergiert gegen y 0 für x gegen x 0 . Beachten Sie, dass der Wert x 0 , dem man sich annähert, nicht im Definitionsbereich D von f liegen muss. So lassen sich beispielsweise auch Funktionsgrenzwerte in Definitionslücken x 0 von f formulieren. In diesem Fall gilt für die eingesetzen Folgen ( x n ) n ∈ N natürlich x n ̸ = x 0 . Wenn man x 0 durch Folgen aus D heraus gar nicht annähern kann (isolierte Punkte), so lässt sich kein Grenzwert berechnen. Ansonsten gilt: Für x 0 ∈ D ist lim x → x 0 f ( x ) = f ( x 0 ) oder der Grenzwert existiert nicht. Denn die konstante Folge ( x n ) n ∈N mit x n = x 0 für alle n ergibt lim n →∞ f ( x n ) = lim n →∞ f ( x 0 ) = f ( x 0 ) (siehe das folgende Beispiel). Damit der Grenzwert existiert, muss f ( x ) auch für alle anderen Folgen mit lim n →∞ x n = x 0 der Grenzwert sein. Beispiel 8.1 [1] Mit c ∈ R gilt lim x → x 0 c = c , denn mit f ( x ) = c , lim n →∞ x n = x 0 gilt lim n →∞ f ( x n ) = lim n →∞ c = c . [2] Mit x 0 ∈ R gilt lim x → x 0 x = x 0 , denn mit f ( x ) = x und lim n →∞ x n = x 0 gilt auch lim n →∞ f ( x n ) = lim n →∞ x n = x 0 . [3] Mit x 0 ∈ R gilt lim x → x 0 x 2 = x 20 , denn mit f ( x ) = x 2 und lim n →∞ x n = x 0 gilt lim n →∞ f ( x n ) = lim n →∞ x 2 n = lim n →∞ x n · lim n →∞ x n = x 20 . [4] Mit x 0 ≥ 0 gilt lim x → x 0 √ x = √ x 0 , denn mit f ( x ) = √ x und lim n →∞ x n = x 0 gilt auch lim n →∞ f ( x n ) = lim n →∞ √ x n = √ x 0 , vgl. Beispiel 7.12, S. 134 Die vorangegangenen Beispiele sind typisch für Grenzwerte bei stetigen Funktionen vgl. S. 173 . Man darf hier die Variable x im Ausdruck f ( x ) einfach durch ihren Grenzwert f ( x 0 ) ersetzen. Bei Definitionslücken sind aber oft noch Zwischenschritte nötig: 48818_Terveer.indd 164 48818_Terveer.indd 164 18.07.2023 11: 49: 07 18.07.2023 11: 49: 07 <?page no="165"?> 8.1 Funktionsgrenzwerte 165 Beispiel 8.2 lim x → 1 x 2 − 1 x − 1 = 2. Für x ̸ = 1 gilt nämlich x 2 − 1 x − 1 = ( x − 1)( x +1) x − 1 = ( x + 1); jetzt darf die Grenzwertberechnung durch Einsetzen von x = 1 in den Term x + 1 erfolgen. Das Beispiel zeigt eine Möglichkeit auf, wie man Funktionsgrenzwerte bei einem Bruchterm, dessen Zähler und Nenner eines Bruchs mit x → x 0 Null werden, berechnen kann. Man vereinfacht unter der Annahme x ̸ = x 0 , was oft auf Kürzen hinausläuft, und setzt dann x 0 ein, wenn dies möglich ist. Es gibt noch weitere Möglichkeiten, die aber dann das Konzept der Ableitung benötigen: ■ Die Bruchterme werden als Differenzenquotienten von Funktionen interpretiert, der Grenzwert ist dann die Ableitung. ■ Zähler und Nenner werden abgeleitet, für das Ergebnis wird dann der Grenzwert berechnet. Dies wird als Regel von L’Hospital bezeichnet vgl. S. 195 . Ein gleichwertiger Zugang zum Funktionsgrenzwert ohne Rückgriff auf Folgengrenzwerte ist die Festlegung über ein „ ϵ δ -Kriterium“, mit dem formal festgelegt wird, dass f ( x ) nahe genug bei y liegt, wenn x nur nahe genug an x 0 liegt: Satz 8.1 Zu einer Funktion f : D → R und x 0 ∈ D gilt lim x → x 0 f ( x ) = y genau dann wenn es zu jedem ϵ > 0 ein δ > 0 gilt, so dass für alle x ∈ D mit | x − x 0 | < δ gilt: | f ( x ) − f ( x 0 ) | < ϵ . Die Argumentationen zur Bestimmung von Grenzwerten sind aber dann oft sehr ähnlich zu denen, die das Folgenkonzept verwenden. 8.1.2 Einseitige Funktionsgrenzwerte Die Folgen ( x n ) n ∈ N , die zur Festlegung von Funktionsgrenzwerten lim x → x 0 f ( x ) erforderlich sind, müssen stets im Definitionsbereich D von f liegen. Dabei kann es vorkommen, dass ■ eine Annäherung an x 0 nur von links oder nur von rechts möglich ist, beispielsweise, wenn D = [ a ; b ] ein Intervall ist und der Grenzwert lim x → a f ( x ) oder lim x → b f ( x ) gesucht ist. Im Falle von offenen oder halboffenen Intervallen ] a ; b [ oder ] a ; b ] oder [ a ; b ] wird möglicherweise der Grenzwert an einer Stelle ( a bzw. b ) gesucht, die gar nicht zum Definitionsbereich von f gehört. ■ x 0 eine Stelle der Funktion ist, so dass die Funktion in jedem x 0 umgebenden Intervall I durch Fallunterscheidung x < x 0 versus x > x 0 erklärt wird. Beispiel 8.3 Betrachten Sie die „Sprungfunktion“ x → 1 [0; ∞ [ ( x ) mit x 0 = 0. Hier ist x n = − 1 n eine Folge mit Grenzwert Null. Wenn man diese Folge einsetzt, so ergibt sich die Funktionswertfolge 0 , 0 , . . . mit Grenzwert Null. Mit der ebenfalls gegen Null konvergenten Folge x n = 1 n ergibt sich die Funktionswertfolge 1 , 1 , . . . mit Grenzwert 1. Es findet sich also kein eindeutiger Funktionsgrenzwert. Hilfreich ist dann eine „einseitige“ Version des Grenzwertbegriffs, bei denen nur Folgen links bzw. nur Folgen rechts von x 0 berücksichtigt werden. 48818_Terveer.indd 165 48818_Terveer.indd 165 18.07.2023 11: 49: 10 18.07.2023 11: 49: 10 <?page no="166"?> 166 8 Differentialrechnung in einer Variablen Definition 8.2 (Einseitige Grenzwerte von Funktionen) ! Es sei f : D → R eine Funktion und x 0 ∈ R ■ y ∈ R heißt linksseitiger Grenzwert von f für x gegen x 0 , in Formelschreibweise y = f ( x − 0 ) = lim x ↑ x 0 f ( x ), wenn lim n →∞ f ( x n ) = y für jede Folge ( x n ) n ∈ N in D mit x n ≤ x 0 und lim n →∞ x n = x 0 . ■ y ∈ R heißt rechtsseitiger Grenzwert von f für x gegen x 0 , in Formelschreibweise y = f ( x +0 ) = lim x ↓ x 0 f ( x ), wenn lim n →∞ f ( x n ) = y für jede Folge ( x n ) n ∈ N in D mit x n ≥ x 0 und lim n →∞ x n = x 0 . Beispiel 8.4 Die Sprungfunktion im Beispiel 8.3 hat keinen Grenzwert lim x → 0 f ( x ), weil schon ihr linksseitiger Grenzwert lim x ↑ 0 f ( x ) nicht existiert. Dieser müsste nach den Überlegungen im Anschluss an Definition 8.1 mit f (0) = 1 übereinstimmen, andererseits hat wie im vorigen Beispiel erläutert, die Funktionsfolge f ( − 1 n ) den Grenzwert 0. In Unterscheidung zu den einseitigen Grenzwerten wird der Grenzwert gemäß Definiton 8.1 auch oft als „beidseitiger“ Grenzwert bezeichnet. Es ist klar, dass aus der Existenz des beidseitigen Grenzwertes jeweils die Existenz der einseitigen Grenzwerte folgt (weil ja nur spezielle Funktionswertfolgen, einmal von links und einmal von rechts betrachtet werden). Existieren aber die einseitigen Grenzwerte und stimmen überein, so existiert auch der beidseitige Grenzwert: Satz 8.2 Falls links- und rechtsseitige Grenzwerte f ( x − 0 ) und f ( x +0 ) gebildet werden können, so gilt: lim x → x 0 f ( x ) existiert genau dann, wenn f ( x − 0 ) = f ( x +0 ). Dann ist lim x → x 0 f ( x ) = f ( x ± 0 ). Bei Funktionen f : [ a ; b ] → R und x 0 ∈ { a, b } sind die Funktionsgrenzwerte lim x → x 0 f ( x ) natürlich ausschließlich als einseitige Grenzwerte zu berechnen. Das gilt sinngemäß auch für die gleich noch besprochenen uneigentlichen Grenzwerte lim x →±∞ f ( x ). 8.1.3 Methoden zur Bestimmung von Funktionsgrenzwerten Die Methoden zur Bestimmung von Folgengrenzwerten kann man nun fallweise für Funktionsgrenzwerte ausführen, wie in den obigen Beispiel erläutert. Einfacher ist es aber, die bereits für Folgengrenzwerte bekannten Techniken generisch auf Funktionsgrenzwerte zu übertragen. Vor allem das Trichterprinzip und die Grenzwertsätze stellen sich hier als nützlich heraus. Satz 8.3 (Trichterprinzip) Seien f, g, h : D → R Funktionen mit f ( x ) ≤ g ( x ) ≤ h ( x ) für alle x ∈ D. Falls dann gilt lim x → x 0 f ( x ) = lim x → x 0 h ( x ) = y ∈ R, so gilt auch lim x → x 0 g ( x ) = y . Das Trichterprinzip gilt sinngemäß auch für einseitige Grenzwerte. 48818_Terveer.indd 166 48818_Terveer.indd 166 18.07.2023 11: 49: 12 18.07.2023 11: 49: 12 <?page no="167"?> 8.1 Funktionsgrenzwerte 167 Abbildung 8.2: Planskizze zu den Grenzwerten in Beispiel 8.6 Beispiel 8.5 Ein für die Differentialrechnung der Eulerschen Exponentialfunktion wichtiger Grenzwert ist lim x → 0 e x − 1 x = 1. Dieser Grenzwert ergibt sich durch die Ungleichungen 1 + x ≤ e x vgl. Satz 6.4, S. 105 und e x ≤ 1 1 − x . Die zweite Ungleichung folgt, wenn man in der ersten Ungleichung x durch − x ersetzt, d.h. e − x ≥ 1 − x ⇔ e x ≤ 1 1 − x . ■ Für x > 0 folgt daraus 1+ x − 1 x ≤ e x − 1 x ≤ 1 1 − x − 1 x . Vereinfacht man den linken und den rechten Term in dieser Ungleichungskette, so erhält man 1 ≤ e x − 1 x ≤ 1 1 − x . ■ Für x < 0 ergibt sich ganz entsprechend (wobei sich die Ungleichungszeichen bei Division durch x < 0 umkehren) 1 1 − x ≤ e x − 1 x ≤ 1. Sowohl für x > 0 als auch für x < 0 wird der Ausdruck e x − 1 x also durch zwei Ausdrücke „eingeschachtelt“, deren einseitige Grenzwerte für x ↓ 0 bzw. x ↑ 0 gegen 1 konvergieren. Nach dem Trichterprinzip folgt also die eingangs genannte Grenzwertaussage. Beispiel 8.6 Für die Differentialrechnung mit trigonometrischen Funktionen werden die folgenden Grenzwerte benötigt: lim α → 0 cos( α ) − 1 α = 0 und lim α → 0 sin( α ) α = 1. Wir betrachten zunächst die rechtsseitigen Grenzwerte und legen die Planskizze in Abbildung 8.2 zugrunde. Dann gilt für α > 0 im Bogenmaß gemessen: α 2 ≥ a 2 = sin 2 ( α ) + (1 − cos( α )) 2 = sin 2 ( α ) + 1 − 2 cos( α ) + cos 2 ( α ) = 2(1 − cos( α )) Daraus folgt 0 ≤ 1 − cos( α ) α ≤ α 2 , und nach Trichterprinzip lim α ↓ 0 cos( α ) − 1 α = 0 . Für den zweiten rechtsseitigen Grenzwert liest man aus der Planskizze ab: sin( α ) ≤ α ≤ sin( α ) + (1 − cos( α )) ≤ sin( α ) + α 2 2 , also α − α 2 2 ≤ sin( α ) ≤ α . Daraus folgt 1 − α 2 ≤ sin( α ) α ≤ 1 und nach dem Trichterprinzip lim α ↓ 0 sin( α ) α = 1 Linksseitige Grenzwerte erhält man mit den Symmetrieeigenschaften von (Co)Sinus: ■ lim α ↑ 0 cos( α ) − 1 α = lim α ↑ 0 − cos( − α ) − 1 − α = lim α ↓ 0 − cos( α ) − 1 α = 0 ■ lim α ↑ 0 sin( α ) α = lim α ↑ 0 − sin( − α ) α = lim α ↑ 0 sin( − α ) − α = lim α ↓ 0 sin( α ) α = 1 Hier wurde der folgende Zusammenhang zwischen links- und rechtsseitigen Grenzwerte 48818_Terveer.indd 167 48818_Terveer.indd 167 18.07.2023 11: 49: 15 18.07.2023 11: 49: 15 <?page no="168"?> 168 8 Differentialrechnung in einer Variablen gegen Null ausgenutzt: Es gilt stets lim x ↑ 0 f ( x ) = lim x ↓ 0 f ( − x ) bzw. lim x ↓ 0 f ( x ) = lim x ↑ 0 f ( − x ) Bei zusammengesetzten Funktionen lassen sich Grenzwerte oft auf Grenzwerte „einfacher“ Bestandteile zurückführen. Satz 8.4 (Grenzwertsätze) Es seien g, h : D → R zwei Funktionen und x 0 ∈ D. Mit den Grenzwerten lim x → x 0 g ( x ) ∈ R und lim x → x 0 h ( x ) ∈ R existieren auch die folgenden Grenzwerte: [1] lim x → x 0 ( c · g ( x )) = c · lim x → x 0 g ( x ) für alle c ∈ R. [2] lim x → x 0 ( g ( x ) + h ( x )) = lim x → x 0 g ( x ) + lim x → x 0 h ( x ). [3] lim x → x 0 ( g ( x ) h ( x )) = lim x → x 0 g ( x ) lim x → x 0 h ( x ). [4] lim x → x 0 g ( x ) / h ( x ) = lim x → x 0 g ( x ) / lim x → x 0 h ( x ), falls lim x → x 0 h ( x ) nicht Null ist. Dies folgt unmittelbar aus Satz 7.3 vgl. S. 137 und gilt sinngemäß auch für einseitige Grenzwerte. Für die Verkettung von Funktionen gibt es ebenfalls einen Grenzwertsatz: Satz 8.5 Es seien g : D g → R und h : D h → R Funktionen mit g ( x ) ∈ D h für alle x ∈ D g . Für x 0 ∈ D g existiere y 0 = lim x → x 0 g ( x ) ∈ D h und lim y → y 0 h ( y ). Dann gilt lim x → x 0 ( h ◦ g )( x ) = lim y → y 0 h ( y ) Beispiel 8.7 Mit den Grenzwertsätzen zeigen wir lim x → x 0 e x = e x 0 für jedes x 0 ∈ R. Es gilt nämlich e x = e x 0 + ( e x − e x 0 ) = e x 0 (1 + e x − x 0 − 1) = e x 0 (1 + e x n − x − 1) = e x 0 (1 + e x − x 0 − 1 x − x 0 ( x − x 0 )) und dieser Ausdruck lässt sich mittels Verkettung und Produkt von Funktionen schreiben, e x = ( h ◦ g )( x ), wobei gilt: ■ g ( x ) = x − x 0 hat den Grenzwert lim x → x 0 g ( x ) = 0 ■ h ( y ) = e x 0 (1+ e y − 1 y y ) hat nach Beispiel 8.5 und Satz 8.4 den Grenzwert lim y → 0 h ( y ) = e x 0 (1 + 1 · 0) = e x 0 Es gilt dann lim x → x 0 e x = lim x → x 0 ( h ◦ g )( x ) = lim y → 0 h ( y ) = e x 0 . Die Aussage des letzten Beispiels besagt, dass die Exponentialfunktion stetig ist. Mit dem Werteverhalten von e x für x ∈ Q gemäß Satz 6.2 vgl. S. 103 lässt sich zudem nun das Werteverhalten 48818_Terveer.indd 168 48818_Terveer.indd 168 18.07.2023 11: 49: 18 18.07.2023 11: 49: 18 <?page no="169"?> 8.1 Funktionsgrenzwerte 169 von e x 0 auch für beliebige Werte x 0 ∈ R erklären. Es gilt nämlich e x 0 = lim n →∞ e x n , wobei n → x n eine (beliebige) Folge rationaler Zahlen ist, die gegen x 0 konvergiert. Wie bereits in Abschnitt 6.2 angedeutet, ist das generelle Werteverhalten der Eulerschen (aber auch der allgemeinen) Exponentialfunktion also durch die Werte e x mit rationalen Exponenten vollständig festgelegt. Der exakte Wert von e x 0 ist in aller Regel nicht rational und kann nur numerisch angenähert werden, beispielsweise mit dem Intervallhalbierungsverfahren oder mit der Darstellung als Potenzreihe. 8.1.4 Divergente und uneigentliche Grenzwerte Auch Divergenz kann mit der der Limesnotation erfasst werden: ■ Die Schreibweise lim x → x 0 f ( x ) = ∞ bedeutet: Für jede Folge ( x n ) n ∈ N mit x n → x 0 und jedes K > 0 gibt dann es ein n 0 ∈ N mit f ( x n ) > K für alle n ≥ n 0 d.h. „ f ( x ) wächst über jede Schranke K > 0, wenn x sich x 0 nähert. ■ Die Schreibweise lim x → x 0 f ( x ) = −∞ bedeutet: Für jede Folge ( x n ) n ∈ N mit x n → x 0 und jedes K > 0 gibt es ein n 0 mit f ( x n ) < − K für alle n ≥ n 0 , d.h. f ( x ) fällt unter jede Schranke − K < 0, wenn x sich x 0 nähert. ■ Beide Fälle bedeuten insbesondere lim x → x 0 1 f ( x ) = 0. Sie unterscheiden sich im Vorzeichenverhalten von f „nahe x 0 “. Auch für Übergänge x → ∞ (bzw. x → −∞ ) lassen sich Funktionsgrenzwerte erklären. Sie werden benötigt zur Beschreibung des ■ asymptotischen Verhaltens der Funktion (d.h. „im Unendlichen“, „Idealfall“). ■ Langfrist-Verhaltens, falls die Variable x die Fortschreibung der Zeit modelliert. Dabei nimmt man an, dass x jede noch so große (bzw. kleine) Schranke übersteigt (bzw. unterschreitet). Realisiert wird ein solcher Übergang durch Folgen ( x n ) n ≥ 1 mit folgender Eigenschaft: Zu jedem K > 0 sind fast alle x n > K , d.h. nur endlich viele x n ≤ K (bzw. fast alle x n < K , d.h. nur endlich viele x n ≥ K ). Man schreibt für eine solche Folge dann: lim n →∞ x n = ∞ (bzw. lim n →∞ x n = −∞ ). Einfachstes Beispiel ist die „Abzählfolge“ n → x n = n . Definition 8.3 ! Eine Zahl y ∈ R heißt (uneigentlicher) Grenzwert von f ( x ) für x → ∞ , wenn für jede Folge mit lim n →∞ x n = ∞ gilt: lim n →∞ f ( x n ) = y Wie beim Grenzwert x → x 0 verwendet man die Schreibweise lim x →∞ f ( x ) = y (entsprechend mit x → −∞ ) für den uneigentlichen Grenzwert. Die Grenzwertsätze aus Satz 8.4 und Satz 8.5 lassen sich, indem man den Grenzübergang x → x 0 durch x → ∞ oder x → −∞ ersetzt, wortwörtlich auf den Fall uneigentlicher Grenzwerte übertragen. 48818_Terveer.indd 169 48818_Terveer.indd 169 18.07.2023 11: 49: 21 18.07.2023 11: 49: 21 <?page no="170"?> 170 8 Differentialrechnung in einer Variablen Abbildung 8.3: Graph, Polstellenverhalten und Asymptote der gebrochenrationalen Funktion f ( x ) = x 2 +1 2 x − 1 Weiter kann es sowohl im eigentlichen als auch im uneigentlichen Fall vorkommen, dass die Funktionswertfolge n → f ( x n ) für jede Wahl der Argumentfolge x n → x 0 (bzw. x n → ∞ bzw. x n → −∞ ) jede vorgegebene Schranke überschreitet. Dann schreibt man lim x → x 0 f ( x ) = ∞ (bzw. = −∞ , sinngemäß auch für uneigentliche Grenzwerte). 8.1.5 Grenzwertverhalten gebrochen-rationaler Funktionen Wir wollen abschließend das eigentliche und uneigentliche Grenzwertverhalten von gebrochen-rationalen Funktionen f ( x ) = p ( x ) q ( x ) erläutern und betrachten zunächst den Grenzwert lim x → x 0 f ( x ). Für f findet man eine Darstellung f ( x ) = p ( x ) q ( x ) = p 1 ( x )( x − x 0 ) r q 1 ( x )( x − x 0 ) s mit r, s ≥ 0 (die Vielfachheiten der Nullstelle x 0 in Zähler- und Nennerpolynom) und p 1 ( x 0 ) ̸ = 0, q 1 ( x 0 ) ̸ = 0 vgl. Satz 5.10, S. 90 . Der Fall r = 0 bzw. s = 0 bedeutet, dass x 0 keine Nullstelle von p bzw. von q ist. Der Grenzwert ist abhängig von r und s : Satz 8.6 (Polstellenverhalten gebrochen-rationaler Funktionen) Die gebrochen-rationale Funktion f ( x ) = p ( x ) q ( x ) = p 1 ( x )( x − x 0 ) r q 1 ( x )( x − x 0 ) s , wobei r bzw. s die Vielfachheiten der Nullstelle x 0 von p bzw. q sind, hat für x → x 0 folgendes Grenzwertverhalten lim x → x 0 p ( x ) q ( x ) = 0 falls r > s p 1 ( x 0 ) q 1 ( x 0 ) falls r = s ∞ falls r < s und s − r gerade und p 1 ( x 0 ) q 1 ( x 0 ) > 0 −∞ falls r < s und s − r gerade und p 1 ( x 0 ) q 1 ( x 0 ) < 0 In den letzten beiden Fällen heißt x 0 Polstelle ohne Vorzeichenwechsel von f . Gilt schließlich r < s und ist s − r ungerade, so existiert der Grenzwert lim x → x 0 p ( x ) / q ( x ) nicht. Man spricht dann von einer Polstelle mit Vorzeichenwechsel von f . Beispiel 8.8 Die Funktion f ( x ) = x 2 +1 2 x − 1 = x 2 +1 2( x − 12 ) ist eine gebrochen-rationale Funktion, deren Nenner die Nullstelle 12 hat, welche keine Nullstelle des Zählers ist. Also ist r = 0 und s = 1. Die Nullstellenordnung ist ungerade, die Funktion hat daher in x = 12 eine Polstelle mit Vorzeichenwechsel, vgl. auch Abbildung 8.3. Das uneigentliche Grenzwertverhalten einer gebrochen-rationalen Funktion hängt von den Graden des Zähler- und des Nennerpolynoms ab. 48818_Terveer.indd 170 48818_Terveer.indd 170 18.07.2023 11: 49: 24 18.07.2023 11: 49: 24 <?page no="171"?> 8.1 Funktionsgrenzwerte 171 Satz 8.7 (Uneigentliche Grenzwerte gebrochen-rationaler Funktionen) Für eine gebrochen-rationale Funktion f mit Zählergrad n , Nennergrad k gilt: lim x →∞ f ( x ) = 0 falls n < k a n b n falls n = k und a n , b n die Leitkoeffizienten sind −∞ falls n > k und a n b k < 0 ∞ falls n > k und a n b k > 0 Beispiel 8.9 Für die Funktion f ( x ) = x 2 +1 2 x − 1 ist der Zählergrad größer als der Nennergrad, zudem ist der Quotient der Leitkoeffizienten 12 > 0. Es gilt also lim x →∞ x 2 +1 2 x − 1 = ∞ . 8.1.6 Asymptoten von Funktionen Eine Aussage der Form lim x →∞ f ( x ) = ∞ über das uneigentliche Grenzwertverhalten (wie im vorangegangenen Beispiel) ist oft nicht konkret genug, sondern die „Schnelligkeit“, mit der die Funktion über alle Schranken wächst, soll noch genauer beschrieben werden. Oft kann man dieses Verhalten auf eine lineare Funktion zurückführen. Definition 8.4 ! Eine lineare Funktion g heißt Asymptote einer Funktion f , wenn gilt: lim x →∞ f ( x ) − g ( x ) = 0 bzw. lim x →−∞ f ( x ) − g ( x ) = 0 Dabei ist darauf zu achten, dass die Funktionswerte f ( x ) − g ( x ) für beliebig große (bzw. für beliebig kleine) x überhaupt gebildet werden können, z.B. ist das bei Funktionen der Fall, deren Definitionsbereich ein Intervall [ a ; ∞ [ (bzw. ] − ∞ ; a ]) umfasst. Man muss sich das asymptotische Verhalten im Einzelfall so vorstellen, dass sich der Graph von f dem Graphen der Geraden g für „sehr große“ (bzw. für „sehr kleine“) x immer stärker annähert vgl. Abbildung 8.3 . Asymptoten existieren bei gebrochenrationalen Funktionen f ( x ) = p ( x ) q ( x ) mit grad ( p ) ≤ grad ( q ) + 1 und werden dann mittels Polynomdivision bestimmt. Beispiel 8.10 f ( x ) = x 2 +1 2 x − 1 hat die Asymptote g ( x ) = 12 x + 14 vgl. Abbildung 8.3 . Die Asymptote ergibt sich durch Ausführung der Polynomdivision: x 2 +1 2 x − 1 = 12 x + 14 + 5 / 4 2 x − 1 Auch Polynome höheren Grades können als Asymptoten gebrochen-rationaler Funktionen auftreten, wenn der Zählergrad um mehr als 1 größer als der Nennergrad ist. Beispiel 8.11 Gegeben sei die gebrochen-rationale Funktion f ( x ) = x 3 − 1 x +2 . Mit Polynomdivision ergibt sich f ( x ) = x 2 − 2 x + 4 − 9 x +2 . Die Asymptote ist in diesem Fall g ( x ) = x 2 − 2 x + 4, vgl. Abbildung 8.4. Asymptoten sind in der Literatur nicht einheitlich definiert. Manchmal betrachtet man nur lineare Asymptoten, wir werden im folgenden aber auch Polynome als Asymptoten zulassen. Anhand des vorangegangenen Beispiels ist dann aber klar: 48818_Terveer.indd 171 48818_Terveer.indd 171 18.07.2023 11: 49: 26 18.07.2023 11: 49: 26 <?page no="172"?> 172 8 Differentialrechnung in einer Variablen Abbildung 8.4: Asymptote (grau) der Funktion f ( x ) = x 3 − 1 x +2 Satz 8.8 Die Asymptote einer gebrochen-rationalen Funktion mit Zählergrad n und Nennergrad k ≤ n ist ein Polynom vom Grad n − k . Für k > n ist die Nullfunktion Asymptote von f . Für gebrochen-rationale Funktionen lässt sich also immer eine ganzrationale Asymptote finden. Anders ist die Situation bei der Exponentialfunktion x → e x ; sie wächst schneller als jedes beliebige Polynom: Satz 8.9 Für jedes n ∈ N gilt lim x →∞ e x x n = ∞ bzw. lim x →∞ x n · e − x = 0 Denn mit der Ungleichung e x ≥ 1 + x vgl. Satz 6.4, S. 105 folgt e x = ( e x/ ( n +1) ) n +1 ≥ (1 + x n +1 ) n +1 , d.h. e x / x n ≥ (1 + x n +1 ) n +1 / x n und der letzte Ausdruck divergiert gegen ∞ . Die zweite Grenzwertaussage ergibt sich aus e x / x n = 1 / ( e − x · x n ). Übungen zu Abschnitt 8.2 ? 3. Berechnen Sie die folgenden Grenzwerte: a) lim x → 1 x +3 x − 2 , b) lim x → 2 x 3 − 8 x − 2 , c) lim x → 3 x 2 +( t − 2) x − 2 t x 2 + x − 12 , d) lim x → 0 x 2 + x x 2 + rx + s , e) lim x → 4 √ x − 2 x − 4 , f) lim x → 0 e x − e 2 x e x − 1 4. Zeigen Sie lim x → 1 ln( x ) x − 1 = 1. Leiten Sie dafür die folgenden beiden Ungleichungen (für x > 0) her: x − 1 x ≤ ln( x ) ≤ x − 1. Dabei kann Ihnen die Exponentialungleichung e x ≥ 1 + x helfen. 5. Berechnen Sie a) lim x → 0 (1 + x ) 1 x , b) lim x → 0 ln(1+ x ) x 6. Bestimmen Sie die folgenden uneigentlichen Grenzwerte: a) lim x →∞ 3 x 2 +7 − x +2 b) lim x →∞ x 7 − 1 2 x 7 − x 6 + x − 1 c) lim x →∞ x +1 x 4 +2 d) lim x →∞ rx 3 + sx 2 + x − 2 tx 2 +2 e) lim x →∞ 4 e nx − 2 e x +5 3 e 2 x − 2 wobei n ∈ N 7. Berechnen Sie die Asymptote der Funktion f ( x ) = x 2 − 2 x +9 x +3 8. Prüfen Sie, welche der in den vorangegangenen Aufgaben genannten gebrochenrationalen Funktionen eine Asymptote haben, und berechnen Sie diese gegebenenfalls. . 48818_Terveer.indd 172 48818_Terveer.indd 172 18.07.2023 11: 49: 29 18.07.2023 11: 49: 29 <?page no="173"?> 8.2 Stetige Funktionen 173 8.2 Stetige Funktionen Vielleicht noch wichtiger als der Ableitungsbegriff ist in der Analysis das Konzept der Stetigkeit von Funktionen. Es ist zwar nicht unbedingt unmittelbar mit einem Kalkül verbunden (wie z.B. die Ableitung zur Extremwertrechnung führt), aber der Hinweis auf Stetigkeit vereinfacht etliche Argumentationen, z.B. wenn die Existenz einer Extremstelle unklar ist. Zudem begründet die Stetigkeit einer Funktion die Zulässigkeit von numerischen Verfahren der Nullstellenbestimmung, z.B. der Regula falsi. Definition 8.5 ! Eine Funktion f : D → R heißt stetig in x 0 ∈ D, wenn gilt lim x → x 0 f ( x ) = f ( x 0 ). Sie heißt stetig in D, wenn sie in jedem x 0 ∈ D stetig ist. Die Funktionsgraphen stetiger Funktionen weisen keine „Sprünge“ auf, sie lassen sich in jedem Punkt ( x 0 | f ( x 0 )), in dem f stetig ist, „durchzeichnen“. Beispiel 8.12 ■ Unmittelbar aus der Definition der Stetigkeit ergibt sich, dass die Identitätsfunktion x → x stetig ist, denn lim x → x 0 x = x 0 . ■ Auch die konstante Funktion x → c mit vorgegebenem x ∈ R ist stetig. Alle Grenzwerte sind dort lim x → x 0 c = c . ■ In Beispiel 8.7 vgl. S. 168 haben wir den Grenzwert lim x → x 0 e x = e x 0 für alle x 0 ∈ R erläutert. Also ist die Eulersche Exponentialfunktion stetig. Weil der Stetigkeitsbegriff auf dem nicht immer einfachen Grenzwertkonzept basiert, ist der unmittelbare Nachweis der Stetigkeit manchmal zumindest unbequem - bei den Grenzwertrechnungen der Eulerschen e -Funktion haben Sie davon sicher einen Eindruck erhalten. Helfen kann Ihnen allerdings die Tatsache, dass sich mit den Grundrechenarten Addition, Subtraktion, Multiplikation und Division aus stetigen Funktionen weitere stetige Funktionen bilden lassen. Satz 8.10 Es sei D ein Intervall [ a ; b ] und g, h : D → R stetige Funktionen. Dann gilt: [1] Die Funktion f : D → R, f ( x ) = g ( x ) + h ( x ), ist stetig in D. [2] Die Funktion f : D → R, f ( x ) = g ( x ) h ( x ), ist stetig in D. [3] Wenn die Menge M aller Nullstellen von h endlich ist, dann ist die Funktion f : D \ M, f ( x ) = g ( x ) h ( x ) , stetig in D \ M. Beispiel 8.13 Mit den genannten Regeln folgt aus der Stetigkeit der Identitätsfunktion beispielsweise die Stetigkeit der Normalparabel x → x 2 und jeder anderen Monomfunktion x → x n . Jedes Polynom x → a n x n + · · · + a 1 x + a 0 ist Summe von Produkten von Konstanten mit Monomen und nach den ersten beiden Rechenregeln aus Satz 8.10 damit stetig. 48818_Terveer.indd 173 48818_Terveer.indd 173 18.07.2023 11: 49: 31 18.07.2023 11: 49: 31 <?page no="174"?> 174 8 Differentialrechnung in einer Variablen Jede gebrochen-rationale Funktion ist Quotient zweier (stetiger) Polynome und nach dem dritten Teil von Satz 8.10 in ihrem Definitionsbereich stetig. Die in Kapitel 6 besprochenen speziellen Funktionen sind mit Ausnahme einiger stückweise definierter Funktionen durchweg stetige Funktionen. Satz 8.11 Folgende Funktionen sind innerhalb ihres Definitionsbereiches (d.h. mit Ausnahme ihrer Definitionslücken) stetige Funktionen: [1] Jede Exponentialfunktion x → a x (mit a > 0) ist stetig in D = R. [2] Jede Logarithmusfunktion x → log a ( x ) (mit a > 0) ist stetig in D =]0; ∞ [. [3] Jede Potenzfunktion x → x a (mit a ̸ = 0) ist stetig in D =]0; ∞ [. Falls a > 0, so ist die Potenzfunktion x → x a stetig in D = [0; ∞ [. [4] Die trigonometrischen Funktionen sind stetig in ihren Definitionsbereichen. [5] Die Absolutbetragfunktion ist stetig in R. Eine weitere Methode, mit der sich manche Funktionen aus bereits bekannten ergeben, ist die Verkettung, vgl. Kapitel 1. Auch hier überträgt sich die Stetigkeit der „Bausteine“ auf die resultierende Funktion: Satz 8.12 Seien g : D g → W g und h : D h → W h stetige Funktionen mit W g ⊆ D h . Dann ist die Verkettung f = h ◦ g stetig in D g . Beispiel 8.14 Die Funktion f : [0; ∞ [ → R, f ( x ) = √ x 1+ x 2 ist stetig auf [0; ∞ [. Sie lässt sich nämlich als Verkettung der stetigen Funktionen g : [0; ∞ [ → [0; ∞ [, g ( x ) = x 1+ x 2 und h : [0; ∞ [ → R, h ( x ) = √ x schreiben. Vorsicht muss man walten lassen bei Funktionen, die durch Fallunterscheidung oder Grenzwertbildung aus gegebenen stetigen Funktionen entstehen; die Stetigkeit kann dabei „verloren gehen“: Beispiel 8.15 Die Funktionen f n : [0; 1] → [0; 1], f n ( x ) = x n sind allesamt stetig, nicht aber der punktweise Grenzwert f ( x ) = lim n →∞ x n = { 0 falls x ∈ [0; 1[ 1 falls x = 1 . Zu dieser Grenzwertaussage vgl. auch Aufgabe 2 aus Abschnitt 6.1. Eine Funktion, die eine Definitionslücke x 0 ∈ R \ D aufweist (z.B. eine gebrochenrationale Funktion, in deren Term die Nullstellen des Nennerpolynoms nicht eingesetzt werden dürfen), lässt sich unter Umständen stetig ergänzen. Das ist dann der Fall, wenn der Grenzwert lim x → x 0 f ( x ) = y ∈ R existiert. Die Ergänzung bzw. Fortsetzung lässt sich mittels der folgenden fallweise definierten Funktion bewerkstelligen: ˜ f : D ∪ { x 0 } → R , ˜ f ( x ) = { f ( x ) falls x ∈ D y falls x = x 0 48818_Terveer.indd 174 48818_Terveer.indd 174 18.07.2023 11: 49: 33 18.07.2023 11: 49: 33 <?page no="175"?> 8.2 Stetige Funktionen 175 Abbildung 8.5: f 1 (grau) und f 12 (schwarz) zur Kurvenschar f a ( x ) = x 3 − a 3 x − 1 Abbildung 8.6: Illustration des Zwischenwertsatzes für stetige Funktionen Beispiel 8.16 Betrachten Sie die Kurvenschar f a ( x ) = x 3 − a 3 x − 1 = ( x − a )( x 2 + ax + a 2 ) x − 1 . Die einzige Nullstelle des Zählerpolynoms ist x = a , der Nenner hat die Nullstelle x = 1. Daher liegt für a ̸ = 1 in x = 1 eine Polstelle von f a vor, die Funktion kann nach x = 1 nicht stetig fortgesetzt werden. Für a = 1 und x ̸ = 1 gilt x 3 − 1 x − 1 = x 2 + x + 1. Beim Grenzwertübergang x → 1 ergibt sich dann der Wert 3. Für a = 1 lautet die Fortsetzung von f a daher ˜ f ( x ) = { x 3 − 1 x − 1 falls x ̸ = 1 3 falls x = 1 } = x 2 + x + 1. Die Fälle a = 1 und a ̸ = 1, sind in Abbildung 8.5 dargestellt. Mit Polynomdivision sieht man x 3 − a 3 x − 1 = x 2 + x +1+ a 3 +1 x − 1 , daher ist ˜ f ( x ) auch die Asymptote zu f a . Eine wichtige (und offensichtliche) Eigenschaft stetiger Funktionen ist, dass sie „auf ihrem Weg“ keine Werte auslassen können, wie in Abbildung 8.6 illustriert wird: Satz 8.13 (Zwischenwertsatz für stetige Funktionen) Eine stetige Funktion f : [ a ; b ] → R mit f ( a ) ≤ f ( b ) nimmt jeden Wert im Intervall [ f ( a ); f ( b )] als Funktionswert an. Wir besprechen zwei Konsequenzen des Zwischenwertsatzes, die sich auf die Nullstellen einer stetigen Funktion f : [ a ; b ] → R beziehen. Satz 8.14 (Vorzeichenverhalten zwischen benachbarten Nullstellen) Für eine stetige Funktion f [ a ; b ] → R mit f ( a ) = f ( b ) = 0 und f ( x ) ̸ = 0 für x ∈ ] a ; b [ gilt entweder f ( x ) > 0 für alle x ∈ ] a ; b [ oder f ( x ) < 0 für alle x ∈ ] a ; b [ Sonst müsste es x 1 , x 2 ∈ ] a ; b [ geben mit f ( x 1 ) < 0 < f ( x 2 ). Zwischen x 1 und x 2 läge dann nach dem Zwischenwertsatz eine weitere Nullstelle von f , was aber ausgeschlossen war. Wir haben diese Eigenschaft zum Vorzeichenverhalten bereits in Beispiel 5.20 vgl. S. 92 ausgenutzt. Eine andere Eigenschaft liegt der numerischen Nullstellenbestimmung bei 48818_Terveer.indd 175 48818_Terveer.indd 175 18.07.2023 11: 49: 35 18.07.2023 11: 49: 35 <?page no="176"?> 176 8 Differentialrechnung in einer Variablen START Wähle x 0 ∈ ] a ; b [ Setze b = x 0 Setze a = x 0 f ( x 0 ) STOP ( ∗ ) > 0 < 0 Abbildung 8.7: Schematische Darstellung der numerischen Nullstellensuche mit Hilfe des Zwischenwertsatzes Funktionen zugrunde. Gesucht ist eine Nullstelle einer Funktion f : [ a ; b ] → R, die sich nicht explizit berechnen oder erraten lässt, wie etwa bei Polynomfunktionen höheren Grades und auch viele Funktionen, die sich aus Exponentialen, Logarithmen, oder trigonometrischen Termen zusammen setzen. Es sei angenommen, dass f stetig ist und f ( a ) < 0 < f ( b ) gilt (der Fall f ( a ) > 0 > f ( b ) kann analog behandelt werden). Dann hat f aufgrund des Zwischenwertsatzes eine Nullstelle in [ a ; b ], die iterativ gefunden werden kann vgl. Abbildung 8.7 . Es wird nämlich x 0 ∈ ] a ; b [ ausgewählt. Gilt f ( x 0 ) > 0, so gilt f ( a ) < 0 < f ( x 0 ) und im Intervall [ a ; x 0 ] muss nach dem Zwischenwertsatz eine Nullstelle von f liegen, so dass man die gleiche Vorgehensweise (Wahl eines Wertes im Intervall) genannte Vorschrift wieder auf [ a ; x 0 ] anstelle von [ a ; b ] anwenden kann. Gilt f ( x 0 ) < 0, so verkleinert man [ a ; b ] zu [ x 0 ; b ] und fährt analog fort. Das Verfahren wiederholt man so lange, bis ein geeignetes Abbruchkriterium ( ∗ ) erfüllt ist, etwa dass f ( x 0 ) oder aber der Abstand zwischen zwei aufeinander folgenden Werten von x 0 „hinreichend nahe“ bei 0 liegt. Allerdings muss f nach dem Zwischenwertsatz wieder eine Nullstelle in dem verkleinerten Intervall haben, und man wendet das Verfahren erneut auf das Teilintervall an. Die für die Auswahl von x 0 gängigsten Verfahren sind ■ die Intervallhalbierung: Setze x 0 = a + b 2 , ■ die Regula falsi: Setze x 0 = a − f ( a ) · b − a f ( b ) − f ( a ) . Dies ist die Nullstelle der linearen Funktion durch die Punkte ( a | f ( a )) und ( b | f ( b )). Beispiel 8.17 Wir bestimmen in acht Schritten eine numerische Näherung für √ 2 ≈ 1 , 414214, indem wir die positive Nullstelle der Funktion f ( x ) = x 2 − 2 mit Startwerten a 1 = 1 , b 1 = 2 approximieren. ■ Für die Intervallhalbierung ist die Annäherung in Tabelle 8.1, links, dargestellt. Die Folgen n → a n und n → b n in Beispiel 8.17 nähern sich mit wachsendem n dem Wert √ 2 offenbar beliebig genau. Nach siebenmaliger Durchführung der Intervallhalbierung weichen die berechneten Werte a 8 , b 8 (und alle folgenden) 48818_Terveer.indd 176 48818_Terveer.indd 176 18.07.2023 11: 49: 38 18.07.2023 11: 49: 38 <?page no="177"?> 8.3 Differenzierbare Funktionen 177 n a n b n x n = a n + b n 2 x 2 n − 2 b n − a n 1 1 , 0000 2 , 0000000 1 , 5000000 0 , 2500 1 , 0000 2 1 , 0000 1 , 5000000 1 , 2500000 − 0 , 4375 0 , 5000 3 1 , 2500 1 , 5000000 1 , 3750000 − 0 , 1094 0 , 2500 4 1 , 3750 1 , 5000000 1 , 4375000 0 , 0664 0 , 1250 5 1 , 3750 1 , 4375000 1 , 4062500 − 0 , 0225 0 , 0625 6 1 , 4063 1 , 4375000 1 , 4218750 0 , 0217 0 , 03125 7 1 , 4063 1 , 4218750 1 , 4140625 − 0 , 0004 0 , 0156 8 1 , 41403 1 , 4218750 1 , 4179688 0 , 0106 0 , 0078 n a n b n x n = a n b n − 2 a n + b n x 2 n − 2 b n − a n 1 1 , 000000 2 1 , 333333 − 0 , 222222 1 , 000 2 1 , 333333 2 1 , 400000 − 0 , 040000 0 , 667 3 1 , 400000 2 1 , 411765 − 0 , 006920 0 , 600 4 1 , 411765 2 1 , 413793 − 0 , 001189 0 , 588 5 1 , 413793 2 1 , 414141 − 0 , 000204 0 , 586 6 1 , 414141 2 1 , 414201 − 0 , 000035 0 , 586 7 1 , 414201 2 1 , 414211 − 0 , 000006 0 , 586 8 1 , 414211 2 1 , 414213 − 0 , 000001 0 , 586 Tabelle 8.1: Approximation von √ 2 mit dem Intervallhalbierungsverfahren (links) und der Regula falsi (rechts) voneinander und von √ 2 nur noch um höchstens 0 , 01 ab. Auch die berechnete Näherung x 8 = 1 . 14179688 approximiert √ 2 auf zwei Nachkommastellen genau. ■ Mit der Regula falsi ergibt in jedem Schritt die Näherung x 0 = a − ( a 2 − 2) b − a ( b 2 − 2) − ( a 2 − 2) = a − ( a 2 − 2) b − a b 2 − a 2 = a − a 2 − 2 a + b = ab − 2 a + b . Damit ergeben sich die Berechnungsschritte in Tabelle 8.1, rechts. Sie sehen, dass x n mit die Regula falsi nach drei Schritten bereits drei und nach acht Schritten bereits fünf Nachkommastellen der Dezimalentwicklung von √ 2 ergibt. Eine Einschätzung der Genauigkeit anhand der Grenzen ist hier anders als beim Intervallhalbierungsverfahren nicht möglich. Übungen zu Abschnitt 8.3 ? 9. Man ermittle die stetige Ergänzung der nachfolgenden Funktionen, sofern diese möglich ist. a) f ( x ) = x 2 − 25 x − 5 b) f ( x ) = x 3 + x 2 − x − 1 x 2 +2 x +1 c) f ( x ) = 3 x 3 +3 x 2 +3 x +3 x 2 +2 x +1 d) f ( x ) = + x 3 +2 x 2 − 24 x + x 3 +(2 t − 3) x 2 − 6 tx 10. Beschreiben Sie die Nullstellensuche mit Zwischenwertsatz für f ( a ) > 0 > f ( b ) . 11. Zeigen Sie die Näherungsformel x 0 = a − f ( a ) · b − a f ( b ) − f ( a ) der Regula falsi. 12. Es soll eine Nullstelle der Funktion x 3 − 2 x − 1 mit der Regula falsi gefunden werden. Stellen Sie die Formel für die erste Näherung im Intervall [ a ; b ] auf. 13. Berechnen Sie mit der Regula falsi einen Näherungswert für 3 √ 2. Beginnen Sie mit den Startwerten a 1 = 1, b 1 = 2. 8.3 Differenzierbare Funktionen Die Grundaufgabe der Differentialrechnung besteht darin, das Änderungsverhalten einer Funktion quantitativ zu beschreiben. Für eine lineare Funktion f ( x ) = ax + b ist der lineare Koeffizient a die gesuchte quantitative Größe, er beschreibt die Steigung der Geraden; je steiler die Gerade, desto (betragsmäßig) größer ist a . Die Steigung errechnet sich bei gegebener Geraden über jedes beliebige Steigungsdreieck an der Geraden, d.h. sie ist über dem gesamten Funktionsverlauf konstant. Bei nichtlinearen Funktionen f ist die Situation grundlegend verschieden. Hier lässt sich der Zuwachs der Funktion im Punkt ( x 0 | f ( x 0 )) nur über eine Tangente an den Graphen von f festlegen. 48818_Terveer.indd 177 48818_Terveer.indd 177 18.07.2023 11: 49: 42 18.07.2023 11: 49: 42 <?page no="178"?> 178 8 Differentialrechnung in einer Variablen Abbildung 8.8: Die Tangente im Punkt P (1 | 5) an den Graphen von f ( x ) = − 2 x 2 +5 x +2 ist diejenige Gerade, welche mit dem Graphen von f nur den Punkt P gemeinsam hat. 8.3.1 Tangenten an Funktionsgraphen Eine Tangente an eine konvexe (oder konkave) Funktion f in einem Punkt P ( x 0 | f ( x 0 )) ist eine Gerade y = ax + b , die mit dem Graphen von f genau den Punkt P gemeinsam hat. Für quadratische Funktionen lässt sich diese Tangente elementar ausrechnen. Beispiel 8.18 Untersucht werden soll das Wachstumsverhalten der quadratischen Funktion f ( x ) = − 2 x 2 + 5 x + 2 in x 0 = 1 vgl. Abbildung 8.8 . Wir versuchen, eine Tangente an den Graphen von f im Punkt P (1 | 5) zu legen. Dies ist eine lineare Funktion g mit der Punkt-Steigungsform y = g ( x ) = m ( x − 1) + 5. Die Steigung m der Geraden ist dabei so zu wählen, dass g nur den Punkt P mit der Parabel f gemeinsam hat. Hierzu lösen wir die Gleichung f ( x ) = g ( x ), wobei m zunächst allgemein bleibt: − 2 x 2 + 5 x + 2 = m ( x − 1) + 5 ⇔ x 2 + m − 5 2 x + 3 − m 2 = 0. Wir haben es also mit einer quadratischen Gleichung in x zu tun. Die Anzahl der Lösungen hängt von der Diskriminante D = (( m − 5) / 2) 2 4 − 3 − m 2 = ( m − 5) 2 − 8(3 − m ) 16 = ( m − 1) 2 16 der Gleichung ab. Genau für D = 0 ⇔ m = 1 liegt eine einzelne Lösung vor, nämlich x = 1. Wir haben also über die allgemeine Lösung der Gleichung f ( x ) = g ( x ) die Tangentensteigung m = 1 gefunden. Weil die Gerade gleichzeitig durch den Punkt P (1 | 5) läuft, hat sie die Punkt-Steigungs-Form y = ( x − 1) + 5, also y = x + 4. Der lineare Koeffizient m = 1 kann als Steigung von f in P (1 | 5) interpretiert werden. Für andere Funktionstypen ist eine derartige Berechnung der Tangente kompliziert und nicht praktikabel. Zudem ist der Begriff der Tangente bei Funktionen, die kein einheitliches Krümmungsverhalten haben, etwas heikel. Eine Tangente an einen Punkt P auf dem Graph von f kann den Graph in einem anderen „entfernten“Punkt Q ebenfalls schneiden und trotzdem Tangente heißen. Ist P ein Wendepunkt von f , so schneidet die Tangente den Graph von f dort; trotzdem spricht spricht man immer noch von einer Tangente. Erst über das Grenzwertkonzept kommt man zu einer Darstellung der Funktionssteigung, welche mit einem bequemen Kalkül verbunden ist. 8.3.2 Ableitung als Grenzwert von Sekantensteigungen Dazu verwendet man für einen Punkt P ( x 0 | f ( x 0 )) auf dem Graphen von f die Steigung der Sekante durch einen weiteren Punkt Q ( x 1 | f ( x 1 )), d.h. den Wert f ( x 1 ) − f ( x 0 ) x 1 − x 0 und lässt den zweiten Punkt Q mittels eines Grenzwertübergangs immer näher an P 48818_Terveer.indd 178 48818_Terveer.indd 178 18.07.2023 11: 49: 45 18.07.2023 11: 49: 45 <?page no="179"?> 8.3 Differenzierbare Funktionen 179 Abbildung 8.9: Die Ableitung f ′ ( x 0 ) ist als Steigung der Tangente g an den Graphen von f im Punkt x 0 erklärt. Diese Steigung ergibt sich durch Grenzwertübergang aus Sekantensteigungen. heranrücken vgl. Abbildung 8.9 . Es handelt sich dann um den Grenzübergang x 1 → x 0 , wobei x 1 niemals gleich x 0 sein darf. Bei diesem Grenzübergang ergibt sich die Tangentensteigung als Grenzwert der Steigungen der Sekanten. Der Grenzwert wird als Steigung der Funktion im Punkt P ( x 0 | f ( x 0 )) definiert und ist gleichzeitig die Steigung der Tangente an den Graph von f in diesem Punkt. Definition 8.6 ! Sei D = ] a ; b [ ⊂ R. Eine Funktion f : D → R heißt differenzierbar in x 0 ∈ D, wenn f ′ ( x 0 ) : = lim x → x 0 f ( x ) − f ( x 0 ) x − x 0 existiert und endlich ist. Der Grenzwert heißt Ableitung von f in x 0 . Die Ableitung f ′ ( x 0 ) ist also die stetige Ergänzung des Differenzenquotienten x → f ( x ) − f ( x 0 ) x − x 0 in x = x 0 . Wir führen die Rechnung in mehreren Beispiele aus: Beispiel 8.19 (Ableitung konstanter Funktionen) Die konstante Funktion f : R → R , f ( x ) = c mit c ∈ R hat die Ableitung f ′ ( x ) = 0, denn für jedes x 0 gilt lim x → x 0 f ( x ) − f ( x 0 ) x − x 0 = lim x → x 0 c − c x − x 0 = lim x → x 0 0 = 0. Beispiel 8.20 (Ableitung der Identitätsfunktion) Die Identitätsfunktion id : R → R , id( x ) = x hat die Ableitung id ′ ( x ) = 1, denn für jedes x 0 gilt lim x → x 0 id( x ) − id( x 0 ) x − x 0 = lim x → x 0 x − x 0 x − x 0 = lim x → x 0 1 = 1. Beispiel 8.21 Gesucht ist die Ableitung f ′ (1) der Funktion f : R → R, f ( x ) = − 2 x 2 + 5 x + 2. In Beispiel 8.18 haben wir die Tangente ohne Grenzwertrechnung bestimmt. Jetzt führen wir die Rechnung mit dem Differenzenquotient in x 0 = 1 aus. Für x ̸ = 1 gilt: f ( x ) − f (1) x − 1 = − 2 x 2 + 5 x − 3 x − 1 = − ( x − 1) (2 x − 3) x − 1 = 3 − 2 x Für die Ableitung ist der Grenzwertübergang x → 1 durchzuführen. Während im Ausgangsterm, dem Differenzenquotienten der Wert x = 1 noch nicht einfach eingesetzt werden darf, ist dies im zuletzt durch Kürzen von ( x − 1) erhaltenen Term 48818_Terveer.indd 179 48818_Terveer.indd 179 18.07.2023 11: 49: 48 18.07.2023 11: 49: 48 <?page no="180"?> 180 8 Differentialrechnung in einer Variablen möglich. Es ergibt sich daher die Ableitung f ′ (1) = lim x → 1 (3 − 2 x ) = 3 − 2 · 1 = 1 Beispiel 8.22 Gesucht ist die Ableitung f ′ (2) der Funktion f : [0; ∞ ] → R, f ( x ) = x 1+ x . Wieder wird der Differenzenquotient für x ̸ = 2 aufgestellt: f ( x ) − f (2) x − 2 = x 1+ x − 23 x − 2 = x − 2 3(1 + x )( x − 2) = 1 3(1 + x ) Nach Kürzen des Bruches folgt durch Einsetzen f ′ (2) = lim x → 2 1 3(1+ x ) = 1 3(1+2) = 1 9 Satz 8.15 Eine in x 0 ∈ D differenzierbare Funktion f : D → R ist in x 0 stetig. Denn es gilt nach den Grenzwertsätzen vgl. S. 168 lim x → x 0 ( f ( x ) − f ( x 0 )) = lim x → x 0 ( ( x − x 0 ) · f ( x ) − f ( x 0 ) x − x 0 ) = lim x → x 0 ( x − x 0 ) · lim x → x 0 f ( x ) − f ( x 0 ) x − x 0 = 0 d.h. lim x → x 0 f ( x ) = lim x → x 0 ( f ( x ) − f ( x 0 ) + f ( x 0 )) = lim x → x 0 ( f ( x ) − f ( x 0 ) + lim x → x 0 f ( x 0 ) = f ( x 0 ). Umgekehrt folgt aus Stetigkeit aber nicht die Differenzierbarkeit einer Funktion. Beispiel 8.23 Die Absolutbetragfunktion f ( x ) = | x | ist an der Stelle x 0 = 0 stetig vgl. Satz 8.11, S. 174 , aber dort nicht differenzierbar. Der Differenzenquotient im Punkt (0 | 0) lautet f ( x ) − f (0) x − 0 = | x |− 0 x − 0 = | x | x = { x x = 1 falls x > 0 − x x = − 1 falls x < 0 } Damit der Grenzwert existiert, muss sich für jede Folge n → x n mit lim n →∞ x n = 0 derselbe Grenzwert der Folge n → | x n |− 0 x − 0 ergeben. Jedoch liefern schon die beiden Folgen n → 1 n und n → − 1 n die voneinander verschiedenen Folgengrenzwerte 1 und − 1. Die Absolutbetragfunktion ist in x = 0 also nicht differenzierbar - aber sie ist in x 0 stetig. Oft wird die Ableitung als Grenzwert auch mit der so genannten h -Methode bestimmt. Dazu schreibt man im Differenzenquotienten f ( x ) − f ( x 0 ) x − x 0 die Stelle x als x = x 0 + h , wobei h = x − x 0 die Abweichung von x zu x 0 angibt. Der Grenzwertübergang x → x 0 ist dann gleichwertig zum Grenzwertübergang h → 0; also kann die Ableitung als Grenzwert lim h → 0 f ( x 0 + h ) − f ( x 0 ) h bestimmt werden. Der Vorteil bei dieser Vorgehensweise ist, dass das Faktorisieren zur Vereinfachung des Bruches oft einfacher ist; der Faktor h ist im Zähler besser zu erkennen als der Faktor x − x 0 . Ein höherer Rechenaufwand ergibt sich aber bei der Vereinfachung des Ausdrucks f ( x + h ). 48818_Terveer.indd 180 48818_Terveer.indd 180 18.07.2023 11: 49: 51 18.07.2023 11: 49: 51 <?page no="181"?> 8.3 Differenzierbare Funktionen 181 Beispiel 8.24 Für die Funktion f : R → R, f ( x ) = − 2 x 2 + 5 x + 2 berechnen wir noch einmal die Ableitung f ′ (1), im Gegensatz zu Beispiel 8.21 jetzt aber mit der h -Methode. Der Differenzenquotient lautet f (1+ h ) − f (1) h = − 2(1+ h ) 2 +5(1+ h )+2 − 5 h = − 2 − 4 h − 2 h 2 +5+5 h +2 − 5 h = − 2 h 2 + h h = 1 − 2 h und der Grenzwert für h → 0 ist 1. Beispiel 8.25 (Ableitung der Quadratwurzel) Die Quadratwurzelfunktion f : [0; ∞ [ → R, f ( x ) = √ x hat für x > 0 die Ableitung f ′ ( x ) = 1 2 √ x . Dies ergibt sich mit der h -Methode wie folgt: f ( x + h ) − f ( x ) h = √ x + h −√ x h = ( √ x + h −√ x )( √ x + h + √ x ) ( √ x + h + √ x ) h = ( x + h ) − x √ x + h + √ xh = 1 √ x + h + √ x → 1 2 √ x für h → 0. Im letzten Schritt wurde Stetigkeit von f genutzt vgl. Beispiel 8.1, S. 164 . 8.3.3 Die Ableitungsfunktion Wenn eine Funktion f in ihrem gesamten Definitionsbereich D differenzierbar ist, so erhält man für jedes x ∈ D eine Ableitung f ′ ( x ) und die Zuordnung x → f ′ ( x ) liefert eine neue Funktion, die Ableitungsfunktion. Beispiel 8.26 (Ableitung der Normalparabel) Wir bestimmen für f : R → R, f ( x ) = x 2 in einem beliebigen Punkt x ∈ R die Ableitung mit der h -Methode. Der Differenzenquotient für h ̸ = 0 lautet f ( x + h ) − f ( x ) h = ( x + h ) 2 − x 2 h = 2 hx + h 2 h = 2 x + h . Es ist daher f ′ ( x ) = lim h → 0 (2 x + h ) = 2 x . Beispiel 8.27 Wir wiederholen diese Vorgehensweise für das Monom f ( x ) = x 3 . Der Differenzenquotient wird mit Hilfe der binomischen Formel [2] aus Satz 5.1 vgl. S. 76 umgeformt, d.h. für h ̸ = 0 gilt f ( x + h ) − f ( x ) h = ( x + h ) 3 − x 3 h = 3 hx 2 + 3 h 2 x + h 3 h = 3 x 2 + 3 hx + h 2 Es ist daher f ′ ( x ) = lim h → 0 (3 x 2 + 3 hx + h 2 ) = 3 x 2 . Wenn man genau hinsieht, erkennt man ein Muster in der Ableitungsbildung. Der Grad des Polynoms verringert sich um 1, der Exponent des Monoms wird zum Faktor. Dieser Sachverhalt gilt für alle Monome: Satz 8.16 (Ableitung von Monomen) Für n ∈ N hat das Monom f ( x ) = x n die Ableitung f ′ ( x ) = nx n − 1 . Wir wollen diese Formel nun überprüfen und beschränken uns dabei auf den Fall n ≥ 2. Wie in den beiden vorangegangenen Beispielen kann man den Differenzenquotienten durch Ausmultiplizieren des Ausdrucks ( x + h ) n so vereinfachen, dass alle verbleibenden Summanden um den Faktor h gekürzt werden können. Man verwendet die allgemeine binomische Formel für den Exponenten 48818_Terveer.indd 181 48818_Terveer.indd 181 18.07.2023 11: 49: 55 18.07.2023 11: 49: 55 <?page no="182"?> 182 8 Differentialrechnung in einer Variablen n vgl. S. 76f.. Es gilt dann f ( x + h ) − f ( x ) h = ( x + h ) n − x n h = x n + ( n 1 ) x n − 1 h + ( n 2 ) x n − 2 h 2 + · · · + ( n n ) h n − x n h = ( n 1 ) x n − 1 + ( n 2 ) x n − 2 h + · · · + ( n n ) h n − 1 Mit h → 0 ergibt sich der Grenzwert ( n 1 ) x n − 1 = nx n − 1 , es gilt also die Potenzregel. Dies lässt sich auch induktiv mit der Produktregel nachweisen vgl. S. 187. Auch die Ableitung der Eulerschen Exponentialfunktion kann mit der h -Methode bestimmt werden. Wir stellen den Differenzenquotienten auf: f ( x + h ) − f ( x ) h = e x + h − e x h = e x e h − e x h = e x e h − 1 h In Beispiel 8.5 vgl. S. 167 haben wir uns überlegt, dass der Ausdruck e h − 1 h für h → 0 den Grenzwert 1 hat, woraus sich jetzt die Ableitung ergibt. Satz 8.17 Die Eulersche Exponentialfunktion x → f ( x ) = e x ist für alle x ∈ R differenzierbar, und es gilt f ′ ( x ) = e x . Die Eulersche Exponentialfunktion ist bis auf Vorfaktor die einzige Funktion mit der Eigenschaft, dass sie sich bei Ableitung reproduziert. Genauer gilt: Satz 8.18 Die Eulersche Exponentialfunktion f ( x ) = e x ist die eindeutige Lösung der Differentialgleichung f ′ ( x ) = f ( x ) für alle x ∈ R, für die gleichzeitig f (0) = 1 gilt. Dies zeigt man wie die Übereinstimmung von Exponentialreihe und Exponentialfunktion vgl. S. 190. Eine Funktion f , die sich durch Ableiten reproduziert, muss dann automatisch ein Vielfaches der Exponentialfunktion sein, nämlich f ( x ) = f (0) e x . Auch die trigonometrischen Funktionen haben eine Reproduktionseigenschaft. Satz 8.19 x → f ( x ) = sin( x ) und x → g ( x ) = cos( x ) sind für alle x ∈ R differenzierbar mit f ′ ( x ) = cos( x ) und g ′ ( x ) = − sin( x ). Für die Sinusfunktion soll dies nachgerechnet werden. Mit Additionstheorem gilt: f ′ ( x ) = lim h → 0 sin( x + h ) − sin( x ) h = lim h → 0 sin( x ) cos( h )+cos( x ) sin( h ) − sin( x ) h = lim h → 0 ( sin( x ) · cos( h ) − 1 h + cos( x ) · sin( h ) h ) = sin( x ) · lim h → 0 cos( h ) − 1 h + cos( x ) · lim h → 0 sin( h ) h = sin( x ) · 0 + cos( x ) · 1 = cos( x ) Dabei wurden im vorletzten Schritt die Grenzwertregeln aus Beispiel 8.6 verwendet. Grenzwertrechnungen wie bei der Exponentialfunktion oder den vorangegangenen Beispielen sind zur Ermittlung von Ableitungen meist aber nicht erforderlich. Es gibt vielmehr einen sehr umfangreichen Kalkül zur Berechnung von Ableitungsfunktionen, der in der Mehrzahl aller Situationen zur Anwendung kommen kann, und den wir in Abschnitt 8.4 besprechen werden. 48818_Terveer.indd 182 48818_Terveer.indd 182 18.07.2023 11: 49: 58 18.07.2023 11: 49: 58 <?page no="183"?> 8.3 Differenzierbare Funktionen 183 x f ( x ) g ( x ) 0 0 0 , 44 1 0 , 5 0 , 56 1 , 5 0 , 6 0 , 61 1 , 7 0 , 63 0 , 63 1 , 9 0 , 66 0 , 66 2 0 , 67 0 , 67 2 , 1 0 , 68 0 , 68 2 , 3 0 , 70 0 , 7 2 , 5 0 , 71 0 , 72 3 0 , 75 0 , 78 Abbildung 8.10: Graph von f und Linearisierung g (gestrichelt) in Beispiel 8.28 (links) und Wertetabelle von f und g (rechts) 8.3.4 Ableitung und Linearisierung Die Ableitung f ′ ( x 0 ) einer differenzierbaren Funktion lässt sich als Steigung der Tangente an den Graphen von f im Punkt ( x 0 | f ( x 0 )) interpretieren. Diese Tangente kann dabei als Näherung für die Funktion in der Nähe von x 0 aufgefasst werden, man sagt, dass f linearisierbar ist und spricht im Zusammenhang mit der Tangente von einer Linearisierung von f . Die Geradengleichung der Tangente lässt sich leicht aufstellen: Die Differenzierbarkeit in x 0 bedeutet nämlich, dass m = f ′ ( x 0 ) = lim x → x 0 f ( x ) − f ( x 0 ) x − x 0 . Bringt man alle Teile auf einer Seite der Gleichung auf einen Bruch, so folgt lim x → x 0 f ( x ) − f ( x 0 ) − m ( x − x 0 ) x − x 0 = 0, daraus folgt aber auch lim x → x 0 f ( x ) − f ( x 0 ) − m ( x − x 0 ) = 0. Also gilt für Werte in der Nähe von x 0 , dass f ( x ) ≈ f ( x 0 ) + f ′ ( x 0 )( x − x 0 ). Diese Näherung ist um so besser, je näher x an x 0 liegt. Umgekehrt folgt aber auch für eine Zahl m , für die lim x → x 0 f ( x ) − f ( x 0 ) − m ( x − x 0 ) x − x 0 = 0 gilt, sofort, dass f in x 0 differenzierbar mit der Ableitung f ′ ( x 0 ) = m ist. Definition 8.7 ! Die Gleichung y = f ( x 0 ) + f ′ ( x 0 )( x − x 0 ) heißt Tangentengleichung an den Graph von f im Punkt x 0 . Die lineare Funktion g ( x ) = f ( x 0 ) + f ′ ( x 0 )( x − x 0 ) heißt Tangente an den Graph von f im Punkt ( x 0 | f ( x 0 )). Beispiel 8.28 Betrachtet werde die Funktion f : [0; ∞ ] → R, f ( x ) = x 1+ x aus Beispiel 8.22 vgl. S. 180 . Wir wollen die Linearisierung von f im Punkt (2 | f (2)) = (2 | 23 ) bestimmen. In Beispiel 8.22 wurde f ′ (2) = 19 berechnet. Daraus ergibt sich die Tangentengleichung y = f ′ (2)( x − 2) + f (2) = 19 ( x − 2) + 23 = 1 9 x + 49 . Wie „ gut“ die Linearisierung ist, können Sie am Vergleich der Graphen von f und g und der Funktionswerte erkennen vgl. Abbildung 8.10 . Je näher x beim „Sockelwert“ 2 liegt, desto genauer wird f durch die Gerade approximiert. In x = 2 stimmen beide Funktionen überein - das ist neben der identischen Ableitung f ′ (2) = g ′ (2) die weitere Anforderung an die Tangente. Das näherungsweise Ersetzen eines Funktionsterms durch die Linearisierung ist ein gängiges Hilfsmittel in zahlreichen ökonomischen Konzepten und wird später auch für 48818_Terveer.indd 183 48818_Terveer.indd 183 18.07.2023 11: 50: 02 18.07.2023 11: 50: 02 <?page no="184"?> 184 8 Differentialrechnung in einer Variablen Abbildung 8.11: Mittelwertsatz der Differentialrechnung. Funktionen mehrerer Variablen konzeptionell erweitert. Sie sollten sich daher damit vertraut machen. 8.3.5 Mittelwertsatz Wenn man bei einer differenzierbaren Funktion f : ] a ; b [ → R zu zwei Werten x 1 , x 2 ∈ ] a ; b [ mit x 1 < x 2 die Sekante durch die Punkte ( x 1 | f ( x 1 )), ( x 2 | f ( x 2 )) legt vgl. Abbildung 8.11 , so kann man durch eine Parallelverschiebung der Sekante einen Punkt ( x 0 | f ( x 0 ) „zwischen“ den beiden vorgegebenen Punkten finden, in dem die Tangente an den Graphen von f die selbe Steigung wie die vorgegebene Sekante hat. Weil die Tangentensteigung mit der Steigung des Funktionsgraphen an der Stelle übereinstimmt, an der die Tangente angesetzt ist, gilt also Satz 8.20 (Mittelwertsatz der Differentialrechnung) Für eine differenzierbare Funktion f : ] a ; b [ → R und x 1 , x 2 ∈ ] a ; b [ mit x 1 < x 2 gibt es ein x 0 ∈ ] x 1 ; x 2 [ mit f ′ ( x 0 ) = f ( x 2 ) − f ( x 1 ) x 2 − x 1 . Ein wichtiger Spezialfall tritt dann auf, wenn f ( x 1 ) = f ( x 2 ). Dann muss es ein x 0 ∈ ] x 1 ; x 2 [ geben mit f ′ ( x 0 ) = 0 (Satz von Rolle). Eine weitere Konsequenz des Mittelwertsatzes ergibt sich, wenn f ′ ( x ) = 0 für alle x ∈ ] a ; b [. Nach dem Mittelwertsatz muss dann für alle x 1 , x 2 ∈ ] a ; b [ mit x 1 < x 2 gelten: f ( x 2 ) − f ( x 1 ) x 2 − x 1 = 0, also f ( x 1 ) = f ( x 2 ). Es gilt daher: Satz 8.21 Eine Funktion f : ] a ; b [ → R mit f ′ ( x ) = 0 für alle x ∈ ] a ; b [ ist konstant. 8.3.6 Ableitungen höherer Ordnung Einer differenzierbaren Funktion f : D → R ist durch Differenzieren ihre Ableitungsfunktion x → f ′ ( x ) zugeordnet. Falls die Ableitungsfunktion f ′ wieder differenzierbar ist, so nennt man die Ableitungsfunktion von f ′ zweite Ableitung von f und schreibt dafür f ′′ oder f (2) . Entsprechend lassen sich auch Ableitungen dritter, vierter,. . . Ordnung berechnen. Man verwendet hierfür die Notation f ′′′ , f ′′′′ , . . . bzw. f (3) , f (4) , . . . . 48818_Terveer.indd 184 48818_Terveer.indd 184 18.07.2023 11: 50: 05 18.07.2023 11: 50: 05 <?page no="185"?> 8.4 Ableitungsregeln 185 Die direkte Berechnung höherer Ableitungen mittels Funktionsgrenzwerten ist meist sehr mühsam. Erst im Zusammenspiel mit den in Abschnitt 8.4 behandelten Ableitungsregeln lohnt es sich, systematisch auf höhere Ableitungen zurückzugreifen. Für die Untersuchung von (ökonomischen) Funktionen reicht meist die Berechnung und Diskussion von f ′ , f ′′ (manchmal auch noch f ′′′ ) aus. Übungen zu Abschnitt 8.1 ? 1. Berechnen Sie ohne Rückgriff auf Grenzwerte eine Tangente an den Graphen der Funktion x → 1 x im Punkt (2 | 12 ). 2. Berechnen Sie mittels Differenzenquotienten für x 0 ∈ R die Ableitung f ′ ( x 0 ) der Funktion f ( x ) = ax + b (wobei a, b ∈ R). 3. Untersuchen Sie, für welches t ∈ R die Funktion f : R → R, f ( x ) = { x 2 falls x < 1 tx + (1 − t ) falls x ≥ 1 in x = 1 differenzierbar ist. 4. Berechnen Sie mit der h -Methode die folgenden Ableitungen a) f ′ (0) für f ( x ) = x x 2 +1 b) f ′ ( − 2) für f ( x ) = x +1 x − 2 5. Berechnen Sie die Ableitung von g ( x ) = cos( x ). Gehen Sie analog zur Rechnung für sin( x ) vor vgl. Satz 8.19, S. 182 . 6. Bestimmen Sie jeweils die Gleichung der Tangente an den Graph von f im Punkt ( x 0 | f ( x 0 )): a) f ( x ) = 4 x 3 − x 2 , x 0 = 2 b) f ( x ) = x 1+ x 2 , x 0 = 1 c) f ( x ) = e x , x 0 = ln 2 d) f ( x ) = x 1+ x , x 0 ∈ R , x 0 ̸ = 1 7. Berechnen Sie zur Funktion f ( x ) = x 1+ x und den Stellen 0 < x 1 < x 2 eine Stelle x 0 ∈ ] x 1 ; x 2 [ mit f ′ ( x 0 ) = f ( x 2 ) − f ( x 1 ) x 2 − x 1 a) x 1 = 1 , x 2 = 2 b) x 1 = 1 , x 2 = 1 + t 8. Berechnen Sie zur Funktion f ( x ) = x 1+ x für x > 0 die Ableitung f ′′ ( x ). 8.4 Ableitungsregeln Wir haben bisher Ableitungen durch Grenzwertbildung definiert und auch in Beispielen berechnet. Diese Vorgehensweise ist jedoch selbst in einfachen Situationen recht umständlich und in vielen Fällen kaum noch rechenbar; in Anwendungen der Differentialrechnung wird vielmehr die Ableitung oft schematisch unter Zuhilfenahme des so genannten Ableitungskalküls gebildet. Grundlagen dieses Kalküls sind ■ eine „Basisliste“ von Funktionen, deren Ableitungen man kennen sollte, ■ eine Anzahl generischer Ableitungsregeln („Operatoren“), nämlich zu Vervielfachung, Summe, Produkt, Quotient und Verkettung von Funktionen. Fast alle genannten Operatoren sind binär, d.h. sie „bauen“aus zwei Funktionen eine neue. Findet sich eine Funktion nicht in der Basisliste, so versucht man sie mit Hilfe der Operatoren aus Funktionen der Basisliste zu konstruieren. Mit Hilfe der Ableitungsregeln für die Operatoren und der verwendeten Funktionen der Basisliste kann man dann die gesuchte Ableitung errechnen. 48818_Terveer.indd 185 48818_Terveer.indd 185 18.07.2023 11: 50: 07 18.07.2023 11: 50: 07 <?page no="186"?> 186 8 Differentialrechnung in einer Variablen Typ f ( x ) = Parameter Definitionsbereich f ′ ( x ) Berechnung Konstant 1 x ∈ R 0 S. 179 Linear x x ∈ R 1 S. 179 Quadratisch x 2 x ∈ R 2 x S. 181 Kehrwert 1 x x ̸ = 0 − 1 x 2 S. 188 Monom, allgemein x n n ∈ Z x ∈ R ( x ̸ = 0 für n < 0) nx n − 1 S. 181 Quadratwurzel √ x = x 12 x > 0 1 2 √ x S. 181 Potenzfunktion x a a ̸ = 0 x > 0 ax a − 1 S. 189 Exponentialfunktion, speziell e x x ∈ R e x S. 182 allgemein a x = e x ln( a ) a > 0 x ∈ R a x ln( a ) S. 189 natürlicher Logarithmus ln( x ) x > 0 1 x S. 189 allgemeiner Logarithmus log a ( x ) = ln( x ) ln( a ) a > 0 x > 0 1 x ln( a ) S. 189 Trigonometrisch, Sinus sin( x ) x ∈ R cos( x ) S. 182 Cosinus cos( x ) x ∈ R − sin( x ) S. 182 Tangens tan( x ) = sin( x ) cos( x ) x ∈ R, x ̸ = ± π 2 , ± 3 π 2 , . . . 1 cos 2 ( x ) S. 188 Tabelle 8.2: Tabelle wichtiger Funktionen und ihrer Ableitungsfunktionen Bei der Basisliste, die wir in Tabelle 8.2 angeben, handelt es sich um einen Kompromiss. Man könnte einerseits - wie in entsprechend umfangreichen Formelsammlungen - eine umfassende Sammlung mit zahlreichen Spezialfällen angeben, welche dann als reines Nachschlagewerk verwendet werden kann. Die „puristische“ Alternative hierzu besteht andererseits darin, die Liste so klein wie möglich zu halten, um dann mit den genannten Operatoren bei Bedarf andere Ableitungen zu berechnen. Unsere Basisliste ist ein Kompromiss dieser beiden extremen Sichtweisen; sie stellt - teilweise redundant - Ableitungen für die von Ihnen vermutlich am häufigsten benötigten Funktionen bereit; weitere Funktionen können Sie dann mit Hilfe der Basisliste und den in den nächsten Unterabschnitten besprochenen Operatorenregeln in meist wenigen Schritten ableiten. 8.4.1 Faktorregel Für c ∈ R ist mit g : ] a ; b [ → R auch f ( x ) = c · g ( x ) differenzierbar in ] a ; b [ und es gilt: Faktorregel: f ′ ( x ) = c · g ′ ( x ) Die Regel scheint auf den ersten Blick banal zu sein, aber sie wird - ohne audrücklich darüber nachzudenken, am häufigsten angewandt, denn Faktoren als Ausdruck der Proportionalität von (ökonomischen) Größen sind in ökonomischen Modellen weit verbreitet, sie beschreiben die Umrechnung von Faktoreinsatzmengen in verschiedenen Einheiten, die Anteile von Faktoren in Rezepturen oder auch Wechselkurse verschiedener Währungen. Die Faktorregel wird auch beim Ableiten von Polynomgliedern eingesetzt, wobei noch die Potenzregel 8.16 vgl. S. 181 verwendet wird: Die Funktion f ( x ) = c · x n mit n ∈ N 0 , c ∈ R hat Ableitung f ′ ( x ) = c · nx n − 1 . 48818_Terveer.indd 186 48818_Terveer.indd 186 18.07.2023 11: 50: 10 18.07.2023 11: 50: 10 <?page no="187"?> 8.4 Ableitungsregeln 187 8.4.2 Summenregel Mit g, h : ] a ; b [ → R ist auch f ( x ) = g ( x ) + h ( x ) differenzierbar in ] a ; b [ ist und es gilt Summenregel: f ′ ( x ) = g ′ ( x ) + h ′ ( x ) Die Summen- und Faktorregel zusammen mit der Potenzregel 8.16 für Monome ergibt die allgemeine Ableitungsregel für Polynome: Für ein Polynom n -ten Grades, f ( x ) = a n x n + a n − 1 x n − 1 + · · · + a 1 x + a 0 gilt f ′ ( x ) = na n x n − 1 + ( n − 1) a n − 1 x n − 2 + · · · + a 1 Die Ableitung eines Polynoms ist also ebenfalls ein Polynom. Der Grad hat sich um 1 verringert, denn beim Ableiten verringert sich der Grad jedes Summanden. Nach spätestens n -maligem Ableiten wird ein Polynom n -ten Grades also zu einer konstanten Funktion. Umgekehrt ist jede auf einem Intervall definierte Funktion, deren n -te Ableitung eine konstante Funktion ist, ein Polynom n -ten Grades. 8.4.3 Produktregel Mit g, h : ] a ; b [ → R ist auch f ( x ) = g ( x ) · h ( x ) in ] a ; b [ differenzierbar und es gilt: Produktregel: f ′ ( x ) = g ′ ( x ) h ( x ) + g ( x ) h ′ ( x ) Dies ergibt sich mit dem Ansatz g ( x ) h ( x ) − g ( x 0 ) h ( x 0 ) x − x 0 = = ( g ( x ) − g ( x 0 )) h ( x )+ g ( x 0 )( h ( x ) − h ( x 0 )) x − x 0 und anschließendem Grenzwertübergang x → x 0 und den Grenzwertsätzen. Beispiel 8.29 f ( x ) = x 2 e x ist Produkt von g ( x ) = x 2 und h ( x ) = e x mit Ableitungen g ′ ( x ) = 2 x und h ′ ( x ) = e x . Dann gilt f ′ ( x ) = 2 xe x + x 2 e x = ( x 2 + 2 x ) e x . Mit Hilfe der Produktregel und der Ableitungsformel für x lässt sich die Ableitungsformel für Monome x n , n ∈ N, aus der Basisliste induktiv herleiten: Der Induktionsanfang n = 1 ergibt f ( x ) = x , f ′ ( x ) = 1 = 1 · x 0 . Im Induktionsschritt gelte die IV für eine Funktion f ( x ) = x n mit einem n ∈ N, d.h. es gelte f ′ ( x ) = n · x n − 1 . Dann hat die Funktion h ( x ) = x n +1 = x n · x = f ( x ) · x nach Produktregel und IV die Ableitung h ′ ( x ) = ( nx n − 1 ) · x + x n · 1 = n · x n + x n = ( n + 1) x n . 8.4.4 Quotientenregel Mit g, h : ] a ; b [ → R ist auch f ( x ) = g ( x ) h ( x ) in ] a ; b [ differenzierbar, falls h ( x ) ̸ = 0, es gilt: Quotientenregel f ′ ( x ) = g ′ ( x ) h ( x ) − g ( x ) h ′ ( x ) ( h ( x )) 2 Insbesondere ist die Ableitung einer gebrochen-rationalen Funktion f ( x ) = p ( x ) / q ( x ) wieder gebrochen rational, denn die Ableitung lautet f ′ ( x ) = p ′ ( x ) q ( x ) − q ′ ( x ) p ( x ) q ( x ) 2 und alle Teilausdrücke p ( x ) , p ′ ( x ) , q ( x ) , q ′ ( x ) , q ( x ) 2 sind Polynome. 48818_Terveer.indd 187 48818_Terveer.indd 187 18.07.2023 11: 50: 14 18.07.2023 11: 50: 14 <?page no="188"?> 188 8 Differentialrechnung in einer Variablen Beispiel 8.30 Die Funktion f ( x ) = x 2 − 2 x +7 x 3 − 5 hat die Ableitung f ′ ( x ) = (2 x − 2)( x 3 − 5) − ( x 2 − 2 x +7)(3 x 2 ) ( x 3 − 5) 2 = − x 4 +4 x 3 − 21 x 2 − 10 x +10 ( x 3 − 5) 2 für x ̸ = ± 3 √ 5 . Im Gegensatz zum Zähler wird der Nenner üblicherweise nicht ausmultipliziert. Dadurch vereinfacht man beispielsweise die Berechnung der zweiten Ableitung f ′′ ( x ), vgl. auch Beispiel 8.35 vgl. S. 189 . Beispiel 8.31 Mit der Quotientenregel folgt die Ableitung des Tangens f ( x ) = tan( x ) = sin( x ) cos( x ) , denn f ′ ( x ) = cos( x ) · cos( x ) − sin( x ) · ( − sin( x ) cos 2 ( x ) = cos 2 ( x )+sin 2 ( x ) cos 2 ( x ) = 1 cos 2 ( x ) Mit der Quotientenregel kann man auch Ableitungen von Kehrfunktionen f ( x ) = 1 h ( x ) berechnen. Die Eins im Zähler wird als konstante Funktion g ( x ) = 1 mit g ′ ( x ) = 0 interpretiert; mit Quotientenregel folgt f ′ ( x ) = g ′ ( x ) h ( x ) − g ( x ) h ′ ( x ) h ( x ) 2 = 0 · h ( x ) − 1 · h ′ ( x ) h ( x ) 2 = − h ′ ( x ) h ( x ) 2 . Diese Regel kann ausgenutzt werden, um die Ableitungsregeln für Monomterme f ( x ) = x − n = 1 x n mit n ∈ N herzuleiten: f ′ ( x ) = − nx n − 1 ( x n ) 2 = − nx n − 1 x 2 n = − nx − n − 1 8.4.5 Kettenregel Die bisherigen Ableitungsregeln beschäftigten sich nur mit elementaren Rechenoperationen wie Addition, Multiplikation und Division von Funktionen. Viele ökonomische Funktionen entstehen aber durch Verkettung, d.h. Hintereinanderausführung.. Bei der Berechnung von Ableitungen verketteter Funktionen geht man davon aus, dass g : D → W und h : W → R differenzierbare Funktionen auf offenen Intervallen D , W sind. Dann ist auch die durch Verkettung von h und g gebildete Funktion f = h ◦ g : D → R , f ( x ) = h ( g ( x )) differenzierbar und es gilt Kettenregel: f ′ ( x ) = h ′ ( g ( x )) · g ′ ( x ) Schema: „äußere Ableitung verkettet mit innerer Funktion, mal innere Ableitung“. Dies ergibt sich mit dem Ansatz h ( g ( x )) − h ( g ( x 0 )) x − x 0 = h ( g ( x )) − h ( g ( x 0 )) g ( x ) − g ( x 0 ) · g ( x ) − g ( x 0 ) x − x 0 aus den Grenzwertsätzen, denn der erste Faktor konvergiert mit x → x 0 gegen h ′ ( g ( x 0 )), weil auch g ( x ) → g ( x 0 ) gilt (differenzierbare Funktionen sind stetig). Der zweite Faktor konvergiert gegen g ′ ( x 0 ). Typische Fälle äußerer Funktionen sind sind Exponential-, Logarithmus-, Potenz- oder trigonometrische Funktionen, bei denen die Verkettung nicht vereinfacht werden kann. Beispiel 8.32 f ( x ) = √ x 2 + 1 mit der äußeren Funktion h ( x ) = √ x und der inneren Funktion g ( x ) = x 2 + 1 hat die Ableitung f ′ ( x ) = 2 x 2 √ ( x 2 +1) = x √ ( x 2 +1) . Beispiel 8.33 f ( x ) = e − x 2 mit der äußeren Funktion h ( x ) = e x und der inneren Funktion g ( x ) = − x 2 hat die Ableitung f ′ ( x ) = e − x 2 · ( − 2 x ). 48818_Terveer.indd 188 48818_Terveer.indd 188 18.07.2023 11: 50: 19 18.07.2023 11: 50: 19 <?page no="189"?> 8.4 Ableitungsregeln 189 Beispiel 8.34 Auch für die allgemeine Exponentialfunktion f a ( x ) = a x = e x ln( a ) folgt die Ableitung mit der Kettenregel unter Verwendung der Ableitung der Eulerschen Exponentialfunktion vgl. Satz 8.17, S. 182 . Es ist dann nämlich f ′ a ( x ) = e x ln( a ) · ln( a ) = a x · ln( a ). Beispiel 8.35 (Fortsetzung von Beispiel 8.30 vgl. S. 188 ) Die Kettenregel hilft auch bei höheren Ableitungen gebrochen-rationaler Funktionen. Zu der Funktion f ( x ) = x 2 − 2 x +7 x 3 − 5 amit f ′ ( x ) = − x 4 +4 x 3 − 21 x 2 − 10 x +10 ( x 3 − 5) 2 berechnen wir die zweite Ableitung f ′′ ( x ) wieder mit der Quotientenregel, wobei wir die Ableitung der Nennerfunktion g ( x ) = ( x 3 − 5) 2 mit der Kettenregel bestimmen und nicht ausmultiplizieren, damit im Folgenden leichter gekürzt werden kann: f ′′ ( x )= ( − 4 x 3 +12 x 2 − 42 x − 10)( x 3 − 5) 2 − ( − x 4 +4 x 3 − 21 x 2 − 10 x +10)2( x 3 − 5)3 x 2 ( x 3 − 5) 4 = ( − 4 x 3 +12 x 2 − 42 x − 10)( x 3 − 5) − ( − x 4 +4 x 3 − 21 x 2 − 10 x +10)6 x 2 ( x 3 − 5) 3 = 2 x 6 − 12 x 5 +84 x 4 +70 x 3 − 120 x 2 +210 x +50 ( x 3 − 5) 3 Mit der Kettenregel lässt sich die Ableitung der Umkehrfunktion f − 1 bestimmen: ■ Einerseits gilt ( f ◦ f − 1 )( x ) = x und damit ( f ◦ f − 1 ) ′ ( x ) = 1. ■ Andererseits ist ( f ◦ f − 1 ) ′ ( x ) = ( f ′ ◦ f − 1 )( x )( f − 1 ) ′ ( x ). Aus den beiden Rechenwegen ergibt sich 1 = ( f ′ ◦ f − 1 )( x )( f − 1 ) ′ ( x ), d.h. Satz 8.22 (Ableitung der Umkehrfunktion) ( f − 1 ) ′ ( x ) = 1 f ′ ( f − 1 ( x )) Beispiel 8.36 Die Logarithmusfunktion g ( x ) = ln( x ) ist Umkehrfunktion der Funktion f ( x ) = e x . Die Ableitung berechnet sich als g ′ ( x ) = ( f − 1 ) ′ ( x ) = 1 f ′ ( f − 1 ( x )) = 1 e ln( x ) = 1 x . Mit der Faktorregel folgt hieraus auch die Ableitung des Logarithmus zu allgemeiner Basis: f a ( x ) = log a ( x ) = ln( x ) ln( a ) und f ′ a ( x ) = 1 ln( a ) · 1 x . Beispiel 8.37 Ähnlich wie in Beispiel 8.34 wird für die Potenzfunktion f ( x ) = x a mit a ∈ R die Darstellung f a ( x ) = e a ln( x ) verwendet und dann mit der Kettenregel sowie der Ableitung des Logarithmus gerechnet: f ′ a ( x ) = e a ln( x ) · a x = a x · a x = a · x a − 1 . 8.4.6 Ableitung von Potenzreihen Wie Polynome stellen auch konvergente Potenzreihen f ( x ) = ∑ ∞ k =0 a k x k differenzierbare Funktionen dar, deren Ableitung man gliedweise berechnet: Satz 8.23 Ist f ( x ) = ∑ ∞ k =0 a k x k für x 0 > 0 eine in ] − x 0 ; x 0 [ konvergente Potenzreihe, so ist f auf ] − x 0 ; x 0 [ differenzierbar und für alle x ∈ ] − x 0 ; x 0 [ gilt f ′ ( x ) = ∑ ∞ k =0 ka k x k − 1 . Mit dieser Regel folgen z.B. aus bekannten Potenzreihen weitere Summenformeln: 48818_Terveer.indd 189 48818_Terveer.indd 189 18.07.2023 11: 50: 23 18.07.2023 11: 50: 23 <?page no="190"?> 190 8 Differentialrechnung in einer Variablen Beispiel 8.38 Die geometrische Reihe f ( x ) = ∑ ∞ k =0 x k ist konvergent für x ∈ ] − 1; 1[. Dort gilt dann f ′ ( x ) = ∑ ∞ k =1 kx k − 1 . Andererseits hat f nach dem bekannten Ableitungskalkül für Funktionen einer Variablen die Ableitung f ′ ( x ) = 1 (1 − x ) 2 . Beide Ableitungen müssen also übereinstimmen und das ergibt die Formel ∑ ∞ k =1 kx k − 1 = 1 (1 − x ) 2 für | x | < 1. Auch einige Ableitungsregeln lassen sich mit Potenzreihen schnell herleiten. Beispiel 8.39 Die Exponentialreihe f ( x ) = ∞ ∑ k =0 x k k ! hat Ableitung f ′ ( x ) = ∞ ∑ k =1 kx k − 1 k ! = ∞ ∑ k =1 x k − 1 ( k − 1)! , denn k ! = k · ( k − 1)! für k ≥ 1. Es ergibt sich wieder die Exponentialreihe - es liegt lediglich eine Indexverschiebung vor. Es gilt also f ′ ( x ) = f ( x ). Vielleicht haben Sie gemerkt, dass wir die Begriffe der Exponentialfunktion f ( x ) = e x und der Exponentialreihe exp( x ) = ∑ ∞ k =0 x k / k ! voneinander getrennt behandelt haben. Mit der gerade gefundenen Ableitungseigenschaft der Exponentialreihe lässt sich aber zeigen, dass g ( x ) = e x und f ( x ) = exp( x ) dieselben Funktionen sind. Betrachten wir nämlich die Funktion h : R → R , h ( x ) = f ( x ) / g ( x ) = exp( x ) / e x , so ist h differenzierbar und nach Quotientenregel gilt h ′ ( x ) = f ′ ( x ) g ( x ) − f ( x ) g ′ ( x ) g ( x ) 2 = f ( x ) g ( x ) − f ( x ) g ( x ) g ( x ) 2 = 0 für alle x ∈ R, weil sowohl f ′ ( x ) = f ( x ) als auch g ′ ( x ) = g ( x ) gilt. Nach Satz 8.21 vgl. S. 184 ist h aber eine konstante Funktion, für die h (1) = e 1 exp(1) = 1 gilt. Es ist also h ( x ) = 1, d.h. exp( x ) / e x = 1, daraus folgt: Satz 8.24 Die Exponentialfunktion hat die Reihendarstellung e x = ∑ ∞ k =0 x k k ! für alle x ∈ R. Auch trigonometrische Funktionen besitzen Darstellungen als Potenzreihen: Satz 8.25 Sinus und Cosinus haben für alle x ∈ R die Reihendarstellungen ■ sin( x ) = ∞ ∑ k =0 ( − 1) k x 2 k +1 (2 k +1)! ■ cos( x ) = ∞ ∑ k =0 ( − 1) k x 2 k (2 k )! Für die Sinusreihe f ( x ) = sin( x ) = ∑ ∞ k =1 x 2 k +1 / (2 k + 1)! berechnet sich die Ableitung nämlich durch gliedweises Differenzieren zu f ′ ( x ) = ∑ ∞ k =0 ( − 1) k (2 k +1) x 2 k / (2 k +1)! = ∑ ∞ k =0 ( − 1) k x 2 k / (2 k )! . Die Cosinusreihe ist also Ableitung der Sinusreihe. Analog folgt, dass die Sinusreihe bis auf den Faktor ( − 1) die Ableitung der Cosinusreihe ist. Mit diesen Überlegungen kann man ähnlich wie bei der Exponentialfunktion schließen, dass Sinus- und Cosinusreihe die Reihendarstellungen der Sinus- und Cosinus-Funktion sind. Übungen zu Abschnitt 8.2 ? 9. Berechnen Sie die Ableitungsfunktionen f ′ ( x ) und f ′′ ( x ) : a) f ( x ) = − 7 x 3 + 2 x 2 − 5 x − 12 b) f ( x ) = x 4 − 3 x + 1 c) f ( x ) = (2( x + 1) 2 − 5) 2 d) f ( x ) = ax n − ( a − 1) x n − 1 , a ∈ R, n ∈ N e) f ( x ) = x 3 − 1 x − 1 f) f ( x ) = x n e x für n ∈ N 48818_Terveer.indd 190 48818_Terveer.indd 190 18.07.2023 11: 50: 28 18.07.2023 11: 50: 28 <?page no="191"?> 8.5 Ableitung und Funktionseigenschaften 191 g) f ( x ) = (3 x + 1) √ x h) f ( x ) = x a mit a ∈ R i) f ( x ) = x x j) f ( x ) = sin( x ) cos( x ) 2 k) f ( x ) = x a − 1 e − x l) f ( x ) = √ x +3 x m) f ( x ) = √ x 3 x +1 n) f ( x ) = e − x 3 o) f ( x ) = e 1 − e − x p) f ( x ) = e x x q) f ( x ) = 1 1+ e − x r) f ( x ) = ln( x 2 + 1) s) f ( x ) = ln(( xr 2 )( xs 2 )), r, s ̸ = 0 10. Überlegen Sie sich je ein Beispiel dafür, dass a) Quotienten von Funktionen f ( x ) g ( x ) nicht einfach komponentenweise zu f ′ ( x ) g ′ ( x ) abgeleitet werden dürfen. b) Verkettungen von Funktionen f ( g ( x )) nicht einfach zu Verkettungen der Ableitungen f ′ ( g ′ ( x )) abgeleitet werden dürfen. 11. Leiten Sie mit der Produktregel und der Regel für die Ableitung der Kehrfunktion die Quotientenregel her. 12. Begründen Sie oder widerlegen Sie mit einem Gegenbeispiel: a) Sind f, g : ] a ; b [ → R differenzierbare Funktionen mit f ′ ( x ) = g ′ ( x ) für alle x ∈ ] a, b [, so ist f ( x ) = g ( x ). b) Eine differenzierbare Funktion f : R → R ist genau dann ein Polynom, wenn ihre Ableitungsfunktion ein Polynom ist. c) Eine differenzierbare Funktion f : ] a ; b [ → R ist genau dann eine gebrochen-rationale Funktion, wenn die Funktion f ′ eine gebrochenrationale Funktion ist. d) Das Polynom q ( x ) ist genau dann ein Teiler des Polynoms p ( x ), wenn die Ableitungsfunktion von f ( x ) = p ( x ) q ( x ) ein Polynom ist. 13. Die Funktion f : [ − π/ 2; π/ 2], f ( x ) = sin( x ) ist streng monoton wachsend, sie hat also eine Umkehrfunktion f − 1 . Diese Umkehrfunktion wird auch als Arcussinusfunktion bezeichnet (lat. arcus: Bogen; die vom Sinus zum Bogen(maß) zurückführende Funktion). Berechnen Sie die Ableitung der Arcussinusfunktion. 14. Berechnen Sie die Ableitungen der folgenden Funktionen anhand ihrer Potenzreihendarstellung in Tabelle 7.2 vgl. S. 149 : a) f ( x ) = cos( x ) b) f ( x ) = ln(1 + x ) c) f ( x ) = arctan( x ) 8.5 Ableitung und Funktionseigenschaften Für die früher besprochenen linearen und quadratischen Funktionen lassen sich prinzipiell alle wichtigen Eigenschaften (Monotoniebereiche, Krümmungsverhalten, Scheitelpunkte) unmittelbar aus den Funktionen bzw. den Koeffizienten ablesen. Bei Polynomen höheren Grades und anderen speziellen Funktionen ist das jedoch meist nicht mehr möglich; statt dessen kann man mit Hilfe der (ersten und zweiten) Ableitung zahlreiche Eigenschaften der Funktion beschreiben bzw. dann im konkreten Fall berechnen. Diese Zusammenhänge sind die Grundlage für den Einsatz der Differentialrechnung in den ökonomischen Wissenschaften. Wir betrachten zunächst Eigenschaften einer Funktion mit Bezug auf die erste Ableitung, später mit Bezug auf die zweite Ableitung. 48818_Terveer.indd 191 48818_Terveer.indd 191 18.07.2023 11: 50: 32 18.07.2023 11: 50: 32 <?page no="192"?> 192 8 Differentialrechnung in einer Variablen 8.5.1 Ableitung erster Ordnung und Nullstellen Die genaue Berechnung der Nullstelle einer Funktion ist zunächst einmal nur für lineare und quadratische Funktionen möglich. Es gibt zwar auch für Polynome dritten und vierten Grades Nullstellenformeln; diese sind aber oft kaum zu handhaben. Funktionsterme, in denen Exponential-, Potenz-, Logarithmusfunktion oder aber trigonometrische Funktionen auftreten, lassen sich hingegen nur in seltenen Ausnahmenfällen auf Nullstellen überprüfen. Andererseits werden diese Nullstellen sehr oft dringend benötigt. Wenn man sich damit zufrieden stellen kann, diese mit einer vorgegebenen Genauigkeit anzugeben, bietet sich ein iteratives Verfahren zur Annäherung der Nullstelle an, das so genannte Newton-Verfahren. Die Grundidee des Newton-Verfahrens besteht darin, eine differenzierbare Funktion f , deren Nullstelle man nicht kennt, zu linearisieren und dann die Nullstelle der linearen Annäherungsfunktion zu verwenden. Dafür benötigt man einen Startpunkt ( x 0 | f ( x 0 )). Die Linearisierung von f in diesem Punkt lautet y = f ( x 0 )+ f ′ ( x 0 )( x − x 0 ). Nullsetzen und Auflösen nach x ergibt eine Nullstelle dieser linearen Funktion f ( x 0 ) + f ′ ( x 0 )( x 1 − x 0 ) = 0 ⇔ x 1 = x 0 − f ( x 0 ) f ′ ( x 0 ) Nun ist im Allgemeinen weder x 0 noch x 1 eine Nullstelle von f (wäre x 0 eine Nullstelle, so hätte man gar nicht suchen müssen). Aber wenn x 0 nur nahe genug an einer Nullstelle von f liegt, dann ist in aller Regel x 1 näher an dieser Nullstelle und man kann das Prinzip wiederholen, d.h. man berechnet x 2 = x 1 − f ( x 1 ) f ′ ( x 1 ) . Schon nach wenigen Wiederholungen erhält man oft eine zufriedenstellende Näherung für die gesuchte Nullstelle. Davon können Sie sich überzeugen, wenn Sie das Verfahren für eine Funktion ausprobieren, deren Nullstellen Sie kennen. Beispiel 8.40 Gesucht ist eine Approximation von √ 2 als (positive) Nullstelle von f ( x ) = x 2 − 2, f ′ ( x ) = 2 x . Das Newton-Verfahren bedeutet hier, dass mit einem Startwert x 0 der Folgewert x i +1 = x i − f ( x i ) f ′ ( x i ) = x i − x 2 i − 2 2 x i = x 2 i +2 2 x i = 12 ( x i + 2 x i ) gebildet wird. Die gewonnene Formel x i +1 = 12 ( x i + 2 x i ) heißt Heron-Iteration, und man kann sie so interpretieren, dass x i und 2 x i Näherungen für √ 2 sind, von denen die eine zu klein und die andere zu groß ist, weshalb der Mittelwert der beiden eine „bessere“ Näherung darstellt. Mit Startwert x 0 = 1 ist die Näherung schon nach drei Schritten besser als mit der Intervallhalbierung und der Regula falsi aus Beispiel 8.17: ■ x 1 = 12 (1 + 21 ) = 1 , 5 ■ x 2 = 12 (1 , 5 + 2 1 , 5 ) = 17 / 12 = 1 , 41¯6 ■ x 3 = 12 (17 / 12 + 2 17 / 12 ) = 577 408 ≈ 1 , 414216 Für manche Startwerte zeigt das Newton-Verfahren ein unerwartetes Verhalten. Beispiel 8.41 Betrachten Sie die Funktion f ( x ) = 15 x 3 − x = 15 x ( x 2 − 5) mit der Ableitung f ′ ( x ) = 35 x 2 − 1 und den Nullstellen x = 0 und x = ±√ 5 ≈ ± 2 , 236. Startet man mit x 0 = 2, so lautet die erste Linearisierung g 1 ( x ) = f (2) + f ′ (2)( x − 2) = − 25 + 75 ( x − 2) = 75 x − 16 5 . g 1 hat die Nullstelle x 1 = 16 7 ≈ 2 , 28. Die nächste Linearisierung 48818_Terveer.indd 192 48818_Terveer.indd 192 18.07.2023 11: 50: 35 18.07.2023 11: 50: 35 <?page no="193"?> 8.5 Ableitung und Funktionseigenschaften 193 Abbildung 8.12: Visualisierung des Newton-Verfahrens für Beispiel 8.41 ist nun g 2 ( x ) = f ( x 1 ) + f ′ ( x 1 )( x − x 1 ) = 523 245 x − 8192 1715 , und die Nullstelle von g 2 ist x 2 = 8192 3661 ≈ 2 , 238. Die beiden Linearisierungen sind in Abbildung 8.12, links, skizziert. Sie sehen, wie gut die Approximation der Nullstelle bereits ist. Dies geht auch aus der folgenden tabellarischen Darstellung der Rechenschritte hervor: n x f ( x ) f ′ ( x ) y = x − f ( x ) / f ′ ( x ) 1 2 , 0 − 0 , 4 1 , 4 2 , 28571 2 2 , 28571 0 , 102624 2 , 13469 2 , 23764 3 2 , 23764 0 , 00314734 2 , 00422 2 , 23607 4 2 , 23607 3 , 31 × 10 − 6 2 , 0 2 , 23607 Die Linearisierung etwa für den Startwert x 0 = 1 lautet g 1 ( x ) = f (1) + f ′ (1)( x − 1) = − 25 x − 25 mit der Nullstelle x 1 = − 1. Hierfür lautet die Linearisierung dann g 2 ( x ) = f ( − 1) + f ′ ( − 1) + ( x + 1) = − 25 x + 25 mit der Nullstelle x 2 = 1 = x 0 . Das Verfahren springt also nur zwischen den Stellen x = 1 und x = − 1 hin und her, statt zu konvergieren. Illustriert ist dieses Verhalten in Abbildung 8.12, rechts. Ist der Startwert oder eine der nachfolgend bestimmten Näherungen eine Nullstelle der Ableitung, so bricht das Verfahren ab, da Division durch Null nicht erlaubt ist. Problematisch ist ferner, wenn die gesuchte Nullstelle der Funktion auch eine Nullstelle der Ableitung ist; dann kann sich die Konvergenz gegen die Nullstelle verlangsamen. Fehlerhaftes bzw. nicht konvergierendes Verhalten des Newton-Verfahrens kann man vermeiden, indem ein Startwert gewählt wird, der ausreichend nahe bei der gesuchten Nullstelle liegt. Solch ein Startwert kann beispielweise mit dem Intervallhalbierungsverfahren oder der Regula falsi vgl. S. 176 bestimmt werden. Beide Verfahren sind zwar auch schon recht schnell, aber in der Regel lässt sich die näherungsweise Berechnung durch Fortsetzung mit dem Newton-Verfahren noch drastisch beschleunigen. Eine derartige zweistufige Methode zur numerischen Berechnung von Nullstellen wird auch hybrides Verfahren genannt. 8.5.2 Ableitung erster Ordnung und Monotonieverhalten Wir wollen hier annehmen, dass eine Funktion f : D → R, D =] a ; b [, vorliegt, die differenzierbar ist. In einem Punkt x 0 ∈ D lässt sich f durch die Linearisierung, d.h. durch die Gerade mit der Gleichung y = m ( x − x 0 )+ y 0 annähern. Dabei ist m = f ′ ( x 0 ), y 0 = f ( x 0 ). Falls m > 0 ist, so hat die Gerade einen steigenden Verlauf. Dann ist auch der Verlauf der Funktion f nahe bei x 0 monoton wachsend. Wenn f ′ ( x 0 ) für alle x 0 ∈ D positiv ist, hat die Funktion zwangsläufig einen insgesamt monoton wachsenden Verlauf. Diese etwas formlosen Überlegungen lassen sich wie folgt präzisieren: 48818_Terveer.indd 193 48818_Terveer.indd 193 18.07.2023 11: 50: 38 18.07.2023 11: 50: 38 <?page no="194"?> 194 8 Differentialrechnung in einer Variablen Satz 8.26 Sei f : ] a ; b [ → R eine differenzierbare Funktion. Dann gilt: [1] Falls f ′ ( x ) ≥ 0 (bzw. > 0) für alle x ∈ ] a ; b [, so ist f auf ] a ; b [ monoton wachsend (bzw. streng monoton wachsend). [2] Falls f ′ ( x ) ≤ 0 (bzw. < 0) für alle x ∈ ] a ; b [, so ist f auf ] a ; b [ monoton fallend (bzw. streng monoton fallend). [3] Umkehrung: Wenn f auf ] a ; b [ streng monoton wachsend (bzw. fallend) ist, so gilt f ′ ( x ) ≥ 0 (bzw. f ′ ( x ) ≤ 0) für alle x ∈ ] a ; b [. Nicht immer ist die Ableitung f ′ einer Funktion f durchweg positiv oder durchweg negativ. Wenn man es nicht gerade mit einer fallweise definierten Funktion oder der konstanten Nullfunktion zu tun hat, so besitzt die Ableitung von f in aller Regel im Definitionsbereich D =] a ; b [ nur endlich viele Nullstellen und zwischen diesen Nullstellen, d.h. auf bestimmten - größtmöglichen - Intervallen jeweils ein einheitliches Vorzeichenverhalten, mithin hat die Funktion f auf diesen Intervallen jeweils ein einheitliches Monotonieverhalten. Meist kann man auch noch davon ausgehen, dass neben der Funktion f auch die Ableitung f ′ eine stetige Funktion ist - das ist der Fall bei allen Funktionen der „Basisliste“ vgl. S. 186 und bei hieraus mit den verschiedenen „Operatoren“ konstruierten weiteren Funktionen. Zwischen zwei Nullstellen von f ′ hat die Ableitung dann ein einheitliches Vorzeichenverhalten. Das bedeutet allerdings nicht unbedingt, dass zwischen den Nullstellen das Vorzeichenverhalten von f ′ und damit das Monotonieverhalten von f wechselt. Insgesamt ist festzuhalten: Die Intervalle mit einheitlichen Vorzeichen von f ′ legen die Monotoniebereiche von f fest. Beispiel 8.42 Betrachten Sie die Polynomfunktion f ( x ) = x 5 + x 4 − 12 x 3 mit der Ableitung f ′ ( x ) = 5 x 4 + 4 x 3 − 32 x 2 . Man erkennt sofort die (zweifache! ) Nullstelle x = 0 von f ′ , die übrigen Nullstellen sind Lösung der quadratischen Gleichung 5 x 2 + 4 x − 32 = 0 und damit von der Form − 25 ± √ 23 50 . Also sind x 1 ≈ − 1 , 078, x 2 = 0 und x 3 ≈ 0 , 278 die Nullstellen von f ′ . Anhand des Graphen von f ′ , vgl. Abbildung 8.13, kann man erkennen, dass f ′ ( x ) > 0 für x < x 1 und f ′ ( x ) < 0 für x ∈ ] x 1 ; x 2 [ und x ∈ ] x 2 ; x 3 [. Schließlich gilt f ′ ( x ) > 0 für x > x 3 . In ] − ∞ ; x 1 [ ist f also streng monoton wachsend (streng isoton), in ] x 1 ; x 2 ] und ] x 2 ; x 3 [ ist f streng monoton fallend (streng antiton), in ] x 3 ; ∞ [ ist f streng monoton wachsend (streng isoton). Man kann die Intervalle jeweils auf die Randpunkte erweitern; hierdurch „verschmelzen“ die Intervalle ] x 1 ; x 2 ] und ] x 2 ; x 3 [ zu einem Intervall [ x 1 ; x 3 ] mit einheitlich monoton fallendem Verlauf von f . Beispiel 8.43 (Fortsetzung von Beispiel 8.34 vgl. S. 189 ) Für die allgemeine Exponentialfunktion f a : R → R , f a ( x ) = a x mit a > 0 gilt. f ′ a ( x ) = ln( a ) a x . Weil a x > 0 für alle x ∈ R, wird das Monotonieverhalten der Exponentialfunktion vom Vorzeichen von ln( a ) bestimmt, wobei ln( a ) > 0 für a > 1 und ln( a ) < 0 für a < 1. Daher ist im Fall a > 1 die Ableitung f ′ a ( x ) > 0, so dass f a streng monoton wachsend ist. Im Fall a < 1 ist f a streng monoton fallend. 48818_Terveer.indd 194 48818_Terveer.indd 194 18.07.2023 11: 50: 42 18.07.2023 11: 50: 42 <?page no="195"?> 8.5 Ableitung und Funktionseigenschaften 195 Abbildung 8.13: Graph von f ( x ) = x 5 + x 4 − 12 x 3 (schwarz) f ′ (grau) 8.5.3 Ableitung erster Ordnung und Regel von de l’Hospital Eine Verallgemeinerung der Ableitung als Grenzwert von Differenzenquotienten findet sich in der Regel von de l’Hospital. Dabei ersetzt man den Ausdruck x − x 0 im Nenner des Differenzenquotienten durch die Differenz g ( x ) − g ( x 0 ) einer weiteren in x 0 differenzierbaren Funktion, betrachtet also den Quotienten f ( x ) − f ( x 0 ) g ( x ) − g ( x 0 ) = f ( x ) − f ( x 0 ) x − x 0 / g ( x ) − g ( x 0 ) x − x 0 Sofern g ′ ( x 0 ) ̸ = 0, ergibt sich also der Grenzwert lim x → x 0 f ( x ) − f ( x 0 ) g ( x ) − g ( x 0 ) = f ′ ( x 0 ) g ′ ( x 0 ) . Die Regel von de l’Hospital ist noch ein wenig allgemeiner: Satz 8.27 (Regel von de l’Hospital) Seien f, g : ] a ; b [ → R differenzierbar, g ′ ( x ) ̸ = 0 ∀ x ∈ ] a ; b [ sowie x 0 ∈ R mit f ( x 0 ) = g ( x 0 ) = 0. Dann gilt: lim x → x 0 f ( x ) g ( x ) = lim x → x 0 f ′ ( x ) g ′ ( x ) , sofern der zweite Grenzwert existiert. Aufgrund des Grenzwertübergangs genügt es, dass g ′ ( x ) ̸ = 0 in einer „kleinen“ Umgebung von x 0 gilt. Die de l’Hospitalsche Regel ist auch richtig, wenn x 0 eine Definitionslücke von f und g mit lim x → x 0 f ( x ) = 0 = lim x → 0 g ( x ) ist sowie mit entsprechenden Anpassungen auch für uneigentliche Grenzwertübergänge, d.h. für x → ±∞ . Beispiel 8.44 (Laufzeit von Annuitäten, vgl. Abschnitt 7.6.3) Die Laufzeit einer Annuität war mit − log(1 − p p + t ) / log(1 + p 1200 ) ermittelt worden. Leitet man den Zähler dieses Bruches nach p ab, so ergibt sich mit der Kettenregel un der Ableitungsregel für die Logarithmusfunktion der Term 1 1 − p p + t t ( p + t ) 2 . Für den Nenner erhält man entsprechend die Ableitung 1 1200 1 1+ p 1200 . Strebt der Zinsfaktor p gegen Null, so ergibt sich mit der de l’Hospital’schen Regel die Laufzeit als lim p → 0 − ln(1 − p p + t ) ln(1 + p 1200 ) = lim p → 0 1 1 − p p + t t ( p + t ) 2 1 1200 1 1+ p 1200 = 1200 t wie in Abschnitt 7.6.3 angegeben. 48818_Terveer.indd 195 48818_Terveer.indd 195 18.07.2023 11: 50: 46 18.07.2023 11: 50: 46 <?page no="196"?> 196 8 Differentialrechnung in einer Variablen Abbildung 8.14: Linksseitige und rechtsseitige Sekantensteigungen zu einer Minimalstelle x 0 einer differenzierbaren Funktion f : ] a ; b [ → R. Die Ableitung als Grenzwert muss in x 0 sowohl ≤ 0 als auch ≥ 0 sein. 8.5.4 Ableitungen erster Ordnung und Bedingungen für Extrema Eine der wichtigsten Anwendungen der Ableitung ist die Bestimmung von Extrema bei differenzierbaren Funktionen f mit Definitionsbereich D =] a ; b [. Dabei unterscheidet man zwischen ■ einer notwendigen Bedingung, d.h. einer Bedingung, welche eine Stelle x 0 ∈ D erfüllt, wenn in ihr ein (lokales) Extremum vorliegt, ■ einer hinreichenden Bedingung, d.h. einer Bedingung, aus welcher folgt, dass eine bestimmte Stelle eine (lokale) Extremstelle ist. Mit der notwendigen Bedingung bestimmt man zunächst Kandidaten für Extremstellen, diese werden auch kritische Punkte genannt; ein Kandidat, welcher zusätzlich die hinreichende Bedingung erfüllt, ist dann eine Extremstelle. Wir besprechen zunächst die notwendige Bedingung für ein Extremum. Nehmen wir an, dass f in x 0 ∈ D ein Minimum hat, dann gilt f ( x ) ≥ f ( x 0 ) für alle x ̸ = x 0 . Die linksseitigen Sekanten durch die Punkte ( x 0 | f ( x 0 )) und ( x, f ( x )), d.h. für x < x 0 haben dann allesamt die Steigung f ( x ) − f ( x 0 ) x − x 0 ≤ 0, vgl. auch Abbildung 8.14, links. Für die rechtsseitigen Sekanten, d.h. für x > x 0 ist f ( x ) − f ( x 0 ) x − x 0 ≥ 0 und entsprechend muss f ′ ( x 0 ) ≥ 0 sein, siehe Abbildung 8.14, rechts. Die Ableitung als Grenzwert von Sekantensteigungen kann nur dann beiden Eigenschaften Genüge leisten, wenn sie gleich Null ist. Ganz entsprechend kann man argumentieren, wenn x 0 Stelle eines Maximums von f ist. Es gilt also: Bei der Suche nach Extrema von f : ] a ; b [ → R kann man sich auf die Nullstellen der Ableitungsfunktion f ′ beschränken. Beispiel 8.45 Die Funktion f : R → R, f ( x ) = x 2 − 4 x +5 hat die Ableitung f ′ ( x ) = 2 x − 4. Einzige Nullstelle der Ableitung ist x = 2. Dass an dieser Stelle mit f (2) = 1 tatsächlich ein Minimum von f vorliegt, kann man anhand der Scheitelpunktform erkennen, denn x 2 − 4 x + 5 = ( x 2 − 4 x + 4) + 1 = ( x − 2) 2 + 1 ≥ 1. Der Wert 1 wird als kleinstmöglicher Funktionswert von f also für x = 2 „realisiert“. Gleich werden wir sehen, wie man dies auch ohne die Scheitelpunktform erkennen kann. Ein Maximum 48818_Terveer.indd 196 48818_Terveer.indd 196 18.07.2023 11: 50: 48 18.07.2023 11: 50: 48 <?page no="197"?> 8.5 Ableitung und Funktionseigenschaften 197 Abbildung 8.15: Graphen der Funktionen aus Beispiel 8.46 (links) und Beispiel 8.47 (rechts). hat die Funktion auf R nicht, da sie als nach oben geöffnete Parabel unbeschränkt große Funktionswerte annehmen kann. Wenn die Ableitung einer Funktion f mehrere Nullstellen hat, so ist in der Regel höchstens eine von diesen eine Minimalstelle bzw. eine Maximalstelle von f , während die übrigen nicht weiter berücksichtigt werden müssen. Hier ist dann ein Funktionswertvergleich oder die Prüfung anhand des Funktionsgraphen erforderlich: Beispiel 8.46 Die Funktion f : R → R, f ( x ) = x 4 − 3 x 3 + 4 x + 1 hat die Ableitung f ′ ( x ) = 4 x 3 − 9 x 2 + 4. Eine Nullstelle von f ′ ist x 3 = 2, die anderen erhält man, indem zunächst der lineare Faktor ( x − 2) per Polynomdivision aus f ′ ( x ) abgespalten wird. Das ergibt f ′ ( x ) = ( x − 2) ( 4 x 2 − x − 2 ) . Der quadratische Restterm hat dann die Nullstellen x 1 = 1 −√ 33 8 ≈ − 0 , 59 und x 2 = 1+ √ 33 8 ≈ 0 , 84. Am Graphen in Abbildung 8.15, links, ist zu erkennen, dass das Minimum von f in x 1 angenommen wird. Ein Maximum hat die Funktion nicht, sie wird „zu den Rändern hin“ beliebig groß. Im vorangegangenen Beispiel sind die beiden Nullstellen x 1 , x 3 keine Extrema. Wenn man sich aber auf ein hinreichend kleines Intervall um x 1 bzw. x 3 beschränkt, so ist innerhalb dieses Intervalls x 3 ein Maximum und x 1 ein Minimum von f . Solche Extrema heißen lokale Extrema. Die zuvor behandelten Extrema werden zur besseren Abgrenzung von diesen lokalen Extrema auch globale Extrema bzw. absolute Extrema genannt. Mit den obigen Überlegungen zur Sekantensteigung ergibt sich nun der wichtige Satz: Satz 8.28 (Notwendige Bedingung für lokale Extrema) Es sei x 0 ∈ ] a ; b [ lokales Extremum einer differenzierbaren Funktion f : ] a ; b [ → R. Dann gilt f ′ ( x 0 ) = 0. Die Eigenschaft f ′ ( x ) = 0 muss für ein lokales Extremum vorliegen, reicht aber zum Nachweis noch nicht aus. Schließlich bedeutet f ′ ( x ) = 0 nichts anderes, als dass die Tangente an den Graphen von f horizontal verläuft. Das folgende Beispiel verdeutlicht, dass damit noch nicht zwangsläufig ein Extremwert gefunden wurde: Beispiel 8.47 Die Ableitung der Funktion f : R → R, f ( x ) = 3 x 4 − 20 x 3 + 48 x 2 − 48 x + 18 ist f ′ ( x ) = 12 x 3 − 60 x 2 + 96 x − 48. Die Nullstellen der Ableitung sind (nach Division durch 12) Lösungen der Gleichung x 3 − 5 x 2 + 8 x − 4 = 0 ⇔ ( x − 1)( x − 2) 2 = 0. Die Nullstelle x = 1 rät man, nach Polynomdivision durch ( x − 1) bleibt das Polynom 48818_Terveer.indd 197 48818_Terveer.indd 197 18.07.2023 11: 50: 52 18.07.2023 11: 50: 52 <?page no="198"?> 198 8 Differentialrechnung in einer Variablen x 2 − 4 x + 4 = ( x − 2) 2 übrig, welches die Nullstelle x = 2 hat. Die Besonderheit dieses Beispiels ist, dass die Ableitung in x = 2 eine doppelte Nullstelle hat. Bei x = 2 handelt es sich hier nicht um ein Extremum, sondern um einen Sattelpunkt, d.h. eine Wendestelle mit horizontaler Tangente vgl. Abbildung 8.15 links . Derartige Stellen werden wir später noch besprechen. Im Unterschied zur Extremstelle x = 1 sind die linksseitigen und die rechtsseiten Sekantensteigungen in x = 2 jeweils positiv. An dem vorangegangenen Beispiel können Sie erkennen, woran es liegen kann, dass eine Nullstelle der Ableitung nicht auch Extremum ist. Immer dann, wenn die Steigung der links- und rechtsseitige Sekanten zu einem Punkt ( x 0 | f ( x 0 )) mit Ableitung f ′ ( x 0 ) = 0 durch Punkte ( x | f ( x )) „nahe“ x 0 durchweg positiv oder durchweg negativ ist, hat die Funktion in x 0 einen durchweg monotonen Verlauf; dann kann dort kein Extremum vorliegen. Wechselt umgekehrt aber das Monotonieverhalten von f in x 0 , dann muss die Funktion an der Stelle x 0 ein (lokales) Extremum haben. Daraus leitet sich das folgende hinreichende Kriterium für (lokale) Extrema ab: Satz 8.29 (Hinreichende Bedingungen für Extrema) Es sei f : D → R, differenzierbar, D =] a ; b [ und x 0 ∈ D die einzige Nullstelle von f ′ in D. Dann gilt: [1] Wenn f ′ in x 0 einen Vorzeichenwechsel von − nach + hat, d.h. wenn f ′ ( x 1 ) < 0 < f ( x 2 ) für alle x 1 < x 0 < x 2 gilt, dann hat f in x 0 ein Minimum. [2] Wenn f ′ in x 0 einen Vorzeichenwechsel von + nach − hat, d.h. wenn f ′ ( x 1 ) > 0 > f ( x 2 ) für alle x 1 < x 0 < x 2 gilt, dann hat f in x 0 ein Maximum. Hat f ′ mehrere Nullstellen und gilt [1] oder [2] nur in einem echten Teilintervall ] x 0 − δ ; x 0 + δ [ ⊂ D mit δ > 0, so hat f in x 0 ein lokales Extremum. Wenn f ′ mehrere Nullstellen hat, so prüft man das Vorzeichenverhalten von f ′ jeweils links und rechts von den Nullstellen und kann so auf lokale Extrema schließen. Beispiel 8.48 (Fortsetzung von Beispiel 8.47) Die Ableitung von f : R → R, f ( x ) = 3 x 4 − 20 x 3 + 48 x 2 − 48 x + 18 ist f ′ ( x ) = 12 x 3 − 60 x 2 + 96 x − 48 = 12( x − 1)( x − 2) 2 und hat folgendes Vorzeichenverhalten: ■ Für x < 1 ist f ′ ( x ) < 0 (dafür ist der Faktor ( x − 1) < 0 „zuständig“). ■ Für 1 < x < 2 und x > 2 ist f ′ ( x ) > 0. In x = 1 liegt also ein Vorzeichenwechsel von f ′ von − nach + vor, in x = 2 liegt kein Vorzeichenwechsel vor. Daher hat f in x = 1 ein lokales Minimum, in x = 2 hingegen nicht. x = 1 ist sogar Stelle eines globalen Minimums, denn aufgrund des Vorzeichenverhaltens von f ′ ist f auf ] − ∞ ; 1] monoton fallend, auf [1; ∞ [ hingegen monoton wachsend. Für x < 1 und für x > 1 gilt also f ( x ) ≥ f (1). 8.5.5 Ableitungen erster und zweiter Ordnung und lokale Extrema Mit der zweiten Ableitung f ′′ ( x ) kann man die notwendige Bedingung für lokale Extrema so erweitern, dass sie eine hinreichende Bedingung für lokale Extrema ist: 48818_Terveer.indd 198 48818_Terveer.indd 198 18.07.2023 11: 50: 56 18.07.2023 11: 50: 56 <?page no="199"?> 8.5 Ableitung und Funktionseigenschaften 199 Abbildung 8.16: Graphen von Funktion f und Ableitungen f ′ , f ′′ in Beispiel 8.49 (links) und Beispiel 8.50 (rechts) Satz 8.30 (Hinreichende Bedingungen für lokale Extrema) Es sei D =] a ; b [ und f : D → R sei zweimal differenzierbar auf D. x 0 ∈ D sei eine Stelle mit folgenden Eigenschaften: [1] f ′ ( x 0 ) = 0 [2] f ′′ ( x 0 ) ̸ = 0 Dann hat f in x 0 ein lokales Extremum. Im Falle f ′′ ( x 0 ) > 0 handelt es sich um ein lokales Minimum, bei f ′′ ( x 0 ) < 0 um ein lokales Maximum. Man kann sich den Sachverhalt wie folgt verdeutlichen. In x 0 hat die Ableitung die Linearisierung f ′ ( x ) ≈ f ′ ( x 0 ) + f ′′ ( x 0 )( x − x 0 ) = f ′′ ( x 0 )( x − x 0 ). Je nach Vorzeichen von f ′′ ( x 0 ) liegt also in der Nähe von x 0 ein f ′ -Vorzeichenwechsel von − nach + oder von + nach − vor. In jedem Fall sind die Voraussetzungen für ein lokales Extremum erfüllt. Beispiel 8.49 Die Funktion f : ]1; ∞ [ → R, f ( x ) = x 2 x − 1 hat die Ableitungen f ′ ( x ) = 2 x ( x − 1) − x 2 ( x − 1) 2 = x 2 − 2 x ( x − 1) 2 = x ( x − 2) ( x − 1) 2 f ′′ ( x ) = (2 x − 2)( x − 1) 2 − 2 x ( x − 2)( x − 1) ( x − 1) 4 = 2 ( x − 1) 3 In Abbildung 8.16, links, sind f, f ′ , f ′′ skizziert. Notwendig für ein lokales Extremum ist f ′ ( x ) = 0 ⇔ x = 2 (die Nullstelle x = 0 des Zählerpolynoms von f liegt nicht im Definitionsbereich). Hinreichend für ein lokales Extremum ist, dass an der berechneten Stelle x = 2 die zweite Ableitung ungleich Null ist. Dies ist hier aber der Fall, es ist f ′′ (2) = 2 > 0. Es liegt also ein lokales Minimum vor. Beispiel 8.50 f : ]0; ∞ [ → R, f ( x ) = x 3 − 9 x 2 +24 x − 16 x = x 2 − 9 x +24 − 16 x hat die Ableitungen f ′ ( x ) = 2 x − 9 + 16 x 2 = 2 x 3 − 9 x 2 +16 x 2 und f ′′ ( x ) = 2 − 32 x 3 = 2 x 3 − 32 x 3 . In Abbildung 8.16, rechts, sind f, f ′ , f ′′ skizziert. Notwendig für ein lokales Extremum ist f ′ ( x ) = 0. Durch Raten erhält man die Nullstelle x = 4 des Zählers, der sich durch Polynomdivision faktorisieren lässt: 2 x 3 − 9 x 2 + 16 = ( x − 4)(2 x 2 − x − 4). Damit erhält man eine weitere Nullstelle der ersten Ableitung durch Lösen der quadratischen Gleichung 2 x 2 − x − 4 = 0 ⇔ x = 1 4 ± √ 33 16 = 1 ±√ 33 4 . Nur noch die positive Lösung 1+ √ 33 4 ≈ 1 , 6861 liegt im Definitionsbereich. Die beiden berechneten Punkte werden nun in die zweite Ableitung eingesetzt: f ′′ (4) = 2 · 4 3 − 32 4 3 = 32 > 0 und f ′′ ( 14 + √ 33 16 ) = 48818_Terveer.indd 199 48818_Terveer.indd 199 18.07.2023 11: 51: 00 18.07.2023 11: 51: 00 <?page no="200"?> 200 8 Differentialrechnung in einer Variablen Abbildung 8.17: Funktionen mit f ′ (1) = f ′′ (1) = 0, links Beispiel 8.53 ohne Extremum, rechts Beispiel 8.54 mit Extremum. 33 4 − 9 √ 33 4 ≈ − 4 , 675 < 0. In x = 4 liegt ein lokales Minimum , in x = 1+ √ 33 4 ein lokales Maximum von f vor. Ob ein lokales Extremum einer Funktion bereits ein globales Extremum ist, kann man im allgemeinen nur mit einer zusätzlichen Prüfung herausfinden, dem sogenannten Randwertvergleich. Wenn die Funktion auf einem Intervall erklärt ist, berechnet man hierzu die Funktionswerte an den Intervallrändern bzw. die Funktionsgrenzwerte an diesen Randpunkten, wenn sie nicht zum Intervall gehören. Abschließend wird mit den Funktionswerten zu den lokalen Extrema verglichen. Beispiel 8.51 Die Funktion f : ]1; ∞ [ → R, f ( x ) = x 2 x − 1 aus Beispiel 8.49 hat ein lokales Minimum in x = 2. Kleinere Funktionswerte können nur für x → 1 bzw. x → ∞ auftreten. Beide Funktionsgrenzwerte sind aber + ∞ . Daher hat f in x = 2 schon ein globales Minimum. Beispiel 8.52 Die Funktion f : ]0; ∞ [ → R, f ( x ) = x 3 − 9 x 2 +24 x − 16 x = x 2 − 9 x + 24 − 16 x aus Beispiel 8.50 hat in x = 4 ein lokales Minimum und in x = 1+ √ 33 4 ein lokales Maximum. Sie hat für x → 0 den Grenzwert −∞ und für x → ∞ den Grenzwert ∞ . Also hat f weder ein globales Minimum noch ein globales Maximum. Wenn an einer Stelle x 0 sowohl die erste als auch die zweite Ableitung verschwindet, ist noch keine Aussage über das Vorliegen bzw. Nichtvorliegen eines Extremums möglich. Beispiel 8.53 Die Funktion f ( x ) = x 3 − 3 x 2 + 3 x = ( x − 1) 3 + 1 hat die Ableitungen f ′ ( x ) = 3 x 2 − 6 x + 3 = 3( x 2 − 2 x + 1) = 3( x − 1) 2 und f ′′ ( x ) = 6 x − 6 = 6( x − 1). In x = 1 liegt daher sowohl eine Nullstelle von f ′ als auch von f ′′ vor. Die Funktion hat an dieser Stelle kein Extremum, denn ihre erste Ableitung ist überall ≥ 0, d.h. die Funktion ist monoton wachsend (sogar streng monoton wachsend). Der Graph von f ist in Abbildung 8.17, links, dargestellt. Beispiel 8.54 Die Funktion f ( x ) = x 4 − 4 x 3 + 6 x 2 − 4 x = ( x − 1) 4 − 1 hat die Ableitungen f ′ ( x ) = 4 x 3 − 12 x 2 +12 x − 4 = 4( x − 1) 3 und f ′′ ( x ) = 12 x 2 − 24 x +12 = 12( x − 1) 2 . In x = 1 liegt daher sowohl eine Nullstelle von f ′ als auch von f ′′ vor. Die Funktion hat an dieser Stelle ein globales Minimum, wie man aus der Darstellung f ( x ) = ( x − 1) 4 − 1 erkennt. Der Graph von f ist in Abbildung 8.17, rechts, dargestellt. Mit weiteren höheren Ableitungen f ′′′ ( x 0 ) , f (4) ( x 0 ) , . . . ließe sich wieder ein hinreichendes Kriterium formulieren, darauf soll hier aber nicht eingegangen werden. 48818_Terveer.indd 200 48818_Terveer.indd 200 18.07.2023 11: 51: 04 18.07.2023 11: 51: 04 <?page no="201"?> 8.5 Ableitung und Funktionseigenschaften 201 Die erste und zweite Ableitung können auch zur numerischen Approximation von Extremstellen verwendet werden. Weil die notwendige Bedingung für ein lokales Extremum f ′ ( x ) = 0 heißt, kann man kritische Punkte mit dem Newton-Verfahren vgl. Unterabschnitt 8.5.1, S. 192 bestimmen, indem dieses auf f ′ angewendet wird. Mit einem ausreichend nahe bei der gesuchten Stelle liegenden Startwert x 1 wird eine implizite Folge ( x n ) n ≥ 1 konstruiert, bei der x n +1 = x n − f ′ ( x n ) / f ′′ ( x n ) gilt. 8.5.6 Ableitung zweiter Ordnung und Krümmungsverhalten Geht man bei einer zweimal differenzierbaren Funktion f : D → R mit D =] a ; b [ von der ersten Ableitung f ′ zur zweiten Ableitung f ′′ über, so kann man mit dem Vorzeichenverhalten dieser Ableitung das Monotonieverhalten von f ′ genau so beschreiben, wie mit dem Vorzeichenverhalten von f ′ das Monotonieverhalten von f erfasst wird. Welchen Nutzen kann es bringen, das Monotonieverhalten von f ′ zu beschreiben? Nehmen wir einmal an, die Ableitung f ′ einer Funktion f ist monoton steigend. Das bedeutet, dass die Steigung f ′ ( x ) der Funktion f mit zunehmendem x immer größer wird. Eine monoton wachsende Funktion verläuft dann mit zunehmendem x immer „steiler“ während eine monoton fallende Funktion mit zunehmendem x immer „flacher“ verläuft. Insgesamt hat eine Funktion f mit monoton steigender Ableitung f ′ einen linksgekrümmten Verlauf. Umgekehrt liegt bei einer monoton fallenden Ableitungsfunktion f ′ ein rechtsgekrümmter Funktionsverlauf von f vor. Wenn die Ableitungsfunktion aufeinander folgende „Monotonie-Intervalle“ hat, wechselt das Krümmungsverhalten von f also gemäß dieser Intervalle. Insgesamt kann man daher mit der zweiten Ableitung f ′′ über die Monotonie von f ′ mittelbar die Bereiche von f identifizieren, in denen f konvex bzw. konkav ist. Genauer gilt: Satz 8.31 Es sei D =] a ; b [ und f : ] a ; b [ → R eine zweimal differenzierbare Funktion. Dann gilt: [1] Wenn f ′′ ( x ) ≥ 0 ( ≤ 0) für alle x ∈ D, so ist f auf D konvex (konkav). [2] Wenn f ′′ ( x ) > 0 ( < 0) für alle x ∈ D, so ist f auf D streng konvex (streng konkav). [3] Wenn f auf D konvex (konkav) ist, so gilt f ′′ ( x ) ≥ 0 ( ≤ 0) für alle x ∈ D. Beispiel 8.55 Die Funktion f : ]1; ∞ [ → R, f ( x ) = x 2 x − 1 aus Beispiel 8.49 vgl. S. 199 hat die zweite Ableitung f ′′ ( x ) = 2 ( x − 1) 3 . Für x > 1 ist die zweite Ableitung größer als Null, daher ist die Funktion auf ]1; ∞ [ konvex. Dieses Krümmungsverhalten konnte man in Abbildung 8.16, links vgl. S. 199 bereits erkennen. Beispiel 8.56 Die Funktion f ( x ) = x 4 − 4 x 3 + 6 x 2 − 4 x = ( x − 1) 4 − 1 aus Beispiel 8.54 vgl. S. 200 hat die zweite Ableitung f ′′ ( x ) = 12 x 2 − 24 x + 12 = 12( x − 1) 2 ≥ 0. Die Funktion ist also konvex. Dieses Krümmungsverhalten konnte man auch schon in Abbildung 8.17, rechts vgl. S. 200 erkennen. Bei Funktionen, die ein einheitliches Krümmungsverhalten aufweisen, lässt sich das Vorliegen globaler Extrema viel einfacher nachweisen, denn sowohl die Prüfung der hinreichenden Bedingungen für lokale Extrema als auch der Randwertvergleich kann entfallen: 48818_Terveer.indd 201 48818_Terveer.indd 201 18.07.2023 11: 51: 07 18.07.2023 11: 51: 07 <?page no="202"?> 202 8 Differentialrechnung in einer Variablen Abbildung 8.18: Graphen von f, f ′ , f ′′ für f ( x ) = e x / x aus Beispiel 8.58 Satz 8.32 Sei f : ] a ; b [ → R eine differenzierbare Funktion und x 0 ∈ ] a ; b [ mit f ′ ( x 0 ) = 0. Dann gilt: [1] Falls f konvex ist, so hat f in x 0 ein globales Minimum. [2] Falls f konkav ist, so hat f in x 0 ein globales Maximum. Die Prüfung des Krümmungsverhaltens erfolgt hier in aller Regel über die Untersuchung des Vorzeichenverhaltens der zweiten Ableitung. Beispiel 8.57 Die Funktionen in den Beispielen 8.49 vgl. S. 199 und 8.54 vgl. S. 200 sind konvex und haben ein lokales Minimum. An dieser Stelle liegt dann ein globales Minimum. Beispiel 8.58 Die Funktion f : ]0; ∞ [ → R, f ( x ) = e x x hat die Ableitungen f ′ ( x ) = e x x − e x x 2 = e x ( x − 1) x 2 f ′′ ( x ) = ( e x ( x − 1) + e x ) x 2 − e x ( x − 1)2 x x 4 = e x (( x − 1) 2 + 1) x 3 Hier ist f ′′ ( x ) ≥ 0 für alle x > 0, die Funktion f ist also auf ]0; ∞ [ konvex. Es gilt f ′ (1) = 0, die Funktion hat in x = 1 ein globales Minimum vgl. Abbildung 8.18 . Für eine Funktion f mit nicht einheitlichem Vorzeichenverhalten ihrer zweiten Ableitung berechnet man nun die Nullstellen von f ′′ . Hierdurch wird der Definitionsbereich in Teilintervalle mit einheitlichem Vorzeichen von f ′′ aufgeteilt. Die Übergänge zwischen zwei derartigen Intervallen stellen den Wechsel von einer Linkszu einer Rechtskrümmung bzw. umgekehrt dar, man nennt sie Wendestellen. Satz 8.33 Sei f : ] a ; b [ → R zweimal differenzierbar und x 0 ∈ ] a ; b [ mit f ′′ ( x 0 ) = 0. Wenn f ′′ in x 0 einen Vorzeichenwechsel von + nach − (von − nach +) hat, so hat f in x 0 eine Wendestelle mit Wechsel von Linkszu Rechtskrümmung (von Rechtszu Linkskrümmung). Statt des Vorzeichenwechsels von f ′′ kann man auch noch einmal weiter differenzieren und erhält folgendes Kriterium für Wendestellen: 48818_Terveer.indd 202 48818_Terveer.indd 202 18.07.2023 11: 51: 10 18.07.2023 11: 51: 10 <?page no="203"?> 8.5 Ableitung und Funktionseigenschaften 203 Satz 8.34 (Hinreichende Bedingungen für Wendestellen) Sei f : D → R, D =] a ; b [ eine dreimal differenzierbare Funktion und x 0 ∈ D eine Stelle mit [1] f ′′ ( x 0 ) = 0 und [2] f ′′′ ( x 0 ) ̸ = 0. Dann hat f in x 0 eine Wendestelle. Über die (notwendige) Bedingung f ′′ ( x ) = 0 werden zunächst die Kandidaten x 0 für eine Wendestelle ermittel und mit der dritten Ableitung dann auf ihr Wendestellenverhalten überprüft. ■ Gilt f ′′ ( x 0 ) = 0 und f ′′′ ( x 0 ) > 0, so liegt eine Wendestelle mit Übergang von der Rechtszur Linkskrümmung vor. ■ Gilt f ′′ ( x 0 ) = 0 und f ′′′ ( x 0 ) < 0, so liegt eine Wendestelle mit Übergang von der Linkszur Rechtskrümmung vor. Beispiel 8.59 In Beispiel 8.53 vgl. S. 200 wurde die Funktion f ( x ) = x 3 − 3 x 2 +3 x = ( x − 1) 3 +1 auf Extrema untersucht. Hier prüfen wir die Funktion auf Wendestellen. Ihre erste und zweite Ableitung lauten (s.o.) f ′ ( x ) = 3 x 2 − 6 x + 3 = 3( x − 1) 2 und f ′′ ( x ) = 6( x − 1). Ihre dritte Ableitung ist f ′′′ ( x ) = 6. Die zweite Ableitung hat eine Nullstelle in x = 1 mit Vorzeichenwechsel von − nach + bzw. mit dritter Ableitung f ′′ (1) = 6 > 0. Es liegt in x = 1 also eine Wendestelle mit Übergang von Rechtszu Linkskrümmung vor. Dies Verhalten ist auch schon in Abbildung 8.17, links, zu erkennen. Liegt in einem Punkt W ( x 0 | f ( x 0 )) einer differenzierbaren Funktion f eine Wendestelle vor, so nennt man die Tangente an den Graphen von f auch Wendetangente. Ein besonderer Spezialfall liegt dann vor, wenn diese Wendetangente die Steigung 0 hat, d.h. wenn bei einer zweimal differenzierbaren Funktion sowohl f ′′ ( x 0 ) = 0 als auch f ′ ( x 0 ) = 0 gilt. Einen solchen Punkt W mit f ′′′ ( x 0 ) ̸ = 0 oder einem Vorzeichenwechsel von f ′′ in x 0 nennt man Sattelpunkt von f (seltener: Terrassenpunkt). Beispiel 8.60 In Beispiel 8.47 vgl. S. 197 liegt an der Stelle x = 2 ein Sattelpunkt vor. 8.5.7 Kurvendiskussionen und Funktionssteckbriefe Die bisher besprochenen Eigenschaften einer Funktion in Abhängigkeit von ihren Ableitungen werden u.a. im Rahmen der so genannten Kurvendiskussion eingesetzt. Dabei handelt es sich um eine detaillierte Untersuchung des Verhaltens einer Funktion bzw. Funktionenschar, bei der meist die folgenden Eigenschaften geprüft werden: Schritte einer Kurvendiskussion [1] Bestimmung des Definitionsbereiches von f . [2] Untersuchung des Symmetrieverhaltens von f . [3] Berechnung der Ableitungen f ′ , f ′′ und ggf. f ′′′ . [4] Verhalten im Unendlichen/ an den Rändern des Definitionsbereiches : Ermittlung der uneigentlichen bzw. eigentlichen Grenzwerte am Rand des Definitionsbereiches vgl. S. 169 und ggf. der Asymptoten vgl. S. 171 von f , ggf. unter Verwendung der Regel von l’Hospital vgl. S. 195 . 48818_Terveer.indd 203 48818_Terveer.indd 203 18.07.2023 11: 51: 14 18.07.2023 11: 51: 14 <?page no="204"?> 204 8 Differentialrechnung in einer Variablen [5] Diskussion des Polstellenverhaltens von f vgl. S. 170f. , ggf. unter Verwendung der Regel von l’Hospital. [6] Berechnung der Nullstellen von f : mittels des Nullstellenverhaltens linearer, quadratischer und ganzrationaler Funktionen sowie spezieller Funktionen. [7] Nullstellen von f ′ und Monotonieverhalten von f . [8] Nullstellen von f ′′ und Krümmungsverhalten von f . [9] Lokale und globale Extrema von f : aus Nullstellen von f ′ , Vorzeichenverhalten von f ′′ (oder f ′ ) und Randverhalten bzw. dem Krümmungsverhalten von f . [10] Wendestellen von f : Nullstellen von f ′′ und Vorzeichenverhalten von f ′′′ ( f ′′ ). [11] Skizze des Graphen unter Aufstellung einer repräsentativen Wertetabelle mit Nullstellen, Extremstellen und Wendestellen von f . Exemplarisch führen wir dieses Programm mit einer gebrochen-rationalen Funktion aus; für diesen Funktionstyp sind oft besonders viele der Punkte genauer zu prüfen: Beispiel 8.61 Betrachtet wird die Funktion f ( x ) = x 3 + x 2 (1 − 2 x ) 2 . [1] Die Nullstelle 12 des Nenners ist einzige Definitionslücke. Ist der Definitionsbereich so groß wie möglich zu wählen, so ist dieser also D = R \ { 12 } = { x ∈ R : x ̸ = 12 } . [2] Symmetrieverhalten: Zu prüfen ist, ob f eine gerade oder eine ungerade Funktion ist, d.h. ob f ( x ) = f ( − x ) für alle x ∈ D gilt oder ob f ( − x ) = − f ( x ) für alle x ∈ D gilt. Da aber schon nicht immer mit x ∈ D auch x ∈ D gilt (z.B. nicht für x = 12 , ist f weder gerade noch ungerade. [3] Ableitungen sind f ′ ( x ) = − 2 x 3 +3 x 2 +2 x (1 − 2 x ) 3 , f ′′ ( x ) = 14 x +2 (1 − 2 x ) 4 , f ′′′ ( x ) = 84 x +30 (1 − 2 x ) 5 [4] Verhalten im Unendlichen: Zähler und Nenner sind Polynome vom Grad 3 bzw. 2 mit positivem Leitkoeffizient. Die Grenzwerte lauten also auch hier lim x →∞ f ( x ) = + ∞ und lim x →−∞ f ( x ) = −∞ . Aufgrund des Gradunterschiedes hat f eine lineare Asymptote, die man durch Polynomdivision gewinnt: ( x 3 + x 2 ) : (4 x 2 +1) = 14 x + 12 [5] Polstellenverhalten: Das Nennerpolynom q ( x ) = (1 − 2 x ) 2 = 4( x − 1 2 ) 2 hat eine doppelte Nullstelle in x = 12 . Diese ist keine Nullstelle des Zählerpolynoms. Also liegt in x = 12 eine Polstelle ohne Vorzeichenwechsel vor. Der Funktionsgrenzwert für x → 12 ist dann + ∞ , denn in der Polstelle x = 12 ist das Zählerpolynom positiv. [6] Die Nullstellen von f sind genau die Nullstellen des Zählerpolynoms p ( x ) = x 3 + x 2 = x 2 ( x + 1), also hat f die Nullstellen x = 0 und x = 1. [7] Die Nullstellen von f ′ ( x ) sind genau die Nullstellen des Zählerpolynoms: − 2 x 3 + 3 x 2 + 2 x = 0 ⇔ ( − 2 x 2 + 3 x + 2) x = 0 ⇔ x = 0 oder x 2 − 3 2 x − 1 = 0. Hierzu findet man zwei weitere Nullstellen, nämlich x = 2 und x = − 12 . Zwischen diesen Stellen ist das Vorzeichenverhalten von f ′ ( x ) = ( x − 2) x (2 x +1) (2 x − 1) 3 jeweils einheitlich: 48818_Terveer.indd 204 48818_Terveer.indd 204 18.07.2023 11: 51: 18 18.07.2023 11: 51: 18 <?page no="205"?> 8.5 Ableitung und Funktionseigenschaften 205 Abbildung 8.19: Graph und Wertetabelle der Funktion aus Beispiel 8.61. Links oben ist der Ausschnitt für x < 12 mit vergrößerter Ordinatenskala dargestellt. Monoton wachsende Bereiche von f sind schwarz, monoton fallende Bereiche grau, konvexe Bereiche mit durchgezogener und konkave Bereiche mit geschrichelter Linie erfasst. ■ auf ] − ∞ ; − 12 [ ∪ ]0; 12 [ ∪ ]2; ∞ [ ist f ′ ( x ) > 0 ■ auf ] − 12 ; 0[ ∪ ] 12 ; 2[ ist f ′ ( x ) < 0 Die Funktion ist daher auf ] − ∞ ; − 12 ], auf [0; 12 [ und auf [2; ∞ [ (streng) monoton wachsend und auf [ − 12 ; 0] und ] 12 ; 2] (streng) monoton fallend (die Monotonie überträgt sich auf die Intervallgrenzen im Definitionsbereich, wobei 12 ̸∈ D). [8] Einzige Nullstelle von f ′′ ( x ) = 14 x +2 (1 − 2 x ) 4 ist x = − 17 . Für x > − 17 ist f ′′ ( x ) > 0, für x < − 1 7 ist f ′′ ( x ) < 0. Die Funktion ist also auf ] − ∞ ; − 17 ] konkav (rechtsgekrümmt), auf [ − 17 ; 12 [ und ] 12 ; ∞ [ ist sie konvex (linksgekrümmt). [9] Extrema: Aus den bisherigen Überlegungen lässt sich ohne weitere Rechnung folgern, dass f in x = − 12 ein lokales Maximum und in x = 0 und x = 2 ein lokales Minimum hat. Globale Extrema hat die Funktion nicht, diese kann man aufgrund der Grenzwerte für x → ±∞ ausschließen. [10] Wendestellen: Die bisherigen Überlegungen zeigen außerdem, dass f in x = − 17 eine Wendestelle mit Übergang von Rechtszu Linkskrümmung hat. [11] Nachfolgend ist eine Wertetabelle für f angegeben: x − 3 − 2 − 1 − 12 − 17 0 1 32 3 4 f ( x ) − 0 , 37 − 0 , 16 0 0 , 03 0 , 01 0 2 , 00 1 , 41 1 , 44 1 , 63 Der Graph von f findet sich in Abbildung 8.19. Den oben dargestellten Ablauf kann man natürlich auch in Teilen umstellen, etwa um die Bestimmung von lokalen Extrema (bzw. von Wendestellen) vor der Untersuchung des Monotonieverhaltens (bzw. des Krümmungsverhaltens) durchzuführen. [4] hingegen sollte vor der Untersuchung auf globale Extrema erfolgen, weil man es beim Übergang von lokalen zu globalen Extrema im Randwertvergleich benötigt. Während bei einer Kurvendiskussion zu einem vorgegebenen Funktionsterm Charakteristika ermittelt werden, muss aus einem Funktionssteckbrief ein Funktionsterm bestimmt werden, der diese Charakteristika aufweist. Meist setzt man voraus, dass die gesuchte Funktion ganzrational ist. Auch hier gibt es eine „Standard“-Vorgehensweise: 48818_Terveer.indd 205 48818_Terveer.indd 205 18.07.2023 11: 51: 21 18.07.2023 11: 51: 21 <?page no="206"?> 206 8 Differentialrechnung in einer Variablen Lösung von Steckbriefproblemen [1] Aufstellen des allgemeinen Funktionsterms und Bestimmung der Ableitungen. [2] Umsetzen der Informationen in Aussagen über f , f ′ und f ′′ , die sich als Gleichungen schreiben lassen. [3] Übertragung der gewonnenen Aussagen in ein System von (linearen) Gleichungen in den unbekannten Funktionsparametern. [4] Lösen des Gleichungssystems. [5] Aufstellen des Funktionsterms und Prüfung derjenigen Steckbriefvorgaben, von denen nur die notwendigen Bedingungen in den Steckbrief übernommen wurden. Beispiel 8.62 Von einer ganzrationalen Funktion f vierten Grades sei bekannt, dass ihr Graph einen Sattelpunkt in S (0 | 43 ) hat und dass ihre Wendetangente in x = − 43 senkrecht zur Gerade y = − 27 32 x verläuft (d.h. die Steigung 32 27 hat). Formaler Ansatz ist ein Polynom vierten Grades f ( x ) = ax 4 + bx 3 + cx 2 + dx + e mit Kurvenparametern a, b, c, d, e ∈ R und den Ableitungen f ′ ( x ) = 4 ax 3 + 3 bx 2 + 2 cx + d f ′′ ( x ) = 12 ax 2 + 6 bx + 2 c Folgende Aussagen über f, f ′ , f ′′ kann man aus dem Steckbrief ablesen (auf der rechten Seite stehen die zugehörigen Gleichungen in a, b, c, d, e ): 1. S (0 | 43 ) 2. Sattelpunkt in S 3. Wendestelle in x = 43 4. Tangentensteigung in x = 43 f (0) = 43 f ′ (0) = 0 f ′′ (0) = 0 f ′′ ( − 43 ) = 0 f ′ ( − 43 ) = 32 27 e = 43 d = 0 c = 0 12 a · ( − 43 ) 2 + 6 b · ( − 43 ) = 0 4 a · ( − 43 ) 3 + 3 b · ( − 4 3 ) 2 + 2 c · ( − 43 ) = 32 27 Dabei stellen die Aussagen in 2./ 3. nur notwendige Bedingungen dar. Beide müssen abschließend geprüft werden. Aus den Gleichungen erhält man c = d = 0 , e = 43 und das folgende System linearer Gleichungen 64 3 a − 8 b = 0 − 256 27 a + 16 3 b = 32 27 } ⇔ { b = 83 a b = 29 + 16 9 a } ⇔ { b = 83 a 83 a = 29 + 16 9 a } ⇔ { b = 83 a 89 a = 29 Lösung ist a = 14 , b = 23 . Die gesuchte Funktion ist f ( x ) = 14 x 4 + 24 x 3 + 43 . Abschließend werden noch die Steckbriefvorgaben in 2./ 3. geprüft: Es ist f ′ ( x ) = x 3 + 2 x 2 , f ′′ ( x ) = 3 x 2 + 4 x , f ′′′ ( x ) = 6 x + 4. ■ fehlende Sattelpunkteigenschaft: f ′′′ (0) = 4 ̸ = 0. ■ fehlende Wendepunkteigenschaft: f ′′′ ( − 43 ) = 6 · ( − 43 ) + 4 = − 4 ̸ = 0. Damit hat f auch den vorgegebenen Sattelpunkt und Wendepunkt. 48818_Terveer.indd 206 48818_Terveer.indd 206 18.07.2023 11: 51: 25 18.07.2023 11: 51: 25 <?page no="207"?> 8.5 Ableitung und Funktionseigenschaften 207 Übungen zu Abschnitt 8.3 ? 15. Berechnen Sie mit dem Newton- Verfahren einen rationalen Näherungswert für 3 √ 2 (beginnen Sie mit x 0 = 2). 16. Bestimmen Sie mit der Regel von de l’Hospital die folgenden Grenzwerte: a) lim x → 0 sin( x ) x , b) lim x → π cos( x )+1 sin( x ) , c) lim x → 1 ln(2 x 2 − 1) ln(3 x 2 +2 x − 4) , d) lim x ↓ 0 x n ln( x ), n ∈ N. e) lim a ↓ 0 ( x + c ) a − 1 a für x, c > 0 17. Es seien a > 0 und t ∈ R. Gegeben sei die Funktion f a,t : R → R, f a,t ( x ) = { x 3 − ax 2 + a falls x < 1 tx 2 + 1 − t falls x ≥ 1 a) Bestimmen Sie ein t = t a ∈ R, so dass f a,t differenzierbar ist. b) Es sei g a : [0; ∞ [ → R , g a ( x ) = f a,t a ( x ). Bestimmen Sie alle lokalen und globalen Extrema von g a . 18. Zeigen Sie: Für α, β > 0 ist f : [0; ∞ [, f ( x ) = αx u + βx v genau dann konstant, wenn u = v = 0. 19. Führen Sie in dieser und in den nächsten Aufgaben für die angegebene Funktion jeweils eine Kurvendiskussion nach dem auf Seite 203 angegebenen Schema: f ( x ) = − 2 x 3 + 3 x 2 − x . 20. f ( x ) = e − x 2 21. f ( x ) = ln( x ) x 22. f a ( x ) = ae x 1+ ae x , a > 0 23. f a ( x ) = x 3 + x 2 ( x − a ) 2 , a ∈ R 24. Es sei a > 0. Bestimmen Sie für die Funktion f : [0; ∞ [ → R , f ( x ) = x · e − ax a) das Monotonieverhalten, b) das Krümmungsverhalten, c) lokale und globale Extrema, d) Wendestellen. 25. Eine ganzrationale Funktion f dritten Grades ist punktsymmetrisch und verläuft durch P (1 |− 1). In x = 2 hat die Funktion ein Extremum. Berechnen Sie f . 26. Der Graph einer ganzrationalen Funktion vierten Grades berührt die Abszisse in x = 2, hat in x = 0 den lokal maximalen Anstieg 1 und in x = 32 eine Wendestelle. Wie lautet der Funktionsterm? 27. In Kapitel 5, Aufgabe 8 vgl. S. 83 wurde die Eigenschaft der Punkt- und Achsensymmetrie einer Funktion geklärt. Überlegen Sie sich ausgehend von diesen Begriffen, welche der nachfolgenden Aussagen richtig sind (Begründung oder Gegenbeispiel): a) Eine differenzierbare Funktion f : R → R ist genau dann gerade (ungerade), wenn ihre Ableitungsfunktion ungerade (gerade) ist. b) Jede ganzrationale Funktion dritten Grades ist punktsymmetrisch zu ihrem Wendepunkt. c) Jede ganzrationale Funktion vierten Grades ist achsensymmetrisch zu einem ihrer Extrempunkte. 28. Es sei f : D → ]0; ∞ [ eine differenzierbare Funktion. Unter der logarithmischen Ableitung von f versteht man die Ableitung der Funktion h ( x ) = ln( f ( x )). a) Stellen Sie eine allgemeine Regel für die Berechnung der logarithmischen Ableitung auf. b) Begründen Sie: Die logarithmische Ableitung eines Produktes von Funktionen f , g ist Summe der logarithmischen Ableitungen von f und g . c) Zeigen Sie: Ist f zweimal differenzierbar, dann stimmen in einem Wendepunkt von h ( x ) = ln( f ( x )) die logarithmischen Ableitungen von f und von f ′ überein. 48818_Terveer.indd 207 48818_Terveer.indd 207 18.07.2023 11: 51: 30 18.07.2023 11: 51: 30 <?page no="208"?> 208 8 Differentialrechnung in einer Variablen 8.6 Ökonomische Anwendungen der Differentialrechnung Bisher haben wir die Grundlagen der Differentialrechnung so dargestellt, wie sie in allen quantitativen Wissenschaften benötigt werden. In den Wirtschaftswissenschaften spielt die Ableitung vor allem im Zusammenhang mit Fragestellungen rund um bilanzierbare ökonomische Größen wie Kosten, Umsatz und Gewinn eine Rolle, wobei man die Ableitung einer ökonomischen Funktion oft mit dem Präfix „Grenz-“ oder dem Adjektivs „marginal“ vor den (sachlogischen) Funktionstyp benennt. Beispielsweise ■ wird die Ableitung einer Produktionsfunktion Grenzproduktivität genannt. ■ versteht man unter den Grenzkosten die Ableitungeiner Kostenfunktion. Im linearen Fall sind das dann die variablen Stück-Kosten. ■ bezeichnet der marginale Gewinn die Ableitung einer Gewinnfunktion. Man verwendet die Ableitung in der Ökonomie, wenn das „momentane“ Änderungsverhalten einer ökonomischen Größe y = f ( x ) in Abhängigkeit vom Änderungsverhalten einer weiteren Größe x erfasst werden soll. Konkrete Anwendungsgebiete sind: ■ die Marginalanalyse: dabei handelt es sich um die Kurvendiskussion einer gegebenen ökonomischen Funktion mit anschließender ökonomischer Wertung. ■ Optimierungsaufgaben: konkret sind das Fragestellungen, bei denen Extremwerte ökonomischer Funktionen (z.B. Gewinn- oder Kostenfunktionen) ermittelt werden oder auch implizit auftreten, wenn etwa im Rahmen der Statistik Methoden der Differentialrechnung zum Einsatz kommen (z.B. in der Regressionsrechnung). Zudem wird die Ableitung zur Festlegung einer einheitenunabhängigen Änderungsrate, der so genannten Elastizität, verwendet. Wir werden in diesem Abschnitt ausführliche Beispielsituationen für die Anwendung der Ableitung in der Ökonomie besprechen. 8.6.1 Optimaler Preis Im Stellenmarkt einer westfälischen Lokalzeitung findet sich die folgende Anzeige: Werseschule sucht engagierte Person für selbstständigen Verkauf von Pausenbrötchen; Verkaufsraum vorhanden, Tel.: 02382/ . . . Frau W. interessiert sich für diese Tätigkeit. Sie bespricht die finanziellen Aspekte mit dem Schulleiter, der ihr mitteilt, dass der Schulträger für die Nutzung des Verkaufsraumes eine Miete von 15 e je Verkaufstag erhebt. Frau W. überlegt, welche weiteren Kosten mit der Zubereitung von Pausenbrötchen verbunden sind. Spontan geht sie von 0,25 e je Brötchen zuzüglich 0,35 e für den Belag, also einem Selbstkostenpreis von 0,60 e aus. Andererseits meint der Schulleiter, dass für ein belegtes Brötchen in der Schule nicht mehr als 1,60 e verlangt werden kann, da sich sonst sogar die Lehrer aus der nächstgelegenen Bäckerei versorgen. Frau W. vermutet, dass sie während des laufenden Schulbetriebs nicht mehr als 200 Brötchen pro Tag belegen kann. Sie geht davon aus, dass diese zum Selbstkostenpreis vollständig verkauft werden können, und fragt sich nun, ob sie mit dem Brötchenverkauf an der Werseschule einen Gewinn erzielen kann und wie hoch dieser maximal ist. Aus ihren Anfangsüberlegungen wird ihr schnell klar, dass sie durch die Preisgestaltung maßgeblichen Einfluss auf den Gewinn haben 48818_Terveer.indd 208 48818_Terveer.indd 208 18.07.2023 11: 51: 31 18.07.2023 11: 51: 31 <?page no="209"?> 8.6 Ökonomische Anwendungen der Differentialrechnung 209 Gewinn G ( p ) = E ( p ) − K ( p ) Erlös: E ( p ) = p · f ( p ) Kosten: K ( p ) Preis: p Absatz: f ( p ) Abbildung 8.20: Schmematischer Zusammenhang zwischen Preis, Nachfrage, Kosten, Erlös und Gewinn im Brötchenbeispiel. Abbildung 8.21: Links: Gewinn-, Erlös-, Kostenfunktion beim „Brötchenverkauf“. Rechts: Gewinnfunktion im Regal-Beispiel für die Nachfragefunktion p ( x ) = 0 , 0000325 x 2 − 0 , 13 x + 160 wird. In der mathematischen Modellierung scheint es sinnvoll, den Gewinn als Funktion des Brötchenpreises p darzustellen. Dieser berechnet sich als Differenz von Erlös und Kosten. Wenn hierbei fixe Kosten nicht berücksichtigt werden, so spricht man statt vom Gewinn auch vom Deckungsbeitrag. Der Erlös aus dem Verkauf eines Produktes errechnet sich aus der verkauften Menge mal dem Stückpreis. Wieviel von einem Produkt verkauft wird, hängt schließlich vom Preis des Produktes ab. Wenn man in der vorliegenden Situation davon ausgeht, dass alle zubereiteten Brötchen verkauft werden, hängen auch die gesamten Herstellungskosten von der verkauften Menge und damit mittelbar vom Preis der Brötchen ab. Alle ökonomischen Größen im Problem, d.h. Absatzmenge, Erlös, Kosten und Gewinn werden daher als Funktionen des Preises p modelliert. Schematisch ist dies in Abbildung 8.20 dargestellt. Alle Bestimmungsgrößen benötigen die Modellierung des Absatzes als Funktion des Preises p , der sich per Annahme im ökonomisch relevanten Definitionsbereich [0 , 6 ; 1 , 6] bewegen darf. Folgende Bedingungen lassen eine Modellierung als lineare Funktion f ( p ) = ap + b zu: ■ Zum Preis 0,60 e werden alle hergestellten Brötchen verkauft: f (0 , 6) = 200. ■ Bei einem Preis von 1,60 e werden keine Brötchen verkauft: f (1 , 6) = 0. Dieser Steckbrief ergibt die lineare Funktion f ( p ) = 320 − 200 p . Der Erlös zum Preis p beträgt E ( p ) = p · f ( p ) = 320 p − 200 p 2 . Mit Verkauf und Herstellung der Brötchen verbundene Kosten sind unter Berücksichtigung der Raumnutzungsgebühr und der Selbstkosten eines Brötchens K ( p ) = 0 , 6(320 − 200 p ) + 15 = 207 − 120 p . Damit ist der Gewinn G ( p ) = E ( p ) − K ( p ) = − 200 p 2 + 440 p − 207. Gewinn, Erlös und Kosten als Funktionen des Preise p sind in Abbildung 8.21 skizziert. Durch Berechnung der Nullstellen der Gewinnfunktion G kann Frau W. sich zunächst die sogenannte Gewinnzone veranschaulichen, d.h. denjenigen Preisbereich, für den der Erlös E ( p ) die Kosten K ( p ) deckt. Die Gleichung G ( p ) = 0 liefert (näherungsweise) Gewinnschwelle p ≈ 0 , 68, Gewinngrenze p ≈ 1 , 52 und Gewinnzone [0 , 68 ; 1 , 52]. Der Grenzgewinn ist G ′ ( p ) = − 400 p + 440. Die Nullstelle von G ′ ( p ) ist p = 1 , 1. Die Gewinnparabel ist nach unten geöffnet, daher liegt für p = 1 , 1 ein globales Maximum 48818_Terveer.indd 209 48818_Terveer.indd 209 18.07.2023 11: 51: 35 18.07.2023 11: 51: 35 <?page no="210"?> 210 8 Differentialrechnung in einer Variablen vor. Frau W. kann also bei einem Preis von 1,10 e je Brötchen einen maximalen Gewinn von G (1 , 1) = 35 e pro Tag erzielen. Dabei verkauft sie f (1 , 1) = 100 Brötchen am Tag. Pro Brötchen verdient Frau W. dann 0,35 e . In diesem Beispiel wurden alle wichtigen Größen als Funktionen des Preises modelliert, weil der Preis für Frau W. die einzige entscheidungsrelevante Größe darstellt. Zwar könnte man im Modellansatz auch alle Größen über die nachgefragte/ abgesetzte Menge darstellen; inhaltlich wäre dies aber so zu interpretieren, dass Frau W. eine bestimmte Anzahl Brötchen belegt und auf Preisgebote der Schüler wartet. 8.6.2 Gewinnmaximierung Wir betrachten noch einmal das Beispiel der Gewinnmaximierung in der Regalproduktion des Möbelherstellers Ikebau vgl. S. 71 . Dabei wurde für einen Absatz- und (damit gleichzeitig) Produktionsbereich von 0 bis 2000 Regalen eine quadratische Nachfragefunktion durch die Punkte P (0 | 160) und Q (2000 | 30) von der Form x → p ( x ) = 0 , 0000325( x − 2000) 2 + 30 = 0 , 0000325 x 2 − 0 , 13 x + 160 bestimmt. Die gesamten Herstellungskosten inklusive Fixkosten für die Herstellung von x Regalen werden über die Kostenfunktion x → K ( x ) = 30 x + 1000 angesetzt. Mit diesen Bestimmungsstücken erzielt Ikebau bei Absatz von x produzierten Regalen den folgenden Gewinn G ( x ) = xP ( x ) − K ( x ) = 0 , 0000325 x 3 − 0 , 13 x 2 + 130 x − 1000. Für eine erste Orientierung wird der Graph der Gewinnfunktion skizziert vgl. Abbildung 8.21 . Wir wollen im folgenden zwei Fragen beantworten: [1] Wo liegt die Gewinnzone der Produktion, d.h. für welche (ganzzahligen) x ∈ [0; 2000] gilt G ( x ) > 0? Der Funktionsgraph suggeriert ungefähr den Bereich [0; 1800]. [2] Für welche Produktionsmenge x wird der Gewinn maximal? Der Funktionsgraph suggeriert hier eine Produktionszahl „irgendwo“ zwischen 600 und 800 Regalen. Beide Fragestellungen werden mit den ersten beiden Ableitungen von G beantwortet: ■ G ′ ( x ) = 0 , 0000975 x 2 − 0 , 26 x + 130 = 390 2000 2 x 2 − 26 100 x + 130 ■ G ′′ ( x ) = 780 2000 2 x − 26 100 Wir bestimmen zunächst die Gewinnzone. Hierzu werden die Nullstellen der Gewinnfunktion bestimmt. Zwischen je zwei Nullstellen hat die Funktion ein einheitliches Vorzeichenverhalten, daher kann man durch Probewerte aus den Intervallen zwischen zwei Nullstellen auf das Vorzeichenverhalten schließen. Hier sollte man die Nullstellen mit dem Newton-Verfahren numerisch zu approximieren, d.h. mit geeigneten Startwerten x 0 die ersten Glieder der rekursiv erklärten Folge x n = x n − 1 − G ( x n − 1 ) G ′ ( x n − 1 ) bestimmen. Anhand der Skizze des Funktionsgraphen bieten sich als Startwerte x 0 beispielsweise 0, 1800 und 2100 an - letzterer führt aber nicht zu einer Nullstelle im ökonomischen Definitionsbereich). Die entsprechenden Iterationen für die Startwerte 0 und 1800 finden Sie in Tabelle 8.3. Die Näherungswerte stabilisieren sich schon nach vier Schritten; der Abgleich mit dem Funktionsgraphen zeigt das Intervall [7 , 7523 ; 1871 , 79] als Gewinnzone. Da nur ganzzahlige Werte für x einen Sinn ergeben, wird die Gewinnzone der Produktion durch das Intervall [8; 1871] gegeben. Als nächstes soll untersucht werden, für welche Anzahl produzierter (und abgesetzter) Regale der Gewinn maximal wird. Hierzu gehen Sie wie folgt vor: 48818_Terveer.indd 210 48818_Terveer.indd 210 18.07.2023 11: 51: 37 18.07.2023 11: 51: 37 <?page no="211"?> 8.6 Ökonomische Anwendungen der Differentialrechnung 211 x G ( x ) G ′ ( x ) x − G ( x ) / G ′ ( x ) 0 − 1000 130 7 , 6923 7 , 6923 − 7 , 6775 128 , 006 7 , 7523 7 , 7523 − 0 , 0005 127 , 99 7 , 7523 7 , 7523 0 127 , 99 7 , 7523 x G ( x ) G ′ ( x ) x − G ( x ) / G ′ ( x ) 1800 1340 − 22 , 1 1860 , 63 1860 , 63 174 , 522 − 16 , 2239 1871 , 39 1871 , 39 5 , 9896 − 15 , 1065 1871 , 79 1871 , 79 0 , 0082 − 15 , 0649 1871 , 79 Tabelle 8.3: Newton-Verfahren zur Nullstellenannäherung für die Funktion G ( x ) = 0 , 0000325 x 3 − 0 , 13 x 2 + 130 x − 1000 [1] Lösen Sie die Gleichung G ′ ( x ) = 0 in ]0; 2000[ (notwendige Bedingung für ein lokales Extremum, Berechnung eines kritischen Punktes). [2] Prüfen Sie, ob für den kritischen Punkt, den Sie gerade berechnet haben, die hinreichende Bedingung G ′′ ( x ) < 0 erfüllt ist für ein lokales Maximum erfüllt ist. [3] Vergleichen Sie den Gewinn an der berechneten Stelle mit den Gewinnen G (0) = G (2000) = − 1000 (Randwertvergleich). Ist der Gewinn im lokalen Maximum größer als − 1000, so liegt ein globales Gewinnmaximum vor. Kritische Punkte sind hier Lösungen einer quadratischen Gleichung in ]0; 2000[: G ′ ( x ) = 0 ⇔ 390 2000 2 x 2 − 26 100 x + 130 = 0 ⇔ x 2 − 8000 3 x + 2000 2 3 = 0 ⇔ x = 4000 3 ± 2000 3 Die beiden Nullstellen sind also x = 2000 3 und x = 2000. Letztere liegt am Rand des Definitionsbereiches und kann, da sowieso noch der Randwertvergleich erfolgt, zunächst ignoriert werden. Der einzige „innere“ kritische Punkt des Definitionsbereiches wird durch x = 2000 3 gegeben. Die Prüfung auf lokales Maximum erfolgt durch Berechnung der zweiten Ableitung: G ′ ( 2000 3 ) = 780 2000 2 2000 3 − 26 100 = − 13 100 < 0. In x = 2000 3 liegt ein lokales Gewinnmaximum. Weil der berechnete Wert in der Gewinnzone liegt, ist klar, dass G ( 2000 3 ) ≥ 0, während die Randpunkte jeweils den Gewinn − 1000 (d.h. einen Verlust) erbringen. Also liegt in x = 2000 3 ein globales Gewinnmaximum. Sie könnten bei der Prüfung auf lokales und globales Maximum auch einfacher argumentieren, indem Sie die erste Ableitung G ′ ( x ) im ökonomischen Definitionsbereich [0; 2000] untersuchen. Diese hat in x = 2000 3 einen Vorzeichenwechsel von + nach − , und das ist der einzige Vorzeichenwechsel in [0; 2000]. G ist also „links von“ 2000 3 monoton wachsend und „rechts von“ 2000 3 monoton fallend. Dann muss G in 2000 3 ein globales Maximum haben. Es bleibt der „Makel“, dass die berechnete gewinnmaximale Stelle 2000 3 nicht ganzzahlig ist. Aufgrund des Monotonieverhaltens von G kommen dann nur die beiden nächst 2000 3 gelegenen ganzzahligen Werte 666 und 667 in Frage. Wegen G (666) = 38418 , 4896 und G (667) = 38418 , 5113 ergibt sich der maximale Gewinn bei der Produktion und dem Absatz von 667 Regalen. 8.6.3 Elastizitäten Ein Unternehmen der chemischen Industrie hat einen seiner wichtigsten Rohstoffe in einem Tanklager in der Nähe von Ludwigshafen verfügbar. Es sei angenommen, dass sich die durchschnittlichen jährlichen Lagerhaltungskosten je eingelagerter Tonne des Rohstoffes in Abhängigkeit von der eingelagerten Menge x (in Tonnen) in der Form k ( x ) = 10800 x + 3 x + 5 darstellen lassen (zur Erläuterung des Funktionstyps vgl. Abschnitt 8.6.4). Momentan seien 100 Tonnen Rohstoffes eingelagert, für welche die jährlichen durchschnittlichen Kosten je eingelagerter Tonne k (100) = 413 e . Die Grenzlagerkosten ergeben sich als k ′ ( x ) = 3 − 10800 x 2 . Bei der betrachteten Lagermenge gilt 48818_Terveer.indd 211 48818_Terveer.indd 211 18.07.2023 11: 51: 42 18.07.2023 11: 51: 42 <?page no="212"?> 212 8 Differentialrechnung in einer Variablen k ′ (100) = 1 , 92. Beispielsweise sinken bei einer Verringerung der Lagermenge um 1 , 5 Tonnen die durchschnittlichen Lagerkosten um etwa 1 , 92 · 1 , 5 = 2 , 88 e . Die exakte Änderung beträgt k (100) − k (98 , 5) ≈ 413 − 410 , 144 = 2 , 855 e , und man erkennt, dass mit Hilfe der Grenzkosten eine gute Näherung gefunden ist. Eine andere Möglichkeit, die Daten aufzubereiten, besteht darin die Änderungen in Prozent darzustellen. Die Verringerung des Lagerbestandes von 100 auf 98,5 Tonnen entspricht einer Verringerung um 1,5 Prozent unabhängig von der verwendeten Maßeinheit für das Gewicht. Die Verringerung der Durchschnittskosten um 2,88 Euro entspricht einer Verringerung um etwa 0,7 Prozent. Das Verhältnis dieser beiden Größen, also der Ausdruck 0 , 7 1 , 5 ≈ 0 , 46% stellt die prozentuale Erhöhung/ Verringerung der durchschnittlichen Lagerkosten bei einprozentiger Erhöhung/ Verringerung des Lagerbestandes dar - vorausgesetzt man kann zumindest näherungsweise ein proportionales Änderungsverhalten der Durchschnittskosten bei kleinen Mengenänderungen annehmen. Der zuletzt angegebene Prozentwert bleibt gleich, wenn Einheiten linear in andere Einheiten überführt werden (also z.B. für eine Konzernpräsentation in den USA das Gewicht in Long tons und die Kosten in US-Dollar). In Formeln ausgedrückt, haben wir folgende Größe ausgerechnet k ( x ) − k ( x 0 ) k ( x 0 ) / x − x 0 x 0 = x 0 · k ( x ) − k ( x 0 ) x − x 0 / k ( x 0 ) Dabei stellt x 0 den Ausgangswert (in unserer Situation die eingelagerte Menge des Rohstoffes) und x den (geringfügig) geänderten Lagerbestand dar. Liegt x nahe genug bei x 0 bzw. vollzieht man den Grenzwertübergang x → x 0 , so ergibt sich als Ausdruck für die marginale relative Kostenänderung bei einprozentiger Änderung der eingelagerten Menge der Wert x 0 k ′ ( x 0 ) k ( x 0 ) . Er wird als Durchschnittskosten-Elastizität der Lagermenge x 0 bezeichnet. Der Wert kann nur gebildet werden, wenn k ( x 0 ) ̸ = 0. Im Beispiel gilt 100 · k ′ (100) k (100) = 100 · 1 , 92 413 ≈ 0 , 46. Die Elastizität stimmt also recht genau mit dem oben berechneten Prozentwert überein. Elastizitäten lassen sich für jede differenzierbare Funktion bilden: Definition 8.8 ! Es sei f : ] a ; b [ → R eine differenzierbare Funktion. Die Funktion x → ϵ f ( x ) = x · f ′ ( x ) f ( x ) für x ∈ ] a ; b [ mit f ( x ) ̸ = 0 heißt Elastizitätsfunktion bzw. Elastizität von f . Beispiel 8.63 [1] Die lineare Funktion f ( x ) = b − ax hat die Ableitung f ′ ( x ) = − a und die Elastizität ϵ f ( x ) = − ax b − ax [2] Die Cobb-Douglas-Funktion f ( x ) = c · x a mit c, a > 0 hat für x > 0 die Ableitung f ′ ( x ) = ca · x a − 1 und die Elastizität ϵ f ( x ) = cax a − 1 cx a = a . Interpretation der Elastizität Für x 0 ∈ ] a ; b [ mit f ( x ) ̸ = 0 verändert sich f ( x 0 ) um näherungsweise ϵ f ( x 0 ) Prozent, wenn sich x 0 um ein Prozent verändert. Bei linearen Funktionen entspricht die Elastizität der exakten prozentualen Änderung: 48818_Terveer.indd 212 48818_Terveer.indd 212 18.07.2023 11: 51: 46 18.07.2023 11: 51: 46 <?page no="213"?> 8.6 Ökonomische Anwendungen der Differentialrechnung 213 Beispiel 8.64 Wir betrachten wieder die Nachfragefunktion im Regalbeispiel aus Abschnitt 4.6.1, also p ( x ) = 160 − 0 , 065 x . Die optimale Produktionsmenge x 0 = 1000 werde um 1 Prozent geändert. Um wieviel Prozent ändert sich der zugehörige Preis p (1000) = 95? ■ Die Antwort kann exakt berechnet werden: die um ein Prozent geänderte Menge beträgt 1010 Regale, der neue Preis hierzu ist p (1010) = 94 , 35. Dies entspricht einer Verringerung des ursprünglichen Preises 95 um 0 , 684 Prozent. ■ Die Näherungslösung mit der Elastizität berechnet ϵ p ( x ) = x · p ′ ( x ) p ( x ) für die aktuelle Produktion als ϵ p (1000) = − 0 , 065 · 1000 p (1000) = − 65 95 ≈ − 0 , 684, was einerseits die näherungsweise Änderung ist, wenn sich der Preis um 1 Prozent ändert und anderseits auch mit der exakten prozentualen Änderung übereinstimmt. Bei nichtlinearen Funktionen ist die Elastizität zumindest eine Näherung für die Prozentuale Änderung, die bei marginaler Änderung von x auch recht gut ist: Beispiel 8.65 Wir betrachten die quadratische Nachfragefunktion p ( x ) = 0 , 0000325( x − 2000) 2 +30 vgl. S. 71 und die zugehörige optimale Produktionsmenge. ■ Ändert sich die optimale Produktionsmenge x 0 = 2000 3 , siehe Abschnitt 8.6.2, um 1 Prozent zu 2020 3 , so verringert sich der aktuelle Preis p ( 2000 3 ) = 87 , ¯7 zu p ( 2020 3 ) ≈ 87 , 201, d.h. um 0 , 657 Prozent. ■ Eine näherungsweise Änderung kann mit der Preiselastizität bestimmt werden, mit x = 2000 3 ist diese ϵ p ( x ) = 0 , 000065 x ( x − 2000) p ( x ) = − 52 79 ≈ − 0 , 658, was ziemlich genau der exakten prozentualen Preisänderung entspricht. Das Heranziehen eines Beispiels zur Durchschnittskostenanalyse für die Einführung der Elastizität ist nicht rein zufällig. Zwischen dem Ableitungsverhalten einer Durchschnittsfunktion f ( x ) / x und der Elastizität der Funktion f besteht ein enger Zusammenhang: Satz 8.35 Es sei f : D → R differenzierbar und x ∈ D mit f ( x ) ̸ = 0. Weiter sei ¯ f ( x ) : = f ( x ) x die zugehörige Durchschnittsfunktion. Dann gilt: ¯ f ′ ( x ) = 0 ⇔ ϵ f ( x ) = 1. An einer solchen Stelle x wird f auch als 1-elastisch bezeichnet. Hierzu muss man nur die Ableitung der Durchschnittsfunktion nach der Quotientenregel bilden und gleich Null setzen: ¯ f ′ ( x ) = f ′ ( x ) x − f ( x ) x 2 = 0 ⇔ f ′ ( x ) x = f ( x ) ⇔ xf ′ ( x ) f ( x ) = 1 Für Durchschnittskosten lässt sich der Sachverhalt wie folgt umschreiben: Die Kostenfunktion ist in einem Durchschnittskostenminimum 1-elastisch. Die Elastizität lässt sich auch als logarithmische Ableitung auffassen. Werden die Variablen x, y in einem Zusammenhang y = f ( x ) logarithmisch transformiert zu v = ln( x ) und z = ln( y ), so gilt x = e v und damit z = ln( f ( x )) = ln( f ( e v )). Die Funktion h ( v ) = ln( f ( e v )) hat dann nach Kettenregel die Ableitung h ′ ( v ) = f ′ ( e v ) e v f ( e v ) = f ′ ( x ) · x f ( x ) = ϵ f ( x ). 48818_Terveer.indd 213 48818_Terveer.indd 213 18.07.2023 11: 51: 51 18.07.2023 11: 51: 51 <?page no="214"?> 214 8 Differentialrechnung in einer Variablen 8.6.4 Marginalanalyse Unter einer Marginalanalyse versteht man die Kurvendiskussion einer ökonomischen Funktion mit anschließender ökonomischer Wertung des Kurvenverlaufes. Eine Orientierung am den 11 Schritten aus Abschnitt 8.5.7 vgl. S. 203 ist ratsam, in aller Regel ist die Marginalanalyse aber einem ökonomischen Kontext untergeordnet, der es einerseits erlaubt, Teilaspekte auszublenden, andererseits aber möglicherweise erfordert, einige über das obige Programm hinaus gehende Fragestellungen zu besprechen: ■ Es ist auch die Durchschnittsfunktion einer ökonomischen Funktion zu untersuchen. ■ Neben dem Ableitungsverhalten könnte auch die Elastizität von Interesse sein. Eine Besonderheit der Marginalanalyse besteht weiterhin darin, dass die zu diskutierende Funktion oft gar nicht voll spezifiziert ist, sondern noch von mindestens einem zusätzlichen Parameter abhängt. Es wird also gleich eine ganze Kurvenschar diskutiert bzw. die Abhängigkeit von Extremwerten, Wendestellen etc. von diesem Parameter untersucht. Man spricht von einer Sensitivitätsanalyse bezüglich der Parameter. Betrachten Sie etwa folgende Situation: Von einem speziellen Gut werden x > 0 Einheiten gelagert. Die Kosten der Lagerung setzen sich aus einem fixen Kostenanteil in Höhe von a > 0 Geldeinheiten zusammen, hinzu kommen Stückkosten für die Lagerung in Höhe von c > 0 Geldeinheiten. Weiter nimmt man an, dass bei einer besonders starken Auslastung des Lagers die Kosten überproportional ansteigen etwa infolge von Wartungsarbeiten - und setzt hierfür einen quadratischen Term bx 2 mit b > 0 an. Bei Lagerung von x Einheiten betragen dann die Lagerhaltungskosten g ( x ) = a + bx 2 + cx . Die Stückkosten der Lagerung sollen analysiert werden. Wenn die gesamten Kosten g ( x ) betragen, erhält man die Stückkosten mittels Division durch x . Die Stückkostenfunktion hat dann die Gestalt f : D =]0; ∞ [ → R , f ( x ) = g ( x ) x = a x + bx + c . Bei ihrer Diskussion fällt auf, dass die ursprüngliche Kostenfunktion für beliebige Werte x ≥ 0 berechnet werden kann. Die Stückkostenfunktion lässt wegen der Division durch x aber den Wert x = 0 nicht mehr zu. Die Funktion hat hier eine Definitionslücke in Form einer Polstelle, es gilt weiter lim x → 0 f ( x ) = + ∞ , wobei aufgrund der Lage der Definitionslücke am linken Rand des Definitionsbereiches nur der sogenannte rechtsseitige Grenzwert zu berechnen ist (d.h. man betrachtet nur Folgen x n → 0 mit x n > 0). Die Funktion hat Asymptote h ( x ) = bx + c , denn lim x →∞ a x + bx + c bx + c = lim x →∞ ( a bx 2 + cx + 1) = 1. Die Funktion f besitzt keine Nullstellen, denn f ist Summe positiver Ausdrücke (alle Bestimmungsstücke sind größer als Null). Angesichts der Fixkosten im Gesamtkostenmodell können natürlich auch die Stückkosten niemals Null sein. Für weitere Eigenschaften von f berechnet man f ′ ( x ) = − a x 2 + b und f ′′ ( x ) = 2 a x 3 > 0. Das Monotonieverhalten lässt sich anhand der ersten Ableitung beschreiben. Diese hat in x = √ a/ b ihre einzige Nullstelle und zudem dort einen Vorzeichenwechsel von − nach +. Also muss f in x = √ a/ b ein globales Minimum haben. Das Krümmungsverhalten von f ist aufgrund des positiven Vorzeichens der zweiten Ableitung durchweg konvex. f hat also insbesondere keine Wendestelle. Mit diesen Informationen kann man nun den Graphen von f und auch f ′ , f ′′ sowie der Asymptote h skizzieren vgl. Abbildung 8.22 . Am Term √ a/ b erkennt man, dass steigende Lagerfixkosten a zu einem Anstieg des kostenoptimalen Lagerbestandes führen und ein Anstieg des Kostenkoeffizienten b , welcher den überproportionalen Anstieg der Lagerkosten bei Anstieg des Lagerbestandes 48818_Terveer.indd 214 48818_Terveer.indd 214 18.07.2023 11: 51: 53 18.07.2023 11: 51: 53 <?page no="215"?> 8.6 Ökonomische Anwendungen der Differentialrechnung 215 x y z = x Abbildung 8.22: Links: Graphen der Stückkostenfunktion, ihrer beiden Ableitungen und der Asympoten im Lagerhaltungsbeispiel, rechts: Skizze des Aquariums im Kostenbeispiel modelliert, sich demzufolge dämpfend auf den stückkosten-optimalen Lagerbestand auswirkt. Keinen Einfluss haben die Lagerstückkosten c . 8.6.5 Kostenminimierung Die Produktion eines Gutes ist in allen Phasen mit Kosten verbunden, beginnend bei der Entwicklung über die Fertigung bis hin zum Absatz und der damit verbundenen Lagerung des Gutes. Für ein Unternehmen besteht, wenn die abzusetzende Menge des Produktes prinzipiell bekannt ist, ein grundsätzliches Interesse, die Kosten, die im Verlauf dieser Phasen entstehen, möglichst gering zu halten - bei gleichzeitiger Einhaltung der vom Unternehmen angesetzten Qualitätsstandards. Dabei entstehen vielfältige Minimierungsaufgaben, von denen wir hier eine aus der Produktentwicklung beispielhaft diskutieren wollen. Ein Hersteller von Aquaristikprodukten plant die Produktion eines Aquariums. Dieses Aquarium soll bei quaderförmiger Gestalt einen Rauminhalt von 0,5 Kubikmeter besitzen, oben offen sein, über Kunststoff-Seiten und einen Kunststoff-Boden verfügen sowie an Front- und Rückseite verglast sein. Die Kunststoff-Seitenflächen sollen einen quadratischen Grundriss aufweisen vgl. Abbildung 8.22 . Die bei der Herstellung entstehenden variablen Kosten hängen im Wesentlichen von den Quadratmeterpreisen der verwendeten Materialien ab. Diese betragen für Kunststoffplatten c = 30 e und für Glasscheiben d = 20 e . Andere Kosten (Klebstoff, Dichtmaterial, Arbeitslohn etc. ) seien aus Gründen der Übersichtlichkeit hier als fix und damit entscheidungsirrelevant angesehen. Das Ziel des Aquaristik-Herstellers ist ein Design des Aquariums, d.h. Abmessungen x (Tiefe), y (Breite) und z (Höhe), für welche die Gesamtkosten des Aquariums infolge Kunststoff- und Glasverbrauchs minimal werden. Diese Gesamtkosten betragen in Abhängigkeit von den Abmessungen K ( x, y, z ) = c · (2 xz + xy ) + d · 2 yz = 30 · (2 xz + xy ) + 20 · 2 yz und sollen minimiert werden. Dabei gilt für die Abmessungen zusätzlich z = x (quadratische Seitenfläche) und xyz = 12 (Volumen vorgegeben). Mit der später besprochenen Lagrange-Methode lässt sich dieses Problem unter den zwei Nebenbedingungen lösen. Hier sollen die beiden Nebenbedingungen genutzt werden, um in der Zielfunktion K ( x, y, z ) zwei der Variablen zu „eliminieren“. Dazu lösen wir die Volumen-Nebenbedingung xyz = 12 (beispielsweise) nach der Variablen y auf und berücksichtigen, dass das Aquarium quadratische Seitenflächen hat, d.h. dass z = x gilt: xyz = 12 ⇔ y = 1 2 xz = 1 2 x 2 . Die variablen Kosten 48818_Terveer.indd 215 48818_Terveer.indd 215 18.07.2023 11: 51: 55 18.07.2023 11: 51: 55 <?page no="216"?> 216 8 Differentialrechnung in einer Variablen lassen sich dann abhängig von der Tiefe x des Aquariums schreiben: k ( x ) = K ( x, 1 2 x 2 , x ) = c (2 x 2 + x · 1 2 x 2 ) + 2 d · 1 2 x 2 x = 2 cx 2 + c/ 2+ d x = 60 x 2 + 35 x Als Definitionsbereich dieser Funktion ergibt sich D =]0; ∞ [. Die Kostenfunktion ist auf D differenzierbar mit Ableitung k ′ ( x ) = 4 cx − c/ 2+ d x 2 = 120 x − 35 x 2 . Die Nullstellen dieser Ableitung werden berechnet: k ′ ( x ) = 0 ⇔ 120 x = 35 x 2 ⇔ x 3 = 35 120 ⇔ x = 3 √ 7 / 24 ≈ 0 , 6632 bzw. in allgemeiner Notation k ′ ( x ) = 0 ⇔ 4 cx = c/ 2+ d x 2 ⇔ x = x c,d = 3 √ c/ 2+ d 4 c . Da dies die einzige Nullstelle in ]0; ∞ [ ist, und dort ein k ′ -Vorzeichenwechsel von − nach + vorliegt, hat k in x = 3 √ 7 / 24 ein globales Minimum. Das Aquarium erhält die Abmessungen x = z ≈ 0 , 66 cm, y = 1 2 x 2 ≈ 1 , 14 cm und kostet k ( 3 √ 7 / 24) ≈ 79 , 16 e . Eine ökonomische Diskussion der minimalen Materialkosten geht über diese Optimierung hinaus. So kann man sich fragen, ob und wie weit die minimalen Kosten nicht noch zu senken sind, wenn Änderungen der Materialkosten zur Disposition stehen - beispielsweise durch Wechsel des Zulieferers oder durch Änderung des „Design“. Betrachten wir die Quadratmeter-Kosten c und d von Kunststoff und Glas als veränderlich, so kann man die oben gewählte allgemeine Darstellung der Kostenfunktion in c und d verwenden: k c,d ( x ) = 2 cx 2 + c 2 + d x , k ′ c,d ( x ) = 4 cx − c 2 + d x 2 , x c,d = 3 √ c/ 2+ d 4 c . Man hat es hier dann mit einer Kurvenschar in den beiden Schar-Parametern c und d zu tun. Die minimalen Kosten ergeben sich als k c,d ( x c,d ) = 2 c ( 3 √ ( c/ 2 + d ) / (4 c ) ) 2 + c/ 2 + d 3 √ ( c/ 2 + d ) / (4 c ) = 3 2 c 13 (2 d + c ) 23 Man kann jetzt diesen Ausdruck auf zwei Arten diskutieren: ■ Man setzt d = 20 und variiert c . Dann betragen die minimalen Kosten c → k c, 20 ( x c, 20 ) = 32 c 13 (40 + c ) 23 . Leitet man diesen Ausdruck nach c ab, so erhält man 1 2 c 23 3 c +40 3 √ c +40 . Durch Einsetzen von c = 30 berechnet sich schließlich der marginale Minimalkostenanstieg bei Änderung von c auf etwa 1,63. Das bedeutet: Eine Erhöhung/ Verringerung der Quadratmeter-Kosten für Kunststoff um einen Euro ausgehend von den aktuellen Werten führt zu einer ungefähren Erhöhung/ Verringerung der Gesamtkosten eines dann kostenminimalen Aquariums um 1,63 e . ■ Man setzt c = 30 und variiert d . Dann betragen die minimalen Kosten d → k 30 ,d ( x 30 ,d ) = 3 3 √ 15 ( d + 15) 23 . Leitet man diesen Ausdruck nach d ab, so erhält man 2 3 √ 15 3 √ d +15 . Durch Einsetzen von d = 20 berechnet sich der marginale Minimalkostenanstieg bei Änderung von d zu etwa 1 , 51. Das bedeutet: Eine Erhöhung/ Verringerung der Quadratmeter-Kosten für Glas um einen Euro ausgehend von den aktuellen Werten führt zu einer ungefähren Erhöhung/ Verringerung der Gesamtkosten eines dann kostenminimalen Aquariums um 1,51 e . Die Änderungsaussagen sind circa-Eigenschaften, sie ergeben sich jeweils aus der Interpretation einer Ableitung als Steigung. Diese gilt dann näherungsweise in einer „kleinen“ Umgebung um die betreffende Stelle c = 30 bzw. d = 20. Die Änderungsaussagen wurden ermittelt unter der „ceteris paribus“-Annahme, d.h. bei Änderung der Kosten für Kunststoff bei gleichzeitiger Beibehaltung der Kosten für Glas und umgekehrt. Die Minimalkostenfunktion ermöglicht eine Sensitivitätsanalyse und führt bei der Entwicklung des Produktes zu einer Berücksichtigung der relevanten Kostenfaktoren. 48818_Terveer.indd 216 48818_Terveer.indd 216 18.07.2023 11: 52: 00 18.07.2023 11: 52: 00 <?page no="217"?> 8.6 Ökonomische Anwendungen der Differentialrechnung 217 Übungen zu Abschnitt 8.4 ? 29. Der Inhaber eines ländlich gelegenen Campingplatzes verkauft Mineralwasser an die Besucher seines Platzes. Die Flaschen bezieht er einmal wöchentlich von einem Getränke-Großhandel zu einem Einkaufspreis von 0,25 e pro Flasche zuzüglich einer Transportkostenpauschale von 100 e . Der Mann überlegt nun, zu welchem Preis p > 0 er die Flaschen an seine Kundschaft verkaufen soll. Er kann jedoch nicht mehr als 1 e pro Flasche berechnen, da anderenfalls seine Kundschaft lieber den weiten Weg ins benachbarte Dorf in Kauf nimmt, um sich dort selbst zu versorgen. Aus Kapazitätsgründen kann der Campingplatz-Besitzer höchstens 1800 Flaschen bereit halten, die er bei Abgabe zum Einkaufspreis vollständig verkaufen würde. a) Leiten Sie eine quadratische Nachfragefunktion f : [0 , 25 ; 1] → R mit Scheitelpunkt in (1 | 0) her. b) Berechnen Sie zur genannten Nachfragefunktion die Erlösfunktion, die Kostenfunktion und die Gewinnfunktion. c) Bestimmen Sie die Gewinnzone (sollten Sie eine Nullstelle nicht raten, so verwenden Sie das Newton-Verfahren oder die Regula falsi) d) Bestimmen Sie denjenigen Preis, für den der Gewinn maximal ist. Wie hoch ist der Gewinn und wie viele Flaschen werden verkauft? 30. Betrachten Sie nochmals das Problem des Brötchenverkaufs vgl. S. 208f. und das Problem des Mineralwasserverkaufs aus der vorangegangenen Aufgabe. Modellieren Sie beide Sachverhalt erneut (mit einer linearen Nachfragefunktion im Brötchenbeispiel und einer quadratischen Nachfragefunktion im Mineralwasserbeispiel), diesmal aber in Abhängigkeit von der abgesetzten Menge Brötchen bzw. Flaschen. Bestimmen Sie in beiden Fällen die gewinnmaximalen Absatzmengen und zugehörigen Preise. Was fällt Ihnen auf, wenn Sie mit den preisabhängigen Modellansätzen vergleichen? 31. Bestimmen Sie die Elastizität der Funktion f : R → R, f ( x ) = e ax . Dabei ist a eine vorgegebene reelle Zahl. 32. Berechnen Sie die Elastizitätsfunktion a) zur linearen Nachfragefunktion f ( x ) = 120 − 15 x . b) zur ertragsgesetzlichen Produktionsfunktion f ( x ) = − x 3 + 32 x 2 + x . c) zur Cobb-Douglas-Produktionsfunktion f ( x ) = cx a mit c > 0 , a ∈ R. d) zur Funktion f ( x ) = ln( x ). Fertigen Sie auch jeweils eine Skizze der Elastizitätsfunktion an. 33. Es sei r ∈ R, r ̸ = 0. Eine Funktion f : [0; ∞ [ → R heißt homogen vom Grad r bzw. r -homogen, wenn für alle x ∈ [0; ∞ [ und λ ≥ 0 gilt: f ( λx ) = λ r f ( x ). Zeigen Sie: a) Für eine homogene Funktion f gilt stets f (0) = 0. b) Für eine r -homogene Funktion f gilt mit geeignetem c ∈ R: f ( x ) = c · x r c) Ist f r -homogen und ändert sich x um 1%, so ändert sich f ( x ) näherungsweise um r %. 34. Aus x > 0 Einheiten eines Produktes entstehen x t Einheiten eines Produktes, dabei sei 0 < t < 1. Den Stückkosten c > 0 des Rohstoffes steht ein Stückerlös d > 0 des Produktes gegenüber. Führen Sie eine Marginalanalyse der Deckungsbeitragsfunktion x → G ( x ) = dx t − cx und des durchschnittlichen Deckungsbeitrags G ( x ) / x t durch. 35. Eine rechteckige Gartenfläche mit Abmessungen x, y > 0 soll an einer Seite mit einer Mauer (Kosten c > 0 je laufendem 48818_Terveer.indd 217 48818_Terveer.indd 217 18.07.2023 11: 52: 03 18.07.2023 11: 52: 03 <?page no="218"?> 218 8 Differentialrechnung in einer Variablen Meter) und an den anderen drei Seiten mit einem Zaun (Kosten d > 0 je laufendem Meter) abgegrenzt werden, so dass die abgegrenzte Fläche 1000 Quadratmeter beträgt. Bestimmen Sie die Abmessungen x, y > 0 mit minimalen Gesamtkosten. 36. Diskutieren Sie zur Kostenfunktion k ( x ) = a + bx t + cx mit t > 1 und a, b, c > 0 die Durchschnittskostenfunktion f ( x ) = k ( x ) x mit a, b, c, t > 0 im Rahmen einer Marginalanalyse. Berechnen Sie insbesondere das Betriebsoptimum, d.h. diejenige Ausbringungsmenge x , für die die durchschnittlichen Kosten minimal sind. Wie lassen sich die zugehörigen Durchschnittskosten interpretieren? Zusammenfassung Die Ableitung einer Funktion ist das maßgebliche Hilfsmittel für die Analyse ökonomischer Zusammenhänge, ihre solide Berechnung und Verwendung wird später im Studium auch für Funktionen in mehreren Variablen dringend benötigt. Nach der gründlichen Erarbeitung der Inhalte dieses Kapitels sollten Sie in der Lage sein, ■ Funktionsgrenzwerte in eigentlicher und uneigentlicher Form, speziell bei gebrochenrationalen Funktionen zu berechnen, auch mit Hilfe der L’Hospital-Regel, ■ Funktionsgrenzwerte insbesondere beim Randwertvergleich in Optimierungsaufgaben einzusetzen, ■ Stetigkeit bei Funktionen zu erkennen und im Anwendungsfall einzusetzen, insbesondere bei numerischen Verfahren der Nullstelenbestimmung, ■ Ableitungen und Ableitungsfunktionen erster und höherer Ordnung zu Funktionen diverser Funktionstypen zu ermitteln, insbesondere unter Verwendung der Basistabelle und der Operatorenregeln (Faktor-, Summen-, Produkt-, Quotienten- und Kettenregel), ■ die Linearisierung einer Funktion auf Basis der ersten Ableitung zu bestimmen und zu interpretieren, ■ die Ableitung zur Maximierung und Minimierung einzusetzen, ■ das Monotonie- und Krümmungs-Verhalten von Funktionen auf Ableitungen zurückzuführen, ■ Funktionen einer Kurvendiskussion zu unterziehen und die Ergebnisse im Rahmen der Marginalanalyse ökonomisch zu interpretieren, ■ Steckbriefe auf Basis von Ableitungen zu lösen, ■ einfache ökonomische Sachverhalte wie Gewinnmodelle mathematisch umzusetzen und mit Ableitungskalkül zu lösen. 48818_Terveer.indd 218 48818_Terveer.indd 218 18.07.2023 11: 52: 05 18.07.2023 11: 52: 05 <?page no="219"?> 9 Integralrechnung Mit Integralen lassen sich Inhalte von Flächen berechnen, die von Funktionsgraphen begrenzt werden. Solche Flächeninhalte haben einige Anwendungen in der Ökonomie: ■ Im Rahmen der Wahrscheinlichkeitsrechnung und Statistik dienen sie als Modelle für stetige Wahrscheinlichkeiten. ■ Sie führen im Kontext der Wohlfahrtsmessung zu den wichtigen Konzepten der Konsumentenbzw. Produzentenrente. Neben der Flächenberechnung stellt sich die Integralrechnung aber auch als eine Art „Umkehrung“ der Differentialrechnung heraus. Ist von einem Zusammenhang zwischen zwei ökonomischen Variablen nur die Grenzrate (Ableitung) bekannt, so gewinnt man den ursprünglichen Zusammenhang durch Integrieren - manchmal auch als „Aufleiten“ (im Gegensatz zum „Ableiten“) bezeichnet. Weiter treten Integrale bei der Lösung von Differentialgleichungen auf, die in der Volkswirtschaftslehre eine Rolle spielen. Integrale lassen sich über das Konzept der Stammfunktion und mittels eines durch Grenzwerte gesteuerten Flächenberechnungsprozesses einführen. 9.1 Flächenintegrale und Stammfunktionen Flächen unter Funktionsgraphen lassen sich mit Hilfe von Stammfunktionen berechnen. Betrachten Sie hierzu eine auf einem Intervall [ a ; b ] ⊂ R stetige Funktion f : [ a ; b ] → [0; ∞ [ (die Stetigkeit kann auch abgeschwächt werden). Im Folgenden wird die Fläche zwischen dem Graphen von f und der Abszisse sowie je zwei vertikalen Geraden x = x 0 und x = x 1 mit a ≤ x 0 < x 1 ≤ b genauer untersucht, vgl. Abbildung 9.1 links . Definition 9.1 ! Der Flächeninhalt unter dem Graphen von f zwischen x 0 und x 1 wird mit ∫ x 1 x 0 f ( x ) dx bezeichnet. Man nennt ihn bestimmtes Integral von f in den Grenzen von x 0 bis x 1 . Wir vereinfachen die folgenden Rechnungen, indem wir annehmen, dass die Funktion, wie im Schaubild verwendet, in dem Intervall [ a ; b ] nicht nur stetig, sondern auch monoton wachsend ist. Für monoton fallendes f lassen sich die folgenden Überlegungen leicht übertragen. Ist f ( x ) < 0 auf [ a ; b ], so wird dies auch für ∫ x 1 x 0 f ( x ) dx angenommen. Hat f kein einheitliches Vorzeichenund/ oder Monotonieverhalten, so teilt man [ a ; b ] in Teilintervalle auf, in denen f einheitliches Monotonie- und Vorzeichenverhalten hat und führt für jedes Teilintervall die Rechnung separat aus; summiert man anschließend die Ergebnisse, so ergibt sich die Flächendifferenz der Teilflächen unter positiven und über negativen Funktionswerten vgl. Unterabschnitt 9.1.3 . Eine exakte Definition des bestimmten Integrals erfordert den Einsatz der Rechtecksapproximation vgl. Abschnitt 9.2 . 48818_Terveer.indd 219 48818_Terveer.indd 219 18.07.2023 11: 52: 07 18.07.2023 11: 52: 07 <?page no="220"?> 220 9 Integralrechnung Abbildung 9.1: Illustration zum Hauptsatz der Differential- und Integralrechnung: Der Flächeninhalt unter einer Funktion zwischen zwei Stellen x 0 < x 1 lässt sich mit einem geeigneten z ∈ [ x 0 ; x 1 ] als Rechtecksfläche f ( z )( x 1 − x 0 ) schreiben. 9.1.1 Stammfunktion Für t ∈ [ a ; b ] bezeichne F ( t ) den Flächeninhalt unter dem Graphen von f zwischen a und t , es sei also F ( t ) = ∫ t a f ( x ) dx . Man nennt F Integralfunktion. Der Flächeninhalt zwischen x 0 und x 1 ist dann die Differenz des größeren Flächeninhaltes F ( x 1 ) und des kleineren Flächeninhalts F ( x 0 ) d.h. es gilt in der gerade eingeführten Notation x 1 ∫ x 0 f ( x ) dx = x 1 ∫ a f ( x ) dx − x 0 ∫ a f ( x ) dx = F ( x 1 ) − F ( x 0 ) Die Berechnung der Fläche ist also grundsätzlich einfach, Sie brauchen „nur“ noch die Integralfunktion F . Bis hierher haben wir eigentlich nur Überlegungen über den Zusammenhang zwischen verschiedenen Flächenstücken unter dem Graphen von f angestellt. Entscheidend für die Flächenbestimmung ist folgende Eigenschaft von F : Satz 9.1 Für jede stetige Funktion f : [ a ; b ] → [0; ∞ [ ist die Integralfunktion t → F ( t ) = ∫ t a f ( x ) dx differenzierbar, und es gilt F ′ ( x ) = f ( x ) für alle x ∈ [ a ; b ]. Wie ergibt sich diese Aussage? Weil f auf [ x 0 ; x 1 ] als monoton wachsend angenommen wird, gilt für die gesuchte Fläche wie in Abbildung 9.1, Mitte, dargestellt, f ( x 0 )( x 1 − x 0 ) ≤ F ( x 1 ) − F ( x 0 ) ≤ f ( x 1 )( x 1 − x 0 ) ⇔ f ( x 0 ) ≤ F ( x 1 ) − F ( x 0 ) x 1 − x 0 ≤ f ( x 1 ) Nach dem Zwischenwertsatz 8.13 vgl. S. 175 gibt es dann ein z ∈ [ x 0 ; x 1 ] mit f ( z ) = F ( x 1 ) − F ( x 0 ) x 1 − x 0 , so dass die gesuchte Fläche exakt mit f ( z )( x 1 − x 0 ) übereinstimmt, vgl. Abbildung 9.1 rechts , d.h. es gilt F ( x 1 ) − F ( x 0 ) = ∫ x 1 x 0 f ( x ) dx = f ( z )( x 1 − x 0 ). Also lässt sich der Differenzenquotient von F immer als Funktionswert f ( z ) mit geeignetem z ∈ [ x 0 ; x 1 ] darstellen. Daraus folgt, dass die Funktion F in x 0 differenzierbar ist und ihre Ableitung sich berechnet, indem man im Differenzenquotienten den Grenzübergang x 1 → x 0 durchführt. Denn zwangsläufig muss der aus dem Zwischenwertsatz resultierende Wert z auch gegen x 0 konvergieren, und es folgt, da f stetig ist, F ′ ( x 0 ) = lim x 1 → x 0 F ( x 1 ) − F ( x 0 ) x 1 − x 0 = lim z → x 0 f ( z ) = f ( x 0 ) 48818_Terveer.indd 220 48818_Terveer.indd 220 18.07.2023 11: 52: 12 18.07.2023 11: 52: 12 <?page no="221"?> 9.1 Flächenintegrale und Stammfunktionen 221 Definition 9.2 ! Eine Funktion G mit G ′ ( x ) = f ( x ) für alle x ∈ [ a ; b ] heißt Stammfunktion bzw. unbestimmtes Integral von f . Man schreibt dann G ( x ) = ∫ f ( x ) dx . Bei der Festlegung der „Integralfunktion“ F sind wir von der linken Intervallgrenze a ausgegangen sind. Wenn man aber die Fläche unter dem Graphen von f über dem Intervall [ x 0 ; x 1 ] berechnen will, so könnte man mit der linken Grenze bei der Integralfunktion von a aus auch noch weiter Richtung x 0 „rutschen“ (Grundsätzlich wäre sogar jeder beliebige Wert innerhalb des Intervalls [ a ; b ] möglich, was aber zu Interpretationsschwierigkeiten bzgl. des Wertes F ( x 1 ) − F ( x 0 ) führt). In jedem Fall würde die Ableitung der Integralfunktion F wieder die Ausgangsfunktion f ergeben. Daher ist eine Stammfunktion niemals eindeutig, vielmehr gilt: ■ Ist G eine Stammfunktion zu f und c ∈ R, so ist auch H = G + c eine Stammfunktion zu f , denn H ′ ( x ) = G ′ ( x ) + 0 = G ′ ( x ) = f ( x ). ■ Sind G 1 , G 2 zwei Stammfunktionen zu f und H = G 1 − G 2 , so gilt H ′ ( x ) = G ′ 1 ( x ) − G ′ 2 ( x ) = f ( x ) − f ( x ) = 0 für alle x ∈ [ a ; b ]. H ist also nach Satz 8.21 vgl. S. 184 konstant, d.h. es gibt ein c ∈ R mit H ( x ) = c , d.h. G 1 ( x ) = G 2 ( x ) + c . Alle Stammfunktionen zu f unterscheiden sich nur um Konstanten. Deshalb schreibt man oft ∫ f ( x ) dx = F ( x ) + c . Diese Konstante spielt in einigen Fragestellungen eine Rolle, z.B. bei der Lösung von Differentialgleichungen oder bei Steckbriefproblemen. Eine spezielle Stammfunktion ist die „Integralfunktion“ x → F ( x ) = ∫ x a f ( t ) dt , welche für festes x den Flächeninhalt unter dem Graphen von f zwischen a und x angibt. 9.1.2 Hauptsatz der Differential- und Integralrechnung Weil sich also zwei Stammfunktionen nur um eine Konstante unterscheiden, gibt es für jede Stammfunktion G von f eine Konstante c derart, dass die Integralfunktion F und die Funktion G sich nur um eine Konstante unterscheiden, d.h. es gilt G ( x ) = F ( x )+ c . Da wir schon gesehen haben, dass sich der Flächeninhalt unter f zwischen x 0 und x 1 als Differenz F ( x 1 ) − F ( x 0 ) ergibt, kann man nun folgern: Satz 9.2 (Hauptsatz der Differential- und Integralrechnung) Ist f : [ a ; b ] → R stetig mit Stammfunktion G , so gilt ∫ b a f ( x ) dx = G ( b ) − G ( a ). Man schreibt [ G ( x )] ba : = G ( b ) − G ( a ). Denn es gilt G ( b ) − G ( a ) = ( F ( b ) + c ) − ( F ( a ) + c ) = F ( b ) − F ( a ), was nach Vereinbarung von F als Integralfunktion die gesuchte Fläche ist. Bei einer stetigen Funktion f : [ a ; b ] → [0; ∞ [ mit nicht durchgehend einheitlichem Monotonieverhalten spaltet man [ a ; b ] in Intervalle [ a 1 ; a 2 ] , [ a 2 ; a 3 ] , . . . , [ a k − 1 ; a k ] mit a = a 1 < a 2 < a 2 < · · · < a k − 1 < a k = b auf, auf denen f jeweils einheitliches Monotonieverhalten hat. Die Fläche unter dem Graph von f ergibt sich dann durch Summation ∫ a 2 a 1 f ( x ) dx + ∫ a 3 a 2 f ( x ) dx + · · · + ∫ a k a k − 1 f ( x ) dx mit einer beliebigen 48818_Terveer.indd 221 48818_Terveer.indd 221 18.07.2023 11: 52: 19 18.07.2023 11: 52: 19 <?page no="222"?> 222 9 Integralrechnung 0.0 0.5 1.0 1.5 2.0 2.5 3.0 x 5 10 15 20 25 30 35 f ( x ) Abbildung 9.2: Funktion und Flächeninhalt zu Beispiel 9.1 Stammfunktion G von f zu ( G ( a 2 ) − G ( a 1 )) + ( G ( a 3 ) − G ( a 2 )) + · · · + ( G ( a k ) − G ( a k − 1 ). Dabei handelt es sich um eine Teleskopsumme, d.h. jeder Klammerausdruck enthält einen Term, der mit umgekehrtem Vorzeichen im nächsten Klammerausdruck vorkommt, so dass nur noch G ( a k ) − G ( a 1 ) = G ( b ) − G ( a ) übrig bleibt. Der Hauptsatz gilt also auch für stetige Funktionen f : [ a ; b ] → R mit nicht einheitlichem Monotonieverhalten. Beispiel 9.1 f : [0; 3] → R, f ( x ) = x 4 − 10 x 2 + x + 35 vgl. Abbildung 9.2 hat die Stammfunktion F ( x ) = 1 5 x 5 − 10 3 x 3 + 12 x 2 + 35 x , wie man durch Prüfung der Ableitung F ′ sieht. Die Funktion ist in [0; 3] nullstellenfrei und positiv. Denn x 4 − 10 x 2 + x + 35 > x 4 − 10 x 2 + 25 = ( x 2 − 5) 2 > 0 für x ∈ [0; 3]. Die Fläche unter dem Graph von f ist ∫ 3 0 f ( x ) dx = F (3) − F (0) = ( 15 · 3 5 − 10 3 · 3 3 + 12 · 3 2 +35 · 3) − 0 = 243 5 − 90+ 92 +105 = 68 , 1. Last but not least lässt sich der Hauptsatz auch auf Funktionen mit nicht einheitlichem Vorzeichenverhalten übertragen vgl. Unterabschnitt 9.1.3 , dann stellt G ( b ) − G ( a ) die Gesamtfläche unter positivem f abzüglich der Gesamtfläche über negativem f dar. Die wesentlichen Überlegungen und Ansätze seien hier zusammengefasst: ■ Ausgehend vom Ziel der Flächenberechnung ist eine „Formel“ für den Flächeninhalt über einem Intervall gesucht, was zu der Aufgabe führt, die Integralfunktion F ( t ) = ∫ t a f ( x ) dx zu berechnen. ■ Die Ableitung von F ist die Ausgangsfunktion f . Funktionen G mit G ′ = f heißen Stammfunktionen von f . ■ Stammfunktionen sind nicht eindeutig; mit F ( x ) ist auch F ( x ) + c eine Stammfunktion von f . Hat man eine Stammfunktion F von f gefunden, so schreibt man auch oft ∫ f ( x ) = F ( x ) + c . ■ Jede Stammfunktion F von f kann zur Berechnung der Ausgangsfläche herangezogen werden, die additive Konstante, um die sich Stammfunktionen einer Funktion unterscheiden, fällt bei der Berechnung des bestimmten Integrals über den Hauptsatz, d.h. bei ∫ b a f ( x ) dx = F ( b ) − F ( a ) weg. Deshalb rückt die Berechnung einer „Muster“-Stammfunktion G zu f in den Vordergrund. Aufgrund des Ansatzes G ′ ( x ) = f ( x ) nutzt man den Ableitungskalkül aus, um die Stammfunktion durch „Aufleiten“ zu gewinnen. Dazu werden Ableitungsregeln uminterpretiert: 48818_Terveer.indd 222 48818_Terveer.indd 222 18.07.2023 11: 52: 24 18.07.2023 11: 52: 24 <?page no="223"?> 9.1 Flächenintegrale und Stammfunktionen 223 Beispiel 9.2 [1] F ( x ) = x 2 , F ′ ( x ) = 2 x , F ( x ) = x 2 ist eine Stammfunktion zu f ( x ) = 2 x . Entsprechend folgt, dass G ( x ) = 12 x 2 eine Stammfunktion zu g ( x ) = x ist. [2] Für x > 0 sei F ( x ) = ln( x ), F ′ ( x ) = 1 x , d.h. F ( x ) = ln( x ) ist eine Stammfunktion zu f ( x ) = 1 x . [3] Für x < 0 sei F ( x ) = ln( − x ). Nach der Kettenregel ist F ′ ( x ) = − 1 − x = 1 x , d.h. F ( x ) = ln( − x ) ist eine Stammfunktion zu f ( x ) = 1 x . [4] Die beiden vorangehenden Fälle x > 0 und x < 0 lassen sich so zusammenfassen, dass F ( x ) = ln( | x | ) eine Stammfunktion zu f ( x ) = 1 x ist. [5] F ( x ) = sin( x ), F ′ ( x ) = cos( x ), d.h. F ( x ) = sin( x ) ist eine Stammfunktion zu f ( x ) = cos( x ), [6] Für G ( x ) = x ln( x ) ist G ′ ( x ) = 1 · ln( x ) + x · 1 x = ln( x ) + 1. Mit F ( x ) = x ln( x ) − x folgt F ′ ( x ) = ln( x ), d.h. F ( x ) ist eine Stammfunktion zu f ( x ) = ln( x ). [7] Für a > 0 und H ( x ) = ln( x ) x − x ln( a ) folgt dann H ′ ( x ) = ln( x ) ln( a ) = log a ( x ), d.h. H ist eine Stammfunktion von log a . Sie erkennen an den Beispielen, dass die generischen Ableitungsregeln wie Produktregel oder Kettenregel auch bei der Berechnung von Stammfunktionen zum Einsatz kommen. Die entsprechenden generischen Integrationsregeln heißen partielle Integration vgl. Unterabschnitt 9.3.2 und Substitutionsregel vgl. Unterabschnitt 9.3.3 . Das bestimmte Integral ∫ b a f ( x ) dx als Flächenmaßzahl ist für Integrationsgrenzen a < b erklärt. Jedoch kommt es bei der später besprochenen Substitutionsregel vor, dass nach ihrer Anwendung die kleinere Integrationsgrenze „oben“ und die größere Integrationsgrenze „unten“ steht. Mit der Stammfunktion F zu f kann man dies leicht beheben: denn beim Tausch der Integrationsgrenzen wird einfach das Vorzeichen des Integrals umgekehrt. Konkret gilt ∫ a b f ( x ) dx = F ( a ) − F ( b ) = − ( F ( b ) − F ( a )), also ∫ a b f ( x ) dx = − ∫ b a f ( x ) dx 9.1.3 Flächenintegrale bei Funktionen mit Vorzeichenwechsel Der Integralbegriff beschränkt sich nicht auf durchweg positive Funktionen. Betrachten Sie die Polynomfunktion f ( x ) = x 4 − 11 x 3 +34 x 2 − 24 x = x ( x − 1)( x − 4)( x − 6) mit den Nullstellen 0, 1, 4 und 6 vgl. Abbildung 9.3 . Zu f gehört die spezielle Stammfunktion F ( x ) = 15 x 5 − 11 4 x 4 + 34 3 x 3 − 12 x 2 . Wie man auf diese Stammfunktion kommt, werden wir gleich besprechen, Sie können die Tatsache, dass es sich um eine Stammfunktion von f handelt, aber durch Ableiten von F schon nachvollziehen. Wir berechnen die Fläche, die der Graph von f mit der Abszisse umschließt, bestehend aus drei Teilflächen: Bei der mittleren der Teilflächen über dem Intervall [1; 4] ist f positiv. Die genannte Teilfläche beträgt also ∫ 4 1 f ( x ) dx = [ F ( x )] 41 = F (4) − F (1) = 512 15 − ( − 193 60 ) = 747 20 Für die anderen Teilflächen wird der Graph von f an der Abszisse gespiegelt, d.h. man geht zu − f ( x ) über. Dann ist entsprechend − F ( x ) Stammfunktion und die linke Teilfläche beträgt ∫ 1 0 − f ( x ) dx = ( − F (1)) − ( − F (0)) = F (0) − F (1) = 0 − ( − 193 60 ) = 193 60 . Die 48818_Terveer.indd 223 48818_Terveer.indd 223 18.07.2023 11: 52: 30 18.07.2023 11: 52: 30 <?page no="224"?> 224 9 Integralrechnung Abbildung 9.3: Die Fläche, die der Graph von f ( x ) = x 4 − 11 x 3 +34 x 2 − 24 x mit der Abszisse einschließt, setzt sich aus drei Teilflächen zusammen, auf denen f wechselndes Vorzeichen hat. rechte Teilfläche beträgt hingegen ∫ 6 4 − f ( x ) dx = ( − F (6)) − ( − F (4)) = F (4) − F (6) = 512 15 − 36 5 = 404 15 Der gesamte Flächeninhalt ist dann die Summe der Teilflächeninhalte, also 193 60 + 747 20 + 404 15 = 193+2241+1616 60 = 4050 60 = 135 2 = 67 , 5. Berechnet man das Integral „über die Vorzeichenwechsel hinweg“ mit dem Hauptsatz, so ergibt sich ∫ 6 0 f ( x ) dx = F (6) − F (0) = 36 5 = 7 , 2. Derselbe Wert ergibt sich als Summe der Flächeninhalte der Flächen unter positiven Funktionsteilen abzüglich der Summe der Flächeninhalte über negativen Funktionsteilen, d.h. 747 20 − ( 193 60 + 404 15 ) = 7 , 2. Den Hauptsatz kann man zur Berechnung von Flächeninhalten ohne Zusatzüberlegungen also nur für nichtnegative Funktionen verwenden. Übungen zu Abschnitt 9.1 ? 1. Skizzieren Sie den Graphen von f und bestimmen Sie mit dem Hauptsatz der Differential- und Integralrechnung die Fläche zwischen Abszisse und Graphen von f im angegebenen Intervall: a) f ( x ) = 2 x + 3 im Intervall [1; 5] b) f ( x ) = 4 x 2 − 4 x im Intervall [2; 4] c) f ( x ) = 3 − | x − 2 | im Intervall [0; 4] 2. Berechnen Sie den Inhalt der Flächenstücke, die von der Abszisse und dem Graphen von f umschlossen werden. a) f ( x ) = x − x 2 b) f ( x ) = x 3 − 19 4 x 2 + 99 16 x − 81 64 c) f ( x ) = ax + x 2 − x 3 mit a > 0 3. Zeigen Sie, dass F ( x ) = ( x − 1) 2 1+ x 2 Stammfunktion zu f ( x ) = 2 ( x 2 − 1 ) (1+ x 2 ) 2 ist. Berechnen Sie den Inhalt der Fläche, die vom Graphen von f und der Abszisse umschlossen wird. 4. Berechnen Sie Stammfunktionen folgender Funktionen: a) f ( x ) = 2 x 3 − 7 x , b) f ( x ) = (3 x ) 1 / 4 , c) f ( x ) = e − x . 5. Berechnen Sie den Inhalt der Fläche, die von den Graphen der beiden Funktionen f und g umschlossen wird. a) f ( x ) = x 2 , g ( x ) = x 4 b) f ( x ) = x 2 − x , g ( x ) = 1 − x 3 6. Bestimmen Sie denjenigen Wert von a ∈ R, für den die von den Funktionen f ( x ) = ax und g ( x ) = ax 3 umschlossene Fläche den Inhalt 1 hat. 7. Für m > 3 sei f eine Parabel mit inhaltsgleichen Flächenstücken A 1 , A 2 gemäß folgendem Graph. Bestimmen Sie m . 8. Welche nach unten geöffnete achsensymmetrische Parabel, die durch den Punkt P (1 | 1) verläuft, umschließt mit der Abszisse eine minimale Fläche? 48818_Terveer.indd 224 48818_Terveer.indd 224 18.07.2023 11: 52: 35 18.07.2023 11: 52: 35 <?page no="225"?> 9.2 Numerische Berechnung von Flächenintegralen 225 Abbildung 9.4: Flächenberechnung durch Ausschöpfung mit einer zunehmenden Anzahl von Rechtecken 9.2 Numerische Berechnung von Flächenintegralen Im vergangenen Abschnitt haben wir die Integralrechnung als Flächenberechnung unter Kurven mit der Differentialrechnung zusammengeführt. Es gibt einen anderen Zugang, mit dem die zu bestimmenden Flächen unter Verwendung von Ausschöpfungs- oder Einschließungsverfahren berechnet werden. Der genaue Flächeninhalt ergibt sich dann durch einen Grenzwertübergang. Das Ausschöpfen erfolgt mit Hilfe von Summen von Rechtecksflächen gemäß Abbildung 9.4. Wir erläutern die Methode beispielhaft anhand der dort dargestellten Funktion f : R → R, f ( x ) = 34 x 2 mit (einer) Stammfunktion F ( x ) = 14 x 3 , für die sich nach dem Hauptsatz ∫ 2 1 f ( x ) dx = F (2) − F (1) = 1 , 75 ergibt. Dieser Wert läßt sich auch durch fortgesetzte Ausschöpfung annähern. Wir betrachten zunächst die Aufteilung [1; 2] = [1; 1 , 5] ∪ [1 , 5; 2] in zwei gleich große („äquidistante“) Teilintervalle, wie sie in Abbildung 9.4, links angegeben ist. Über diese Teilintervalle passen wir zwischen Abszisse und Funktionsgraphen möglichst große Rechtecke ein; diese haben die Höhen f (1) = 34 und f (1 , 5) = 27 16 und jeweils die Breite 12 . Zusammen haben sie den Flächeninhalt 34 · 12 + 27 16 · 12 = 39 32 ≈ 1 , 22. Von dem tatsächlichen Flächeninhalt sind wir noch weit entfernt, das deuten auch die „Versatzflächen“ an, die von den Rechtecksflächen bis zur gesuchten Gesamtfläche fehlen. Jetzt verdoppeln wir die Anzahl der Intervalle und betrachten die Zerlegung [1; 2] = [1; 1 , 25] ∪ [1 , 25; 1 , 5] ∪ [1 , 5; 1 , 75] ∪ [1 , 75; 2]. Die Ausschöpfung geschieht nun durch Rechtecke mit der Höhe f (1) = 34 , f ( 54 ) = 75 64 , f ( 32 ) = 27 16 und f ( 74 ) = 147 64 . Als Gesamtflächeninhalt ergibt sich 34 · 14 + 75 64 · 14 + 27 16 · 14 + 147 64 · 14 = 189 128 ≈ 1 , 48 bei dieser Ausschöpfung, was auch noch recht weit von dem uns bereits bekannten Wert 1 , 75 für den Flächeninhalt entfernt liegt. Wir müssen die Anzahl der Intervalle deutlich erhöhen, um näherungsweise auf den angegebenen Wert zu kommen. Mit 16 gleich großen Teilintervallen ergibt sich als Rechteckssumme ca. 1 , 68, bei 64 gleich großen Teilintervallen ca. 1 , 73. Diese Werte erhält man durch systematische Summation der Teilflächen, wobei zwei Grundüberlegungen Anwendung finden: ■ Wenn das Intervall [1; 2] in n gleich große Teilintervalle aufgeteilt wird, haben diese die Intervallgrenzen 1, 1 + 1 n , 1 + 2 n , . . . , 1 + n − 1 n und 2. Dabei werden 1, 1 + 1 n , 1 + 2 n , . . . , 1 + n − 1 n als linke Intervallgrenzen verwendet, während 1 + 1 n , 1 + 2 n , . . . , 1 + n − 1 n , 2 rechte Intervallgrenzen sind. ■ Ein im Intervall [1 + k n ; 1 + k +1 n ] zwischen Funktionsgraphen und Abszisse einbeschriebenes Rechteck hat die Breite 1 n , wegen der Monotonie von f entspricht seine Höhe dem Funktionswert an der linken Intervallgrenze, ist also f ( k n ) = 34 (1 + k n ) 2 . Es hat somit den Flächeninhalt 3 4 n (1 + k n ) 2 = 3 4 n 3 ( n + k ) 2 . 48818_Terveer.indd 225 48818_Terveer.indd 225 18.07.2023 11: 52: 40 18.07.2023 11: 52: 40 <?page no="226"?> 226 9 Integralrechnung Die gesamte Fläche hat dann den Flächeninhalt (Untersumme) n − 1 ∑ k =0 3 4 n 3 ( n + k ) 2 = 3 4 n 3 n − 1 ∑ k =0 ( n + k ) 2 = 3 4 n 3 2 n − 1 ∑ k = n k 2 Mit der Potenzsummenformel aus Satz 7.5 vgl. S. 144 folgt 2 n − 1 ∑ k = n k 2 = 2 n − 1 ∑ k =0 k 2 − n − 1 ∑ k =0 k 2 = (2 n − 1)(2 n )(2(2 n − 1) + 1) − ( n − 1) n (2( n − 1) + 1) 6 = n (2 n − 1)((8 n − 2) − ( n − 1) 6 = n (2 n − 1)(7 n − 1) 6 = n (14 n 2 − 9 n + 2) 6 Also ergibt sich als Flächeninhalt 3 4 n 3 · n (14 n 2 − 9 n + 2) 6 = 18 14 n 2 − 9 n + 2 n 2 Für n = 16 lautet der Wert 1721 1024 ≈ 1 , 68, für n = 64 lautet er 28385 16384 ≈ 1 , 7325. Mit der berechneten Formel lässt sich aber auch der exakte Flächeninhalt bestimmen, nämlich als Grenzwert lim n →∞ 1 8 14 n 2 − 9 n +2 n 2 = 18 · 14 = 74 = 1 , 75. Es ergibt sich also schon mit dem Hauptsatz der Differential- und Integralrechnung gefundene Wert ∫ 2 1 3 4 x 2 dx = 1 , 75. Ein Integral mit dem Hauptsatz zu berechnen, ist der Bestimmung als Grenzwert oder einer Approximation mit „ großem“ n generell vorzuziehen. Sollte aber weder der Hauptsatz noch die Grenzwertmethode möglich sein, so bleibt nur die numerische Approximation. Dies kann notwendig sein, weil etwa eine Stammfunktion von f nicht bekannt ist, beispielsweise bei Funktionen der Form f ( x ) = h ( p ( x )) · q ( x ), wobei p, q Polynome und h eine Funktion ist, die es nicht erlaubt, den Term h ( p ( x )) · q ( x ) durch algebraische Umformungen in eine einfachere Gestalt zu bringen, anhand derer man eine Stammfunktion ablesen kann. Prominentestes Beispiel ist die Funktion f ( x ) = e − x 2 , deren Integral auch als Gauß’sches Fehlerintegral bezeichnet und in der Wahrscheinlichkeitsrechnung benötigt wird. Die Approximation erfolgt mit den beiden Ansätzen der Vereinfachung und Verfeinerung: ■ Vereinfachung: mit einer geeigneten Funktion g wird auf einem gegebenen Intervall ∫ b a g ( x ) dx anstelle von ∫ b a f ( x ) dx ermittelt. Einfache Funktionen für g sind etwa konstante, lineare oder quadratische Funktionen, also beispielsweise [1] die Funktion g ( x ) = f ( x min ) wobei f ( x min ) Minimum von f in [ a ; b ] ist, [2] die Funktion g ( x ) = f ( x max ) wobei f ( x max ) Maximum von f in [ a ; b ] ist, [3] Die lineare Funktion g ( x ) durch P ( a | f ( a )) und Q ( b | f ( b )), [4] die quadratische Funktion g durch P ( a | f ( a )), Q ( a + b 2 | f ( a + b 2 )) und R ( b | f ( b )). ■ Verfeinerung: Das Intervall [ a ; b ] wird in n Teilintervalle [ a ni , b ni ], i = 1 , . . . , n mit a = a n 1 < b n 1 = a n 2 < b n 2 = · · · = a nn < b nn = b zerlegt, so dass die Feinheit max i =1 ,...,n | b ni − a ni | mit wachsendem n gegen 0 strebt. Üblich sind gleich lange Intervalle, oft wird die Anzahl der Intervalle in jedem Schritt auch verdoppelt. Der Wert von ∫ b a f ( x ) dx wird dann durch ∑ n i =1 ∫ b ni a ni g ( x ) dx approximiert. Bei stetigen Funktionen f und geeigneter Ersatzfunktion g (wie z.B. oben beschrieben) strebt dieser Ausdruck mit n → ∞ gegen das gesuchte Integral, er dient bei ausreichend großem n also als Näherung des Integrals. 48818_Terveer.indd 226 48818_Terveer.indd 226 18.07.2023 11: 52: 46 18.07.2023 11: 52: 46 <?page no="227"?> 9.2 Numerische Berechnung von Flächenintegralen 227 35. 29. 96. 96. 96. 96. 0. 3. x f ( x ) 35. 34.41 32.13 28.46 23.87 19.06 14.9 12.45 12.98 17.94 29. 10.4112 9.98066 9.08786 7.84946 6.44042 5.09402 4.10186 3.81386 4.63826 7.04162 68.4592 10.4112 9.98066 9.08786 7.84946 6.44042 5.09402 4.10186 3.81386 4.63826 7.04162 0. 0.3 0.6 0.9 1.2 1.5 1.8 2.1 2.4 2.7 3. x f ( x ) Abbildung 9.5: Illustration der Trapezregel. Angegeben sind für n = 2 (links) und n = 11 (rechts) jeweils die approximierenden Trapezflächen und rechts oben die Trapez-Gesamtfläche. Mit den Ansätzen [1] und [2] und der Verfeinerungstechnik ergeben sich Unter- und Obersummen, deren Grenzwerte zur formalen Definition des Riemann-Integrals verwendet werden, wie für die Untersummen schon beispielhaft besprochen. Die anderen Ansätze werden zur Approximation verwendet, Ansatz [3] wird als Trapezregel, Ansatz [4] als Simpson-Regel bezeichnet. 9.2.1 Numerische Integration mit der Trapezregel Die lineare Interpolation von f : [ a ; b ] → R an den Punkten ( a | f ( a )), ( b | f ( b )) hat die Punkt-Steigungsform g ( x ) = f ( a ) + f ( b ) − f ( a ) b − a ( x − a ). Über das gesamte Intervall ergibt sich somit die Näherung eine Trapezfläche, d.h. die Trapezregel ∫ b a g ( x ) dx = ( b − a )( f ( b ) − f ( a )) 2 gemäß Abbildung 9.5, links. Bei n äquidistanten Stützstellen a = a 1 < a 2 < · · · < a n = b - d.h. die Intervallängen betragen jeweils a i − a i − 1 = b − a n - ergibt sich die Näherung, die ebenfalls als Trapezregel bezeichnet wird: Satz 9.3 (Trapezregel) ∫ b a f ( x ) dx ≈ ∑ n i =1 ( b i − a i )( f ( b i ) − f ( a i ) 2 = b − a 2 n · ( f ( a ) + 2 ∑ n − 1 i =2 f ( a i ) + f ( b )) Für die in Beispiel 9.1 besprochene Funktion f : [0; 3] → R, f ( x ) = x 4 − 10 x 2 + x + 35 mit ∫ 3 0 f ( x ) dx = 68 , 1 erhält man die in Abbildung 9.5 angegebenen Näherungen mit n = 2 und n = 11 Stützstellen. Man sieht, dass der tatsächliche Flächeninhalt schon recht genau approximiert wird. 9.2.2 Numerische Integration mit der Simpson-Regel Hierbei wird eine gegebene Funktion f auf [ a ; b ] mit Hilfe einer quadratischen Funktion g ( x ) = αx 2 + βx + γ , vgl. Abbildung 9.6 links, interpoliert, d.h. die Koeffizienten α , β und γ sind so festgelegt, dass g ( a ) = f ( a ), g ( b ) = f ( b ) und g ( a + b 2 ) = f ( a + b 2 ). Für die Berechnung des Näherungswertes ∫ b a g ( x ) dx braucht man dabei gar nicht die konkrete Form der Koeffizienten α, β, γ , mit der generellen Form von g gilt: 48818_Terveer.indd 227 48818_Terveer.indd 227 18.07.2023 11: 52: 51 18.07.2023 11: 52: 51 <?page no="228"?> 228 9 Integralrechnung 35. 19.06 29. 70.125 70.125 0. 1.5 3. x f ( x ) 35. 34.41 32.13 28.46 23.87 19.06 14.9 12.45 12.98 17.94 29. 20.4762 16.9828 11.5021 7.76676 11.3754 68.1032 0. 0.3 0.6 0.9 1.2 1.5 1.8 2.1 2.4 2.7 3. x f ( x ) Abbildung 9.6: Illustration der Simpson-Regel für m = 1 (links) und m = 5 (rechts). Zur Beschriftung vgl. Abbildung 9.5 ∫ b a g ( x ) dx = α 3 ( b 3 − a 3 ) + β 2 ( b 2 − a 2 ) + γ ( b − a ) = α 3 ( b − a )( b 2 + ab + a 2 ) + β 2 ( b − a )( b + a ) + γ ( b − a ) = b − a 6 · ( 2 α ( b 2 + ab + a 2 ) + 3 β ( b + a ) + 6 γ ) ( ∗ ) = b − a 6 · ( f ( a ) + 4 f ( a + b 2 ) + f ( b )) denn für die drei Summanden gilt ■ f ( a ) = αa 2 + βa + γ und f ( b ) = αb 2 + βb + γ ■ 4 f ( a + b 2 ) = 4( α ( a + b 2 ) 2 + β a + b 2 + γ ) = αa 2 + α 2 ab + αb 2 + β 2( a + b ) + 4 γ und die schraffierten Terme ergeben zusammen den Term ( ∗ ). Es folgt: Satz 9.4 (Simpson-Regel für ein Intervall) ∫ b a f ( x ) dx ≈ ∫ b a g ( x ) dx = ( b − a ) 6 · ( f ( a ) + 4 f ( a + b 2 ) + f ( b )) Diese Regel wird auch als Kepler’sche Fassregel bezeichnet, weil Johannes Kepler sie für den Fall hergeleitet hat, dass f ( x ) die Querschnittsfläche eines Rotationskörpers (Fasses) über dem Intervall [ a ; b ] darstellt, so dass das Integral dann das Volumen dieses Rotationskörpers ergibt. Für quadratische Funktionen f ergibt die Simpson- Regel schon das exakte Ergebnis, weil dann die quadratische Interpolation g mit f übereinstimmt. Überraschenderweise ist das auch noch richtig, wenn f ein Polynom dritten Grades ist. Bei n = 2 m äquidistanten Stützstellen d.h. mit a 1 = a, a n = b und a i − a i − 1 = b − a n ergibt sich durch Summation der einzelnen Flächeninhalte: Satz 9.5 (Simpson-Regel für eine Intervall-Verfeinerung) ∫ b a f ( x ) dx ≈ b − a 6 m · ( f ( a ) + 4 ∑ m i =1 f ( a 2 i − 1 ) + 2 ∑ m − 1 i =1 f ( a 2 i ) + f ( b )) Für f ( x ) = x 4 − 10 x 2 + x + 35 erhält man Näherungen von ∫ 3 0 f ( x ) dx für m = 1 und m = 5 gemäß Abbildung 9.6. Der korrekte Wert wird mit m = 5 gut approximiert. 9.2.3 Exkurs: Das Lebesgue-Integral Dass die Fläche unter einer Kurve als Riemann-Integral mit Unter- und Obersummen approximiert wird, scheint auf den ersten Blick die Flächenberechnung auch auf numerische Art abschließend zu lösen. Dabei wird die (weitgehende) Stetigkeit der zu integrierenden Funktion benötigt. Viele wichtige Funktionen sind jedoch derart unstetig, das ihr Riemann-Integral nicht mehr berechnet werden kann. 48818_Terveer.indd 228 48818_Terveer.indd 228 18.07.2023 11: 52: 57 18.07.2023 11: 52: 57 <?page no="229"?> 9.2 Numerische Berechnung von Flächenintegralen 229 Abbildung 9.7: Approximationsansatz des Riemann-Integrals (links) und des Lebesgue-Integrals (rechts) Beispiel 9.3 Für die stetige Funktion f 0 : [0; 1] → R, f ( x ) = 1 = 1 [0; 1] ( x ), gilt ∫ 1 0 f 0 ( x ) dx = 1. Wir verändern die Funktion an der Stelle x 1 = 12 zu f 1 ( x ) = { 0 x = x 1 1 sonst Die Funktion ist in x = x 1 unstetig, allerdings gilt weiterhin ∫ 1 0 f 1 ( x ) = 1, denn Terme in Untersummen, in denen x 1 als Stützstelle verwendet wird, können mit zunehmender Feinheit der Unterteilung vernachlässigt werden alternativ kann man das Integral auch abschnittweise von 0 bis 12 und von 12 bis 1 uneigentlich berechnen und die Werte summieren, was ebenfalls 1 ergibt. Wird f 0 an n Stellen x 1 , . . . , x n ∈ [0; 1] abgeändert zu f n ( x ) = { 0 x ∈ { x 1 , . . . , x n } 1 sonst , so gilt ebenfalls ∫ 1 0 f n ( x ) = 1, insbesondere mit den ersten n Zahlen einer Abzählung M = { x 1 , x 2 , . . . } der rationalen Zahlen in [0; 1] vgl. Beispiel 1.5, S. 21 . Mit n → ∞ ergibt sich lim n →∞ f n ( x ) = f ( x ), wobei f ( x ) = { 0 x ∈ M 1 sonst . f ( x ) ist gleich 1 für alle irrationalen und gleich 0 für alle rationalen Zahlen in [0; 1]. Gemäß des Grenzwertüberganges würde man erwarten, dass auch f Riemannintegrierbar ist mit ∫ 1 0 f ( x ) = lim n →∞ ∫ 1 0 f n ( x ) dx = 1. Das ist jedoch nicht der Fall, denn für jede Intervallaufteilung 0 = a 1 < a 2 < · · · < a n = 1 gibt es in jedem Intervall eine rationale Zahl zu der f ( x ) = 0 und eine irrationale Zahl, zu der f ( x ) = 1. Jede Untersumme ist daher 0, jede Obersumme ist 1, deshalb existiert das Riemann-Integral von f als Grenzwert nicht. Man sieht, dass das Riemann-Integral hier an seine Grenzen stößt. Seine Unzulänglichkeit erklärt sich dadurch, dass beim Riemann-Ansatz der Definitionsbereich in Intervalle unterteilt wird, ohne dabei Eigenschaften der Funktion f zu berücksichtigen, die im Beispiel an keiner Stelle x ∈ [0; 1] stetig ist (warum? ). Beim Lebesgue-Integral erfolgt nun die die Approximation nicht durch direkte Aufteilung des Definitionsbereiches, sondern durch Aufteilung des Wertebereichs der Funktion in Intervalle. Diesen wird dann abhängig von f eine Partition des Definitionsbereiches in Teilmengen A 1 , . . . , A n zugeordnet sowie eine stückweise auf den Mengen A i konstante Funktion vgl. Abbildung 9.7 rechts . Die Fläche unter dem Graphen dieser Stufenfunktion dient dann als Approximation der Fläche unter dem Graphen von f . Mit zunehmender Feinheit der Aufteilung des Wertebereiches wird die Fläche unter der Kurve dadurch angenähert, die Stufenfunktionen konvergieren gegen f ebenso wie die Fläche unter den Stufenfunktionen gegen die Fläche unter f . Da die Zuordnung 48818_Terveer.indd 229 48818_Terveer.indd 229 18.07.2023 11: 53: 01 18.07.2023 11: 53: 01 <?page no="230"?> 230 9 Integralrechnung der Partition des Wertebereiches im Definitionsbereich nicht immer Intervalle liefert (in Abbildung 9.7, links, gehören Paare von Intervallen zu einem Funktionswert), erfordert das Lebesgue-Integral auch die Bemaßung anderer Mengen als Intervalle, was in der Mathematik im Rahmen der Maßtheorie behandelt wird [Elstrodt, 2009]. Die Funktion f aus Beispiel 9.3 ist bereits eine Stufenfunktion, sie ist 0 auf der Menge M und 1 auf der Menge [0; 1] \ M. Dabei hat die Menge M als abzählbare Menge das Maß 0 und entsprechend [0; 1] \ M das Maß 1. Das Lebesgue-Integral von f über [0; 1] ist daher 1 und entspricht damit der intuitiv angenommenen Fläche. Übungen zu Abschnitt 9.2 ? 9. Berechnen Sie ∫ 2 1 3 4 x 2 dx mittels Obersummen. Teilen Sie hierzu das Intervall [1; 2], wie im Text beschrieben in n Teilintervalle ein, und verwenden Sie als Höhe der Rechtecke jeweils den Funktionswert an der rechten Intervallgrenze. Bilden Sie anschließend den Grenzwert für n → ∞ . 10. Berechnen Sie das Integral ∫ 2 0 x 3 dx durch Ausschöpfung. Vergleichen Sie mit dem Ergebnis aus dem Hauptsatz. 11. Berechnen Sie ∫ 1 0 ( 1 2 x + 1) dx a) durch geometrische Flächenformeln anhand des Graphen von f , b) mit dem Hauptsatz der Differential- und Integralrechnung, c) durch Ausschöpfung von Rechtecksflächen unter Ausnutzung der Formel 1 + 2 + 3 + · · · + n = n ( n +1) 2 , n ∈ N. 12. Prüfen Sie, dass die Simpson-Regel für die Funktion f ( x ) = x 3 den exakten Wert ∫ b a f ( x ) dx = 14 ( b 4 − a 4 ) ergibt. 9.3 Integrationsregeln Wir haben im Zusammenhang mit der Stammfunktion schon den engen Zusammenhang zwischen der Differentiation und der Integration gesehen. Zu einer gegebenen Funktion f läßt sich mit Hilfe einer beliebigen Stammfunktion F von f das Integral ∫ b a f ( x ) dx = F ( b ) − F ( a ) ausdrücken. Weil sich f durch Ableiten aus F wieder ergibt, kann man durch die Umkehrung dieses Vorgangs Regeln zur Berechnung von Stammfunktionen - und damit von Integralen - formulieren. Zunächst lassen sich die in Tabelle 8.2 vgl. S. 186 angegebenen Ableitungsregeln in Integrationsregeln überführen vgl. Tabelle 9.1 . Zudem gibt es generische Integrationsregeln. 9.3.1 Faktorregel und Summenregel Konstante Faktoren in einer Funktion lassen sich aus dem Integral faktorisieren: Satz 9.6 (Faktorregel) g : [ a ; b ] → R sei eine stetige/ integrierbare Funktion, c ∈ R. Dann gilt: [1] Faktorregel für unbestimmte Integrale: ∫ cg ( x ) dx = c ∫ g ( x ) dx [2] Faktorregel für bestimmte Integrale: ∫ b a cg ( x ) dx = c ∫ b a g ( x ) dx 48818_Terveer.indd 230 48818_Terveer.indd 230 18.07.2023 11: 53: 05 18.07.2023 11: 53: 05 <?page no="231"?> 9.3 Integrationsregeln 231 Typ Funktion f ( x ) = Parameter Definitionsbereich Stammfunktion ∫ f ( x ) dx = Berechnung Konstant 1 R x S. 186 Linear x R 12 x 2 S. 223 Normalparabel x 2 R 13 x 3 S. 231f. Kehrwert 1 x x ̸ = 0 ln | x | S. 223 Monom, allgemein x n n ∈ Z, n ̸ = − 1 R, ( x ̸ = 0 für n < 0) 1 n +1 x n +1 S. 231f. Potenzfunktion x a a ∈ R, a ̸ = − 1 x > 0 1 a +1 x a +1 S. 186 Exponentialfkt. e x R e x S. 186 allgemein a x = e x ln( a ) a > 0 R 1 ln( a ) a x S. 186 Logarithmusfkt. ln( x ) x > 0 x ln( x ) − x S. 223 allgemein log a ( x ) = ln( x ) ln( a ) a > 0 x > 0 x ln( x ) − x ln( a ) S. 223 Sinus sin( x ) R − cos( x ) S. 186 Cosinus cos( x ) R sin( x ) S. 186 Tangens tan( x ) = sin( x ) cos( x ) R \ {± π 2 , ± 3 π 2 , . . . } − ln | cos( x ) | S. 235 Tabelle 9.1: Tabelle wichtiger Funktionen und ihrer Stammfunktionen Beispiel 9.4 Wir suchen die Stammfunktion der Funktion f ( x ) = x 7 . Wir wissen, dass die Funktion G ( x ) = x 8 die Ableitung g ( x ) = G ′ ( x ) = 8 x 7 = 8 f ( x ) hat. Es gilt f ( x ) = 18 g ( x ). Mit der Faktorregel folgt jetzt: ∫ x 7 dx = ∫ 18 g ( x ) dx = 18 ∫ g ( x ) dx = 18 x 8 Die Faktorregel lässt sich also verwenden, um bekannte Ableitungsregeln, in denen Faktoren auftreten, zu Integrationsregeln zu machen. Für das n -te Monom ( n ∈ N) gilt entsprechend ∫ x n dx = 1 n +1 x n . Der Exponent n wird also um 1 erhöht, anschließend wird mit dem Kehrwert von n + 1 multipliziert. Satz 9.7 (Summenregel) g, h : [ a ; b ] → R seien stetige/ integrierbare Funktionen. Dann gilt: [1] Summenregel für unbestimmte Integrale: ∫ g ( x ) + h ( x ) dx = ∫ g ( x ) dx + ∫ h ( x ) dx [2] Summenregel für bestimmte Integrale: ∫ b a g ( x ) + h ( x ) dx = ∫ b a g ( x ) dx + ∫ b a h ( x ) dx Aus der Faktorregel, der Summenregel und der Regel für allgemeine Monome folgt die am häufigsten verwendete Regel, nämlich die für die Integration von Polynomen. Diese werden gliedweise integriert, ein Monom vom Grad n geht über in ein Monom vom Grad n + 1, wobei der Grad als Kehrfaktor 1 n +1 mitberücksichtigt wird. Beispiel 9.5 Eine Stammfunktion von p ( x ) = x 4 − 11 x 3 + 34 x 2 − 24 x erhalten Sie durch Aufleiten jedes Summanden, d.h. durch die Übergänge x 4 15 x 5 , x 3 14 x 4 , x 2 13 x 3 und x 12 x 2 . Wenn man noch die vorhandenen Koeffizienten in p fortführt, ergibt sich die Stammfunktion P ( x ) = 15 x 5 − 11 4 x 4 + 34 3 x 3 − 8 x 2 . Manchmal sind nur ein paar mehr oder weniger „trickreiche“ Termumformungen nötig, um mit Summen- und Faktorregel auf vertafelten Integrale zurückgreifen zu können. 48818_Terveer.indd 231 48818_Terveer.indd 231 18.07.2023 11: 53: 11 18.07.2023 11: 53: 11 <?page no="232"?> 232 9 Integralrechnung + − D I u v ′ u ′ v ∫ u ( x ) v ′ ( x ) dx = u ( x ) v ( x ) − ∫ u ′ ( x ) v ( x ) dx Abbildung 9.8: Schematische Illustration der partiellen Integration. Beispiel 9.6 Gesucht ist eine Stammfunktion von f ( x ) = 3 x 2 − 13 x +12 ( x − 1) 3 = 3 x − 1 − 7 ( x − 1) 2 + 2 ( x − 1) 3 (Partialbruchzerlegung vgl. Beispiel 5.29, S. 98 ). Die auftretenden Summanden lassen sich anhand von Tabelle 9.1 leicht integrieren; so gilt etwa (1 / ( x − 1)) ′ = − 1 / ( x − 1) 2 , also ∫ 1 ( x − 1) 2 dx = − 1 ( x − 1) . Insgesamt ergibt sich ∫ f ( x ) dx = 3 ln | x − 1 | + 7 x − 1 − 1 ( x − 1) 2 . 9.3.2 Partielle Integration Für rationale Funktionen kommt man mit den bisher genannten Regeln meist aus. Auch Summen von „Standardfunktionen“ aus der angegebenen Integrationstabelle sind unproblematisch. Ist aber f aber Produkt f ( x ) = g ( x ) · h ( x ) ■ eines Polynoms g ( x ) mit einer nicht-elementaren Funktion h ( x ), ■ zweier nicht-elementarer Funktionen g ( x ) und h ( x ), so muss man meist die partielle Integration versuchen, deren Idee es ist, eine Produktdarstellung zu finden, bei der der eine Faktor als Funktion f ( x ) = u ( x ) aufgefasst und abgeleitet wird, und der andere Faktor als Ableitung g ( x ) = v ′ ( x ) verstanden und integriert wird . Das (unbestimmte) Ausgangsintegral ist von der Form ∫ u ( x ) · v ′ ( x ) dx . Als Ergebnis erhält man einen Ausdruck, in dem das unbestimmte Integral ∫ u ′ ( x ) v ( x ) dx steht. Ziel ist es, solch eine Darstellung zu finden, bei der das entstehende Integral „leichter“ zu berechnen ist. Außerdem sollte die Stammfunktion v zu v ′ verfügbar sein. Satz 9.8 (Partielle Integration) u, v : [ a ; b ] → R seien differenzierbare Funktionen. Dann gilt: [1] Regel der partiellen Integration für unbestimmte Integrale: ∫ u ( x ) v ′ ( x ) dx = u ( x ) u ( x ) − ∫ u ′ ( x ) v ( x ) dx [2] Regel der partiellen Integration für bestimmte Integrale: ∫ b a u ( x ) v ′ ( x ) dx = ( u ( b ) v ( b ) − u ( a ) v ( a )) − ∫ b a u ′ ( x ) v ( x ) dx Die Regel für unbestimmte Integrale lässt sich so interpretieren: Ist F eine Stammfunktion von uv ′ , dann ist uv − F eine Stammfunktion von u ′ v . Welche Funktionen in Integralen gebunden werden und welche die Stammfunktion bilden, lässt sich wie in Abbildung 9.8 darstellen. Die angegebenen Funktionen werden längst der Linien paarweise multipliziert. Die Vorzeichen der Produkte sind links markiert. In der D-Spalte wird differenziert, in der I-Spalte wird unbestimmt integriert. Beispiel 9.7 f : ]0; ∞ [ → ∞ , f ( x ) = x ln( x ) hat die Stammfunktion H ( x ) = x 2 (ln( √ x ) − 1). Betrachten Sie nämlich hierzu die Darstellung f ( x ) = u ( x ) v ′ ( x ) mit v ′ ( x ) = x und u ( x ) = ln( x ). Eine Stammfunktion zu v ′ ist v ( x ) = 1 2 x 2 , außerdem ist u ′ ( x ) = 1 x . 48818_Terveer.indd 232 48818_Terveer.indd 232 18.07.2023 11: 53: 17 18.07.2023 11: 53: 17 <?page no="233"?> 9.3 Integrationsregeln 233 Nach der Regel der partiellen Integration ist die gesuchte Stammfunktion ∫ x ln( x ) dx = ∫ u ( x ) v ′ ( x ) dx = u ( x ) v ( x ) − ∫ u ′ ( x ) v ( x ) dx = 1 2 x 2 ln( x ) − ∫ 12 x 2 1 x dx = x 2 ln( √ x ) − ∫ 12 xdx = x 2 ln( √ x ) − x 2 = x 2 (ln( √ x ) − 1) Beispiel 9.8 Die Stammfunktion zur Funktion f : R → R, f ( x ) = x 2 e − x wird durch zweimaliges partielles Integrieren gewonnen. Schritt 1: u ( x ) = x 2 , v ′ ( x ) = e − x . Mit u ′ ( x ) = 2 x , v ( x ) = − e − x folgt ∫ x 2 e − x dx = − x 2 e − x − ( ∫ 2 x ( − e − x ) dx = x 2 e − x + 2 ∫ xe − x dx 6 Schritt 2: u ( x ) = x , v ′ ( x ) = e − x . Mit u ′ ( x ) = 1, v ( x ) = − e − x folgt ∫ xe − x dx = − xe − x − ∫ 1 · ( − e − x ) dx und schließlich ∫ x 2 e − x dx = − x 2 e − x + 2( − xe − x − e − x ) = e − x ( − x 2 − 2 x − 2) Führt man mehrere partielle Integrationen hintereinander aus, so kann man das Schema in Abbildung 9.8 zu einer Tabelle wie rechts angegeben erweitern. In den Spalten D und I werden die Ausgangsfunktionen, hier x 2 und e − x fortlaufend differenziert (D) D I + x 2 e − x − 2 x − e − x + 2 e − x und integriert (I). Das Produkt der Einträge in Zeile 1 ist die Funktion, deren Stammfunktion berechnet werden soll. In der letzten Zeile steht entsprechend das Produkt der Funktionen, welches abschließend noch integriert werden muss. Summanden der Stammfunktion sind Produkte jedes Eintrages in der Spalte D mit einem Eintrag eine Zeile tiefer in der Spalte I. Das verbleibende unbestimmte Integral wird über das Produkt der Einträge in der letzten Zeile genommen. Die Vorzeichen der Produkte werden der linken Spalte entnommen, die abwechselnd + und − enthält. Es ergibt sich hier dann: ∫ x 2 e − x dx = + x 2 ( − e − x ) − 2 xe − x + ∫ 2 e − x dx = e − x ( − x 2 − 2 x − 2) Diese so genannte Tabellenmethode hilft, sich auf das fortgesetzte Differenzieren und Integrieren der Faktoren zu fokussieren und Vorzeichenfehler zu vermeiden. Manchmal führt auch die mehrfache Ausführung der partiellen Integration nicht zu einem einfacheren Integral, sondern irgendwann gelangt man zum Ausgangsintegral zurück (so genanntes Phönix-Prinzip). Das ist regelmäßig dann der Fall, wenn die auftretenden Funktionen aus dem Bereich der trigonometrischen Funktionen kommen. Dann liefert die partielle Integration zumindest eine Formel, aus der man gegebenenfalls das zu bestimmende Integral „isolieren“ kann. Beispiel 9.9 Gesucht ist das unbestimmte Integral I = ∫ sin( x ) cos( x ) dx . Mit u ( x ) = sin( x ), v ′ ( x ) = cos( x ) folgt mit der partiellen Integration I = ∫ sin( x ) cos( x ) dx = ∫ u ( x ) v ′ ( x ) dx = u ( x ) v ( x ) − ∫ u ′ ( x ) v ( x ) = sin 2 ( x ) − ∫ sin( x ) cos( x ) dx = sin 2 ( x ) − I 48818_Terveer.indd 233 48818_Terveer.indd 233 18.07.2023 11: 53: 23 18.07.2023 11: 53: 23 <?page no="234"?> 234 9 Integralrechnung Also gilt I = sin 2 ( x ) − I . Löst man diese Gleichung nach I = ∫ sin( x ) cos( x ) dx auf, so folgt ∫ sin( x ) cos( x ) dx = 12 sin 2 ( x ). Nicht immer führt das Phönix-Prinzip zum Ziel: Beispiel 9.10 Für die Funktion f ( x ) = cos 2 ( x ) ergibt die Tabellenmethode ∫ cos 2 ( x ) = cos( x ) sin( x ) − ( − sin( x ))( − cos( x )) + ∫ cos 2 ( x ) dx , d.h. eine Tautologie. Bricht man aber schon nach der ersten par- D I + cos( x ) cos( x ) − − sin( x ) sin( x ) + − cos( x ) − cos( x ) tiellen Integration ab, erhält man ∫ cos 2 ( x ) = cos( x ) sin( x )+ ∫ sin 2 ( x ) dx . Jetzt kann man nach dem Additionstheorem sin 2 ( x ) = 1 − cos 2 ( x ) substitieren, daraus folgt ∫ cos 2 ( x ) dx = sin( x ) cos( x ) + ∫ (1 − cos 2 ( x )) dx = sin( x ) cos( x ) + x − ∫ cos 2 ( x ) dx Dies kann aufgelöst werden: ∫ cos 2 ( x ) dx = x +sin( x ) cos( x ) 2 = x +sin(2 x ) / 2 2 . Wenn eine Funktion sich als Produkt mehrerer Funktionen darstellt, so hat man mehrere Möglichkeiten, u ′ und v als Faktoren des Produktes festzulegen. Diese Möglichkeiten ergeben völlig verschiedene Richtungen der Umformung und nur eine der beiden Möglichkeiten führt in der Regel zum Ziel der Vereinfachung des Integrals. Beispiel 9.11 Die Problematik sei anhand des gerade behandelten Beispiels ∫ x 2 e − x dx erläutert. Wenn man hier g ′ ( x ) = x 2 und h ( x ) = e − x wählt, so ergibt sich durch den Ansatz der partiellen Integration ∫ x 2 e − x dx = 13 x 3 e − x + ∫ 13 x 3 e − x dx , und es ist nichts gewonnen, denn das resultierende Integral hat sich eher noch „verschlimmert“. Hier versucht man statt dessen, wie in Beispiel 9.8 gerechnet durch wiederholte partielle Integration den Polynomfaktor so lange zu differenzieren, bis er konstant wird. 9.3.3 Substitutionsregel Bei der Methode der partiellen Integration werden Integranden der f ( x ) = g ( x ) · h ( x ) behandelt. Es kommt aber vor, dass (beispielsweise) der Faktor h ( x ) eine Verkettung ˜ h ( v ( x )) einer nicht-elementaren Funktion ˜ h mit einer „einfacheren“ Funktion v darstellt und bei der partiellen Integration kann dieser Faktor ■ weder integriert werden, weil die Stammfunktion nicht bekannt ist ■ noch differenziert werden, weil durch die Kettenregel h ′ ( x ) = ˜ h ( v ( x )) v ′ ( x ) das resultierende Integral dann eher verkompliziert wird. Ist dann aber der andere Faktor g ( x ) gerade die Ableitung des inneren Terms v ( x ), also g ( x ) = v ′ ( x ), so hat das Produkt die Form f ( x ) = ˜ h ( v ( x )) · v ′ ( x ), die wir aus der Kettenregel kennen, d.h. eine Stammfunktion lautet ˜ H ( v ( x )), wobei ˜ H eine Stammfunktion von ˜ h ist. Bei der Substitutionsmethode muss man versuchen, genau solch eine Darstellung f ( x ) = ˜ h ( v ( x )) · v ′ ( x ) abzulesen. Satz 9.9 (Substitutionsregel) H : [ c ; d ] → R sei Stammfunktion von h : [ c ; d ] → R, g : [ a ; b ] → [ c ; d ] sei differenzierbar mit stetiger Ableitungsfunktion g ′ und mit g ( x ) ∈ [ a ; b ] für alle x ∈ R. [1] Substitutionsregel für unbestimmte Integrale: Für alle x ∈ [ a ; b ] gilt: ∫ h ( g ( x )) g ′ ( x ) dx = H ( g ( x )) 48818_Terveer.indd 234 48818_Terveer.indd 234 18.07.2023 11: 53: 29 18.07.2023 11: 53: 29 <?page no="235"?> 9.3 Integrationsregeln 235 [2] Substitutionsregel für bestimmte Integrale: ∫ b a h ( g ( x )) g ′ ( x ) dx = ∫ g ( b ) g ( a ) h ( z ) dz = H ( g ( b )) − H ( g ( a )) Beispiel 9.12 ∫ e ( x − 1) 2 (2 x − 2) dx = e ( x − 1) 2 , denn mit g ( x ) = ( x − 1) 2 = x 2 − 2 x + 1, g ′ ( x ) = 2 x − 2 ist der Integrand von der Form e g ( x ) g ′ ( x ) und H ( x ) = ∫ e x dx = e x . Beispiel 9.13 ∫ cos( √ x +1) 2 √ x +1 = sin √ x + 1, denn mit g ( x ) = √ x + 1, g ′ ( x ) = 1 2 √ x +1 ist der Integrand von der Form cos( g ( x )) g ′ ( x ), und sin( x ) ist Stammfunktion der Kosinusfunktion. Beispiel 9.14 ∫ 2 x − 10 ( x − 5) 2 dx = ln(( x − 5) 2 ) = 2 ln( x − 5), denn mit g ( x ) = ( x − 5) 2 = x 2 − 10 x + 4, g ′ ( x ) = 2 x − 10 ist der Integrand von der Form g ′ ( x ) g ( x ) , und die äußere Funktion ist hier die Kehrfunktion h ( x ) = 1 x mit Stammfunktion ln( x ). Spezialfälle der Substitutionsregel mit allgemeinen differenzierbaren (inneren) Funktionen g : ] a ; b [ → R sind (in [4] muss dabei g ( x ) > 0 sein) [1] ∫ e g ( x ) g ′ ( x ) dx = e g ( x ) [2] ∫ cos( g ( x )) g ′ ( x ) dx = sin( g ( x )) und ∫ sin( g ( x )) g ′ ( x ) dx = − cos( g ( x )) [3] ∫ g ′ ( x ) g ( x ) dx = ln | g ( x ) | . [4] ∫ g ′ ( x ) √ g ( x ) dx = 2 √ g ( x ) Man nennt den Ausdruck g ′ ( x ) / g ( x )) in [3] auch die logarithmische Ableitung von g . Beispiel 9.15 In [3] erhält man mit g ( x ) = cos( x ) und g ′ ( x ) = sin( x ) eine Stammfunktion der Tangensfunktion als ∫ tan( x ) dx = ∫ sin( x ) cos( x ) dx = ∫ − g ′ ( x ) g ( x ) dx = − ln | g ( x ) | = − ln | cos( x ) | . Liest man die Substitutionsregel seitenverkehrt, d.h. ∫ g ( b ) g ( a ) h ( z ) dz = ∫ b a h ( g ′ ( x )) g ( x ) dx , so muss in den Integrationsgrenzen der Rückschluss von g ( a ) auf a und von g ( b ) auf b erfolgen. In dieser Form wird die Substitutionsregel für invertierbare oder sogar streng monotone Funktionen g durchgeführt: ∫ b a h ( x ) dx = ∫ g − 1 ( b ) g − 1 ( a ) h ( g ( z )) g ′ ( z ) dz , schematisiert also: [1] Substituiere x = g ( z ) [2] Substituiere dx = g ′ ( z ) dz [3] Die neuen Grenzen sind g − 1 ( a ) und g − 1 ( b ). Die Herausforderung bei dieser Vorgehensweise besteht darin, eine Substitution x = g ( z ) zu finden, für die das rechts stehende Integral tatsächlich eine Vereinfachung ist. Oft handelt es sich dabei um eine trigonometrische (Umkehr-)Funktion: 48818_Terveer.indd 235 48818_Terveer.indd 235 18.07.2023 11: 53: 36 18.07.2023 11: 53: 36 <?page no="236"?> 236 9 Integralrechnung Beispiel 9.16 Es sei r > 0. Die Funktion f : [ − r ; r ] → R, f ( x ) = √ r 2 − x 2 beschreibt die obere Hälfte einer Kreislinie mit Radius r . Die Fläche unter dieser Linie müsste also die halbe Kreisfläche, d.h. 12 πr 2 betragen. Wir wollen dies nun mit Hilfe der Integralrechnung überprüfen. Gesucht ist also das bestimmte Integral ∫ r − r √ r 2 − x 2 dx . Wir substituieren x = r sin( z ), erhalten die Ableitung dx = r cos( z ) dz und die neuen Grenzen ± r = r sin( z ) ⇔ sin( z ) = ± 1 ⇔ z = ± π 2 . Die Substitutionsregel ergibt also ∫ r − r √ r 2 − x 2 dx = ∫ π/ 2 − π/ 2 √ r 2 − ( r sin( z )) 2 cos( z ) dz = ∫ π/ 2 − π/ 2 r 2 cos 2 ( z ) dz Mit dem in Beispiel 9.10 berechneten Integral ergibt sich nun wegen sin( ± π ) = 0 ∫ r − r √ r 2 − x 2 dx = [ r 2 ( z +sin(2 z )) 2 ] π/ 2 − π/ 2 = r 2 π 2 Übungen zu Abschnitt 9.3 ? 13. Berechnen Sie mit Faktor- und Summenregel und Tabelle 9.1: a) ∫ 6 0 x 3 − 2 x 2 + 5 dx b) ∫ 3 / √ 2 − 3 / √ 2 ( x + 1)(2 x − 3) dx c) ∫ e 1 ( e ln( x ) + 2 x ) dx d) ∫ e 1 x +1 x dx e) ∫ 2 0 √ 4 x + 1 dx f) ∫ a − a a 2 ( e x a + e − x a ) dx g) ∫ ( x +1 x − 1 ) 2 dx 14. Bestimmen Sie mit partieller Integration: a) ∫ (5 + x ) e x dx b) ∫ sin 2 ( x ) dx c) ∫ x cos( x ) dx d) ∫ π − π sin( x ) e − x dx e) ∫ ln( x ) 2 dx f) ∫ ln( x 1 − x ) dx 15. Bestimmen Sie mit Substitutionsregel: a) ∫ (2 x 2 + 1) 10 · 5 x dx b) ∫ xe − x 2 dx , c) ∫ (1 + ln( x )) x 2 x dx d) ∫ sin( x ) cos( x ) dx e) ∫ x +1 √ x 2 +2 x +4 dx 16. Ein Verkehrswacht-Unternehmen wirbt mit einem Schutzengel-Logo, dessen Begrenzungslinien durch die Funktionen f ( x ) = 3 x √ x (1 − x ) und g ( x ) = f (1 − x ) dargestellt werden. An die Fassade der Hauptverwaltung soll eine 4 Meter breite Version des Logos aus 5 cm dickem Edelstahl montiert werden. Wie schwer wird das Logo bei einem Gewicht der Platte von 445 Kilogramm pro qm? 17. Der Catering-Service „Leckerfatz“ möchte seinen exklusiven Flyer durch ein 3 cm breites Logo in Form eines stilisierten Sektglases verschönern. Die dabei verwendete Silberdruckfolie wird von der Druckerei separat berechnet. Der rechte Glasrand oberhalb des Fußes kann durch die Funktion f : [0; 32 ] → R , f ( x ) = e 32 x − 14 + 12 beschrieben werden, der Fuß ist ein gleichschenkliges Dreieck mit Abszisse als Basis und Tangente an f im Punkt (0 | f (0)) als Schenkel. Berechnen Sie den Flächeninhalt des Logos. 9.4 Uneigentliche Integrale Bisher haben wir Flächen nur unter begrenzten Teilstücken von Funktionen berechnet, d.h. über endlichen Intervallen [ a ; b ]. Gerade in der Wahrscheinlichkeitsrechnung und 48818_Terveer.indd 236 48818_Terveer.indd 236 18.07.2023 11: 53: 42 18.07.2023 11: 53: 42 <?page no="237"?> 9.4 Uneigentliche Integrale 237 Abbildung 9.9: Die Fläche unter dem Graphen der Funktion f ( x ) = e − x über dem Intervall [1; ∞ [ ist ein uneigentliches Integral Statistik aber müssen Flächen unter Funktionsgraphen auch über Intervallen der Form [0; ∞ [, ]0; ∞ [ oder ] − ∞ ; ∞ [ ausgerechnet werden. Beispielsweise wird im Rahmen der Warteschlangenrechnung die Wahrscheinlichkeit für das Auftreten des nächsten Kunden innerhalb einer vorgegebenen Zeitspanne mit Hilfe der so genannten Exponentialverteilung modelliert. Ein Spezialfall hiervon ist eine Exponentialverteilung mit Wahrscheinlichkeitsdichte p ( x ) = e − x . Das bedeutet beispielsweise, dass die Wahrscheinlichkeit für das Eintreffen des nächsten Kunden in dem Zeitraum [2 , 4] mit Hilfe dieser Wahrscheinlichkeitsdichte als ∫ 4 2 e − x dx ausgedrückt wird. Die Fläche unter dem Graphen der Wahrscheinlichkeitsdichte dient also der Darstellung der Wahrscheinlichkeit (diese Vorstellung von Wahrscheinlichkeit lässt sich am leichtesten mit der geometrischen Wahrscheinlichkeit verbinden, bei der die Wahrscheinlichkeit für das „Treffen“ einer Teilfläche, z.B. bei einem Glücksrad als proportional zum Flächeninhalt angenommen wird). Dabei müssen aber auch Wahrscheinlichkeiten von (zeitlich) nach oben (und/ oder nach unten) „offen gehaltenen“ Ereignissen modelliert und berechnet werden. Beispielsweise könnte man im oben angegebenen Warte-Zusammenhang nach der Wahrscheinlichkeit fragen, dass der nächste Kunde frühestens nach einer Zeiteinheit ankommt, d.h. dass der Zeitpunkt seiner Ankunft im Intervall [1; ∞ [ liegt. Man hat es dann mit dem Integral int ∞ 1 e − x dx zu tun vgl. Abbildung 9.9 , dessen genaue Bedeutung zu präzisieren ist, will man die Wahrscheinlichkeit auch berechnen können. Derartige uneigentliche Integrale lassen sich als Grenzwerte von Integralen mit begrenztem Integrationsintervall erklären: Definition 9.3 ! [1] Für eine integrierbare Funktion f : [ a ; ∞ [ → R ist das (uneigentliche) Integral über [ a ; ∞ ] wie folgt definiert: ∫ ∞ a f ( x ) dx : = lim b →∞ ∫ b a f ( x ) dx [2] Für eine integrierbare Funktion f : ] − ∞ ; b ] → R ist das (uneigentliche) Integral über ] − ∞ ; b ] wie folgt definiert: ∫ b −∞ f ( x ) dx : = lim a →−∞ ∫ b a f ( x ) dx Voraussetzung ist in beiden Fällen, dass der rechts stehende Grenzwert existiert. Vorgehensweise bei uneigentlichen Integralen ist also ■ die Grenze ∞ (bzw. −∞ ) durch einen endlichen veränderlichen Wert zu ersetzen, ■ das entstehende Integral zu einem geschlossenen Ausdruck zu berechnen, ■ den Grenzübergang mit dem veränderlichen Wert gegen ∞ (bzw. −∞ ) durchzuführen. 48818_Terveer.indd 237 48818_Terveer.indd 237 18.07.2023 11: 53: 45 18.07.2023 11: 53: 45 <?page no="238"?> 238 9 Integralrechnung Beispiel 9.17 So ergibt sich für das oben genannte uneigentliche Integral bei fester oberer Integrationsgrenze b > 1 der Wert ∫ b 1 e − x dx = [ − e − x ] x = b x =1 = ( − e − b ) − ( − e − 1 ) = 1 e − e − b . Mit b → ∞ gilt e − b → 0, also gilt ∫ ∞ 1 e − x dx = lim b →∞ ∫ b 1 e − x dx = 1 e − lim b →∞ e − b = 1 e Beispiel 9.18 (Gamma-Funktion) Uneigentliche Integrale der Form ∫ ∞ 0 x a e − x dx = lim t →∞ ∫ t 0 x a e − x dx, a > 0 werden wie folgt berechnet: mit f ( x ) = x a , g ′ ( x ) = e − x folgt f ′ ( x ) = ax a − 1 , g ( x ) = − e − x . Partielle Integration ergibt dann für t > 0 ∫ t 0 x a e − x dx = [ − x a e − x ] t 0 + ∫ t 0 ax a − 1 e − x dx = − t k e − t + a ∫ t 0 ax a − 1 e − x dx Weil aber für t → ∞ die Exponentialfunktion schneller gegen ∞ strebt als jedes beliebige Polynom ( k -ten Grades), vgl. Satz 8.9 vgl. S. 172 , verschwindet beim Grenzwertübergang der Stammfunktionssummand des partiellen Integrationsschrittes, und es gilt ∫ ∞ 0 x a e − x dx = a ∫ ∞ 0 x a − 1 e − x dx . Das Integral ∫ ∞ 0 x a − 1 e − x dx ist in der Mathematik als Gamma-Funktion Γ( a ) bekannt. Die gerade hergeleitete (rekursive) Formel lautet für a > 0 dann Γ( a + 1) = a Γ( a ). Speziell gilt dann Γ(1) = ∫ ∞ 0 e − x dx = lim t →∞ ∫ t 0 e − x dx = lim t →∞ (1 − e − t ) = 1 und damit Γ(2) = 1Γ(1) = 1 , Γ(3) = 2Γ(2) = 2 , Γ(4) = 3Γ(3) = 6. Die Gammafunktion verallgemeinert die für ganzzahlige Argumente k definierte Fakultät nach R, es gilt Γ( k ) = ( k − 1)! Manchmal treten auch Integrale auf, bei denen beide Intervallgrenzen uneigentlich sind. Beide Grenzen gleichzeitig durch Approximationen zu ersetzen, führt aber zu einer in sich unschlüssigen Festlegung des Integrals: Beispiel 9.19 Es gilt ∫ b a 2 x 1+ x 2 dx = ln(1+ b 2 ) − ln(1+ a 2 ). Je nach der Form des Grenzwertübergangs a → −∞ , b → ∞ kann man als Ergebnis für ∫ ∞ −∞ 2 x 1+ x 2 dx jeden belieben reellen Wert, die Werte ±∞ oder die Nichtexistenz schließen. Der Ausweg besteht in einer Aufteilung von ] − ∞ ; ∞ [ in zwei Teilintervalle ] − ∞ ; x 0 ] und [ x 0 ; ∞ [. Das Gesamtintegral entsteht durch Summation der Teilintegrale: Definition 9.4 ! Für eine integrierbare Funktion f : ] − ∞ ; ∞ [ → R ist das (uneigentliche) Integral über ] −∞ ; ∞ [ mit beliebig zu wählendem x 0 ∈ R wie folgt definiert (sofern die beiden Integrale auf der rechten Seite existieren): ∫ ∞ −∞ f ( x ) dx : = ∫ x 0 −∞ f ( x ) dx + ∫ ∞ x 0 f ( x ) dx Man kann zeigen, dass der Wert eines zweiseitigen uneigentlichen Integrals nicht davon abhängt, an welcher Stelle x 0 das Integral aufgespalten wird. Existiert er für eine bestimmte Wahl von x 0 , so auch für jede andere, und man erhält denselben Wert. Ergibt sich bei einer bestimmten Wahl von x 0 für eines der Integrale der Wert ∞ und für das andere der Wert −∞ , so existiert das Ausgangsintegral nicht - Ausdrücke der Form ∞ + ( −∞ ) werden in der Analysis als undefiniert angesehen das ist dann auch für jede andere Wahl von x 0 der Fall. 48818_Terveer.indd 238 48818_Terveer.indd 238 18.07.2023 11: 53: 51 18.07.2023 11: 53: 51 <?page no="239"?> 9.5 Exkurs: Konsumentenrente und Produzentenrente 239 Beispiel 9.20 Im vorigen Beispiel gilt bei Verwendung von x 0 = 0: ∫ ∞ 0 2 x 1+ x 2 dx = lim b →∞ ∫ b 0 2 x 1+ x 2 dx = lim b →∞ (ln(1 + b 2 )) = ∞ und entsprechend für das andere Teilintegral ∫ 0 −∞ 2 x 1+ x 2 dx = −∞ . Das gesuchte Integral ∫ ∞ −∞ 2 x 1+ x 2 dx existiert also nicht. Abschließend ein Beispiel, bei dem das Integral mit zwei uneigentlichen Grenzen existiert. In der Wahrscheinlichkeitsrechnung/ Statistik tritt dieses Integral beim sogenannten Erwartungswert der Normalverteilung auf. Beispiel 9.21 Das uneigentliche Integral ∫ ∞ −∞ xe − x 2 dx schreiben wir als Summe: ∫ ∞ −∞ xe − x 2 dx = ∫ 0 −∞ xe − x 2 dx + ∫ ∞ 0 xe − x 2 dx Das rechte Teilintegral ist ∫ ∞ 0 xe − x 2 dx = lim t →∞ ∫ t 0 xe − x 2 dx = lim t →∞ [ − 12 e − x 2 ] t 0 = 12 . Für das rechte Teilintegral ergibt sich auf vergleichbarem Wege ∫ 0 −∞ xe − x 2 dx = − 12 . Es gilt also ∫ ∞ −∞ xe − x 2 dx = 0. Übungen zu Abschnitt 9.4 ? 18. Berechnen Sie die folgenden uneigentlichen Integrale: a) ∫ ∞ 0 1 ( x +1) 2 dx , b) ∫ ∞ 1 ln( x ) x 2 dx , c) ∫ ∞ 0 sin( x ) e − x dx 19. Bei Funktionen mit Definitionslücken können Integrale gegebenenfalls auch dann berechnet werden, wenn eine oder zwei Definitionslücken den Integrationsbereich begrenzen. Dazu lässt man die jeweilige Integrationsgrenze gegen die Polstelle konvergieren. Bestimmen Sie derart den Wert der folgenden Integrale: a) ∫ 1 0 1 √ x dx , b) ∫ 1 0 x ln( 1 x ) dx , c) ∫ 1 0 ln( x 1 − x ) dx , d) ∫ 1 − 1 1 ( x − 1) 2 dx 20. Für t > 0 sei G t der Graph der Funktion f : ]0; ∞ [ → R, f ( x ) = 1 x t . Das Quadrat Q mit den gegenüberliegenden Eckpunkten (0 | 0) und (1 | 1) teilt die Fläche, die von G t , der Abszisse und der Ordinate begrenzt wird, in drei Teilflächen A , B , und Q . Für welche Werte von t hat A endlichen Flächeninhalt, für welche Werte von t hat B endlichen Flächeninhalt? 21. Bestimmen Sie für n ∈ N, n ≥ 2 den Inhalt der Fläche, die von den Funktionen f ( x ) = 1 x n und g ( x ) = 1 x n +1 rechts von x = 1 begrenzt wird. 22. Für n ∈ N sei G n die Fläche unter dem Graphen der Funktion f n ( x ) = e − nx − e − x . Bestimmen Sie den Inhalt der Fläche. 48818_Terveer.indd 239 48818_Terveer.indd 239 18.07.2023 11: 53: 57 18.07.2023 11: 53: 57 <?page no="240"?> 240 9 Integralrechnung 9.5 Exkurs: Konsumentenrente und Produzentenrente Sie werden den grundsätzlichen Sinn eines Kalküls zur Flächenberechnung sicher erkannt haben, sich aber vielleicht jetzt doch noch fragen: „Wo werde ich als angehende/ r Wirtschaftswissenschaftler/ in mit Integralen rechnen müssen? “ Wir haben die Bedeutung der Integralrechnung im Rahmen der Statistik bereits angesprochen. In diesem letzten Abschnitt des Kapitels soll Ihnen jetzt noch eine typisch ökonomische Anwendung der Integralrechnung näher gebracht werden, die Wohlfahrtsrechnung. In der Volkswirtschaftslehre versucht man unter anderem, das Verhalten von Akteuren auf einem Markt zu verstehen, also demjenigen Ort, an dem sich Anbieter und Abnehmer von Waren begegnen, und an dem der Preis für Waren durch das Aufeinandertreffen von Angebot und Nachfrage bestimmt wird. Wir wollen im Folgenden auf diesem Markt ein ganz bestimmtes Produkt zugrunde legen. Hier muss man sich nun einen Mechanismus überlegen, mit dem der Preis des Produktes auf dem Markt festgelegt werden soll, und dabei die Konsequenzen für beide Seiten, Anbieter wie Abnehmer, aus dieser Preisfestlegung erörtern. Ein einzelner Abnehmer des Produktes hat von vorneherein eine gewisse Zahlungsbereitschaft, d.h. wenn er das Produkt auf dem Markt nur zu einem höheren Preis findet, so wird er es nicht kaufen; wenn er es aber zu einem geringeren Preis auf dem Markt findet, so wird er es kaufen. Umgekehrt haben auch die Anbieter auf dem Markt eine Preisbereitschaft. In der Ökonomie geht man meist davon aus, dass ein Anbieter einen Preis akzeptiert, wenn dieser über den variablen Herstellungskosten liegt. Wenn man für das Produkt am Markt einen allgemein gültigen Preis ausgehandelt hat, dann werden diejenigen Anbieter, deren Preisbereitschaften unter diesem Marktpreis liegen, und diejenigen Kunden, deren Zahlungsbereitschaften oberhalb dieses Marktpreises liegen, miteinander den Handel abschließen. Gehen Akteure den Handel ein, so führt der Unterschied zwischen Marktpreis und Preisbereitschaft zu einer Ertragssituation: ■ Der Konsument hat den Unterschied zwischen Marktpreis und seiner eigenen Preisbereitschaft als Geld eingespart, das auszugeben er bereit gewesen wäre. ■ Der Produzent streicht den Unterschied zwischen seinen variablen Herstellungskosten und dem Marktpreis als Deckungsbeitrag ein. Der eingesparte Betrag des Kunden heißt Konsumentenrente, der Deckungsbeitrag des Produzenten heißt Produzentenrente. Werden diese Renten über alle Anbieter bzw. über alle Konsumenten saldiert, so spricht man von der Produzentenbzw. Konsumentenrente des Marktes. Die Summe aus Konsumenten- und Produzentenrente des Marktes heißt Wohlfahrt. Im Folgenden soll anhand der Konsumentenrente erläutert werden, was diese mit der Flächenberechnung durch Integrale zu tun hat. Nehmen wir dazu exemplarisch an, dass sich n = 10 Kunden für ein Produkt interessieren und die folgenden Zahlungsbereitschaften haben: 0, 22, 28, 19, 44, 22, 43, 0, 26, 11. Mit 0 ist hier gemeint, dass die betreffenden beiden Kunden nur dann an dem Produkt interessiert sind, wenn es nichts kostet. Wir berechnen für jeden der angegebenen Werte, wie viel Prozent der Kunden bereit sind, diesen oder einen höheren Preis zu zahlen und erhalten die folgende Tabelle Preisbereitschaft 0 11 19 22 26 28 43 44 Kundenanteil in % 100 80 70 60 40 30 20 10 Beispielsweise wird der Preis p = 28 (oder höher) von drei der Kunden (nämlich denen 48818_Terveer.indd 240 48818_Terveer.indd 240 18.07.2023 11: 53: 58 18.07.2023 11: 53: 58 <?page no="241"?> 9.5 Exkurs: Konsumentenrente und Produzentenrente 241 Abbildung 9.10: Illustration der empirischen Konsumentenrente auf einem Markt mit 10 Teilnehmern und einem Marktpreis p = 18. Links: Preisbereitschaft; Mitte: Treppenfunktion; Rechts: Konsumentenrente des Marktes als Fläche (Angaben auf der Abszisse in % der Marktteilnehmer) mit den Preisbereitschaften 28, 43 und 44), d.h. von 30% der Kunden akzeptiert, der Preis p = 11 hingegen schon von 80% der Kunden. Wir tragen die tabellierten Werte in einem Schaubild ab, welches auf der Abszisse die Kundenanteile und auf der Ordinate die Preisbereitschaft vermerkt, und verbinden die Punkte so, dass eine Treppenfunktion entsteht, welche genau die eingetragenen Punkte als Sprungstellen hat Jeder Konsument findet sich mit seiner Preisbereitschaft in der Treppenfunktion wieder. So zeigt etwa der Bereich zwischen 40% und 60% an, dass es zwei Kunden mit der Preisbereitschaft 22 gibt. vgl. Abbildung 9.10 . Nun werde z.B. angenommen, dass der Marktpreis für das Produkt p = 18 beträgt. Dann tragen alle Kunden, deren Preisbereitschaft 18 oder höher ist, zur Konsumentenrente bei. Ihr Beitrag entspricht der Rechteckssäule, die zwischen der Treppenfunktion und der Gerade p = 18 eingezeichnet werden kann (die Breite jeder Säule ist in diesem Fall 10% oder 20%, je nachdem, ob ein oder zwei Kunden diese Preisbereitschaft aufweisen, der Faktor 10 für den Übergang zu Prozentzahlen kann durch Division entfernt werden, um die Fläche in die tatsächliche Konsumentenrente zu überführen). Die in Abbildung 9.10 rechts dargestellte schraffierte Fläche entspricht dann der Konsumentenrente des Marktes. Der Flächeninhalt beträgt das Zehnfache von (44 − 18) + (43 − 18) + (28 − 18) + (26 − 18) + 2 · (22 − 18) + (19 − 18) = 78 (der Faktor 10 rührt daher, dass auf der Abszisse Prozentzahlen verwendet werden). Eine entsprechende Skizze/ Rechnung kann man auch für die Produzentenrente auf Basis der variablen Herstellungskosten der einzelnen Anbieter anstellen. Weil aber für Produzenten höhere Preise interessanter sind, ist der Verlauf der Treppenfunktion in diesem Falle monoton wachsend und die Produzentenrente entspricht der Fläche unterhalb der Marktpreislinie bis zur Treppenfunktion der Preisbereitschaften der Anbieter. Weil ein realer Markt deutlich größer ist, wird man ihn wesentlich feiner „segmentieren“ müssen. Dies wird in Abbildung 9.11 skizziert. Typischerweise werden die Treppenfunktionen immer „ glatter“ werden und ergeben mit n → ∞ eine stetigen Funktionsverlauf. Hintergrund ist der Zentralsatz der Statistik. Wie bei der Darstellung von Flächen unter Kurven als Grenzwerte von Rechteckssummen (Riemann- Integral) ergibt sich die (theoretische) Konsumentenrente über einen völlig analogen Grenzwertvorgang, sie ist als Integral (einer Nachfragefunktion) zu berechnen. In der Volkswirtschaftslehre werden derartige glatte idealisierte Kurvenverläufe dann sowohl für die Nachfragebereitschaft der Konsumenten als auch für die Angebotsbereitschaft der Produzenten angenommen, diese sehen dann üblicherweise so aus wie 48818_Terveer.indd 241 48818_Terveer.indd 241 18.07.2023 11: 54: 01 18.07.2023 11: 54: 01 <?page no="242"?> 242 9 Integralrechnung n = 10 n = 50 n = 500 Abbildung 9.11: Illustration der empirischen Konsumentenrente auf einem Markt mit 10, 50 und 500 Konsumenten Abbildung 9.12: Nachfrage- und Angebotskurve mit Produzenten- und Konsumentenrente im Marktmodell aus Beispiel 9.22 in Abbildung 9.12. Auf der Abszisse muss jetzt der Markt nicht notwendig in Prozentzahlen angegeben werden; auch absolute Werte sind hier möglich. Die Preisbereitschaft von Anbietern und Abnehmern muss dabei sorgfältig modelliert werden; Grundlage der Nachfragekurve sollten ausreichende empirische Daten sein, die durch direkte Preisnachfrage oder auf typischen Auktionsmärkten gewonnen werden. Für die Angebotskurve benötigt man Informationen über die variablen Herstellungskosten der Anbieter. Das Ergebnis dieser Analysen ist dann eine antitone Nachfragefunktion N : [0; ∞ [ → R für die Preisbereitschaft der Konsumenten und eine isotone Angebotsfunktion A : [0; ∞ [ → R für die Preisbereitschaft der Produzenten. Der Punkt ( x ∗ | p ∗ ), bei dem sich die Nachfragefunktion und die Angebotsfunktion schneiden, wird als Gleichgewichtspreis oder Break-Even-Preis bezeichnet. Unter bestimmten Konstellationen hier spielt das Steigungsverhältnis von A ( x ∗ ) N ( x ∗ ) eine Rolle stellt sich dieser Preis auch als stabiles Gleichgewicht am Markt ein vgl. Abschnitt 7.5, S. 152 . Definition 9.5 ! Auf einem Markt für ein Produkt mit Break-Even-Preis p ∗ seien die monoton fallende Nachfrage N : [0 , ∞ [ → R und das monoton wachsende Angebot A : [0 , ∞ [ → R gegeben. ( x ∗ | p ∗ ) = ( x ∗ | N ( x ∗ )) = ( x ∗ | A ( x ∗ )) sei der Break-Even-Punkt von Nachfrage und Angebot. [1] Die Konsumentenrente ist der Ausdruck KR ( p ∗ ) = ∫ x ∗ 0 ( N ( x ) − p ∗ ) dx , d.h. die Gesamtersparnis der zahlungsbereiten Konsumenten. [2] Die Produzentenrente ist der Ausdruck P R ( p ∗ ) = ∫ x ∗ 0 ( p ∗ − A ( x )) dx , d.h. der Deckungsbeitrag der angebotsbereiten Produzenten. Die Summe aus Konsumenten- und Produzentenrente heißt Wohlfahrt. Konsumenten- und Produzentenrente sowie Wohlfahrt können auch für jeden anderen Marktpreis 48818_Terveer.indd 242 48818_Terveer.indd 242 18.07.2023 11: 54: 04 18.07.2023 11: 54: 04 <?page no="243"?> Zusammenfassung berechnet werden. Dann stimmen nachgefragte und angebotene Mengen des Produktes aber nicht mehr überein. Die Wohlfahrts des Marktes wird dann maximal, wenn der Break-Even-Preis als Marktpreis verwendet wird. Beispiel 9.22 Es sei N : [0 , 52] → R, N ( x ) = 32(1 − x 52 ) 2 = 2 169 x 2 − 16 13 x +32 die Nachfragekurve und A : [0 , 65] → R, A ( x ) = 50( x 65 ) 2 = 2 169 x 2 die Angebotskurve. Den Break-Even-Punkt ( x ∗ | p ∗ ) erhält man durch Gleichsetzen von Angebots- und Nachfragepreis A ( x ) = N ( x ) im Intervall [0 , 44] als x ∗ = 26 und p ∗ = A (26) = 8. Die Konsumentenrente KR (8)ist dann ∫ 26 0 ( N ( x ) − 8) dx = ∫ 26 0 ( 2 169 x 2 − 16 13 x + 24) dx = [ 2 507 x 3 − 8 13 x 2 + 24 x ] x =26 x =0 = 832 3 Die Produzentenrente ist P R (8) = ∫ 26 0 (8 − 2 169 x 2 ) dx = 208 − 2 507 26 3 = 416 3 . Die Wohlfahrt beträgt also 832 3 + 416 3 = 416, graphisch in Abbildung 9.12 dargestellt. Übungen zu Abschnitt 9.5 ? 23. Berechnen Sie jeweils den Break-Even- Preis und die Wohlfahrt. a) A ( x ) = 1 20 x , N ( x ) = 5 − 1 30 x b) A ( x ) = 13 20 x + 3, N ( x ) = 20 − 1 100 x 2 c) A ( x ) = 34 ( x 100 ) 3 / 2 + 4, N ( x ) = 14 − 12 ( x 100 ) 3 / 2 d) A ( x ) = e 2 x/ 5 + 5 e , N ( x ) = e 2 + 5 e − x/ 5 24. Zur Eindämmung des Schwarzmarkt- Handels mit Karten für das Finale der Fußballmeisterschaft von Duropa im Internet eine Einzelticket-Tauschbörse eingerichtet, bei der zunächst Gebote und Gesuche abgegeben werden dürfen und anschließend ein Marktpreis festgelegt wird. a) Aus den Geboten wird die Nachfragefunktion als Polynom N ( x ) dritten Grades mit N (0) = 500, N (200) = 400, N (800) = 200 und N (1000) = 0 ermittelt. Berechnen Sie N ( x ). b) Bestimmen Sie zu N und der A ( x ) = 12 x den Break-Even-Preis. c) Berechnen Sie die Konsumentenrente, die Produzentenrente und die Wohlfahrt der Tauschbörse. Zusammenfassung Integration von Funktionen ist einerseits die zur Differentiation umgekehrte Vorgehensweise, andererseits dient sie zur Flächenberechnung unter Funktionsgraphen und ist damit wichtige Grundlage der Wahrscheinlichkeitsrechnung und Statistik. Nach Erarbeitung der Inhalte dieses Kapitels sollten Sie ■ Stammfunktionen bestimmen können, sowohl für Standard-Funktionen, als auch unter Einsatz der Summenregel, partiellen Integration und Substitutionsregel, ■ Flächen unter Funktionsgraphen mit Hilfe von Integralen bestimmen können, auch in numerischer Annäherung, ■ Integrale mit uneigentlichen Integrationsgrenzen ermitteln können, 48818_Terveer.indd 243 48818_Terveer.indd 243 18.07.2023 11: 54: 09 18.07.2023 11: 54: 09 <?page no="244"?> 244 9 Integralrechnung Übungen zur Vertiefung von Kapitel 9 ? 25. Gegeben sei f : ]0; ∞ [, f ( x ) = ln( x ). a) Berechnen Sie ∫ b 0 f ( x ) dx für b > 0. b) In ]0 , b ] umschließen der Graph von f und die Abszisse zwei Flächenstücke: Für welches b haben die beiden Flächenstücke den gleichen Inhalt? c) Berechnen Sie lim n →∞ n √ n ! / n n . Hinweis: Stellen Sie den logarithmierten Folgenterm als Obersumme von f dar. 26. Die Firma „DryTEX“ erwirbt für fünf Jahre eine Exklusiv-Lizenz zu Herstellung und Vertrieb von Regenbekleidung aus einer Textilfaser, die nach Vorbild einer im Wasser jagenden südamerikanischen Spinnenart entwickelt wurde. In der Fahrrad- Metropole Münster werden Studierende nach der Preisakzeptanz eines solchen Regenanzugs befragt. Aus der Befragung leitet sich die Nachfragefunktion N ( x ) = 250 − 12 x + 1 1000 x 2 − 1 1000000 x 3 her. a) Wie hoch ist der Maximalabsatz x m ? b) Bestimmen Sie eine Nachfragemenge x ∈ [0; x m ] mit N ′′ ( x ) = 0. c) Bestimmen Sie die erlösmaximale Absatzmenge. d) Die Herstellungkosten lassen sich mit der Funktion K ( x ) = 1 10 x 2 +26 x +5000 beschreiben. Bestimmen Sie Gewinnfunktion, Gewinnzone und Cournot- Punkt und skizzieren Sie diese. e) Könnte „DryTEX“ nach dem Auslaufen der Exklusivlizenz einen Konkurrenzpreis von 70 e langfristig unterbieten? f) Nach Auslaufen der Lizenz werden Regenanzüge auch von weiteren Herstellern angeboten. Die Angebotsbereitschaft auf dem Markt wird durch eine quadratische Funktion A ( x ) mit A (0) = 80, A (200) = 100 und A (600) = 200 beschrieben. Berechnen Sie die Angebotsfunktion. g) Berechnen Sie in der Marktsituation den Break-Even-Preis, die Konsumentenrente, Produzentenrente und Wohlfahrt (Runden Sie dabei die Nachfragemenge im Gleichgewichtspreis auf 2 Nachkommastellen) und skizzieren Sie diese. 48818_Terveer.indd 244 48818_Terveer.indd 244 18.07.2023 11: 54: 12 18.07.2023 11: 54: 12 <?page no="245"?> Lineare Wirtschaftsalgebra 48818_Terveer.indd 245 48818_Terveer.indd 245 19.07.2023 09: 09: 03 19.07.2023 09: 09: 03 <?page no="246"?> 48818_Terveer.indd 246 48818_Terveer.indd 246 18.07.2023 11: 54: 12 18.07.2023 11: 54: 12 <?page no="247"?> 10 Lineare Gleichungssysteme Übersicht Lineare Gleichungssysteme (LGS) stellen sich ganz allgemein dar mittels ■ Unbekannten/ Variablen x 1 , . . . , x n , deren Werte zu bestimmen sind. ■ m Gleichungen der Form a 1 x 1 + · · · + a n x n = b , wobei die Werte a 1 , . . . , a n und b in jeder der Gleichungen fest vorgegeben sind. In den Wirtschaftswissenschaften werden viele Fragestellungen direkt mit Hilfe linearer Gleichungssysteme modelliert und gelöst. Die Behandlung linearer Gleichungssysteme ist zudem Grundlage der linearen Optimierung. Schließlich treten lineare Gleichungssysteme im Hintergrund fast aller Fragestellungen der linearen Algebra auf, z.B. bei der Beschreibung von Koordinatensystemen, bei der Matrixinversion und im Rahmen der Berechnung von Eigenvektoren. Zu Beginn besprechen wir typische betriebswirtschaftliche Anwendungssituationen für lineare Gleichungssysteme bis hin zur Grundfragestellung der linearen Optimierung vgl. Abschnitt 10.1, S. 247 . Zur Lösung allgemeiner linearer Gleichungssysteme wird danach das Gauß’sche Eliminationsverfahren vgl. Abschnitt 10.2, S. 251 besprochen. Dabei werden Zeilenumformungen als Transformationen des Gleichungssystems behandelt, welche die Lösungsmenge nicht verändern. Die Lösungsmenge ergibt sich schließlich aus der so genannten Zeilenstufenform eines linearen Gleichungssystems: ein Teil der Variablen ist frei wählbar, die übrigen treten jeweils in genau einer der verbliebenen Gleichungen auf und sind freigestellt. 10.1 Lineare Eingabe-Ausgabe-Beziehungen Fragestellungen der Ökonomie betreffen häufig Zusammenhänge der Form Input x −−−−−−→ BLACK BOX Output y −−−−−−−−→ zwischen ökonomischen Größen x , y . Dabei kann in Form der Symbole x und y eine Bündelung mehrerer ökonomischer Größen als Profile vorliegen. Der „Black Box“ liegen sachlogische, mitunter technische Zusammenhänge zugrunde, deren Verständnis zwar hilfreich, aber für das eigentliche ökonomische Problem meist gar nicht unmittelbar erforderlich ist. Wesentlich ist, dass ein rechnerischer Zusammenhang zwischen x und y hergestellt werden kann. Dieser Zusammenhang wird mit Hilfe von mathematischen Funktionen f modelliert. Durch f wird dabei jedem Input x eindeutig ein rechnerischer Output y = f ( x ) zugeordnet. Die lineare Wirtschaftsalgebra versucht, Input-Output-Zusammenhänge der oben beschriebenen Art - wenn möglich - durch eine lineare Funktion f zu beschreiben. Das ist in vielen Bereichen der Wirtschaftswissenschaften möglich: 48818_Terveer.indd 247 48818_Terveer.indd 247 18.07.2023 11: 54: 14 18.07.2023 11: 54: 14 <?page no="248"?> 248 10 Lineare Gleichungssysteme Produkt Bill 1 Bill 2 Bill 3 Bill 4 Kosten 5 e 6 e 10 e 12 e Stückliste: Bestand Regalträger 2 3 4 5 300 Querstangen 1 1 2 4 130 Regalböden 5 10 15 20 1000 Montagestifte 20 40 60 80 ausreichend vorhanden Tabelle 10.1: Ausgangsdaten des Regal-Verpackungsproblems ■ Produkt-Rohstoff-Verflechtung: verschiedenen Produkten eines werden die benötigten Rohstoffe in Form von Teilelisten zugewiesen. ■ Rohstoff-Produkt-Verflechtung: mittels „Rezepturen“ wird Rohstoffen ein Produkt- Mix zugewiesen. Beispiele hierfür sind Verschnittprobleme. ■ Kostenmodelle: Variable Kosten folgen oft einem linearen Ansatz. ■ Marktmodelle: ein Markt wird von mehreren Anbietern versorgt. Zwischen den Perioden-Marktanteilen lassen sich oft lineare Zusammenhänge begründen. ■ Sektorenmodelle: hier werden die gegenseitig benötigten Dienstleistungen verschiedener Wirtschaftssektoren wechselseitig linear verrechnet werden. Häufig sucht man in einem solchen Verflechtungsansatz zu einem Output y nach dem dafür „ursächlichen“ Input x . Dies entspricht mathematisch der Lösung der Gleichung y = f ( x ) in der Unbekannten x . Wenn Input und Output nicht nur einzelne Größen, sondern ganze Profile ökonomischer Größen sind, so liegt für jede Komponente des Profils y eine Gleichung, d.h. insgesamt ein System von Gleichungen vor. Unabhängig hiervon kann man bei der Lösbarkeit zwischen zwei Fällen unterscheiden: ■ Falls f eine Umkehrfunktion f − 1 hat und y ∈ W f , d.h. im Wertebereich von f liegt, lautet die Lösung x = f − 1 ( y ). Aber nicht immer ist f − 1 explizit angebbar. ■ Bei nicht invertierbarer Funktion f hat die Gleichung bzw. das Gleichungssystem f ( x ) = y oft mehrere (ggf. unendlich viele) Lösungen. Unter diesen ist stets die in einem geeigneten Sinne ökonomisch vorteilhafteste gesucht. Beispiel 10.1 (Produkt-Rohstoff-Verflechtung) Die Ikebau-GmbH stellt Massivholz-Regale der Marke „Bill“ her. Es sind vier verschiedene Bausätze im Sortiment, die jeweils aus verschiedenen Anzahlen Regalträgern und -böden, Montagestiften und Querstangen (zur Stabilisierung der Regale) dienen. Die Zusammensetzung der Regale aus diesen Bauteilen wird üblicherweise in Form einer Teileliste oder als Gozintograph wie in Abbildung 10.1 angegeben. Das Unternehmen will unter vollständiger Verpackung der lagerständigen Bauteile und vollständigem Verkauf der Bausätze einen möglichst niedrige Gesamtkosten erzielen. Lagerbestand, Teiletabellen und Verpackungskosten der vier Regaltypen gibt Tabelle 10.1 vgl. S. 248 . Bei Räumung des Lagers - mit Ausnahme der Montagestifte - müssen die zu produzierenden Anzahlen x j der vier Regalbausätze das Gleichungssystem 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 = 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 48818_Terveer.indd 248 48818_Terveer.indd 248 18.07.2023 11: 54: 17 18.07.2023 11: 54: 17 <?page no="249"?> 10.1 Lineare Eingabe-Ausgabe-Beziehungen 249 Regaltyp B1 Tr¨ager Regaltyp B2 Querstange Regaltyp B3 Boden Regaltyp B4 Montagestift 2 1 5 20 3 1 10 40 4 2 15 60 5 4 20 80 Abbildung 10.1: Gozintograph des Regal-Verpackungsproblems ergibt Anzahl 1 Rolle D (95 cm) mit Schnittmuster Rollen vom Typ 1 2 3 4 5 6 A (60 cm) 1 1 0 0 0 0 B (30 cm) 1 0 3 2 1 0 C (20 cm) 0 1 0 1 3 4 Verschnitt 5 15 5 15 5 15 Tabelle 10.2: Schnittmöglichkeiten im Beispiel 10.2 lösen. Zusätzlich müssen x 1 , . . . , x 4 ≥ 0 und ganzzahlig sein. Da es mehrere Lösungen dieses Gleichungssystems gibt, liegt das eigentliche Ziel im Auffinden der kostengünstigsten Lösung, d.h. in der Minimierung der Gesamtkosten 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 unter den Lösungen des Gleichungssystems. Realistischer ist zusätzlich noch die folgende Annahme: Alle Lösungen, zu deren Herstellung die Rohstoffquantitäten ausreichen, müssen in Betracht gezogen werden. Es müssen also nicht alle Bauteile komplett aufgebraucht werden. In diesem Fall ist das Ungleichungssystem 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 ≤ 300 x 1 + x 2 + 2 x 3 + 4 x 4 ≤ 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 ≤ 1000 zu lösen. Man formt dieses in ein Gleichungssystem um, indem die Anzahlen von Bauteilen, die unverpackt übrig bleiben, als so genannte Schlupfvariablen x 5 , x 6 , x 7 ≥ 0 in die Ungleichungen integriert werden. Hierdurch werden die Ungleichungen zu - leichter zu handhabenden - Gleichungen: 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 + x 5 = 300 x 1 + x 2 + 2 x 3 + 4 x 4 + x 6 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 + x 7 = 1000 Nach wie vor lautet der Deckungsbeitrag 65 x 1 + 120 x 2 + 170 x 3 + 230 x 4 und ist zu maximieren. Die Schlupfvariablen finden nur mittelbar, d.h. über die linearen Verflechtungsgleichungen Eingang in die Optimierung. 48818_Terveer.indd 249 48818_Terveer.indd 249 18.07.2023 11: 54: 21 18.07.2023 11: 54: 21 <?page no="250"?> 250 10 Lineare Gleichungssysteme Beispiel 10.2 (Verschnittproblem, Rohstoff-Produkt-Verflechtung) Papierrollen der Breiten 60 cm (Typ A), 30 cm (Typ B) und 20 cm (Typ C) sollen aus Rollen der Breite 95 cm (Typ D) durch Zurechtschneiden hergestellt werden. Dies ist auf sechs Arten mit unbrauchbarem Verschnitt möglich, wie in Tabelle 10.2 dargestellt wird. Aufgrund einer Bestellung müssen exakt 1440 Rollen vom Typ A, 2160 Rollen vom Typ B und 1080 Rollen vom Typ C hergestellt werden. Für diese Bestellung sucht man eine kostenoptimale Schnittmuster-Vorschrift , d.h. Schnittanzahlen x 1 , x 2 , . . . , x 6 der sechs Muster, die einerseits das Gleichungssystem x 1 + x 2 = 1440 x 1 + 3 x 3 + 2 x 4 + x 5 = 2160 x 2 + x 4 + 3 x 5 + 4 x 6 = 1080 lösen, andererseits unter den zulässigen Lösungen dieses Gleichungssystems eine minimale Anzahl von Rollen x 1 + x 2 + x 3 + x 4 + x 5 + x 6 verbrauchen. Dass die Lösung zusätzlich ganzzahlig sein muss, soll hier nicht berücksichtigt werden. Realistischer ist zudem die Annahme, dass mehr als die geforderten Rollenanzahlen der Typen A,B,C hergestellt werden dürfen. Gesucht ist dann eine kostenoptimale Lösung von x 1 + x 2 ≥ 1440 x 1 + 3 x 3 + 2 x 4 + x 5 ≥ 2160 x 2 + x 4 + 3 x 5 + 4 x 6 ≥ 1080 Diese können mittels Schlupfvariablen x 7 ≥ 0, x 8 ≥ 0, x 9 ≥ 0 (die die Überschreitung der Bestellmengen angeben) in Gleichungen überführt werden: x 1 + x 2 − x 7 = 1440 x 1 +3 x 3 +2 x 4 + x 5 − x 8 = 2160 x 2 + x 4 +3 x 5 +4 x 6 − x 9 = 1080 wobei nach wie vor x 1 + x 2 + x 3 + x 4 + x 5 + x 6 zu minimieren ist. Definition 10.1 ! [1] Ein Gleichungssystem { a 11 x 1 + . . . + a 1 n x n = b 1 ... ... ... a m 1 x 1 + . . . + a mn x n = b m } ( ∗ ) mit a ij ∈ R, b i ∈ R, i = 1 , . . . , m , j = 1 , . . . , n , m ∈ N, n ∈ N, heißt lineares Gleichungssystem mit m Gleichungen und n Variablen (Unbekannten) (kurz: LGS). [2] Falls b 1 = . . . = b m = 0, so heißt das LGS homogen, andernfalls inhomogen. [3] Unter einer Lösung des LGS ( ∗ ) versteht man ein n -Tupel ( x 1 , . . . , x n ) von n reellen Zahlen, das ( ∗ ) erfüllt. Die Lösungsmenge L ist die Menge aller Lösungen von ( ∗ ). Übungen zu Abschnitt 10.1 ? 1. Ein Funktionssteckbrief besteht aus Werte-Angaben zu einem Polynom f . Dessen Koeffizienten lassen sich dann mit Hilfe eines LGS ermitteln. Stellen Sie für die folgenden Steckbriefe das LGS auf: Grad Steckbrief a) 1 f (2) = 4 , f (3) = 0 b) 2 f (2) = 4 , f (3) = 0 , f (4) = − 6 c) 2 f (0) = 5 , f ′ (3) = 1 , f (5) = 0 d) 3 f (4) = f ′′ (4) = 0 , f ′ (4) = 4 , f (0) = 16 48818_Terveer.indd 250 48818_Terveer.indd 250 18.07.2023 11: 54: 26 18.07.2023 11: 54: 26 <?page no="251"?> 10.2 Das Gauß’sche Eliminationsverfahren 251 2. Nikoläuse der Marke LiLa bestehen aus weißer und Milchschokolade: ■ Nikolaus 1 (Preis 1 e ) besteht aus 200g Milchschokolade. ■ Nikolaus 2 (3 e ) besteht aus 200g Milch- und 400g weißer Schokolade. ■ Nikolaus 3 (4 e ) besteht aus 600g Milch- und 400 g weißer Schokolade. Beschreiben Sie den Sachverhalt durch einen Input-Output-Zusammenhang. Welche Fragestellung führt in diesem Kontext zu einem LGS? Wie lassen sich die Lösungen dieses LGS bewerten? 3. Eine Spielzeugfabrik stellt Kasperle- Mobilés her. Die benötigten Figuren werden unter Verwendung folgender Schnittmuster aus rechteckigen Spanplatten (zum Stückpreis von 50 Cent) ausgeschnitten: Schnittmuster 1 2 3 4 5 6 Anzahl Kasper 1 2 2 0 0 0 Prinzessin 2 0 0 1 1 0 Seppl 0 1 0 1 0 1 Zauberer 0 0 1 0 1 1 Die Fabrik stellt drei verschiedene Mobilés A,B,C mit folgenden Figuren (je 1) her: ■ A: Kasper, Prinzessin, Zauberer ■ B: Kasper, Seppl ■ C: Kasper, Prinzessin, Seppl, Zauberer Es sollen je 100 Mobiles aller drei Sorten produziert werden. Stellen Sie ein LGS zur Bestimmung der möglichen Schnittmustervarianten auf, die zur Erfüllung dieses Auftrags erforderlich sind. 4. Die Mathematik-Professoren G. Auß, F. Ermat und E. Uler haben eine MAWIWI-Klausur zu korrigieren. Da G. Auß meint, er habe wichtigeres als seine Kollegen im Kopf, beschließt er, jeweils ein Fünftel seiner Klausuren den beiden Kollegen unterzumogeln. F. Ermat weiß natürlich, daß nur sein Wissen ganz im Zeichen der Wissenschaft steht und so beschließt er, da er G. Auß besser leiden kann als E. Uler, letzterem zwei Fünftel seiner Klausuren zu vermachen. Als E. Uler die Mogelei seiner Kollegen zufällig bemerkt, dankt er es ihnen, indem er beiden Kollegen jeweils ein Viertel seiner ursprünglichen Klausuren zuschiebt. Nach diesen Umverteilungen stellen alle drei Professoren fest, dass sie wieder dieselben Anzahlen an Klausuren zu korrigieren haben wie zuvor (zusammen 820). Bestimmen Sie mit einem LGS, wieviele Klausuren es für jeden Professor sind. 10.2 Das Gauß’sche Eliminationsverfahren Das hier vorgestellte Lösungsverfahren für lineare Gleichungssysteme lässt sich einerseits zur Reduktion des Schreibaufwandes, andererseits aber auch zur Umsetzung auf Computern verwenden, dazu verwendet man eine kompaktere Schreibweise für LGS, bei welcher die Variablen und Rechenzeichen unterdrückt werden. Definition 10.2 ! Gegeben sei ein LGS gemäß Definition 10.1 vgl. S. 250 . [1] A : = a 11 . . . a 1 n ... ... a m 1 . . . a mn heißt Koeffizientenmatrix. [2] ( A | b ) : = a 11 . . . a 1 n b 1 ... . . . ... ... a m 1 . . . a mn b m heißt Gleichungsmatrix. Jede Spalte einer Koeffizientenmatrix (bzw. des linken Teils der Gleichungsmatrix) 48818_Terveer.indd 251 48818_Terveer.indd 251 18.07.2023 11: 54: 29 18.07.2023 11: 54: 29 <?page no="252"?> 252 10 Lineare Gleichungssysteme stellt die Koeffizienten jeweils genau einer Variablen dar. Bis auf die Namen dieser Variablen sind also Gleichungsmatrizen und lineare Gleichungssysteme zueinander gleichwertig. Beim Gauß’schen Eliminationsverfahren(kurz: GEV) werden systematisch Variablen aus dem LGS eliminiert. Nach Abschluss des Verfahrens verbleiben Gleichungen, in denen einige Variablen als unabhängig, d.h. (prinzipiell) frei wählbar klassifiziert werden, während sich die übrigen als lineare Funktionen der unabhängigen Variablen ergeben. Man wechselt von einer impliziten Darstellung (nämlich durch ein LGS) zu einer expliziten Darstellung der Lösungsmenge. 10.2.1 Zeilenumformungen eines LGS Das GEV verwendet drei Typen von Umformungsschritten, die sich sowohl anhand der Gleichungen als auch anhand der Gleichungsmatrix eines LGS beschreiben lassen: Satz 10.1 Die Lösungsmenge eines LGS ändert sich nicht, wenn folgende elementaren Zeilenumformungen ausgeführt werden (links für LGS, rechts für Gleichungsmatrizen): [1] Vertauschungsregel: Zwei Gleichungen dürfen vertauscht werden. [2] Multiplikationsregel: Jede Gleichung darf mit einer Konstanten β ̸ = 0 multipliziert werden. [3] Additionsregel: Zu jeder Gleichung darf ein Vielfaches einer anderen Gleichung addiert werden. [1] Vertauschungsregel: Zwei Zeilen dürfen vertauscht werden. [2] Multiplikationsregel: Jede Zeile darf mit einer Konstanten β ̸ = 0 multipliziert werden. [3] Additionsregel: Zu jeder Zeile darf ein Vielfaches einer anderen Zeile addiert werden. Wir führen diese Zeilenumformungen und die Notationen, mit denen sie beschrieben werden, an einem Beispiel vor: Beispiel 10.3 (Fortsetzung von Beispiel 10.1 vgl. S. 248 ) Angenommen, auf die Herstellung von Bill4 wird verzichtet. Die Lösung des LGS 2 x 1 +3 x 2 +4 x 3 = 300 x 1 + x 2 +2 x 3 = 130 5 x 1 +10 x 2 +15 x 3 = 1000 liefert dann alle Möglichkeiten, die Bauteile zu verbrauchen. Nun werden die verschiedenen Zeilenumformungen bis zur Lösungsmenge durchgeführt: 2 x 1 +3 x 2 +4 x 3 = 300 x 1 + x 2 +2 x 3 = 130 5 x 1 +10 x 2 +15 x 3 = 1000 2 3 4 300 1 1 2 130 5 10 15 1000 I ↔ II x 1 + x 2 +2 x 3 = 130 2 x 1 +3 x 2 +4 x 3 = 300 5 x 1 +10 x 2 +15 x 3 = 1000 1 1 2 130 2 3 4 300 5 10 15 1000 III/ 5 x 1 + x 2 +2 x 3 = 130 2 x 1 +3 x 2 +4 x 3 = 300 x 1 +2 x 2 +3 x 3 = 200 1 1 2 130 2 3 4 300 1 2 3 200 II − 2 I III − I x 1 + x 2 +2 x 3 = 130 x 2 = 40 x 2 + x 3 = 70 1 1 2 130 0 1 0 40 0 1 1 70 Jetzt ist x 1 aus den beiden letzten Gleichungen „eliminiert“. Diese lassen sich nun 48818_Terveer.indd 252 48818_Terveer.indd 252 18.07.2023 11: 54: 33 18.07.2023 11: 54: 33 <?page no="253"?> 10.2 Das Gauß’sche Eliminationsverfahren 253 START R1: Pivotspalte finden R2: Pivotspalte ab Pivotstelle formatieren R3: Alle Pivotspalten gefunden? R4: Rücksubstitution ja nein Abbildung 10.2: Fluss-Darstellung des Gauß’schen Eliminationsverfahrens separat lösen und die Lösungen in die erste Gleichung „rücksubstituieren“. x 1 + x 2 +2 x 3 = 130 x 2 = 40 x 2 + x 3 = 70 1 1 2 130 0 1 0 40 0 1 1 70 III → III − II x 1 + x 2 +2 x 3 = 130 x 2 = 40 x 3 = 30 1 1 2 130 0 1 0 40 0 0 1 30 I → I − 2 III x 1 + x 2 = 70 x 2 = 40 x 3 = 30 1 1 0 70 0 1 0 40 0 0 1 30 I → I − II x 1 = 30 x 2 = 40 x 3 = 30 1 0 0 30 0 1 0 40 0 0 1 30 Es können je 30 Bausätze Bill1 und Bill3 sowie 40 Bausätze Bill2 gepackt werden. Wie im vorangegangenen Beispiel lassen sich lineare Gleichungssysteme durch systematische Anwendung der drei genannten Typen von Zeilenumformungen lösen. Das Berechnungsbeispiel folgt dabei den Leitlinien desGauß’schen Eliminationsverfahrens. 10.2.2 Die Staffelform eines LGS Die Koeffizienten der letzten drei in Beispiel 10.3 berechneten Gleichungsmatrizen ordnen sich in einer Treppen-Struktur an. Von links oben nach rechts steigt die Anzahl der Nulleintrage, d.h. sinkt die Anzahl der Variablen in den Gleichungen. Das GEV vgl. Abbildung 10.2 überführt das LGS zuerst in eine derartige Staffelform. Satz 10.2 (Teil 1 des GEV) Jede Gleichungsmatrix lässt sich durch elementare Zeilenumformungen in die Staffelform gemäß Abbildung 10.3 bringen, wobei im nicht schraffierten Bereich ausschließlich Null- Einträge stehen und die ∗ -Einträge beliebige reelle Zahlen bezeichnen. ■ Die Spalten j 1 , . . . , j k vgl. Abbildung 10.3 heißen Basisspalten bzw. Pivotspalten ■ Die Stellen (1 , j 1 ), (2 , j 2 ), . . . , ( k, j k ) heißen Pivot-Stellen der Matrix. ■ Die zugehörigen Variablen x j 1 , . . . , x j k heißen Basisvariablen bzw. Pivotvariablen. A kann verschiedene Staffelformen mit stets derselben Anzahl k von Treppenstufen bzw. Pivotspalten haben. Die eindeutig bestimmte Zahl k wird Rang von A genannt. In der Staffelform eines LGS kommen „von oben nach unten“ immer weniger Variablen vor, was durch die nachfolgend beschriebenen Zeilenumformungen erreicht wird. 48818_Terveer.indd 253 48818_Terveer.indd 253 18.07.2023 11: 54: 37 18.07.2023 11: 54: 37 <?page no="254"?> 254 10 Lineare Gleichungssysteme j 1 j 2 j k ↓ ↓ ↓ 0 · · · 0 1 ∗ · · · ∗ ∗ ∗ · · · ∗ · · · ∗ ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 1 ∗ · · · ∗ · · · ∗ ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 . . . ∗ ∗ · · · ∗ ∗ ... ... ... ... ... ... ... ... ... ... ... ... . . . ∗ ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 1 ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 0 0 · · · 0 b ′ k +1 ... ... ... ... ... ... ... ... ... ... ... ... 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 0 0 · · · 0 b ′ m Abbildung 10.3: Staffelform eines linearen Gleichungssystems, schematisch Beispiel 10.4 Gelöst werden soll das LGS 3 x 1 + 6 x 2 + 12 x 3 + 15 x 4 + 15 x 5 = 0 x 1 + 2 x 2 + 5 x 3 + 2 x 4 + 9 x 5 = 1 − 3 x 1 − 6 x 2 − 10 x 3 − 21 x 4 − 6 x 5 = − 4 − 2 x 1 − 4 x 2 − 5 x 3 − 19 x 4 + 3 x 5 = − 3 Die Gleichungsmatrix lautet 3 6 12 15 15 0 1 2 5 2 9 1 − 3 − 6 − 10 − 21 − 6 − 4 − 2 − 4 − 5 − 19 3 − 3 R1. In ( A | b ) sei j die Nummer der am weitesten links stehenden von Null verschiedenen Spalte. Man sorge mit Zeilenumformungen für a 1 j = 1. Beispiel 10.5 (Fortsetzung von Beispiel 10.4) Die erste Zeile wird durch 3 geteilt 3 6 12 15 15 0 1 2 5 2 9 1 − 3 − 6 − 10 − 21 − 6 − 4 − 2 − 4 − 5 − 19 3 − 3 → 1 2 4 5 5 0 1 2 5 2 9 1 − 3 − 6 − 10 − 21 − 6 − 4 − 2 − 4 − 5 − 19 3 − 3 In R1 gibt es oft mehrere Möglichkeiten, händisch vorzugehen. Entweder man platziert einen bereits vorliegenden 1-Eintrag in dieser Spalte vor durch eine Zeilenvertauschung, oder man normiert einen Eintrag a 1 j ̸ = 0, indem die Zeile mit 1 / a 1 j multipliziert wird. Zuweilen sind sogar Zeilenvertauschung und Multiplikationsschritt erforderlich. R2. Durch Anwendung der Additionsregel sorge man dafür, dass die Einträge in der j -ten Spalte unterhalb der ersten Zeile alle Null werden. Dazu wird jeweils das a ij -fache der ersten Zeile von der i -ten Zeile subtrahiert, wodurch der Eintrag zu Null wird. Die eigentliche Elimination der Variablen erfolgt hier in Schritt R2. Der Schritt wird jedoch zuvor in R1 insofern vorbereitet, dass die jeweils oberste betrachtete Gleichung auch die Variable enthält, die man aus den darunter liegenden Gleichungen entfernen will. Beispiel 10.6 (Fortsetzung von Beispiel 10.5) Die erste Zeile wird von der zweiten subtrahiert und das dreifache (zweifache) der ersten Zeile wird zur dritten (vierten) Zeile addiert: 48818_Terveer.indd 254 48818_Terveer.indd 254 18.07.2023 11: 54: 43 18.07.2023 11: 54: 43 <?page no="255"?> 10.2 Das Gauß’sche Eliminationsverfahren 255 1 2 4 5 5 0 1 2 5 2 9 1 − 3 − 6 − 10 − 21 − 6 − 4 − 2 − 4 − 5 − 19 3 − 3 → 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 2 − 6 9 − 4 0 0 3 − 9 13 − 3 R3. Nach R1,R2 hat die Gleichungsmatrix die rechts stehende Gestalt. Falls A ′ Nullmatrix ist oder keine Spalten hat, ist die Staffelform erreicht. Sonst sind R1 bis R3 auf ( A ′ | b ′ ) anzuwenden. 0 . . . 0 1 ∗ . . . ∗ ∗ 0 . . . 0 0 . . . ... . . . ... ... ... A ′ ... b ′ 0 . . . 0 0 . . . Die Nummerierung der Zeilenumformungen nimmt dabei aus Gründen der Übersichtlichkeit Bezug auf die komplette Gleichungsmatrix. Beispiel 10.7 (Fortsetzung von 10.6) In der vorliegenden Gleichungsmatrix ist die Teilmatrix ( A ′ | b ) hervorgehoben. 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 2 − 6 9 − 4 0 0 3 − 9 13 − 3 Die Matrix A ′ hat noch von Null verschiedene Spalten, daher werden die Schritte R1 und R2 mit ( A ′ | b ′ ) erneut angestoßen. Erst die 2. Spalte von A ′ ist eine Nullspalte, zudem steht oben in dieser Spalte A ′ der von Null verschiedene Eintrag 1. Damit ist in R1 keine Normierung und kein Vertauschungsschritt erforderlich, man kann mit R2 fortfahren. Das zweifache (dreifache) der 2. Zeile der Gesamtmatrix wird von der 3. (4.) Zeile der Gesamtmatrix subtrahiert. Das ergibt die Gleichungsmatrix 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 0 0 1 − 6 0 0 0 0 1 − 6 Ein weiterer Durchlauf ist erforderlich, da die unten markierte 2 x 2 Matrix noch von Null verschiedene Einträge hat. In R1 ist dabei keine Aktion nötig, in R2 wird die dritte von der vierten Zeile subtrahiert. Man erhält die Staffelform 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 0 0 1 − 6 0 0 0 0 0 0 Pivotvariablen sind x 1 , x 3 und x 5 . Das zur Staffelform gehörige LGS lautet x 1 +2 x 2 +4 x 3 +5 x 4 +5 x 5 = 0 x 3 − 3 x 4 +4 x 5 = 1 x 5 = − 6 0 = 0 Das LGS ist nicht eindeutig lösbar. Erst mit konkreten Werte für die Nicht- Pivotvariablen x 2 und x 4 verbleibt ein eindeutig lösbares LGS in x 1 , x 3 , x 5 . Mit x 2 = 0, x 4 = 0 bekommt man beispielsweise x 5 = − 6, x 3 = 1 − 4 x 5 = 25 und x 1 = − 4 x 3 − 5 x 5 = − 70. Mit der Staffelform ist eine erste Möglichkeit eröffnet, die Lösungsmenge systematisch darzustellen. Es ist möglich, bei den Variablen zwischen frei wählbaren und abhängigen Variablen zu unterscheiden. Außerdem können anhand der Staffelform Aussagen über die Lösbarkeit des LGS getroffen werden. Satz 10.3 Ist in der Staffelform vgl. Abbildung 10.3 einer der Werte b ′ i ungleich Null, so ist das LGS unlösbar, d.h. L = ∅ . Anderenfalls gilt: [1] Falls nur Pivotspalten in der Staffelform auftreten, so hat das LGS genau eine Lösung. [2] Liegen auch Nicht-Pivotspalten vor, so hat das LGS unendlich viele Lösunge: die Werte jeder Nicht-Pivotvariable sind frei wählbar. Bei Lösbarkeit werden die Gleichungen der Form 0 = 0 gestrichen. 48818_Terveer.indd 255 48818_Terveer.indd 255 18.07.2023 11: 54: 50 18.07.2023 11: 54: 50 <?page no="256"?> 256 10 Lineare Gleichungssysteme j 1 j 2 j k ↓ ↓ ↓ 0 · · · 0 1 ∗ · · · ∗ 0 ∗ · · · ∗ · · · 0 ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 1 ∗ · · · ∗ · · · 0 ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 . . . 0 ∗ · · · ∗ ∗ ... ... ... ... ... ... ... ... ... ... ... ... . . . 0 ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 1 ∗ · · · ∗ ∗ 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 0 0 · · · 0 0 ... ... ... ... ... ... ... ... ... ... ... ... 0 · · · 0 0 0 · · · 0 0 0 · · · 0 · · · 0 0 · · · 0 0 Abbildung 10.4: Die Zeilenstufenform eines lösbaren LGS 10.2.3 Die Zeilenstufenform eines LGS Wenn das LGS lösbar ist, kann die Lösungsmenge aus der Staffelform durch Rücksubstitution/ Eliminiation ermittelt werden. Dies entspricht einem Transformationsschritt: R4. die Einträge in den Pivotspalten oberhalb der Pivotstellen werden durch Additionsschritte in Null umgeformt. Satz 10.4 Jedes lösbare LGS lässt sich mit elementaren Zeilenumformungen in die Zeilenstufenform (kurz: ZSF) vgl. Abbildung 10.4 bringen. Hierzu leitet man mit den Schritten R1 bis R3 vgl. S. 254 die Staffelform her und eliminiert anschließend mittels R4 die Pivotvariablen sukzessive so lange, bis jede Gleichung genau eine Pivotvariable enthält. Das Verfahren zur Bestimmung der ZSF für lösbare LGS wurde algorithmisch bereits dargestellt vgl. Abbildung 10.2, S. 253 . Wir illustrieren den Schritt R4: Beispiel 10.8 (Fortsetzung von Beispiel 10.7 vgl. S. 255 ) 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 0 0 1 − 6 → 1 2 4 5 0 30 0 0 1 − 3 0 25 0 0 0 0 1 − 6 → 1 2 0 17 0 − 70 0 0 1 − 3 0 25 0 0 0 0 1 − 6 Hierbei wurde zuerst mit II − 4 III und I − 5 III die Basisvariable x 5 aus der ersten und zweiten Gleichung und schließlich mit I − 4 · II die Basisvariable x 3 aus der ersten Gleichung eliminiert. Wenn man mit der Eliminiation der Basisvariable x 3 in der ersten Gleichung beginnt, so kommt man zum gleichen Endergebnis, hat aber einen etwas höheren händischen Rechenaufwand, weil in der zweiten Zeile, fünften Spalte der ZSF nach dem ersten Additionsschritt noch ein von Null verschiedener Eintrag stünde. Dieser müsste bei der abschließenden Elimination von x 5 in die erste Gleichung „weitergereicht“ werden: 1 2 4 5 5 0 0 0 1 − 3 4 1 0 0 0 0 1 − 6 → 1 2 0 17 − 11 − 4 0 0 1 − 3 4 1 0 0 0 0 1 − 6 → 1 2 0 17 0 − 70 0 0 1 − 3 0 25 0 0 0 0 1 − 6 Am effizientesten in R4 ist spaltenweise Elimination „von rechts nach links“. An der Zeilenstufenform lassen sich spezielle Lösungen und die Lösungsmenge ablesen. 48818_Terveer.indd 256 48818_Terveer.indd 256 18.07.2023 11: 54: 55 18.07.2023 11: 54: 55 <?page no="257"?> 10.2 Das Gauß’sche Eliminationsverfahren 257 Beispiel 10.9 (Fortsetzung von 10.8) Aus der Staffelform des obigen Beispiels wurde bereits die spezielle Lösung x 1 = − 70 , x 2 = 0 , x 3 = 25 , x 4 = 0 , x 6 = − 6 durch rückwärts Einsetzen ad hoc bestimmt. Diese Lösung läßt sich nun explizit aus der ZSF ablesen: Die rechte Spalte der ZSF gibt die Werte der Pivotvariablen in dieser speziellen Lösung an. Die anderen Variablen werden gleich Null gesetzt. Die Gleichungen zur ZSF sind die folgenden und werden durch Freistellen der Pivotvariablen umgeformt x 1 +2 x 2 +17 x 4 = − 70 x 3 − 3 x 4 = 25 x 5 = − 6 ⇒ x 1 = − 70 − 2 x 2 − 17 x 4 x 3 = 25 +3 x 4 x 5 = − 6 ( ∗ ) Nun können die Nicht-Pivotvariablen beliebig eingesetzt werden, wodurch die Pivotvariablen fixiert werden. Insbesondere ergibt x 2 = 0 , x 4 = 0 die „spezielle“ Lösung aus Beispiel 10.7. Zusammengefasst besteht die Lösungsmenge des LGS nun aus allen Tupeln ( x 1 , . . . , x 5 ) mit x i ∈ R, welche die drei Gleichungen ( ∗ ) erfüllen. Satz 10.5 (Die Lösungsmenge eines linearen Gleichungssystems) Für die Lösungsmenge L eines LGS in Unbekannten x 1 , . . . , x n gibt es drei Möglichkeiten: [1] L ist leer, d.h. es gibt keine Lösung. [2] Es gibt eine eindeutig bestimmte Lösung. Dann hat die ZSF des LGS nur Pivotspalten und die Lösung kann rechts in der ZSF abgelesen werden. [3] Es gibt mehrere Lösungen. Dann kann man die Variablen in zwei Gruppen einteilen: [a] zum einen die Nicht-Pivotvariablen, welche frei gewählt werden dürfen, [b] zum anderen die Pivotvariablen, die sich aus den Nicht-Pivotvariablen in expliziten linearen Gleichungen ergeben. L besteht aus allen Tupeln ( x 1 , . . . , x n ), welche diese Gleichungen erfüllen. Übungen zu Abschnitt 10.3 ? 7. Bestimmen Sie mit dem GEV die Lösungsmenge zu dem folgenden LGS: 1 2 − 1 1 1 1 2 − 1 1 − 2 − 1 3 1 1 − 1 − 1 1 3 4 2 − 1 − 2 1 7 − 1 3 − 2 3 2 − 2 8. Lösen Sie die Funktionssteckbriefe der Aufgabe 1 vgl. S. 250 mit dem GEV. 9. Für welche t ∈ R sind die angegebenen LGS lösbar? Geben Sie jeweils auch die Lösungsmenge an. a) 2 1 t − 4 − 2 3 b) 2 1 t − 4 t 3 10. Beim Einsetzungsverfahren wird eine lineare Gleichung in einem LGS nach einer Variablen aufgelöst und der rechts stehende Ausdruck in die übrigen Gleichungen substituiert. Erläutern Sie diesen Vorgehensweise anhand des Einsetzens der Variable x im LGS 2 x + 4 y − 8 z = 3 6 x + 2 y + 2 z = 15 und stellen Sie den Einsetzungsschritt mit Hilfe von elementaren Zeilenumformungen dar. Verfahren Sie entsprechend für das Gleichsetzungsverfahren. 48818_Terveer.indd 257 48818_Terveer.indd 257 18.07.2023 11: 54: 59 18.07.2023 11: 54: 59 <?page no="258"?> 258 10 Lineare Gleichungssysteme Zusammenfassung Das Gauß’sche Eliminationsverfahren löst lineare Gleichungssysteme auf, indem es sie durch Zeilenumformungen aus der impliziten Form, in der alle Variablen komplex aneinander gebunden sind, in eine explizite Form überführt. Bei der expliziten Form eines LGS, die sich aus der Zeilenstufenform ablesen lässt, zerfallen die Variablen in die Gruppe der Pivot- oder Basisvariablen, nach denen die Gleichungen freigestellt werden und die der Nicht-Pivot- oder Nicht-Basisvariablen, die frei gewählt werden können. Zudem tritt jede Basisvariable in genau einer Gleichung auf. Nach Bearbeitung dieses Kapitels sind Sie in der Lage ■ Problemstellungen in Anwendungsbeispielen in LGS zu überführen, ■ LGS mit dem Gauß’schen Eliminationsverfahren in Zeilenstufenform zu überführen, ■ die Lösungsmenge eines LGS aus der Zeilenstufenform abzulesen. Übungen zur Vertiefung von Kapitel 10 ? 14. Lösen Sie das LGS x 1 + x 2 − x 3 = a, 2 x 1 − x 2 + 5 x 3 = b, 2 x 2 − 5 x 3 = c für beliebige a, b, c ∈ R. 15. Die Firma „Caramba“ stellt Spielzeugrennbahnen in verschiedenen Sets her: Schiene A B C D E Kurve 13 12 2 8 29 Gerade 6 3 10 5 16 Brücke 1 1 0 1 3 Looping 1 0 0 2 5 Kreuzung 1 0 2 2 5 Die unverbindlichen Preisempfehlungen sind 44 , 99 e je Set A, C und D, 24 , 99 e je Set B und 149 , 99 e je Set E. Auf Lager sind noch 7300 Kurvenstücke, 3200 Geradenstücke, 600 Brücken, 200 Loopings und 400 Kreuzungen vorhanden. Diese sollen nun zu Sets verpackt werden. a) Geben Sie die Möglichkeiten, die Sets zu packen, als Lösungsmenge eines LGS an. b) Welche Lösung ergibt den höchsten Umsatz, wenn man davon ausgeht, dass alle Packungen verkauft werden? 48818_Terveer.indd 258 48818_Terveer.indd 258 18.07.2023 11: 55: 01 18.07.2023 11: 55: 01 <?page no="259"?> 11 Lineare Optimierung Übersicht Von einem linearen Optimierungsproblem (LOP) wird gesprochen, wenn ein linearer Term (meist Kosten, Verlust oder Gewinn) minimiert oder maximiert werden soll, und dabei gleichzeitig alle Variablen durch eine oder mehrere lineare Gleichungen oder Ungleichungen aneinander gebunden sind. Lineare Optimierungsprobleme sind weit verbreitet in der betrieblichen Planung, z.B. in der Produktion, bei der Planung von Verkehrsnetzen, aber auch in der Spieltheorie, die als mathematische Disziplin in der Volkswirtschaftslehre eingesetzt wird. Lineare Optimierung wird auch als „lokale Lösungsstrategie“ nichtlinearer Optimierungsprobleme eingesetzt. Probleme der linearen Optimierung wurden erstmals 1939 von Kantorowitsch besprochen, der Simplex- Algorithmus als klassisches Verfahren wurde 1947 von Dantzig vorgestellt. Durch den Einsatz von Computern in der Praxis werden auch sehr große LOP mit dem Simplex- Algorithmus einer Lösung zugänglich. Das vorliegende Kapitel stellt einen Einstieg in die lineare Optimierung dar. Mit einigen Beispielen wird die Grundproblematik vgl. Abschnitt 11.3, S. 263 und danach eine einheitliche Ausgangssituation vgl. Abschnitt 11.2, S. 261 beschrieben. Methodisch beginnen wir vgl. Abschnitt 11.3, S. 263 mit LGS, deren Lösungsmenge sich im Sinne des vorigen Kapitels mit nur einer freien Variable darstellen lässt. LOP mit solchen Nebenbedingungen lassen sich dann auch ganz ohne den Simplex-Algorithmus lösen, dessen Grundidee und Funktionsweise sich aber bei nur einer freien Variable gut veranschaulichen und auf mehrere freie Variable generalisieren lässt. Mit der Zweiphasenmethode vgl. Abschnitt 11.4, S. 275 wird das Problem der ersten Basislösung gelöst, welche der Simplex-Algorithmus benötigt und welche - anders als in den anfänglichen Beispielen - im Regelfall nicht über die Zeilenstufenform des Gauß’schen Eliminationsverfahrens gefunden werden kann. 11.1 Probleme der linearen Optimierung Definition 11.1 ! Ein lineares Optimierungsproblem (LOP) hat ■ eine in n Variablen x 1 , . . . , x n ≥ 0 lineare Zielfunktion c 1 x 1 + · · · + c n x n (mit gegebenen c j ∈ R), die zu minimieren oder zu maximieren ist. ■ m lineare Gleichungen a i 1 x 1 + · · · + a in x n = b i (bzw. ≤ bzw. ≥ ) für i = 1 , . . . , m (mit gegebenen a ij , b i ∈ R) 48818_Terveer.indd 259 48818_Terveer.indd 259 18.07.2023 11: 55: 04 18.07.2023 11: 55: 04 <?page no="260"?> 260 11 Lineare Optimierung 11.1.1 Optimaler Verbrauch von Rohstoffen Bei der Besprechung linearer Gleichungssysteme haben wir in Kapitel 1 bereits die damit verbundene Optimierungsaufgabe aufgezeigt. Beispiel 11.1 (Regalbeispiel, vgl. Beispiel 10.1) Die Lagerbestände sollen vollständig zu Regalen in Quantitäten x 1 , . . . , x 4 ≥ 0 bei minimalen Gesamtkosten 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 verpackt werden, d.h. unter Einhaltung des LGS 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 = 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 11.1.2 Transportprobleme Kosten des Transportes eines Gutes zwischen Quell- und Zielorten mit vorgegebenen Angeboten bzw. Bedarfen und streckenabhängigen Stückkosten sollen minimiert werden. Gesamtangebot und -bedarf der Quell- und Zielorte stimmen überein und sind ganzzahlig. Die Variablen x ij geben an, wieviele Einheiten von Quellort i nach Zielort j befördert werden. Beispiel 11.2 Die Kosten beim Transport von Rohkaffee seien (Angaben in 1000 e / t): Anbaugebiet Röster 1 2 3 Angebot 1 7 6 5 42 t 2 5 4 6 15 t Bedarf 15 t 25 t 20 t Gesucht ist eine Transportmengenverteilung mit minimalen Gesamttransportkosten 7 x 11 + 6 x 12 + 5 x 13 + 5 x 21 + 4 x 22 + 6 x 23 für x ij ≥ 0. Es gibt zwei Transport- Nebenbedingungen für die Anbaugebiete x 11 + x 12 + x 13 = 42 , x 21 + x 22 + x 23 = 18 und drei für die Röstereien: x 11 + x 21 = 15 , x 12 + x 22 = 25 , x 13 + x 23 = 20 11.1.3 Zuordnungsprobleme Personen/ Objekten werden vorgegebene Aktivititäten/ Funktionen zugeordnet; Derartige Probleme stehen in engem Zusammenhang zu Transportproblemen, erfordern aber ganzzahlige, meist sogar 0-1-wertige Lösungen. Beispiel 11.3 Eine Schule veranstaltet für 107 Schülerinnen und Schüler Studienfahrten zu 4 Zielen. Jede/ r Lernende vergibt jede der Prioritäten 1 bis 4 für jedes der Ziele. Die Ziele haben Unterbzw. Obergrenzen a 1 , . . . , a 4 bzw. b 1 , . . . , b 4 ≥ 0 der Teilnehmerzahl. Es sei x jk ∈ { 0 , 1 } die Zuordnung von Person j zu Fahrtziel k ∈ { 1 , . . . , 4 } . Dabei bedeutet 1 die Zuweisung und 0 die Nichtzuweisung. Wurde Person j mit Priorität p ∈ { 1 , . . . , 4 } Ziel k zugewiesen, fallen „Opportunitätskosten“ c jk = o p an, dabei ist üblicherweise o 1 = 0. Gesucht ist eine Zuordnung mit minimalen Gesamtkosten c 11 x 11 + · · · c 14 x 14 + · · · + c 107 , 1 x 107 , 1 + · · · c 107 , 4 x 107 , 4 unter den Restriktionen ■ Ein Fahrtziel je Schüler/ in: x j 1 + · · · + x j 4 = 1 für alle 1 ≤ j ≤ 107, ■ Kapazitäten der Fahrziele: a k ≤ x 1 k + · · · + x 107 ,k ≤ b k für alle 1 ≤ k ≤ 4 Dies ist ein LOP mit 428 Variablen und 115 Nebenbedingungen. 48818_Terveer.indd 260 48818_Terveer.indd 260 18.07.2023 11: 55: 08 18.07.2023 11: 55: 08 <?page no="261"?> 11.2 Standardform eines LOP 261 Übungen zu Abschnitt 11.1 ? 1.Werkstücke A, B, C mit einem Stückprofit von je 200 e (A,B) sowie 400 e (C) werden mit Hilfe von drei Maschinen und nachstehendem Zeitaufwand gefertigt. Formulieren Sie das LOP „Profitmaximierung unter Zeitrestriktionen“. h/ Werkstück Maschine A B C Betriebszeit I 0 1 1 100h II 2 1 1 120h III 2 1 0 120h 2. Eine Firma transportiert die von ihr hergestellten Maschinen A, B, C mit drei LKW-Typen. Zur optimalen Ausnutzung der Ladefläche können mehrere Maschinen verschiedenen Typs gleichzeitig geladen werden: je Ladung des LKW-Typs Maschine I II III Lieferung A 1 1 1 12 B 0 1 2 10 C 2 1 1 16 Für eine Lieferung soll der Fuhrpark möglichst kostengünstig eingesetzt werden. Jede Fuhre kostet 600 e (Typ I), 900 e (Typ II) bzw. 1350 e (Typ III). Formulieren Sie das lineare Optimierungsproblem „Kostenminimierung unter Auftragsrestriktion”. Beachten Sie, dass mit der eingesetzten Transportkapazität das Auftragsvolumen überschritten werden darf und dass hinreichend viele LKW aller Typen zur Verfügung stehen. 11.2 Standardform eines LOP Ein LOP ist zur einheitlichen algorithmischen Lösung meist nicht unmittelbar geeignet: ■ Einerseits ist das Vorgehen bei Maximierung und Minimierung verschieden. ■ Andererseits liegen oft lineare Ungleichungen vor, die man nicht gut lösen kann. Beide Schwierigkeiten lassen sich durch Überführung in die Standardform behandeln: Definition 11.2 ! Mit folgenden Eigenschaften ist ein lineares Optimierungsproblem in Standardform: ■ die Zielfunktion ist zu minimieren, d.h. hat die Form c 1 x 1 + · · · c n x n ! = min x 1 ,...,x n ≥ 0 , ■ die Nebenbedingungen sind Gleichungen, a 11 x 1 + · · · + a 1 n x n = b 1 ... a m 1 x 1 + · · · + a mn x n = b m In Matrizenschreibweise vgl. Abschnitt 13.1, S. 319 hat ein LOP in Standardform die Gestalt c T x ! = min x ≥ 0 unter Ax = b mit c ∈ R n , A ∈ R m × n , b ∈ R m Jedes LOP lässt sich in eine lösungsgleiche Standardform überführen, indem folgende Schritte durchgeführt werden: [1] Ist das Optimierungsproblem ein Maximierungsproblem c T x ! = max x ≥ 0 , so geht man über zum Minimierungsproblem d T x ! = min x ≥ 0 mit d = − c , d.h. alle Koeffizienten der Zielfunktion werden mit − 1 multipliziert. 48818_Terveer.indd 261 48818_Terveer.indd 261 18.07.2023 11: 55: 12 18.07.2023 11: 55: 12 <?page no="262"?> 262 11 Lineare Optimierung [2] Ist die i -te Nebenbedinung eine Ungleichung, so wird diese mit Hilfe einer so genannten Schlupfvariable s i ≥ 0 in eine äquivalente Gleichung überführt und zwar ■ die Ungleichung a i 1 x 1 + · · · + a in x n ≤ b i in a i 1 x 1 + · · · + a in x n + s i = b i ■ die Ungleichung a i 1 x 1 + · · · + a in x n ≥ b i in a i 1 x 1 + · · · + a in x n − s i = b i Alle Ungleichung bekommen somit verschiedene Schlupfvariablen; Schlupfvariablen sind stets nichtnegativ; deshalb müssen die beiden Ungleichungstypen verschieden behandelt werden, denn bei ≤ -Bedingungen gibt die Schlupfvariable an, um wieviel die rechte Seite unterschritten wird, während bei ≥ -Bedingungen von s i angegeben wird, um wieviel die rechte Seite übertroffen wird. Schlupfvariablen verändern die Zielfunktion prinzipiell nicht; will man allerdings die Zielfunktion angeben, so muss diese alle Variablen beinhalten, also auch die Schlupfvariablen. Dies geschieht durch Summanden der Form 0 · s i . Beispiel 11.4 Angenommen, im Regalbeispiel dürfen Träger im Lagerbestand übrig bleiben. Querstangen und Böden hingegen müssen komplett verpackt werden. Die Optimierungsaufgabe lautet dann: minimiere 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 mit x i ≥ 0 unter 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 ≤ 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 Mit Schlupfvariable s 1 ≥ 0 werden die Nebenbedingungen zum LGS 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 + s 1 = 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 Zusammen mit der Zielfunktion 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 = 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 + 0 s 1 ist die Standardform erreicht. Soll hingegen der Deckungsbeitrag 65 x 1 + 120 x 2 + 170 x 3 + 230 x 4 bei gleichen Nebenbedingungen maximiert werden, so ist dies gleichwertig dazu, den Term − 65 x 1 − 120 x 2 − 170 x 3 − 230 x 4 zu minimieren. Mit den obigen Nebenbedingungen erhält man dann die Standardform. Zur Standardform wird mit dem Simplexalgorithmus eine optimale Lösung gesucht. Aus dieser bekommt man dann die Lösung des Ausgangsproblems, indem die Schlupfvariablen gestrichen werden. Vielfach haben die Schlupfvariablen aber auch noch eine ökonomische Bedeutung und werden in diesem Sinne mit aufgeführt. In Beispiel 11.4 stellt die Schlupfvariable s 1 die Anzahl der im Lager verbleibenden Träger dar. Die Standardform muss möglicherweise noch zwei weiteren Transformationen unterzogen werden, ehe die eigentliche Optimierung durchgeführt werden kann: ■ Lassen sich Gleichungen der Nebenbedingungen wechselseitig auseinander herleiten, so kann man später keine spezielle Lösung ablesen, eine der Gleichungen ist zu entfernen. Erkennbar ist dies z.B., wenn sich durch geeignete Zeilenumformungen eine Nullgleichung herleiten lässt, z.B. in der Zeilenstufenform. ■ Zum anderen könnten Gleichungen vorhanden sein, bei denen auf der rechten Seite negative Werte stehen. Diese Gleichungen müssen mit ( − 1) multipliziert werden, weil anderenfalls im Simplexalgorithmus Lösungen abgelesen werden, bei denen einzelne Variablen negative Werte besitzen und die somit nicht zulässig sind. 48818_Terveer.indd 262 48818_Terveer.indd 262 18.07.2023 11: 55: 16 18.07.2023 11: 55: 16 <?page no="263"?> 11.3 Simplex-Algorithmus 263 Übungen zu Abschnitt 11.2 ? 3. Bringen Sie das folgende lineare Optimierungsproblem in Standardform 10 x 1 + 10 x 2 + 20 x 3 + 40 x 4 ! = min 2 x 1 − 4 x 2 + 3 x 3 + x 4 ≥ − 200 2 x 2 − 2 x 3 + 4 x 4 ≥ 100 − x 1 + x 2 ≤ 100 x 1 + x 2 + 2 x 4 = 150 x 1 , x 2 , x 3 , x 4 ≥ 0 4. Bringen Sie die linearen Optimierungsprobleme der Aufgaben in Abschnitt 11.1 (Maschinenbelegung und Transportplanung) jeweils in Standardform und veranschaulichen Sie die ökonomische Bedeutung der auftretenden Schlupfvariablen. 11.3 Simplex-Algorithmus Der Simplex-Algorithmus ist - zunächst ähnlich wie das Gauß’sche Eliminationsverfahren - eine „ gesteuerte“ Abfolge von Zeilenumformungen, mit denen das lineare Gleichungssystem der Nebenbedingungen umgeformt wird. Im Gegensatz zum GEV werden die Umformungen beim Simplexverfahren aber durch die Zielfunktion gesteuert. Wenn in der Gleichungsmatrix dann alle möglichen Einheitsspalten auftreten, so heißt diese Darstellung Basisform. Wie bei der Zeilenstufenform, die ebenfalls eine Basisform ist, kann man eine spezielle Basislösung ablesen. Aufbauend auf der Basisform stellt man ein Simplex-Tableau auf, die zusätzlichen Einträge helfen bei der eingangs genannten „Steuerung“. Der Simplex-Algorithmus beginnt mit einer ersten Basisform und leitet über eine Reihe von Basiswechseln weitere Basisformen her. Er endet mit einer Basisform, aus der man die Optimallösung oder die Information, dass es keine solche gibt, ablesen kann. Das Verfahren lässt sich am besten veranschaulichen, wenn in der Lösungsmenge nur eine freie Variable vorkommt. 11.3.1 Beispiel mit einer freien Variable Wir betrachten die Situation aus Beispiel 11.1 vgl. S. 260 . Gesucht ist eine Lösung mit minimalen Gesamtkosten 5 x 1 +6 x 2 +10 x 3 +12 x 4 , bei der die Lagerbestände vollständig verpackt werden. Zu dieser Forderung gehört ein LGS mit einer aus der Materialverflechtungstabelle ablesbaren Gleichungsmatrix, die in Zeilenstufenform überführt wird: 2 3 4 5 300 1 1 2 4 130 5 10 15 20 1000 −→ 1 0 0 1 30 0 1 0 − 3 40 0 0 1 3 30 Dabei handelt es sich um die gleichen Zeilenumformungen wie in Beispiel 10.3 vgl. S. 252 . Die Lösungsmenge des LGS besteht aus allen 4-Tupeln ( x 1 , x 2 , x 3 , x 4 ) mit x 1 = 30 − x 4 , x 2 = 40 + 3 x 4 und x 3 = 30 − 3 x 4 Mit diesen Bedingungen können die Pivot-Variablen x 1 , x 2 , x 3 im Zielwert Z = 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 48818_Terveer.indd 263 48818_Terveer.indd 263 18.07.2023 11: 55: 20 18.07.2023 11: 55: 20 <?page no="264"?> 264 11 Lineare Optimierung für die Gesamtkosten durch die Nicht-Pivot-Variable x 4 substituiert werden. Das ergibt die reduzierte Zielfunktion Z = 690 − 5 x 4 in folgenden Schritten: Z = 5(30 − x 4 ) + 6(40 + 3 x 4 ) + 10(30 − 3 x 4 ) + 12 x 4 „Substituieren“ = 5 · 30 + 6 · 40 + 10 · 30 + (5 · ( − 1) + 6 · 3 + 10 · ( − 3) + 12) · x 4 „Sammeln“ = 5 · 30 + 6 · 40 + 10 · 30 − ( 5 · 1 + 6 · ( − 3) + 10 · 3 − 12 ) · x 4 „Negieren“ = 690 − 5 x 4 „Vereinfachen“ Der als „Negieren“ bezeichnete Schritt, in dem der Faktor ( − 1) systematisch ausgeklammert und in das Rechenzeichen übernommen wird, könnte dabei auch übersprungen werden. Allerdings kann der schraffierte Term im Simplex-Algorithmus leichter aus dem betreffenden Tableau abgelesen werden als der momentan noch näher liegende Ausdruck 5 · ( − 1) + 6 · 3 + 10 · ( − 3) + 12, weil im Tableau die Gleichungen nicht nach den Basisvariablen aufgelöst werden vgl. S. 266. Man erkennt, dass die Kosten Z = 690 − 5 x 4 aufgrund des negativen Vorfaktors von x 4 minimal werden, wenn x 4 maximal wird, d.h. wenn möglichst viele Regale vom Typ Bill4 hergestellt werden. Berücksichtigt man jetzt noch, dass aus ökonomischer Sicht die Auswahl der Variablenwerte auf x 1 ≥ 0 , x 2 ≥ 0 , x 3 ≥ 0 , x 4 ≥ 0 begrenzt wird, so folgt aus der Lösungsmengendarstellung ■ x 4 ≥ 0 ■ x 1 = 30 − x 4 ≥ 0 ⇔ x 4 ≤ 30 1 = 30 ■ x 2 = 40 + 3 x 4 ≥ 0 ⇔ x 4 ≥ − 40 3 ■ x 3 = 30 − 3 x 4 ≥ 0 ⇔ x 4 ≤ 30 3 = 10, d.h. es dürfen höchstens 10 Regale vom Typ Bill4 verpackt werden, anderenfalls würde sich (wenigstens) bei Bill3 ein negativer Wert ergeben, was nicht erlaubt ist. Da nach dem vorher Gesagten gleichzeitig so viele Regale Bill4 wie möglich hergestellt werden sollen, um die Kosten zu minimieren, müssen zur Kostenminimierung x 4 = 10 Bausätze Bill4, x 1 = 40 − x 4 = 20 Bausätze Bill1 und x 2 = 40 + 3 x 4 = 70 Bausätze Bill2 gepackt werden. Bill3 wird nicht hergestellt, denn x 3 = 30 − 3 x 4 = 0. Die Zahl von 10 = min { 30 1 , 30 3 } Bausätzen Bill4, jenseits derer keine Lösung der Verpackungsaufgabe mehr besteht, wird auch Engpass der Variable x 4 genannt. In der linearen Optimierung gehört zur Zeilenstufenform des linearen Gleichungssystems die spezielle Lösung x 1 = 30, x 2 = 40, x 3 = 30, x 4 = 0, welche man erhält, indem die Nicht-Pivotvariable x 4 gleich Null gesetzt wird. Der Koeffizient 5 in der reduzierten Zielfunktion 690 − 5 x 4 zeigt, dass die Lösung nicht optimal ist, sondern die Variable x 4 möglichst groß sein sollte. Er wird Delta-Wert der Nicht-Pivotvariable x 4 genannt. 11.3.2 Simplex-Tableau Alle genannten Argumente und Werte werden im Simplex-Tableau der aktuellen Lösung x 1 = 30 , x 2 = 40 , x 3 = 30 , x 4 = 0 erfasst. Dieses ist eine Tabelle, deren Herzstück hier die Zeilenstufenform ( F | d ) = 1 0 0 1 30 0 1 0 − 3 40 0 0 1 3 30 ist. Statt „Zeilenstufenform“ soll ab jetzt der allgemeinere Begriff Basisform verwendet werden, dazu später mehr. Entsprechend nennt man die Pivotvariablen auch Basisvariablen. Das Simplex-Tableau erweitert die Basisform: 48818_Terveer.indd 264 48818_Terveer.indd 264 18.07.2023 11: 55: 25 18.07.2023 11: 55: 25 <?page no="265"?> 11.3 Simplex-Algorithmus 265 ■ Es wird eine Zeile mit den Koeffizienten der Zielfunktion ergänzt. Das Symbol x markiert die Spalte, aus der die Werte der Basisvariablen in einer Basislösung abgelesen werden. ■ Links wird eine Spalte hinzugefügt, in der die Zielkoeffizienten jeder Basisvariable stehen, d.h. derjenigen Variablen die aus der Basisform für die spezielle Lösung abgelesen werden. 5 6 10 12 x 1 0 0 1 30 0 1 0 − 3 40 0 0 1 3 30 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 Die Werte links zeigen gleichzeitig an, welche Spalten Basisspalten sind (wenn es mehrere Variablen mit gleichen Kostenkoeffizienten gibt, empfiehlt es sich ggf., noch eine weitere Spalte mit den Indizes oder Namen der Basisvariablen hinzuzufügen). Mit dieser Spalte der Basiskostenkoeffizienten vereinfacht sich die Berechnung der weiteren Einträge im Simplex-Tableau. Das Tableau wird vervollständigt durch eine Zeile ganz unten, in der die reduzierte Zielfunktion dargestellt wird. Bekanntlich heißt diese im vorliegenden Fall Z = 690 − 5 x 4 . Man stellt diese Gleichung so um, dass der Zielwert 690 der aktuellen Basislösung zusammen mit dem (technischen) Ausdruck Z auf die rechte Seite der Gleichung gelangt, und schreibt die Variablen auf die linke Seite, d.h. Z = 690 − 5 x 4 ⇔ 5 x 4 = 690 − Z . Mit „Dummy“-Termen für die eliminierten Variablen x 1 , x 2 , x 3 bekommt die Zielfunktion folgende Gleichung zugeschrieben: 0 x 1 + 0 x 2 + 0 x 3 + 5 x 4 = 690 − Z . ■ Diese Gleichung wird als letzte Zeile an das Simplex-Tableau gehängt, der Ausdruck − Z wird dabei weggelassen: 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 0 0 0 5 690 Die Einträge der neuen Zeile nennt man Delta-Werte. Sie können bestimmt werden, ohne die reduzierte Zielfunktion durch Substitution der Basisvariablen zu berechnen. 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 0 0 0 5 690 δ 1 = 5 · 1 + 6 · 0 + 10 · 0 − 5 = 0 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 0 0 0 5 690 δ 2 = 5 · 0 + 6 · 1 + 10 · 0 − 6 = 0 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 0 0 0 5 690 δ 3 = 5 · 0 + 6 · 0 + 10 · 1 − 10 = 0 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 10 0 0 1 3 30 0 0 0 5 690 δ 4 = 5 · 1 + 6 · ( − 3) + 10 · 3 − 12 = 5 Es reicht aus, diese Rechnung für Delta-Werte von Nichtbasisvariablen durchzuführen (in diesem Fall also für δ 4 ), weil Delta-Werte zu Basisvariablen/ Basisspalten stets Null sind, denn sie stellen in der reduzierten Zielfunktion Koeffizienten der Basisvariablen dar, welche ja gerade aus der Zielfunktion eliminiert wurden. 48818_Terveer.indd 265 48818_Terveer.indd 265 18.07.2023 11: 55: 29 18.07.2023 11: 55: 29 <?page no="266"?> 266 11 Lineare Optimierung Die Formel für δ 4 trat bereits bei der Berechnung der reduzierten Zielfunktion (durch „Negieren“) auf vgl. S. 264. Während sie dort eigentlich überflüssig war und nur diesen Term herausstellen sollte, ist sie hier ein wichtiger Baustein im Aufbau des Simplex-Tableaus. Wir werden später noch einen anderen Weg besprechen, die letzte Zeile zu bestimmen nämlich durch Fortschreibung aus einem gegebenen Tableau vgl. S. 268. Für das erste Tableau des Simplex-Algorithmus muss jedoch stets die Delta-Wert-Zeile wie oben dargestellt berechnet werden. Die letzte Zeile enthält schließlich noch den Zielwert, der sich analog zu den Delta- Werten berechnen lässt, wobei aber zum Schluss kein Koeffizient subtrahiert wird: 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 3 40 10 0 0 1 3 30 0 0 0 5 690 Z = 5 · 30 + 6 · 40 + 10 · 30 = 690 Falls noch keine optimale Lösung vorliegt, wird das Simplex-Tableau um eine weitere Spalte ganz rechts ergänzt, in der die oben beschriebenen Engpässe stehen. Dazu betrachtet man eine (beliebige) Spalte mit Delta-Wert größer als Null (hier δ 4 = 5). Sie zeigt an, dass der Zielwert verringert werden kann, wenn die betreffende Variable (hier x 4 ) mit einem positiven Wert belegt wird. Dies ist aber meist nicht unbegrenzt möglich, denn - wie für das Beispiel bereits oben erläutert - stellen einige Gleichungen Bedingungen dar, die für x 4 einen Engpass bedeuten. Dieser Engpass wird nun als Spalte rechts im Tableau hinzugefügt: 5 6 10 12 x x/ f 5 1 0 0 1 30 30 1 = 30 6 0 1 0 − 3 40 − 10 0 0 1 3 30 30 3 = 10 0 0 0 5 690 Die Engpässe ergeben sich aus den Forderungen x i ≥ 0 an die Basisvariablen, hier: ■ Die erste Gleichung heißt x 1 + x 4 = 30 ⇔ x 1 = 30 − x 4 . Weil x 1 ≥ 0 gefordert ist, folgt hieraus 30 − x 4 ≥ 0 ⇔ x 4 ≤ 30 1 = 30 . Die erste Nebenbedinung hat also den Engpass 30 1 , erkennbar daran, dass man im Simplextableau den x -Wert der 1. Zeile durch den f -Wert der 1. Zeile, 4. Spalte dividiert. ■ Die zweite Gleichung heißt x 2 − 3 x 4 = 40 ⇔ x 2 = 40+3 x 4 , d.h. es liegt ein negativer f -Wert f 24 = − 3 vor. Dann gilt x 2 ≥ 0 ⇔ 40 + 3 x 4 ≥ 0 ⇔ x 4 ≥ − 40 3 , d.h. es liegt kein Engpass für x 4 vor, weil aus x 4 ≥ 0 schon x 4 ≥ − 40 3 folgt. In der Engpassspalte wird dies durch den Eintrag − in der 2. Zeile markiert. Ebenfalls liegt kein Engpass vor, wenn der betreffende f -Wert Null ist; dann ist die Basisvariable unabhängig von der Nichtbasisvariable ≥ 0 (sie nimmt nämlich den auf der rechten Seite der Gleichung stehenden Wert an). ■ Die dritte Gleichung heißt x 3 + 3 x 4 = 30 ⇔ x 3 = 30 − 3 x 4 . Weil x 3 ≥ 0 gefordert ist, folgt hieraus 30 − 3 x 4 ≥ 0 ⇔ x 4 ≤ 30 3 . Die dritte Nebenbedingung hat also den Engpass 30 3 = 10 , erkennbar daran, das man im Simplextableau den x -Wert der 3. Zeile durch den f -Wert der 3. Zeile, 4. Spalte dividiert. Die Engpassspalte wird also schematisch gebildet, indem man komponentenweise die Einträge der x -Spalte durch die f -Werte der Pivotspalte teilt (sofern der betreffende f -Wert größer als Null ist, sonst wird „ − “eingetragen). Deshalb wird die Engpassspalte auch mit x/ f bezeichnet. Wenn das Simplex-Tableau eine optimale Lösung anzeigt, ist es nicht nötig, die Engpassspalte anzugeben. 48818_Terveer.indd 266 48818_Terveer.indd 266 18.07.2023 11: 55: 34 18.07.2023 11: 55: 34 <?page no="267"?> 11.3 Simplex-Algorithmus 267 11.3.3 Basiswechsel mit einer freien Variablen In 11.3.1 vgl. S. 263f. wurde eine bessere Lösung mit Zielwert 640 durch Ausschöpfen des Engpasses für x 4 bestimmt: x 1 = 20 , x 2 = 70 , x 3 = 0 , x 4 = 10. Zusätzlich ist erkennbar, dass dies auch schon die Optimallösung ist, weil das lineare Gleichungssystem nur eine freie Variable x 4 hat, der gesamte Lösungsraum durch einen Minimalwert 0 und einen Maximalwert 10 für diese Nicht-Basisvariable x 4 begrenzt wird und die Zielfunktion sich in die Form 690 − 5 x 4 bringen lässt. Eine lineare nichtkonstante Funktion (hier: wegen des Faktors − 5 streng monoton fallend) nimmt ihr Minimum aber immer am Rand des Intervalls (hier: des Intervalls [0; 10]) an. Unabhängig davon fällt auf, dass in der neuen Lösung wieder drei Variablen ungleich Null und die übrigen Variablen (hier: eine) gleich Null ist. Auch diese Lösung kann man wieder als spezielle Lösung einer Basisform darstellen, d.h. einer Matrix mit drei Einheitsspalten, diesmal den Spalten 1,2 und 4. Der Prozess der Herleitung dieser neuen Basisform aus der aktuell schon gegebenen Basisform heißt Basiswechsel bzw. Pivotisierung. Er geschieht dadurch, dass anstelle der dritten nun die vierte Spalte zur Basisspalte mit einem 1-Eintrag in der 3. Zeile wird. Für den Basiswechsel müssen folgende Schritte durchgeführt werden: [1] Selektion: Festlegung eines Eintrages in der neu einzurichtenden Basisspalte, des so genannten Pivotelementes f kℓ . Dabei wird ■ die neue Pivotspalte ℓ zu einem Delta-Wert δ ℓ > 0 gewählt, anschließend werden die Engpasswerte zu dieser Pivotspalte berechnet. ■ die Pivotzeile k so gewählt, dass mit der zuvor festgelegten Pivotspalte der kleinstmögliche Engpass der x/ f -Spalte zugrunde liegt. Das Pivotelement hebt man zur Übersicht im Tableau hervor. [2] Normierung: Multiplikation der k -ten Zeile mit 1 f kℓ . Das Pivotelement ist nun 1. [3] Elimination: Addition von Vielfachen der k -ten Zeile zu allen anderen Zeilen, so dass die übrigen Einträge der neuen Basisspalte zu Null werden. Im Beispiel beginnen wir mit der aktuellen Basisform. Meist wird dabei das komplette Simplex-Tableau aufgeschrieben, weggelassen (bzw. später ergänzt) werden in Zwischenschritten üblicherweise ■ Koeffizienten der ersten Spalte (Basis-Zielfunktionskoeffizienten), soweit sie ohne Bedeutung sind, weil die betreffende Basisspalte nicht vorhanden ist. ■ die Engpasswerte, die in Zwischenschritten ebenfalls bedeutungslos sind. Die Delta-Zeile wird mitgeführt, weil sie im Rahmen des Basiswechsels durch eine Zeilenumformung fortgeschrieben statt neu berechnet werden kann. Wir führen den Basiswechsel am Regalbeispiel durch. Im vorliegenden Simplextableau ist f 34 = 3 das Pivotelement, denn die vierte Spalte hat den positiven Delta-Wert δ 4 = 5 und der zugehörige Engpass 10 steht in der dritten Zeile. Wir markieren das Pivotelement und überführen das Tableau durch einen Multiplikationsschritt, bei dem das Pivotelement zu Eins normiert wird, in ein „Zwischentableau“: 5 6 10 12 x x/ f 5 1 0 0 1 30 30 6 0 1 0 − 3 40 − 10 0 0 1 3 30 10 0 0 0 5 690 III → III/ 3 −−−−−−−−−−−→ 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 0 0 13 1 10 0 0 0 5 690 48818_Terveer.indd 267 48818_Terveer.indd 267 18.07.2023 11: 55: 37 18.07.2023 11: 55: 37 <?page no="268"?> 268 11 Lineare Optimierung Die übrigen Einträge in der neuen Pivotspalte werden jetzt durch Additionsschritte in Null überführt, wobei sich die restlichen Einträge der betreffenden Zeilen natürlich mit verändern. Die spezielle Form der Umformungen sorgt aber dafür, dass die anderen Pivot-Spalten unverändert bleiben, so dass am Ende wieder drei Einheitsspalten im Tableau stehen und die Basis-Zielfunktionskoeffizienten links ergänzt werden können: 5 6 10 12 x 5 1 0 0 1 30 6 0 1 0 − 3 40 0 0 13 1 10 0 0 0 5 690 I → I − III II → II + 3 III −−−−−−−−−−−−−→ 5 6 10 12 x 5 1 0 − 13 0 20 6 0 1 1 0 70 12 0 0 13 1 10 0 0 0 5 690 Hier lässt sich nun die neue Basislösung x 1 = 20 , x 2 = 70 , x 3 = 0 , x 4 = 10 ablesen. Wir wissen ja schon aus früheren Überlegungen, dass diese Lösung optimal ist. Im Simplex-Tableau kann man dies auch erkennen, wenn die Delta-Werte (und der Zielwert) aktualisiert werden. Dies kann zum einen durch Neuberechnung aus dem vorliegenden Tableau geschehen: δ 1 =5 · 1 − 5 = 0 δ 2 =6 · 1 − 6 = 0 δ 3 =5 · ( − 13 ) + 6 · 1 + 12 · 13 − 10 = − 53 δ 4 =12 · 1 − 12 = 0 Z =5 · 20 + 6 · 70 + 12 · 10 = 640 Das gleiche Ergebnis erhält man, wenn man den Prozess der Pivotisierung in die Delta- Zeile fortsetzt. Konkret wird der Delta-Wert in der neuen Pivot-Spalte durch einen Additionsschritt in Null überführt, wodurch sich der Delta-Wert der alten Pivot-Spalte mittransformiert: Somit lautet das Folgetableau 5 6 10 12 x 5 1 0 − 13 0 20 6 0 1 1 0 70 12 0 0 13 1 10 0 0 0 5 690 −−−−−−−−−−−−−−→ IV → IV − 5 III 5 6 10 12 x 5 1 0 − 13 0 20 6 0 1 1 0 70 12 0 0 13 1 10 0 0 − 53 0 640 Inhaltlich ist der Additionsschritt gleichwertig dazu, dass die neue Basisvariable x 4 der vorigen reduzierten Zielfunktion durch die alte Basisvariable und neue Nichtbasisvariable x 3 substituiert wird. Aus der dritten Zeile liest man die Gleichung 13 x 3 + x 4 = 10 ab und formt nach x 4 um: x 4 = 10 − 13 x 3 . Das ergibt die neue Darstellung der reduzierten Zielfunktion, wie sie auch aus dem neuen Simplex-Tableau abgelesen werden kann: Z = 690 − 5 x 4 = 690 − 5(10 − 13 x 3 ) = 640 + 5 3 x 3 d.h. − 53 x 3 = 640 − Z (beachten Sie wieder, dass der Term − Z in der Delta-Zeile weggelassen wird vgl. S. 265 ). Das zuletzt gewonnene Tableau ist nunmehr das Simplextableau der Lösung x 1 = 20 , x 2 = 70 , x 3 = 0 , x 4 = 10 mit Zielwert 640. Dass die Lösung optimal ist, lässt sich ebenfalls aus dem Tableau ablesen. Alle Delta-Werte sind kleiner oder gleich Null. Die reduzierte Zielfunktion Z = 640 + 5 3 x 3 kann man aus der Delta-Zeile ablesen, und sie zeigt - wie die durchweg nicht positiven Delta-Werte im Tableau -, dass durch eine Erhöhung des Wertes der Nichtbasisvariable x 3 der Zielwert über den Wert 640 der aktuellen Lösung hinaus allenfalls erhöht werden kann. Die Zielfunktion muss aber minimiert werden, deshalb die Optimalitätseigenschaft. 48818_Terveer.indd 268 48818_Terveer.indd 268 18.07.2023 11: 55: 42 18.07.2023 11: 55: 42 <?page no="269"?> 11.3 Simplex-Algorithmus 269 11.3.4 Basiswechsel mit mehreren freien Variablen Die Vorgehensweise des Basiswechsels haben Sie nun anhand einer freien Variable kennen gelernt, sie lässt sich aber genau so gut durchführen, wenn mehr als eine freie Variable in der Basisform vorkommt. Es gibt entsprechend mehr Spalten und Delta-Werte im Tableau, der Basiswechsel wird anhand einer passend ausgewählten Pivotspalte durchgeführt. Als Beispiel betrachten wir wieder die Verpackungs-Situation. Nun nehmen wir an, dass die Regalträger nicht komplett verpackt werden müssen, weil sie auch noch für andere Möbeltypen verwendet werden können. Daher sind die Nebenbedingungen 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 ≤ 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 mit minimalen Kosten 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 zu lösen. Es wird wie in Beispiel 11.4 vgl. S. 262 erklärt eine Schlupfvariable x 5 für die nicht genutzten Träger eingeführt, die die Kostenfunktion nicht verändert und die Ungleichung in eine Gleichung 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 + x 5 = 300 überführt. Wir leiten für das LGS wieder die Zeilenstufenform her: 2 3 4 5 1 300 1 1 2 4 0 130 5 10 15 20 0 1000 ZSF → 1 0 0 1 1 30 0 1 0 − 3 1 40 0 0 1 3 − 1 30 Aus der ZSF liest man die explizite Lösungsmenge ab: x 4 ≥ 0 und x 5 ≥ 0 sind prinzipiell frei wählbar, die Pivot-Variablen errechnen sich hieraus zu ■ x 1 = 30 − x 4 − x 5 ≥ 0 , ■ x 2 = 40 + 3 x 4 − x 5 ≥ 0 , ■ x 3 = 30 − 3 x 4 + x 5 ≥ 0 Setzt man diese in die Zielfunktion ein, so ergibt sich die reduzierte Zielfunktion 5 x 1 + 6 x 2 + 10 x 3 + 12 x 4 + 0 x 5 = 5(30 − x 4 − x 5 ) + 6(40 + 3 x 4 − x 5 ) + 10(30 − 3 x 4 + x 5 ) + 12 · x 4 + 0 · x 5 = 5 · 30 + 6 · 40 + 10 · 30 + (5 · ( − 1) + 6 · 3 + 10 · ( − 3) + 12) x 4 + (5 · ( − 1) + 6 · ( − 1) + 10 · 1 + 0 · 1) x 5 = 5 · 30 + 6 · 40 + 10 · 30 − ( 5 · 1 + 6 · ( − 3) + 10 · 3 − 12 ) x 4 − ( 5 · 1 + 6 · 1 + 10 · ( − 1) − 0 ) x 5 = 690 − 5 x 4 − x 5 Die spezielle Lösung der ZSF entspricht der schon früher gefundenen x 1 = 30, x 2 = 40, x 3 = 30, x 4 = 0, bei der alle Teile verpackt werden, auch die Träger, d.h. x 5 = 0. 48818_Terveer.indd 269 48818_Terveer.indd 269 18.07.2023 11: 55: 46 18.07.2023 11: 55: 46 <?page no="270"?> 270 11 Lineare Optimierung Diese Rechnung kann wieder in einem Simplex-Tableau zusammengefasst werden: 5 6 10 12 0 5 1 0 0 1 1 30 6 0 1 0 − 3 1 40 10 0 0 1 3 − 1 30 0 0 0 5 1 690 Die Delta-Werte und Kosten berechnen sich wie im Beispiel mit einer freien Variable. Die einzig hinzukommende Rechnung betrifft den Delta-Wert der fünften Spalte: δ 5 = 5 · 1 + 6 · 1 + 10 · ( − 1) − 0 = 1 Diese Rechnung bündelt die obige schreibaufwändige Substitution bei der Berechnung der reduzierten Zielfunktion. Die Kosten lassen sich jetzt auf zwei Arten verringern: ■ Man erhöht x 4 , d.h. verpackt auch Regale vom Typ Bill4. Dann beträgt der x 4 - Engpass min { 30 1 , 30 3 } = 10. Das Simplex-Tableau vervollständigt sich dann zu 5 6 10 12 0 x/ f 5 1 0 0 1 1 30 30 6 0 1 0 − 3 1 40 − 10 0 0 1 3 − 1 30 10 0 0 0 5 1 690 und der Basiswechsel wird am markierten Pivotelement f 34 = 3 durchgeführt. ■ Man erhöht x 5 , d.h. lässt möglichst viele Träger ungenutzt. Dann ist der x 5 -Engpass min { 30 1 , 40 1 } = 30. Das Simplex-Tableau vervollständigt sich dann zu 5 6 10 12 0 x/ f 5 1 0 0 1 1 30 30 6 0 1 0 − 3 1 40 40 10 0 0 1 3 − 1 30 − 0 0 0 5 1 690 und der Basiswechsel wird am markierten Pivotelement f 15 = 1 durchgeführt. Der Wechsel ist einfacher, weil das Pivotelement nicht mehr auf 1 normiert werden muss. Im Simplex-Algorithmus wird pro Schritt stets nur eine Basisvariable gewechselt. Die reduzierte Zielfunktion Z = 690 − 5 x 4 − x 5 zeigt, dass ein zusätzliches Regal Bill4 die Kosten fünfmal stärker verringert als die Verringerung des Verbrauchs um einen Träger. Auf den ersten Blick sollte man also Spalte 4 in die Basis aufnehmen (Prinzip des größten Delta-Wertes) - dies ist auch die ursprüngliche Vorgehensweise von Dantzig. Aber zum einen könnte die starke Abnahme der Kosten durch einen kleinen Engpass abgeschwächt werden, zum anderen könnten ggf. noch wesentlich mehr weitere Basiswechsel nötig sein als bei anderer Wahl der Pivotspalte. Schlimmer noch: es gibt Beispiele, in denen das Prinzip des größten Delta-Wertes dazu führt, dass im weiteren Verlauf eine Basisform hergeleitet wird, die zuvor schon einmal bestimmt wurde [Beale, 1955]. Aus algorithmischer Sicht besteht hier die Gefahr einer Endlosschleife, was sich mit folgender Regel vermeiden lässt[Bland, 1977]: 48818_Terveer.indd 270 48818_Terveer.indd 270 18.07.2023 11: 55: 49 18.07.2023 11: 55: 49 <?page no="271"?> 11.3 Simplex-Algorithmus 271 Bland-Regel: Das Pivotelement f kℓ sollte zur Vermeidung von Zyklen nach folgenden Regeln ausgewählt werden: ■ Pivot-Spalte ℓ : anhand des am weitesten links stehenden δ ℓ > 0, ■ Pivot-Spalte k : anhand des obersten minimalen x k / f kℓ (mit f kℓ > 0). Grundsätzlich könnte man in beiden Regelteilen unabhängig voneinander „links“ bzw. „obersten“ durch „rechts“ bzw. „untersten“ ersetzen. Auch andere vorab pauschal festgelegte Reihenfolgen der n Spaltenindizes sind möglich. Für Handrechnungen stellt das Zykeln in der Regel anders als bei algorithmischen Umsetzungen höchstens ein Ärgernis, aber kein Problem dar (weil das Zykeln ja bemerkt würde), so dass die Auswahl des Pivotelementes unter den Obervoraussetzungen (Delta-Wert > 0, minimaler Engpass dazu) eher willkürlich stattfinden kann. Wir wollen im vorliegenden Beispiel abhängig von der Wahl des Pivotelementes f kℓ die beiden möglichen Rechenwege aufführen, zunächst die Auswahl von f 34 = 3: 5 6 10 12 0 x x/ f 5 1 0 0 1 1 30 30 6 0 1 0 − 3 1 40 − 10 0 0 1 3 − 1 30 10 0 0 0 5 1 690 13 III −−→ 5 6 10 12 0 x 1 0 0 1 1 30 0 1 0 − 3 1 40 0 0 13 1 − 13 10 0 0 0 5 1 690 I − III II + 3 III −−−−−→ IV − 5 III 5 6 10 12 0 x x/ f 5 1 0 − 13 0 43 20 15 6 0 1 1 0 0 70 − 12 0 0 13 1 − 13 10 − 0 0 − 53 0 83 640 Das neue Tableau ist nicht optimal, weil δ 5 = 83 > 0. Spalte 5 wird neue Basisspalte. Nach Berechnung der Engpässe stellt sich f 15 = 43 als neues Pivotelement heraus: 5 6 10 12 0 x x/ f 5 1 0 − 13 0 43 20 15 6 0 1 1 0 0 70 − 12 0 0 13 1 − 13 10 − 0 0 − 53 0 83 640 I · 34 −→ 5 6 10 12 0 x 34 0 − 14 0 1 15 0 1 1 0 0 70 0 0 13 1 − 13 10 0 0 0 0 83 640 III + 13 I −−−−−→ IV − 8 3 III 5 6 10 12 0 0 34 0 − 14 0 1 15 6 0 1 1 0 0 70 12 14 0 14 1 0 15 − 2 0 − 1 0 0 600 Mit dem letzten Tableau ist die Optimallösung gefunden, weil alle Delta-Werte kleiner oder gleich Null sind. Die zugehörige Lösung lautet x 1 = 0 , x 2 = 70 , x 3 = 0 , x 4 = 15 , x 5 = 15 mit minimalen Kosten Z = 600. In der Lösung ist noch die Schlupfvariable x 5 = 15 aufgeführt. Für das Ausgangsproblem wird diese Variable einfach gestrichen. Es folgt die Rechnung bei Auswahl des Pivotelements f 15 : 5 6 10 12 0 x x/ f 5 1 0 0 1 1 30 30 6 0 1 0 − 3 1 40 40 10 0 0 1 3 − 1 30 − 0 0 0 5 1 690 II − I III + I −−−→ IV − I 5 6 10 12 0 x x/ f 0 1 0 0 1 1 30 30 6 − 1 1 0 − 4 0 10 − 10 1 0 1 4 0 60 15 − 1 0 0 4 0 660 Auch hier ist die Optimallösung nach einem Schritt noch nicht erreicht. Mit der Umformung III → 14 III bekommt man 5 6 10 12 0 1 0 0 1 1 30 − 1 1 0 − 4 0 10 14 0 14 1 0 15 − 1 0 0 4 0 660 I − III II + 4 · III −−−−−−→ IV − 4 · III 5 6 10 12 0 x 0 34 0 − 14 0 1 15 6 0 1 1 0 0 70 12 14 0 14 1 0 15 − 2 0 − 1 0 0 600 48818_Terveer.indd 271 48818_Terveer.indd 271 18.07.2023 11: 55: 55 18.07.2023 11: 55: 55 <?page no="272"?> 272 11 Lineare Optimierung [1] Simplex- Tableau zur gegebenen Basisform [2] alle δ j ≤ 0? [3] Wähle δ ℓ > 0 [4] alle f kℓ ≤ 0? [5] Wähle k mit f kℓ > 0 und x k f kℓ = min Lösung gefunden [6] Basiswechsel an f kℓ Problem unlösbar nein nein ja ja Abbildung 11.1: Fluss-Darstellung des Simplex-Algorithmus Der Rechenweg ist fast genau so aufwendig wie der zuerst gewählte. Grundsätzlich gibt es keine Regel, die die erforderliche Anzahl an Basiswechseln so gering wie möglich hält. In Extrembeispielen besucht das Verfahren annähernd jede mögliche Basisform, von denen es bei n Variablen und k Gleichungen bis zu n k Stück geben kann man spricht von exponentieller „Worst-Case“-Laufzeit in n , der Anzahl der Variablen. Dieser Fall wird jedoch in der Praxis eher nicht beobachtet, im Gegenteil ist das Verfahren generell („Average-Case“) sehr schnell, so dass sich der Simplex-Algorithmus auch bei großen Problemen - mit geeigneten Anpassungen - immer noch als effizient erweist. Abschließend behandeln wir ein Beispiel, in dem man anhand des Simplex-Tableaus erkennt, dass keine Optimallösung existiert. Die Nebenbedingungen liegen in Form folgender Gleichungsmatrix vor, die in ZSF überführt wird. 2 3 4 − 10 300 1 1 2 − 5 130 5 10 15 − 30 1000 ZSF → 1 0 0 − 3 30 0 1 0 0 40 0 0 1 − 1 30 Die Zielfunktion sei Z = 5 x 1 + 6 x 2 + 10 x 3 − 30 x 4 . Dazu gehört das Simplextableau 5 6 10 − 30 x x/ f 5 1 0 0 − 3 30 − 6 0 1 0 0 40 − 10 0 0 1 − 1 30 − 0 0 0 5 690 Wegen δ 4 = 5 > 0 ist die Optimallösung nicht erreicht. Zur vierten Spalte gibt es keine Engpässe, weil alle Basisvariablen entweder unabhängig von x 4 sind (hier: x 2 = 40) oder aber mit x 4 zunehmen (hier: x 1 = 30 + 3 x 4 ≥ 0 , x 3 = 30 + x 4 ≥ 0). Der Zielwert kann damit beliebig verringert werden. Das Problem hat keine Lösung, erkennbar daran, dass die f -Werte in Spalte 4 kleiner oder gleich Null sind. 11.3.5 Schematische Darstellung des Simplex-Verfahrens Der Simplex-Algorithmus ist in Abbildung 11.1 schematisch dargestellt. Ausgehend von einem LOP mit Basisform ( F | d ), Basisspalten i 1 , . . . , i k und d j ≥ 0 lauten seine Schritte: 48818_Terveer.indd 272 48818_Terveer.indd 272 18.07.2023 11: 55: 59 18.07.2023 11: 55: 59 <?page no="273"?> 11.3 Simplex-Algorithmus 273 c 1 . . . c ℓ . . . c n x x/ f c i 1 f 11 . . . f 1 ℓ . . . f 1 n d 1 d 1 / f 1 ℓ ... ... ... ... ... ... c i k f k 1 . . . f kℓ . . . f kn d k d k / f kℓ ... ... ... ... ... ... c i m f m 1 . . .f mℓ . . . f mn d m d m / f mℓ δ 1 . . . δ ℓ . . . δ n z δ ℓ = c i 1 · f 1 ℓ + c i 2 · f 2 ℓ + · · · + c i m · f mℓ − c ℓ Abbildung 11.2: Simplex-Tableau und Delta-Werte [1] Stelle das Simplex-Tableau auf (Basisform, δ -Werte) vgl. Abbildung 11.2 . [2] Wenn alle δ j ≤ 0: Optimallösung erreicht (STOP). Sonst Schritt [3]. [3] Wähle ℓ so, dass δ ℓ > 0. [4] Wenn alle f iℓ ≤ 0, ist das Problem unlösbar (STOP). Sonst Schritt [5]. [5] Wähle k so, dass f kℓ > 0 und d k / f kℓ minimal ist. [6] Bestimme durch folgenden Basiswechsel am Pivotelement f kℓ die neue Basisform ( F ′ | d ′ ) mit Basisspalten i 1 , . . . , i k − 1 , ℓ, i k +1 , . . . , i m : [a] Teile die k -te Zeile durch f kℓ : f ′ kj = f kj / f kℓ , d ′ k = d k / f kℓ [b] Subtrahiere von jeder Zeile i ̸ = k das f iℓ -fache der k -ten Zeile: f ′ ij = f ij − f iℓ f ′ kj = f ij − f iℓ f kj / f kℓ d ′ i = d i − f iℓ d ′ k = d i − f iℓ d k / f kℓ [c] Neuberechnung von δ -Werten und Zielwert oder Fortschreibung: Subtrahiere das δ ℓ -fache der k -ten Zeile von der δ -Zeile. Weiter in [1] mit ( F ′ | d ′ ) statt ( F | d ). 11.3.6 Diskussion des Verfahrens Basisformen sind Gleichungsmatrizen, in denen sämtliche Einheitsspalten auftreten. Ihre zugehörigen speziellen Lösungen heißen Basislösungen, die Einheitsspalten selber heißen Basisspalten, die zugehörigen Variablen Basisvariablen. Sind alle Basisvariablen ≥ 0, so heißt die Basislösung und auch die Basisform zulässig. Das Simplex- Tableau erweitert eine zulässige Basisform um Kennzahlen der zugehörigen Basislösung und steuert damit den Basiswechsel im Simplexalgorithmus, so dass die folgende Basislösung, sofern sie gefunden werden kann, zulässig ist und einen kleineren Zielwert hat. Beim Basiswechsel wird genau eine Nichtbasisspalte ℓ (mit δ ℓ > 0) zur Basisspalte der folgenden Basisform („die Spalte ℓ geht in die Basis“) und jeweils genau eine Basisspalte (nämlich eine mit einem minimalen Engpass) zu einer Nichtbasisspalte in der folgenden Basisform („die Spalte verlässt die Basis“). Der Begriff „Basis“ hat in der Vektorrechnung eine eigenständige Bedeutung vgl. S. 299 . Dass man sich auf die Untersuchung bzw. Fortschreibung von Basisformen mit dem Simplex-Algorithmus beschränken kann, rechtfertigt der folgende Satz: Satz 11.1 Ein LOP mit optimaler Lösung hat stets auch eine optimale Lösung, die Basislösung ist. 48818_Terveer.indd 273 48818_Terveer.indd 273 18.07.2023 11: 56: 05 18.07.2023 11: 56: 05 <?page no="274"?> 274 11 Lineare Optimierung Das Verfahren endet in der Regel nach endlich vielen Schritten aufgrund des folgenden Sachverhaltes: Satz 11.2 Sind in einer nicht-optimalen Basislösung alle Basisvariablen ungleich Null, so erhält man durch den Basiswechsel eine Lösung mit strikt kleinerem Zielwert. Denn der Zielwert jeder zulässigen Lösung lässt sich ausgehend vom aktuellen nicht-optimalen Simplextableau gemäß Abbildung 11.2 im Falle von δ ℓ > 0 als Z − ∑ k δ k x k = Z − δ ℓ x ℓ − ∑ k ̸ = ℓ δ k x k schreiben, wobei z der Zielwert der aktuellen Basislösung ist. Die hinten stehende Summe ist Null, denn entweder sind die δ k = 0 (Basisvariablen) oder die x k = 0 (Nichtbasisvariable). Geht nun x ℓ in die Basis, so verringert sich z um den Wert δ ℓ x ℓ > 0, denn δ ℓ > 0 und x ℓ > 0, wenn x ℓ in die Basis geht, weil x ℓ laut Annahme an alle Basislösungen ungleich Null (also > 0) ist. Eine Basislösung mit Basisvariablen mit Wert Null heißt degeneriert. Zyklen treten nach obigem Satz nur (und dann auch nur selten) auf, wenn degenerierte Basislösungen erzeugt werden. Oft wird das Verfahren - gerade bei Problemen mit sehr vielen Variablen - aber sehr langsam. Bei ausschließlich nichtdegenerierten Basislösungen wird der Algorithmus, angesichts von nur endlich vielen Basislösungen auch nach endlich vielen Schritten terminieren - mit einer Optimallösung oder erkennbarer Unlösbarkeit. Übungen zu Abschnitt 11.3 ? 5. Gegeben sei das LGS 2 x 1 − x 2 − x 4 = 13 − 3 x 2 − x 3 − 10 x 4 = 12 − 2 x 1 + x 2 + 2 x 3 + 3 x 4 = 7 a) Stellen Sie die Gleichungsmatrix auf. b) Geben Sie Basislösung und allgemeine Lösung zur Zeilenstufenform an. c) Leiten Sie durch Basiswechsel die übrigen wesentlich verschiedenen Basisformen her. Lesen Sie Basislösungen ab. 6. Zu minimieren ist für x i ≥ 0 der Ausdruck 10 x 1 + 15 x 2 + 30 x 3 + 20 x 4 + 10 x 5 + 30 x 6 unter den Nebenbedingungen − x 1 + x 2 − 2 x 4 − x 5 = 200 x 1 + x 3 + x 4 + x 5 = 200 x 1 − x 4 + x 5 + x 6 = 600 Ermitteln Sie durch Basiswechsel verschiedene (zulässige oder nichtzulässige) Basislösungen zu dem folgenden Optimierungsproblem in Standardform und berechnen Sie jeweils die mit diesen Basislösungen verbundenen Zielfunktionswerte. 7. Im anfänglichen Regalproblem aus Abschnitt 1 (ohne Ungleichung) soll nun der Deckungsbeitrag 65 x 1 + 120 x 2 + 170 x 3 + 230 x 4 maximiert werden. Lösen Sie dieses Problem mittels des Simplex-Verfahrens; nutzen Sie dabei die Zeilenstufenform. 8. Untersuchen Sie mit Hilfe des Simplex- Verfahrens, ob das folgende lineare Programm eine Optimallösung besitzt: 2 x 1 − x 2 + x 3 + 5 x 4 ! = min − x 2 + x 3 + 2 x 4 + x 5 = 2 x 1 + x 3 + 2 x 4 + 2 x 6 = 2 2 x 2 + 2 x 3 + x 7 = 3 x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 ≥ 0 9. Verfahren Sie wie in der vorangegangenen Aufgabe mit dem linearen Programm 2 x 1 − x 2 + x 3 + 5 x 4 ! = min − x 2 + x 3 + 2 x 4 + x 5 = 2 x 1 + x 3 + 2 x 4 + 2 x 6 = 2 x 1 , x 2 , x 3 , x 4 ≥ 0 10. Lösen Sie das Produktionsplanungsproblem aus Aufgabe 1 mittels des Simplex-Verfahrens. 48818_Terveer.indd 274 48818_Terveer.indd 274 18.07.2023 11: 56: 11 18.07.2023 11: 56: 11 <?page no="275"?> 11.4 Zweiphasenmethode 275 2 3 4 5 1 300 1 1 2 4 0 180 5 10 15 20 0 1000 1 0 0 1 1 80 0 1 0 − 3 1 − 60 0 0 1 3 − 1 80 1 0 − 13 0 43 160 3 0 1 1 0 0 20 0 0 13 1 − 13 80 3 1 0 1 4 0 160 0 1 1 0 0 20 0 0 − 1 − 3 1 − 80 3 1 0 0 4 180 − 3 0 1 0 − 4 − 160 1 0 0 1 1 80 − 1 1 0 − 4 0 − 140 1 0 1 4 0 160 1 0 0 1 1 80 0 1 1 0 0 20 14 0 14 1 0 40 34 0 − 14 0 1 40 0 1 1 0 0 20 14 − 14 0 1 0 35 34 14 0 0 1 45 1 13 0 0 43 60 0 1 1 0 0 20 0 − 13 0 1 − 13 20 1 − 1 0 4 0 140 0 1 1 0 0 20 0 1 0 − 3 1 − 60 Abbildung 11.3: Verschiedene Basisformen im Verpackungsbeispiel 11.4 Zweiphasenmethode Der Simplex-Algorithmus benötigt eine Startlösung, die wir im vorangegenen Abschnitt über die Zeilenstufenform des Gleichungssystems der Nebenbedingungen bestimmen konnten. Die Zeilenstufenform ist aber nur in Ausnahmefällen geeignet, denn meist ist die zugehörige Basislösung gar nicht zulässig, weil sie negative Werte beinhaltet. Betrachten wir beispielhaft wieder das Regal-Verpackungsproblem, bei dem nicht alle Regalträger verpackt werden müssen. Jetzt nehmen wir aber an, dass 180 statt 130 Querstangen im Lager sind, führen wieder eine Schlupfvariable für die Träger ein und überführen das Gleichungssystem der Nebenbedingungen in die Zeilenstufenform: 2 3 4 5 1 300 1 1 2 4 0 180 5 10 15 20 0 1000 −→ 1 0 0 1 1 80 0 1 0 − 3 1 − 60 0 0 1 3 − 1 80 Die zugehörige Basislösung x 1 = 80 , x 2 = − 60 , x 3 = 80 , x 4 = 0 , x 5 = 0 ist nicht brauchbar, weil x 2 < 0. Also kann eine erste zulässige Basislösung nicht mit dem Gauß’schen Eliminationsverfahren gefunden werden. Es stellt sich die Frage, ob das Problem überhaupt eine Basisform mit nichtnegativer Basislösung hat. Dies ist in der Tat der Fall. Indem man beispielsweise ausgehend von der Zeilenstufenform verschiedene, nicht vom Simplex-Algorithmus gelenkte Basiswechsel durchführt, könnte man neun Basisformen gemäß Abbildung 11.3 erhalten die Kanten des innen dargestellten Graphen zeigen, welche Basisformen man durch Basiswechsel direkt ineinander überführen kann. Tatsächlich gibt es sogar 54 Basisformen, von denen je 6 dieselbe Basislösung haben und ausschließlich durch Zeilenvertauschungen auseinander hervorgehen. Für jede Basislösung steht oben eine repräsentative Basisform, die Basisspalten sind jeweils hervorgehoben. Für die Spalten 1,4,5 gibt es keine Basisform (daher wird rechts unten in Abbildung 11.3 die Ausgangsgleichungsmatrix dargestellt), weil die Spalten linear abhängig sind vgl. S. 295 . Von den insgesamt 9 Basislösungen haben nur vier ausschließlich nichtnegative Einträge, bei diesen sind oben die rechten Seiten hervorgehoben. Schon in diesem Beispiel ist es sehr aufwändig, eine erste zulässige Basislösung zu finden und wir wollen Sie nicht ermutigen, dies durch Handrechnung und Probieren zu lösen, wenn Sie nicht viel Zeit mitbringen. Erst recht in größeren Optimierungsproblemen gleicht die Suche nach einer ersten zulässigen Basislösung ohne weitere Hilfen der sprichwörtlichen Suche nach der „Nadel im Heuhaufen“. 48818_Terveer.indd 275 48818_Terveer.indd 275 18.07.2023 11: 56: 16 18.07.2023 11: 56: 16 <?page no="276"?> 276 11 Lineare Optimierung Die Zweiphasenmethode ist eine elegante Strategie zur Lösung dieses Problems, weil sie die Suche nach einer zulässigen Basislösung ebenfalls als LOP darstellt und dieses dann löst. Dazu sind folgende vorbereitenden Schritte durchzuführen: ■ Eine Gleichung der Nebenbedingungen, die auf der rechten Seite einen negativen Wert auf, wird mit − 1 multipliziert. Das ist wichtig, weil später die Basislösungen einfach auf der rechten Seite abgelesen werden und ja nicht negativ sein sollen. ■ Fehlende Einheitsspalten werden nun an die anderen Variablenspalten des LGS angehängt, was die Anzahl der Variablen im Problem erhöht. Die zusätzlichen Spalten heißen künstlich, die zugehörigen Variablen künstliche Variablen. Aus der erweiterten Gleichungsmatrix kann man sofort eine Basislösung ablesen. Im obigen Verpackungsbeispiel werden zwei fehlende Einheitsspalten hinzugefügt: : 2 3 4 5 1 300 1 1 2 4 0 180 5 10 15 20 0 1000 2 3 4 5 1 0 0 300 1 1 2 4 0 1 0 180 5 10 15 20 0 0 1 1000 Hierzu gehören nun zwei künstliche Variablen x 6 , x 7 und die zulässige Basislösung x 1 = 0 , x 2 = 0 , x 3 = 0 , x 4 = 0 , x 5 = 300 , x 6 = 180 , x 7 = 1000 Würde der obere rechte Eintrag in der Gleichungsmatrix − 300 statt 300 lauten, so müsste zunächst die erste Zeile mit ( − 1) multipliziert werden und es gäbe dann überhaupt keine Einheitsspalten, so dass drei künstliche Variablen benötigt würden, d.h. 2 3 4 5 1 − 300 1 1 2 4 0 180 5 10 15 20 0 1000 − 2 − 3 − 4 − 5 − 1 1 0 0 300 1 1 2 4 0 0 1 0 180 5 10 15 20 0 0 0 1 1000 Die gewonnene Gleichungsmatrix liegt jetzt in Basisform vor, so dass durch Basiswechsel weitere Basisformen gewonnen werden können. Wenn als Ergebnis dieser Basiswechsel keine der künstlichen Spalten mehr in der Basis ist, kann man die künstlichen Spalten einfach streichen und hat eine Basisform des ursprünglichen Problems. Das Verschieben der Basisspalten aus dem „künstlichen“ in den ursprünglichen Bereich mittels Basiswechsel nennt man Phase 1, die weitere Optimierung Phase 2. In Phase 1 muss eine andere Zielfunktion verwendet werden - die ursprüngliche Zielfunktion hat ja zu wenig Variablen. Die neue Zielfunktion wird so gestaltet, dass der Verbleib von künstlichen Variablen in der Basis so stark wie möglich bestraft wird, die Aufnahme von ursprünglichen Variablen in die Basis hingegen gar nicht. Die Zielfunktion der Phase 1 hat folgende Koeffizienten: ■ Die Variablen des Ausgangsproblems haben Koeffizienten Null. ■ Die künstlichen Variablen haben Koeffizienten Eins. Der Simplex-Algorithmus wird bei dieser Kostenfunktion versuchen, die künstlichen Variablen aus der Basis zu entfernen und durch Ausgangsvariablen zu ersetzen. Das Optimierungsproblem der Phase 1 hat immer eine Lösung, denn die Zielfunktion ist stets ≥ 0. Bei linearen Minimierungsproblemen ist dies aber schon ausreichend dafür, dass es eine Optimallösung gibt, sofern es überhaupt eine zulässige Lösung der Nebenbedingungen gibt - das ist in Phase 1 aber immer der Fall, weil genau zu diesem Zweck die künstlichen Variablen eingeführt wurden. Im obigen Beispiel mit den zwei künstlichen Variablen lautet die zu minimierende Zielfunktion der ersten Phase 0 x 1 + 0 x 2 + 0 x 3 + 0 x 4 + 0 x 5 + 1 x 6 + 1 x 7 . 48818_Terveer.indd 276 48818_Terveer.indd 276 18.07.2023 11: 56: 19 18.07.2023 11: 56: 19 <?page no="277"?> 11.4 Zweiphasenmethode 277 Es wird Phase 1 nach den Vorschriften des Simplex-Algorithmus durchgeführt. Das Starttableau steht rechts, Nr. 1 . Wegen der zahlreichen positiven Delta-Werte gibt es Lösungsvarianten für die Basiswechsel. Bland’s Regel bleibt hier hier nicht unberücksichtigt. Wir bringen Spalte 4 ins die Basis und erhalten Tableau Nr. 2 mit noch zwei positiven Delta-Werten. Mit dem nächsten Basiswechsel verlässt auch die letzte künstliche Variable die Basis. Tableau Nr. 3 ist optimal in Phase 1. In Phase 2 streicht man die künstlichen Spalten und verwendet die ursprüngliche Zielfunktion; Starttableau 4 hat noch einem positiven Delta-Wert. Das Folgetableau 5 ist Optimaltableau. Optimale Lösung ist x 1 = 0 , x 2 = 20 , x 3 = 0 , x 4 = 40 , x 5 = 40 mit Zielwert 600. Gemäß Variable x 5 bleiben 40 Regalträger ungenutzt. Es werden 20 Stück Bill2 und 40 Stück Bill4 gepackt. 1 0 0 0 0 0 1 1 x x f 0 2 3 4 5 1 0 0 300 60 1 1 1 2 4 0 1 0 180 45 1 5 10 15 20 0 0 1 1000 50 6 11 17 24 0 0 0 1180 2 0 0 0 0 0 1 1 x x f 0 34 7 4 3 2 0 1 − 54 0 75 50 0 14 1 4 1 2 1 0 14 0 45 90 1 0 5 5 0 0 − 5 1 100 20 0 5 5 0 0 − 6 0 100 3 0 0 0 0 0 1 1 x x f 0 34 1 4 0 0 1 14 − 3 10 45 0 14 − 14 0 1 0 34 − 1 10 35 0 0 1 1 0 0 − 1 15 20 0 0 0 0 0 − 1 − 1 0 4 5 6 10 12 0 x f 0 34 1 4 0 0 1 45 180 12 14 − 14 0 1 0 35 − 10 0 1 1 0 0 20 20 − 2 1 0 0 0 620 5 5 6 10 12 0 x x f 0 34 0 − 14 0 1 40 12 14 0 14 1 0 40 6 0 1 1 0 0 20 − 2 0 − 1 0 0 600 Wir ändern das Beispiel nochmals ab. Statt 300 stehen jetzt 200 Träger zur Verfügung (nicht komplett zu verbrauchen). Wieder sind zwei künstliche Variablen nötig, was in Phase 1 zu Starttableau 1 führt. In den beiden Basiswechseln bis zum Optimaltableau 3 verlässt nur eine künstliche Variable die Basis. Der Zielwert ist größer als Null, auch das bedeutet, dass noch wenigstens eine künstliche Variable in der Basis ist, eben x 7 . Man findet also keine Basislösung, die ausschließlich aus ursprünglichen Variablen besteht. Das Problem mit 200 Trägern ist unlösbar. 1 0 0 0 0 0 1 1 x x f 0 2 3 4 5 1 0 0 200 50 1 1 1 2 4 0 1 0 130 65 1 5 10 15 20 0 0 1 1000 200 3 6 11 17 24 0 0 0 1130 2 0 0 0 0 0 1 1 x x f 0 12 3 4 1 54 14 0 0 50 40 1 0 − 1 2 0 32 − 12 1 0 30 20 1 − 52 − 54 0 54 − 15 4 0 1 250 200 − 52 − 74 0 11 4 − 17 4 0 0 280 3 0 0 0 0 0 1 1 x 0 12 7 6 1 0 23 − 56 0 25 0 0 − 1 3 0 1 − 13 23 0 20 1 − 52 − 5 6 0 0 − 10 3 − 56 1 225 − 52 − 5 6 0 0 − 10 3 − 11 6 0 225 Zuletzt lösen wir das Transportproblem aus Beispiel 11.2 vgl. S. 260 , in Standardform: Minimiere 7 x 11 +6 x 12 +5 x 13 +5 x 21 +4 x 22 +6 x 23 mit x ij ≥ 0 unter x 11 + x 12 + x 13 = 42, x 21 + x 22 + x 23 = 18, x 11 + x 21 = 15, x 12 + x 22 = 25. Die Tableaus lauten: 48818_Terveer.indd 277 48818_Terveer.indd 277 18.07.2023 11: 56: 26 18.07.2023 11: 56: 26 <?page no="278"?> 278 11 Lineare Optimierung LOP in Standardform Phase 1: Hilfsproblem mit zusätzlichen künstlichen Variablen und künstlicher Kostenfunktion Zielwert in Phase 1 > 0? Problem unlösbar Phase 2: Ausgangsproblem mit Startlösung aus Phase 1 durchführen. ja nein Abbildung 11.4: Fluss-Darstellung der Zweiphasenmethode 1 0 0 0 0 0 0 1 1 x x/ f 0 1 1 1 0 0 0 0 0 42 42 0 0 0 0 1 1 1 0 0 18 − 1 1 0 0 1 0 0 1 0 15 15 1 0 1 0 0 1 0 0 1 25 − 1 1 0 1 1 0 0 0 40 2 0 0 0 0 0 0 1 1 x x/ f 0 0 1 1 − 1 0 0 − 1 0 27 27 0 0 0 0 1 1 1 0 0 18 − 0 1 0 0 1 0 0 1 0 15 − 1 0 1 0 0 1 0 0 1 25 25 0 1 0 0 1 0 − 1 0 25 3 0 0 0 0 0 0 1 1 x 0 0 0 1 − 1 − 1 0 − 1 − 1 2 0 0 0 0 1 1 1 0 0 18 0 1 0 0 1 0 0 1 0 15 0 0 1 0 0 1 0 0 1 25 0 0 0 0 0 0 − 1 − 1 0 4 7 6 5 5 4 6 x x/ f 5 0 0 1 − 1 − 1 0 2 − 6 0 0 0 1 1 1 18 18 7 1 0 0 1 0 0 15 15 6 0 1 0 0 1 0 25 − 0 0 0 3 3 0 373 5 7 6 5 5 4 6 x x/ f 5 1 0 1 0 − 1 0 17 − 6 − 1 0 0 0 1 1 3 3 5 1 0 0 1 0 0 15 − 6 0 1 0 0 1 0 25 25 − 3 0 0 0 3 0 328 6 7 6 5 5 4 6 x 5 0 0 1 0 0 1 20 4 − 1 0 0 0 1 1 3 5 1 0 0 1 0 0 15 6 1 1 0 0 0 − 1 22 0 0 0 0 0 − 3 319 Zur Erläuterung: Eine redundante Nebenbedingung wurde gestrichen. Phase 1 benötigt zwei künstliche Variablen (Tableaus 1 , 2 und 3 ). Die optimale Lösung mit Zielwert Null ergibt für das Ausgangsproblem eine Startlösung durch Streichen der künstlichen Spalten. In der rechten Spalte wird Phase 2 mit der ursprünglichen Kostenfunktion durchgeführt (Tableaus 4 , 5 und 6 ). Bei minimalen Gesamtkosten von 319 (Tausend Euro) müssen 20t von Gebiet 1 zu Röster 3, 15t von Gebiet 2 zu Röster 1, 22t von Gebiet 1 zu Röster 2 und 3t von Gebiet 2 zu Röster 2 transportiert werden. Alle f -Koeffizienten der Tableaus sind 0 , 1 oder − 1. Aus dieser Beobachtung haben sich graphische Algorithmen entwickelt, die direkt auf Grundlage der Kostenmatrix arbeiten (Transporttableau, Zyklenmethode, [Müller-Funk/ Kathöfer, 2017]). Wir fassen die Zweiphasenmethode zusammen, der Ablauf ist in Abbildung 11.4 schematisch dargestellt: [1] Bringe das LOP in Standardform (S), entferne „redundante“ Gleichungen. Überführe durch Zeilenumformungen alle rechten Seiten des LGS in Werte ≥ 0. [2] Phase 1: Ergänze alle fehlenden Einheitsspalten. Löse das Minimierungsproblem mit „künstlicher“ Kostenfunktion mit Simplexalgorithmus. [3] Phase 2: Bei einer Lösung von Phase 1 mit Zielwert > 0 ist das Ausgangsproblem nicht lösbar; anderenfalls erhält man mit der Lösung aus Phase 1 nach Streichen 48818_Terveer.indd 278 48818_Terveer.indd 278 18.07.2023 11: 56: 30 18.07.2023 11: 56: 30 <?page no="279"?> Zusammenfassung der künstlichen Variablen und mit der ursprünglichen Zielfunktion in Phase 2 ■ entweder eine optimale Basislösung und durch Streichen der Schlupfvariablen eine Lösung des Ausgangs-LOP, ■ oder eine Basislösung mit einem δ -Wert δ ℓ > 0 und f -Werten f iℓ ≤ 0. Dann ist die Zielfunktion nach unten unbeschränkt, es gibt keine Optimallösung. Übungen zu Abschnitt 11.4 ? 11. Lösen Sie x 1 + 2 x 2 + 4 x 4 ! = min x i ≥ 0 unter 2 x 1 + 4 x 2 + 3 x 3 + x 4 ≥ − 200 2 x 2 + 2 x 3 + 4 x 4 ≥ − 100 − x 1 + 2 x 2 ≤ 100 x 1 + x 2 + 2 x 4 = 150 12. Ist folgendes LOP lösbar? 10 x 1 + 20 x 2 + 40 x 4 ! = min x i ≥ 0 2 x 1 + 4 x 2 + 3 x 3 + x 4 ≤ 10 2 x 2 + 2 x 3 + 4 x 4 ≤ − 10 − x 1 + 2 x 2 + 2 x 4 ≤ − 10 13. Lösen Sie das LOP in Aufgabe 11.2. 14. Eine Papierfabrik hat soll einen Auftrag für Papierrollen der Breiten 60, 30 und 20 cm, durch Zuschnitte aus möglichst wenig 95cm breiten Rollen erfüllen; folgende Zuschnitte sind möglich: Breite 1 2 3 4 5 6 Auftrag 60 1 1 0 0 0 0 1440 30 1 0 3 2 1 0 2160 20 0 1 0 1 3 4 1080 Zusammenfassung Lineare Optimierungsproblem lassen sich mit dem Simplex-Algorithmus lösen. Dieser überführt die Nebenbedingungen von einer zulässigen Basisform in die nächste, so dass sich der Zielwert dabei stets verringert. Die Basiswechsel orientieren sich an der durch Variablensubstitution erhaltenen reduzierten Zielfunktion (in Gestalt der Delta-Werte) und an den Engpässen der Nichtbasisspalten. Der Simplex-Algorithmus erfordert eine Basisform. Diese kann nach Einführung künstlicher Variablen (fehlender Basisspalten) wieder mit dem Simplex-Algorithmus ermittelt werden. Beide Phasen, die Ermittlung einer Startlösung und die eigentliche Optimierung mit Hilfe dieser Startlösung ergeben zusammen die Zweiphasenmethode. Software-Lösungen (auch) größerer LOP sind z.B. mit Tabellenkalkulationen oder geeigneten Programmbibliotheken möglich. Nach Bearbeitung dieses Kapitels sind Sie in der Lage ■ lineare Optimierungsprobleme in einfachen Sachkontexten herzuleiten und in die Standardform zu überführen, ■ bei Vorliegen einer Startlösung das Simplex-Tableau aufzustellen und mit dem Simplex-Algorithmus zu einer Optimallösung zu überführen oder aber zu erkennen, dass eine solche Optimallösung nicht existiert, ■ die gefundene Lösung wieder in den Sachkontext zu überführen, ■ mit der Zweiphasenmethode eine erste Startlösung zu konstruieren oder zu erkennen, dass das Ausgangsproblem mangels Startlösung nicht lösbar ist. Für weitere Anwendungen und Konzepte im Zusammenhang mit LOP (z.B. ganzzahlige lineare Optimierung, Dualität) sei auf die Literatur verwiesen, empfehlenswert sind z.B. [Bazaraa/ Jarvis/ Sherali , 2010], [Grimme/ Bossek , 2018] oder [Müller- Funk/ Kathöfer, 2017]. 48818_Terveer.indd 279 48818_Terveer.indd 279 18.07.2023 11: 56: 33 18.07.2023 11: 56: 33 <?page no="280"?> 280 11 Lineare Optimierung Übungen zur Vertiefung von Kapitel 11 ? 15. Lösen Sie das LOP und geben Sie auch an, wenn das Problem unlösbar ist. a) x 1 + 2 x 2 + 4 x 3 ! = min x i ≥ 0 x 1 + x 4 = 30 2 x 1 + x 2 − 3 x 3 = 40 b) x 1 + 2 x 2 + 4 x 3 ! = min x i ≥ 0 x 1 + x 4 = − 40 2 x 1 + x 2 − 3 x 3 + x 4 = − 30 c) 4 x 1 + x 2 + 7 x 4 ! = min x 1 ,...,x 4 ≥ 0 x 1 + x 4 = 100 − x 1 + x 3 = 200 x 2 − x 4 = 400 d) 3 x 1 − 4 x 2 + 2 x 3 + x 4 ! = min x 1 ,...,x 4 ≥ 0 x 1 + 3 x 3 + 4 x 4 = 100 − x 1 + x 3 + 3 x 4 = 200 x 2 − 2 x 4 = 400 e) 3 x 1 − 4 x 2 + 2 x 3 + x 4 ! = min x 1 ,...,x 4 ≥ 0 x 1 + 4 x 4 = 100 − x 1 + x 3 + 3 x 4 = 200 x 2 − 4 x 4 = 400 f) 3 x 1 − 4 x 2 + 2 x 3 + x 4 + x 5 ! = min x i ≥ 0 x 1 + 4 x 4 + 5 x 5 = 100 − x 1 + x 3 + 3 x 4 + x 5 = 200 x 2 + 2 x 5 = 400 g) 10( x 1 + 4 x 2 + 2 x 3 + x 4 + x 5 + x 6 ) ! = min x i ≥ 0 unter x 3 − x 4 + 4 x 5 + 2 x 6 = 350 x 2 − 2 x 4 + 4 x 5 = 100 x 1 + x 2 + 2 x 5 + 3 x 6 = 700 16. Gegeben sei das Tableau 3 0 2 − 1 0 1 8 − 1 0 2 0 1 0 2 2 1 0 − 1 0 0 4 5 0 0 − 5 0 0 18 a) Passt das Tableau zur Zielfunktion a1) x 1 + 2 x 2 + 4 x 3 + 2 x 4 + x 5 + x 6 a2) 2 x 1 + 2 x 2 + 4 x 3 + 2 x 4 + x 5 + x 6 a3) x 1 + 2 x 2 + 3 x 3 + 4 x 4 + 5 x 5 + 6 x 6 a4) − 14 x 1 + 18 x 3 + 5 x 4 + 9 x 5 ? b) Berechnen Sie das Folgetableau. 17. Gesucht ist ein Anlage-Portfolio für Rückstellungen von bis zu 30 Mio. e : Anlage A 1 A 2 A 3 Rendite in % 10 5 8 Risikokoeffizient 6 1 3 Das Portfolio soll maximale Rendite bei Höchstrisiko 100 haben. A 1 und A 3 zusammen ergeben maximal 50% von A 2 . a) Stellen Sie das LOP auf. b) Lösen Sie das Problem und interpretieren Sie Ihr Ergebnis. 18. In Duropa sollen von der gemeinsamen Währung Duro(D) je mindestens 1 Million Stück der vier im Umlauf befindlichen Banknoten nachgedruckt werden, dabei je mindestens 30 Millionen D mit 5- und 10- D-Noten, 50 Millionen D mit 10- und 20- D-Noten , 200 Millionen D mit 20- und 50-D-Noten. Die Notendruckerei muss die Vorgaben möglichst kostengünstig bei folgenden Stückkosten umsetzen: Wert 5D 10D 20D 50D Kosten 1D 5D 5D 10D a) Erläutern Sie das LOP x 1 + 5 x 2 + 5 x 3 + 10 x 4 ! = min 5 x 1 + 10 x 2 ≥ 15 10 x 2 + 20 x 3 ≥ 20 20 x 3 + 50 x 4 ≥ 130 x 1 , x 2 , x 3 , x 4 ≥ 0 in Hinblick auf die Aufgabenstellung (die Mindestmengen der vier Werte sind bereits herausgerechnet). b) Wie lautet die Standardform? c) In Phase 2 erhalten Sie das Tableau 1 5 5 10 0 0 0 x 5 12 1 0 0 − 1 10 0 0 32 5 − 14 0 1 0 1 20 − 1 20 0 14 10 1 10 0 0 1 − 1 50 1 50 − 1 50 52 54 0 0 0 − 9 20 − 1 20 − 15 135 4 Bestimmen Sie die fehlenden x f -Werte und führen Sie einen Basiswechsel aus. Stellen Sie das Folgetableau auf. d) Wie lautet die Optimallösung und welche minimalen Kosten ergeben sich für den Druck der Banknoten? (Berücksichtigen Sie die Mindestherstellung! ) 48818_Terveer.indd 280 48818_Terveer.indd 280 18.07.2023 11: 56: 43 18.07.2023 11: 56: 43 <?page no="281"?> 12 Vektoren Übersicht Vektoren als mathematische Formalisierung der Bündelung von ökonomischen Größen werden in diesem Kapitel in den ökonomischen Kontext eingeordnet vgl. Abschnitt 12.1 . Wir besprechen wesentliche Fakten rund um Linearkombinationen vgl. Abschnitt 12.2, S. 287 und erläutern das Konzept der Untervektorräume und ihrer Basen vgl. Abschnitt 12.3, S. 297 . Schließlich werden geometrische Grundkonzepte wie Winkel, Länge und Abstand auf Vektorräumen behandelt vgl. Abschnitt 12.4, S. 303 . Der Abstandsbegriff führt uns zum Prinzip der Projektion, auf dem die Kleinste-Quadrate-Methode der Statistik beruht vgl. Abschnitt 12.5, S. 309 . 12.1 Vektoren und Operationen mit Vektoren Ökonomische Größen wie Preis, Absatz, Nachfrage, Faktoreinsatzmenge können adäquat durch Verwendung reeller Zahlen oder, falls sie zunächst noch unbestimmt sind, durch reelle Variablen beschrieben werden. Vielfach ist man aber gezwungen, simultan mit mehreren dieser Größen zu rechnen: ■ Ein Unternehmen der Fertigungsindustrie stellt in der Regel ein ganzes Bündel von Produkten in verschiedenen Mengen her. ■ Jedem Produkt ist in der Fertigung eine Teileliste, also ein Bündel von Mengenangaben der benötigen Rohstoffe zugeordnet. ■ Der Umsatz einer Unternehmung stellt sich als ein Bündel von Einzelumsätzen dargestellt werden, oft in zeitlicher Entwicklung. ■ Ein Aktien-Portfolio stellt ein Bündel von einzelnen Kapitalanlagen dar. ■ Ein Wahlergebnis besteht in einem Bündel von Stimmanzahlen oder Stimmanteilen. ■ Der Markt für ein bestimmtes Gut wird durch ein Bündel von absoluten oder relativen Marktanteilen der Anbieter erfasst. ■ Zur Untersuchung von Preisindizes und Inflationskennzahlen wird der ökonomische Bedarf von Haushalten durch den so genannten Warenkorb, ein Bündel von Mengen verschiedener repräsentativer Güter beschrieben. ■ Unternehmen verwalten Kundenprofile, welche neben persönlichen Daten den Geschäftsverlauf beinhalten. Zur Beschreibung des jeweiligen ökonomischen Sachverhaltes durch ein geeignetes „Profil“ sind in aller Regel gebündelte Größen, oft in Form von Bündeln reeller Zahlen, erforderlich; die Größen eines Bündels haben zudem meist verschiedene nicht untereinander kompatible Einheiten. 48818_Terveer.indd 281 48818_Terveer.indd 281 18.07.2023 11: 56: 44 18.07.2023 11: 56: 44 <?page no="282"?> 282 12 Vektoren Definition 12.1 ! [1] Es bezeichnet R n die Menge/ Gesamtheit aller Spaltenvektoren mit n Komponenten x 1 ... x n mit Einträgen x 1 , . . . , x n ∈ R. [2] Die Menge aller reellen Zeilenvektoren ( x 1 , . . . , x n ) oder ( x 1 | x 2 | . . . | x n ) wird mit R n bezeichnet. Statt Zeilenvektoren sagt man auch geordnete n -Tupel. [3] Transposition von Vektoren: Für einen Spaltenvektor x ∈ R n , x = x 1 ... x n setzt man x T : = ( x 1 , . . . , x n ) (lies: „ x transponiert“) . [4] Für einen Zeilenvektor y = ( y 1 , . . . , y n ) ∈ R n setzt man y T : = y 1 ... y n . Die Darstellung der Zeilenvektoren mit senkrechten Strichen werden wir vor allem verwenden, wenn die Kommaschreibweise zu Mehrdeutigkeiten bei Dezimaleinträgen führen kann. Beispiel 12.1 (Beispiele für Vektoren in der Ökonomie) ■ Im Regalbau-Beispiel ist durch 300 130 1000 = (300 , 130 , 1000) T der Spaltenvektor der zur Verfügung stehenden Rohstoffmengen „Träger, Querstangen, Regalböden“ festgelegt. Der zugehörige Spaltenvektor der Endproduktmengen (Regaltypen) mit maximalem Deckungsbeitrag lautet 20 70 0 10 = (20 , 70 , 0 , 10) T . ■ Drei Produkte eines Unternehmens erzielten im Jahr 2004 den Umsatz-Zeilenvektor (35000 , 17300 , 40000) (Angaben in 1000 e ). ■ Am 22.10.1997 konnte man am Schalter eines deutschen Bankhauses für 100 DM folgende Devisen erwerben (Angabe als Spaltenvektor): 54 , 05 US-Dollar 33 , 39 brit. Pfund 323 , 62 frz. Franc ■ Bei einer Wahl stellen sich vier Parteien. Für zwei ausgezählte Stimmbezirke lauten die absoluten Stimmenzahlen in Form von Vektoren 1000 1500 300 1200 , 2000 3000 600 2400 . ■ Bei einer Umfrage unter Absolventen in einem wirtschaftswissenschaftlichen Studiengang werden Studiendauer, durchschnittliche monatliche finanzielle Förderung und die Abschlußnote festgehalten. Dabei wurden auch folgende zwei Profile angegeben: 13 Semester 400 e 3 , 3 , 10 Semester 450 e 1 , 7 ■ Auf dem Mobilkommunikations-Markt des Inselstaates Wiwinesien treten vier Anbieter auf. Im vierten Quartal 2001 ergibt eine Marktuntersuchung die in Tabelle 12.1 angegebenen Daten. Jede der fünf numerischen Spalten in der Tabelle kann als Spaltenvektor des R 4 aufgefasst werden, jede Zeile zu einem Mobilfunkanbieter als Zeilenvektor des R 5 . Die Darstellung der relativen Marktanteile in der letzten Spalte von Tabelle 12.1 nennt man einen stochastischen Vektor. 48818_Terveer.indd 282 48818_Terveer.indd 282 18.07.2023 11: 56: 49 18.07.2023 11: 56: 49 <?page no="283"?> 12.1 Vektoren und Operationen mit Vektoren 283 Anbieter Netzabdeckung Preis des Kundenzahl im Standardtarif in Prozent Standardtarifs absolut in Prozent relativ Tekom 99 12,50 3.000.000 60 35 E-Minus 95 10,50 500.000 10 1 10 D2 12 97 12,00 900.000 18 9 50 Intracom 98 11,00 600.000 12 3 25 Gesamt 5.000.000 100 1 Tabelle 12.1: Markt-Daten eines (fiktiven) Mobilfunkmarktes Definition 12.2 ! Ein Vektor p = ( p 1 , . . . , p n ) T ∈ R n mit folgenden Eigenschaften heißt stochastischer Vektor, wenn gilt: [1] p i ≥ 0 für alle i = 1 , . . . , n , [2] p 1 + · · · + p n = 1 Stochastische Vektoren als Bündel von Marktanteilen finden sich insbesondere auch in Wahlanalysen; sie werden benötigt, wenn Anteile bzw. relative Häufigkeiten gemessen werden. Im Rahmen der Modellierung beschreiben sie - im diskreten Kontext - subjektive bzw. objektive Wahrscheinlichkeiten. Auch Zeilenvektoren mit den genannten Eigenschaften werden als stochastische Vektoren bezeichnet. Vektoren werden in der Schule um ihrer physikalischen Anwendungen willen zumeist analytisch-geometrisch eingeführt. Man stellt sie in der Anschauungsebene und dem Anschauungsraum mit Pfeilen dar, die einen Start- und einen Zielpunkt ausweisen. Pfeile gleicher Länge und Orientierung werden miteinander identifiziert. Bei den ökonomischen Anwendungen der Vektorrechnung liegt jedoch der Aspekt der Bündelung ökonomischer Größen eindeutig im Vordergrund, daher verzichten wir auch darauf, Vektoren mit Pfeilen zu bezeichnen. Allerdings werden Richtungen bzw. Richtungsvektoren später in der Analysis auch noch eine Rolle spielen vgl. Abschnitt 14.4.1, S. 390 . 12.1.1 Elementare Operationen mit Vektoren Vektoren werden erst dadurch zu einem brauchbaren Instrument (auch in der Ökonomie), dass man sie mittels geeigneter Operationen in andere Vektoren überführen kann. Addition und Multiplikation reeller Zahlen führen zu den wichtigsten Verknüpfungstypen für Vektoren: Definition 12.3 (Vektoraddition) ! Für x = ( x 1 , . . . , x n ) T ∈ R n , y = ( y 1 , . . . , y n ) T ∈ R n setzt man x + y : = x 1 ... x n + y 1 ... y n = x 1 + y 1 ... x n + y n Ganz entsprechend verfährt man mit der Addition von Zeilenvektoren. 48818_Terveer.indd 283 48818_Terveer.indd 283 18.07.2023 11: 56: 52 18.07.2023 11: 56: 52 <?page no="284"?> 284 12 Vektoren Beispiel 12.2 Bei der Addition der Bezirks-Stimmanteile aus dem Eingangsbeispiel ergibt sich 1000 1500 300 1200 + 2000 3000 600 2400 = 1000 + 2000 1500 + 3000 300 + 600 1200 + 2400 = 3000 4500 900 3600 Definition 12.4 (Skalarmultiplikation von Vektoren) ! Für ( x 1 , . . . , x n ) T ∈ R n und α ∈ R setzt man αx : = α x 1 ... x n = αx 1 ... αx n ∈ R n (entsprechend für Zeilenvektoren). α ∈ R heißt in diesem Zusammenhang Skalar. Beispiel 12.3 zur Skalarmultiplikation: Wollte man am 22.10.1997 bei besagtem Bankhaus Devisen für 800 DM, d.h. für den achtfachen angegebenen Wert erwerben, so hätte dies für die verschiedenen Währungen folgende Beträge gegeben: 8 · 54 , 05 33 , 39 323 , 62 = 8 · 54 , 05 8 · 33 , 39 8 · 323 , 62 = 432 , 4 (US-Dollar) 267 , 12 (brit. Pfund) 2588 , 96 (franz. Franc) Durch Operationen auf Vektoren lassen sich also anschauliche Einzelrechnungen effizient zusammenfassen. Dies ist nicht nur händisch sinnvoll, sondern kann gerade bei umfangreicheren Problemen informationstechnisch ausgenutzt werden, weil Programmiersprachen oft in der Lage sind, mit Vektoren als Objekten zu operieren, und der übliche Additions- und Multiplikations-Kalkül von reellen Zahlen intuitiv auf Vektoren übertragen werden kann: Satz 12.1 (Regeln für Vektoraddition und Skalarmultiplikation) V1. Für alle x, y, z ∈ R n gilt: [a] x + ( y + z ) = ( x + y ) + z (Assoziativgesetz) [b] x + y = y + x (Kommutativgesetz) V2. Der Nullvektor ¯0 : = 0... 0 = (0 , . . . , 0) T ∈ R n hat folgende Eigenschaften [a] x + ¯0 = x für alle x ∈ R n . ¯0 wird auch als neutrales Element der Vektoraddition bezeichnet. [b] Für alle x ∈ R n ist − x = ( − 1) x ∈ R n und x + ( − x ) = ¯0. (inverses Element der Vektoraddition). V3. Für alle α, β ∈ R und alle x ∈ R n gilt: α ( βx ) = ( αβ ) x und 1 x = x 48818_Terveer.indd 284 48818_Terveer.indd 284 18.07.2023 11: 56: 57 18.07.2023 11: 56: 57 <?page no="285"?> 12.1 Vektoren und Operationen mit Vektoren 285 V4. Für alle α, β ∈ R und x, y ∈ R n gelten die Distributivgesetze: [a] α ( x + y ) = αx + αy [b] ( α + β ) x = αx + βx 12.1.2 Vektorräume Neben den besprochenen Mengen R n und R n gibt es in der Mathematik zahllose weitere Mengen L, in denen Rechenoperationen vom Typ Vektoraddition und Multiplikation mit Skalaren erklärt sind und die Eigenschaften V1-V4 gelten. Definition 12.5 ! Eine Menge L von Objekten heißt R-Vektorraum, wenn auf ihr die Operationen Vektoraddition und Skalarmultiplikation (mit Skalaren aus R), die nicht aus L herausführen, sowie ein spezifischer Vektor ¯0 als Nullvektor erklärt sind, welche V1 bis V4 genügen. Beispiele von Vektorräumen (neben R n und R n ) sind ■ die Menge aller R-wertigen Folgen, vorstellbar als Tupel ( x 1 , x 2 , x 3 , . . . ) mit unendlich vielen Komponenten. - Die Vektoraddition zweier Folgen ( x 1 , x 2 , x 3 , . . . ) und ( y 1 , y 2 , y 3 , . . . ) ergibt die Folge ( x 1 + y 1 , x 2 + y 2 , x 2 + y 3 , . . . ). - Die skalare Multiplikation von ( x 1 , x 2 , x 3 , . . . ) mit α ∈ R ergibt die Folge ( αx 1 , αx 2 , αx 3 , . . . ). - Der Nullvektor ist die Folge (0 , 0 , 0 , . . . ) mit lauter Null-Einträgen. ■ die Menge aller Funktionen auf einem gegebenen Intervall [ a, b ] - Die Vektoraddition zweier Funktionen f, g : [ a, b ] → R ergibt die Funktion h : [ a, b ] → R, h ( x ) = f ( x ) + g ( x ) - Die skalare Multiplikation einer Funktion f : [ a, b ] → R mit einem Skalar α ∈ R ergibt die Funktion h : [ a, b ] → R, h ( x ) = αf ( x ). - Der Nullvektor ist die Funktion f : [ a, b ] → R, f ( x ) = 0 Auch wenn Folgen und Funktionen im ökonomischen Kontext eine große Rolle spielen, werden wir sie hier aber nicht unter dem Vektorraum-Aspekt behandeln. Die Tupel- Vektorräume R n und R n tragen neben den später noch behandelten Matrizen-Mengen eine viel größere Bedeutung, ebenso wie Teilmengen L ⊆ R n , die selber Vektorräume sind, d.h. die folgende drei Eigenschaften haben: [1] Der Nullvektor ¯0 liegt in L. [2] Liegen zwei Vektoren x, y in L, so auch deren Summe x + y . [3] Liegt ein Vektor x in L, so auch ein beliebiges skalar Vielfaches αx . Beispiel 12.4 Wir betrachten die Menge L = { ( s, t, s − t ) T : s, t ∈ R } ⊂ R 3 derjenigen Vektoren im R 3 , bei denen die dritte Komponente Differenz der ersten beiden ist. Wir untersuchen, ob es sich bei L um einen R-Vektorraum handelt, indem wir die Anforderungen an einen R-Vektorraum prüfen: [1] Es ist (0 , 0 , 0) T ∈ L, man wähle hierzu s = t = 0. 48818_Terveer.indd 285 48818_Terveer.indd 285 18.07.2023 11: 57: 03 18.07.2023 11: 57: 03 <?page no="286"?> 286 12 Vektoren [2] Sind x = ( s 1 , t 1 , s 1 − t 1 ) T ∈ L und y = ( s 2 , t 2 , s 2 − t 2 ) T ∈ L, so liegt auch x + y ∈ L, denn x + y = s 1 + s 2 t 1 + t 2 ( s 1 + s 2 ) − ( t 1 + t 2 ) = s t s − t mit s = s 1 + s 2 und t = t 1 + t 2 . [3] Wenn x = ( s 1 , t 1 , s 1 − t 1 ) T ∈ L und t ∈ R, dann liegt auch αx in L, denn αx = α s 1 t 1 , s 1 − t 1 = αs 1 αt 1 αs 1 − αt 1 = s t s − t mit s = αs 1 , t = αt 1 Insgesamt ist L also ein R-Vektorraum und lässt sich schreiben als Menge der Vektoren x 1 x 2 x 3 = s t s − t = s 101 + t 01 − 1 mit beliebigen Skalaren s, t ∈ R. Beispiel 12.5 Wir betrachten die Menge L = { ( s, t, st ) T : s, t ∈ R } ⊂ R 3 , d.h. die Menge derjenigen Vektoren im R 3 , bei denen die dritte Komponente das Produkt der ersten beiden ist. Wir prüfen der Reihe nach die Anforderungen an einen R-Vektorraum. [1] Der Nullvektor liegt in L (man setze s = t = 0). [2] Die Summe zweier Vektoren aus L muss nicht in L liegen. Beispielsweise liegen x = (1 , 1 , 0) T und y = (2 , 1 , 2) T in L, nicht aber x + y = (3 , 2 , 2) T . Die dritte Komponente 2 ist nicht das Produkt der ersten beiden Komponenten 3 und 2. [3] Auch die skalare Vervielfachbarkeit wird von L nicht erfüllt, beispielsweise liegt der Vektor (2 , 1 , 2) T in L, mit α ̸∈ { 0 , 1 } nicht aber der Vektor α (2 , 1 , 2) T = (2 α, α, 2 α ) T , dann müsste nämlich die dritte Komponente Produkt der ersten beiden sein, also müsste gelten 2 α = (2 α ) α = 2 α 2 . Das ist nur für α ∈ { 0 , 1 } richtig. Insgesamt ist L kein R-Vektorraum. Schon nach der Prüfung der zweiten Anforderung war dieser Sachverhalt geklärt. Beispiel 12.6 Wir betrachten die Menge L = { ( x 1 , x 2 , x 3 ) T ∈ R 3 : 2 x 1 + 5 x 2 − x 3 = 0 } . Diese Teilmenge des Anschauungsraumes ist ein R-Vektorraum, denn: [1] ¯0 = (0 , 0 , 0) T liegt in L, erfüllt die vorgegebene lineare Gleichung. [2] Vektoren x = ( x 1 , x 2 , x 3 ) T und y = ( y 1 , y 2 , y 3 ) T in L erfüllen 2 x 1 + 5 x 2 − x 3 = 0 bzw. 2 y 1 + 5 y 2 − y 3 = 0. Dann erfüllt auch z = ( z 1 , z 2 , z 3 ) = x + y = ( x 1 + y 1 , x 2 + y 2 , x 3 + y 3 ) T die Gleichung und liegt in L, denn 2 z 1 + 5 z 2 − z 3 wird zu 2( x 1 + y 1 ) + 5( x 2 + y 2 ) − ( x 3 + y 3 ) = (2 x 1 + 5 x 2 − x 3 ) + (2 y 1 + 5 y 2 − y 3 ) = 0 [3] Ist x = ( x 1 , x 2 , x 3 ) T ein Vektor in L und erfüllt somit die Gleichung 2 x 1 + 48818_Terveer.indd 286 48818_Terveer.indd 286 18.07.2023 11: 57: 11 18.07.2023 11: 57: 11 <?page no="287"?> 12.2 Koordinatensysteme und Linearkombinationen 287 5 x 2 − x 3 = 0, so auch ein beliebiges skalar Vielfaches z = ( z 1 , z 2 , z 3 ) T = αx = ( αx 1 , αx 2 , αx 3 ) T von x , denn 2 z 1 + 5 z 2 − z 3 = 2( αx 1 )+ 5( αx 2 ) − ( αx 3 ) = α (2 x 1 + 5 x 2 − x 3 ) = 0 Dieses Beispiel steht stellvertretend für einen allgemeinen Sachverhalt: Satz 12.2 Die Lösungsmenge eines homogenen linearen Gleichungssystems, geschrieben als Menge von Zeilenvektoren (bzw. Spaltenvektoren) ist ein R-Vektorraum. Ist A die Koeffizientenmatrix des homogenen LGS, so wird dieser R-Vektorraum auch als Kern von A bezeichnet, in Formelschreibweise: L = Kern ( A ). Dies lässt sich genau wie in dem vorliegenden Beispiel nachrechnen, ist aber in allgemeiner Schreibweise erheblich aufwendiger. Weil homogene lineare Gleichungssysteme häufig als technische Hilfsmittel in der Ökonomie auftreten, ist das Verständnis ihrer Lösungsmengen von hoher Bedeutung. Wir werden diese später noch genauer untersuchen vgl. Abschnitt 12.3, S. 297 . Künftig werden wir statt von einem R-Vektorraum meist von einem Vektorraum sprechen und den Vorsatz Rweglassen, da eigentlich alle ökonomisch relevanten Vektorräume auf R als Menge der Skalare basieren - zuweilen werden noch komplexe Zahlen als mögliche Skalare verwendet, worauf wir aber nicht näher eingehen werden. Übungen zu Abschnitt 12.1 ? 1. Seien α 1 = 3 , α 2 = 2 und a = 12 , b = 23 , c = 123 , d = 234 . Berechnen Sie, falls möglich: a) a + b b) b − a c) a + b T d) a T + b T e) b T − a T f) a − c g) d T − c h) α 2 b − α 2 a i) α 1 a + α 1 b j) α 1 c + α 2 c k) α 1 a − α 2 b T l) α 1 c + 4 α 1 d 2. Betrachten Sie die Tabelle 12.1 vgl. S. 283 zum fiktiven Mobilfunkmarkt auf Wiwinesien. Berechnen Sie den durchschnittlichen Preis, welchen ein Kunde für den Standardtarif zu zahlen hat. 3. Prüfen Sie, welche Mengen jeweils R- Vektorräume sind (dabei sei t ∈ R) a) { ( x 1 , x 2 ) T ∈ R 2 : x 1 + 2 x 2 = t } , b) { ( x 1 , x 2 ) ∈ R 2 : x 21 − 2 tx 1 x 2 + x 22 = 0 } , c) { ( x 1 , x 2 , x 3 ) T ∈ R 3 : x 21 = x 2 x 3 } , d) { ( x 1 , x 2 , x 3 ) T ∈ R 3 : x 1 ∈ Z } , e) { ( x 1 , . . . , x 5 ) T ∈ R 5 : a ( x 3 − x 5 ) = 2 x 1 + x 2 + x 4 , x 1 + ax 3 = 2 x 4 − x 5 } . 4. Ist die Menge L der differenzierbaren Funktionen f : [ a, b ] → R auf einem gegebenen Intervall ein R-Vektorraum? Welche Ableitungsregeln werden benötigt? 12.2 Koordinatensysteme und Linearkombinationen Vektoren stellt man im R 2 und R 3 gewöhnlich in einem Kreuz aus senkrecht aufeinander stehenden mit einer Messskala versehenen Achsen dar. Die Vektoraddition in Anschauungsebene R 2 und Anschauungsraum R 3 lässt sich geometrisch mit Hilfe von Parallelogrammen, die Skalarmultiplikation mittels Punktstreckung durchführen. In Abbildung 12.1 sind diese Grundoperationen für Vektoren des R 2 veranschaulicht. 48818_Terveer.indd 287 48818_Terveer.indd 287 18.07.2023 11: 57: 18 18.07.2023 11: 57: 18 <?page no="288"?> 288 12 Vektoren Abbildung 12.1: Illustration der Vektoraddition und der Skalarmultiplikation in R 2 , der Anschauungsebene Die Komponenten eines Vektors nennt man mit Bezug auf die Darstellung in einem Koordinatensystem auch Koordinaten, zu jeder von diesen gehört eine Achse des Koordinatensystems, die man deshalb auch Koordinatenachse nennt. Jeder Vektor, der einem Punkt auf einer Koordinatenachse entspricht, wird als Koordinatenvektor bezeichnet. Gemäß der Messskala ist hierbei der Koordinatenvektor zur Standard-Einheit besonders ausgezeichnet, man nennt ihn Koordinateneinheitsvektor oder einfach Einheitsvektor. Im R 2 sind dies die Vektoren (1 , 0) T und (0 , 1) T , im R 3 sind es (1 , 0 , 0) T , (0 , 1 , 0) T und (0 , 0 , 1) T . Die Koordinaten eines beliebigen Vektors x = ( x 1 , x 2 ) T in der Anschauungsebene lassen sich ablesen, indem man jeweils das Lot auf die Kordinatenachsen fällt. Diesem Ablesevorgang entspricht das „Zerlegen“ des Vektors mit Hilfe der Koordinateneinheitsvektoren x 1 x 2 = x 1 10 + x 2 01 Man nennt dies die Koordinatendarstellung des Vektors, im Anschauungsraum x 1 x 2 x 3 = x 1 100 + x 2 010 + x 3 001 Für reale ökonomische Anwendungen reicht die Beschränkung auf Vektoren mit höchstens drei Komponenten allerdings nicht aus, da die zugrundeliegenden Profile meist deutlich aufwendiger sind. Man ist daher gezwungen, auch solche Vektoren in Koordinatensystemen darzustellen, die vier oder mehr Komponenten aufweisen. Völlig entsprechend verwendet man die Bezeichnung Einheitsvektor dann wie folgt: Definition 12.6 ! Unter den Einheitsvektoren des R n versteht man die Vektoren e (1) : = 100... 00 , e (2) : = 010... 00 , . . . , e ( n ) : = 000... 01 . Entsprechend ist der Einheitsvektor im Zeilenraum R n erklärt. Auch in den nicht mehr geometrisch vorstellbaren Vektorräumen, d.h. für n ≥ 4, legen e (1) , . . . , e ( n ) ein Koordinatensystem im folgenden Sinne fest: 48818_Terveer.indd 288 48818_Terveer.indd 288 18.07.2023 11: 57: 23 18.07.2023 11: 57: 23 <?page no="289"?> 12.2 Koordinatensysteme und Linearkombinationen 289 Abbildung 12.2: Illustration der Darstellung von Vektoren als Linearkombination in „schiefen“ Koordinatensystemen. Im Beispiel ist (1 , 9; 1 , 35) T = 1 , 3 · (2 , 12 ) T + 0 , 7 · ( − 1; 1) T . ■ Jeder Vektor x = ( x 1 , . . . , x n ) T ∈ R n lässt sich durch Skalare und Einheitsvektoren des R n darstellen: x = x 1 e (1) + x 2 e (2) + . . . + x n e ( n ) . ■ Die Koordinatendarstellung ist eindeutig: Falls x = a 1 e (1) + . . . + a n e ( n ) und x = b 1 e (1) + . . . + b n e ( n ) , so gilt a 1 = b 1 , . . . , a n = b n . In Anschauungsebene und Anschauungsraum stellen das Ablesen von Koordinaten auf den Koordinatenachsen und die Koordinatendarstellung eines Vektores mit den Einheitsvektoren denselben Sachverhaltes. Mit den Einheitsvektoren ist sowohl die Lage der Achsen festgelegt als auch die Position der Eins auf der Messskala. Umgekehrt liegen die Einheitsvektoren als Punkte genau auf den Eins-Stellen der Messskalen. Für n ≥ 4 sind die n Einheitsvektoren insofern ein rechnerisches Äquivalent für die nicht mehr visualisierbaren geometrischen Koordinatenachsen. Bei der Umsetzung von Anwendungsfragen kann man aber oft nicht einfach auf Einheitsvektoren e (1) , . . . , e ( n ) zurückgreifen, sondern ist gezwungen, anstelle der Einheitsvektoren mit nicht senkrecht aufeinander stehenden und nicht gleich langen Koordinatenvektoren a (1) , . . . , a ( m ) zu rechnen, wobei zudem die Anzahl m dieser Vektoren nicht zwangsläufig der Anzahl n der Komponenten entsprechen muss. Man hat also „schiefe“ Koordinatenachsen und möchte wissen, ob und wie die Koordinatendarstellung anderer Vektoren möglich in diesem Koordinatensystem möglich ist. In Abbildung 12.2 ist dies für die Anschauungsebene illustriert. Dass dies auch in ökonomischem Kontext Anwendung findet, sei an Beispielen aus der Produktion und der Statistik verdeutlicht. Beispiel 12.7 (Fortsetzung von Beispiel 10.1 vgl. S. 248 ) Hier gehören zu jedem Regaltyp Teilelisten für Stellwangen, Querstangen und Böden. Diese lassen sich regaltypabhängig als Vektoren 215 , 31 10 , 42 15 , 54 20 darstellen. Um die vorhandenen Rohstoffe in Form des Vektors (300 , 130 , 1000) T aufzubrauchen, muss man das LGS 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 = 300 x 1 + x 2 + 2 x 3 + 4 x 4 = 130 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 = 1000 lösen. Dies ist gleichbedeutend damit, den Rohstoffvektor im Koordinatensystem der 48818_Terveer.indd 289 48818_Terveer.indd 289 18.07.2023 11: 57: 27 18.07.2023 11: 57: 27 <?page no="290"?> 290 12 Vektoren Tankstelle Gewinn Umsatz Kraftstoff Sonstige 1 3 6 7 2 4 2,5 6 3 2 8,5 5 4 3 6,5 7 5 3,5 9,5 7,5 Tabelle 12.2: Daten zum Tankstellenbeispiel 12.9, Angaben in Tausend Euro. Teilelisten-Vektoren darzustellen: 300 130 1000 = x 1 215 + x 2 31 10 + x 3 42 15 + x 4 54 20 Zusätzlich muss im ökonomischen Kontext x i ≥ 0 (und sogar x i ∈ N 0 ) gelten. Die Darstellung ist nicht eindeutig, weshalb zusätzlich eine ökonomisch vorteilhafte Darstellung gesucht wird, etwa diejenige mit maximalem Deckungsbeitrag. Beispiel 12.8 (Fortsetzung von Beispiel 10.2 vgl. S. 250 ) Zu jedem Schnittmuster gehören Listen mit den aus den Mustern sich ergebenden Anzahlen der drei Rollen, d.h. die Produktlisten 110 , 101 , 030 , 021 , 013 , 004 Um die Schnittmuster für die geforderten Rollenanzahlen (1440 , 2160 , 1080) T zu berechnen, ist das LGS x 1 + x 2 = 1440 x 1 + 3 x 3 + 2 x 4 + x 5 = 2160 x 2 + x 4 + 3 x 5 + 4 x 6 = 1080 zu lösen. Gleichwertig hierzu ist die Darstellung des erstrebten Produktvektors im Koordinatensystem der sechs Schnittmuster-Produktlisten , d.h. 1440 2160 1000 = x 1 110 + x 2 101 + x 3 030 + x 4 021 + x 5 013 + x 6 004 Auch hier sucht man unter den mehreren (ganzzahligen) Lösungen eine optimale, z.B. mit geringstem Rollenverbrauch x 1 + x 2 + x 3 + x 4 + x 5 + x 6 . Im nächsten Beispiel wird die Koordinatendarstellung mit einer „zu kleinen“ Anzahl von Koordinatenvektoren gesucht. Dies ist typisch für Fragestellungen der Regression: Beispiel 12.9 (Statistik) Der Inhaber einer Kette von fünf freien Tankstellen möchte wissen, inwiefern sich der Gewinn der Tankstellen aus den Umsätzen der Sparten Kraftstoffe (K), und Sonstige (S) darstellen lässt. Hieraus erhofft er sich Informationen über die Rentabilität eventueller Investitionen (weitere Kraftstoffe, frische Brötchen im Food-Bereich 48818_Terveer.indd 290 48818_Terveer.indd 290 18.07.2023 11: 57: 33 18.07.2023 11: 57: 33 <?page no="291"?> 12.2 Koordinatensysteme und Linearkombinationen 291 usw.). Von den fünf - in Lage und Ausstattung gleichwertigen - Tankstellen liegen Umsätze und Gewinne eines speziellen Tages vor, die in Tabelle 12.2 wiedergegeben sind. Stellt man die Gewinne und Umsätze in den Vektoren g = g 1 g 2 g 3 g 4 g 5 = 3423 3 , 5 u (1) = u (1) 1 u (1) 2 u (1) 3 u (1) 4 u (1) 5 = 6 2 , 5 8 , 5 6 , 5 9 , 5 u (2) = u (2) 1 u (2) 2 u (2) 3 u (2) 4 u (2) 5 = 7657 7 , 5 dar, so könnte man versuchen, den Gewinn der j -ten Tankstelle, d.h. g j in der Form g j = α 0 + α 1 · u (1) j + α 2 · u (2) j mit für alle fünf Tankstellen gültigen Faktoren α 0 , α 1 , α 2 ∈ R zu schreiben. Diese Koeffizienten wären dann Lösung des folgenden LGS 3 = α 0 + 6 α 1 + 7 α 2 4 = α 0 + 2 , 5 α 1 + 6 α 2 2 = α 0 + 8 , 5 α 1 + 5 α 2 3 = α 0 + 6 , 5 α 1 + 7 α 2 3 , 5 = α 0 + 9 , 5 α 1 + 7 , 5 α 2 α 1 , α 2 geben dabei die Anteile der beiden Spartenumsätze an, die als Gewinn anfallen, sollte das Modell gültig sein. α 0 ist ein unabhängig von den Spartenumsätzen angenommener „Sockelgewinn“. Der Sinn eines solchen Ansatzes ist eine „Überschlagsrechnung“ anstelle einer endgültigen formal korrekten Verbuchung von Umsätzen und Kosten interessiert. Wir können die obigen fünf Erklärungsgleichungen in Vektorschreibweise g = α 0 u (0) + α 1 u (1) + α 2 u (2) mit u (0) = (1 | 1 | 1 | 1 | 1) T bringen; ausgeschrieben lauten sie: 3423 3 , 5 = α 0 11111 + α 1 6 2 , 5 8 , 5 6 , 5 9 , 5 + α 2 7657 7 , 5 Ziel ist hier also - aus mathematischer Sicht - eine Darstellung des Gewinnvektors g in drei Koordinaten, die sich aus einem Sockelgewinns und den Spartenumsätzen ergeben. Die drei Vektoren reichen aber zur Koordinatendarstellung nicht aus, denn das obige LGS ist nicht lösbar; es wird sich bei jeder Tankstelle j eine Abweichung e j ergeben e j = g j − ( α 0 + α 1 u (1) j + α 2 u (2) j ) d.h. g j = α 0 + α 1 u (1) j + α 2 u (2) j + e j In Vektorschreibweise gilt dann 3423 3 , 5 = α 0 11111 + α 1 6 2 , 5 8 , 5 6 , 5 9 , 5 + α 2 7657 7 , 5 + e 1 e 2 e 3 e 4 e 5 . Statt eine exakte Darstellung des Gewinns aus den Umsätzen zu berechnen, sucht 48818_Terveer.indd 291 48818_Terveer.indd 291 18.07.2023 11: 57: 41 18.07.2023 11: 57: 41 <?page no="292"?> 292 12 Vektoren man jetzt nach Koeffizienten α 0 , α 1 , α 2 mit denen der Fehlervektor ( e 1 , . . . , e 5 ) T möglichst nahe bei Null liegende Einträge hat. Präziser versucht man den Ausdruck e 21 + · · · + e 25 so klein wie möglich zu machen. Es handelt sich bei der vorliegenden Fragestellung um ein Beispiel aus dem Bereich der Regressionsanalyse, welche thematisch in die Statistik gehört, vgl. etwa [Schira, 2003]. Wir werden später wieder auf dieses Beispiel zurückkommen dabei die Einordnung von Regressionsaufgaben in die Vektor-, Matrizen- und Differentialrechnung vornehmen vgl. S. 298 , vgl. S. 315 . In der Mathematik hat sich für die in den Beispielen genannten Koordinatendarstellungen der Begriff „Linearkombination“ eingebürgert. Definition 12.7 (Linearkombinationen von Vektoren) ! Es seien a (1) , . . . , a ( m ) Vektoren des R n . [1] Ein Vektor x ∈ R n , der sich in der Form x = α 1 a (1) + . . . + α m a ( m ) mit α 1 , . . . , α m ∈ R („Skalare“) schreiben lässt, heißt Linearkombination (kurz: LK) von a (1) , . . . , a ( m ) . [2] Die Menge L aller Linearkombinationen von a (1) , . . . , a ( m ) heißt lineare Hülle von a (1) , . . . , a ( m ) . Als Symbol wird die Bezeichnung L = Span( a (1) , . . . , a ( m ) ) verwendet. Beispiel 12.10 Es seien die Vektoren a (1) = (1 , 2 , 1) T , a (2) = (1 , 1 , − 1) T und a (3) = (2 , 3 , − 1) T gegeben. Lässt sich x = (2 , 1 , 0) T als Linearkombination von a (1) , a (2) , a (3) darstellen? Zu klären ist also, ob es α 1 , α 2 , α 3 ∈ R gibt mit α 1 121 + α 2 11 − 1 + α 3 23 − 1 = 210 Das ergibt über α 1 + α 2 + 2 α 3 2 α 1 + α 2 + 3 α 3 α 1 − α 2 − α 3 = 210 , das LGS α 1 + α 2 + 2 α 3 = 2 2 α 1 + α 2 + 3 α 3 = 1 α 1 − α 2 − α 3 = 0 , dessen Lösung mit dem Gauß’schen Eliminationsverfahren berechnet werden kann. Die Gleichungsmatrix des LGS wird dazu in ZSF überführt: 1 1 2 2 2 1 3 1 1 − 1 − 1 0 → 1 0 0 3 0 1 0 7 0 0 1 − 4 Hieraus gewinnt man die eindeutig bestimmte Lösung α 1 = 3 , α 2 = 7 , α 3 = − 4. Es gibt also nur eine Art der Linearkombination, nämlich 3 121 + 7 11 − 1 − 4 23 − 1 = 210 Berechnung von Linearkombinationen Um zu prüfen, ob und wie sich x ∈ R n als Linearkombination α 1 a (1) + . . . + α m a ( m ) von gegebenen Vektoren a (1) , . . . , a ( m ) ∈ R n darstellen lässt, geht man wie folgt vor: [1] Man stelle die Gleichungsmatrix a (1) . . . a ( m ) | x auf, d.h. a (1) , . . . , a ( m ) und x werden zu Spalten der Gleichungsmatrix. 48818_Terveer.indd 292 48818_Terveer.indd 292 18.07.2023 11: 57: 49 18.07.2023 11: 57: 49 <?page no="293"?> 12.2 Koordinatensysteme und Linearkombinationen 293 [2] Man löse das LGS. Jede Lösung ( α 1 , . . . , α m ) des LGS entspricht einer möglichen LK stellt die Koeffizienten der Linearkombination dar. Mit diesem Ansatz kann man auch prüfen, welche Vektoren sich überhaupt als LK der gegebenen a (1) , . . . , a ( m ) darstellen lassen. Auf der rechten Seite des LGS stehen dann die - allgemein gehaltenen - Koeffizienten x 1 , . . . , x n des darzustellenden Vektors x . Aus der Staffelform des LGS liest man dann die Darstellbarkeit als LK, aus der Zeilenstufenform des LGS liest man Formeln für die Koeffizienten der LK ab. Beispiel 12.11 (Fortsetzung von Beispiel 12.10) Für die Vektoren des vorangegangenen Beispiels kann man zeigen: jeder beliebige Vektor x = ( x 1 , x 2 , x 3 ) T ∈ R 3 lässt sich auf genau eine Art und Weise als Linearkombination der angegebenen Vektoren a (1) , a (2) , a (3) darstellen.Hierzu überführen wir die Gleichungsmatrix des zugehörigen LGS in ZSF. Zu beachten ist, dass die rechten Seiten des LGS dabei variable Größen x 1 , x 2 , x 3 sind: 1 1 2 x 1 2 1 3 x 2 1 − 1 − 1 x 3 II − 2 I III − I −−−−→ 1 1 2 x 1 0 − 1 − 1 x 2 − 2 x 1 0 − 2 − 3 x 3 − x 1 − II −→ 1 1 2 x 1 0 1 1 2 x 1 − x 2 0 − 2 − 3 x 3 − x 1 III + 2 II −−−−→ 1 1 2 x 1 0 1 1 2 x 1 − x 2 0 0 − 1 3 x 1 − 2 x 2 + x 3 − III −−→ 1 1 2 x 1 0 1 1 2 x 1 − x 2 0 0 1 − 3 x 1 + 2 x 2 − x 3 Aus der zuletzt hergeleiteten Staffelform erkennt man, dass das LGS eindeutig lösbar ist, also ist x auf genau eine Art und Weise linear kombinierbar. Durch Überführung der Staffelform in die Zeilenstufenform bekommt man die Lösungskoeffizienten: 1 1 2 x 1 0 1 1 2 x 1 − x 2 0 0 1 − 3 x 1 + 2 x 2 − x 3 I − 2 III II − III −−−−−→ 1 1 0 7 x 1 − 4 x 2 + 2 x 3 0 1 0 5 x 1 − 3 x 2 + x 3 0 0 1 − 3 x 1 + 2 x 2 − x 3 I − II −−→ 1 0 0 2 x 1 − x 2 + x 3 0 1 0 5 x 1 − 3 x 2 + x 3 0 0 1 − 3 x 1 + 2 x 2 − x 3 Die Linearkombination ist also x 1 x 2 x 3 = (2 x 1 − x 2 + x 3 ) 121 + (5 x 1 − 3 x 2 + x 3 ) 11 − 1 + ( − 3 x 1 + 2 x 2 − x 3 ) 23 − 1 Beispiel 12.12 (Fortsetzung von Beispiel 12.10) Im vorangegangen Beispiel gilt zusätzlich: Keiner der drei Vektoren a (1) , a (2) , a (3) lässt sich als Linearkombination der beiden anderen darstellen. Um beispielsweise zu prüfen, dass a (3) sich nicht als Linearkombination von a (1) , a (2) darstellen lässt, wird die Gleichungsmatrix des zugehörigen LGS in Staffelform gebracht: 1 1 2 2 1 3 1 − 1 − 1 II + ( − 2) I III + ( − 1) I −−−−−−−−−→ 1 1 2 0 − 1 − 1 0 − 2 − 3 II → ( − 1) II −−−−−−−−−→ 1 1 2 0 1 1 0 − 2 − 3 III + (2) II −−−−−−−−→ 1 1 2 0 1 1 0 0 − 1 Aus der Staffelform erkennt man, dass das lineare Gleichungssystem nicht lösbar ist. Also ist a (3) nicht als LK von a (1) , a (2) darstellbar. Beispiel 12.13 (Fortsetzung von Beispiel 12.10) Es soll im vorliegenden Beispiel die lineare Hülle Span ( a (1) , a (2) ) berechnet werden. Zu prüfen ist also welche Vektoren x = ( x 1 , x 2 , x 3 ) T sich als Linearkombination von 48818_Terveer.indd 293 48818_Terveer.indd 293 18.07.2023 11: 57: 57 18.07.2023 11: 57: 57 <?page no="294"?> 294 12 Vektoren a (1) , a (2) , also in der Form x = α 1 a (1) + α 2 a (2) darstellen lassen. 1 1 x 1 2 1 x 2 1 − 1 x 3 II − 2 I III − 1 I −−−−−−→ 1 1 x 1 0 − 1 x 2 − 2 x 1 0 − 2 x 3 − x 1 − II −−→ 1 1 x 1 0 1 2 x 1 − x 2 0 − 2 x 3 − x 1 III + 2 II −−−−−−→ 1 1 x 1 0 1 2 x 1 − x 2 0 0 3 x 1 − 2 x 2 + x 3 Die Staffelform hier zeigt: der Vektor x lässt sich genau dann als LK von a (1) , a (2) schreiben (d.h. das LGS ist genau dann lösbar), wenn seine Koeffizienten die lineare Gleichung 3 x 1 − 2 x 2 + x 3 = 0 erfüllen. Dann kann man die Lösungsmöglichkeiten aus der ZSF ablesen, für die ein weiterer Umformungsschritt nötig ist: 1 1 x 1 0 1 2 x 1 − x 2 0 0 3 x 1 − 2 x 2 + x 3 I − II −−−−−−→ 1 0 x 2 − x 1 0 1 2 x 1 − x 2 0 0 3 x 1 − 2 x 2 + x 3 Die lineare Hülle (d.h. Menge aller Linearkombinationen) von a (1 ) , a (2) besteht also aus allen Vektoren x = ( x 1 , x 2 , x 3 ) T mit 3 x 1 − 2 x 2 + x 3 = 0 ⇔ x 3 = 2 x 2 − 3 x 1 . Für diese Vektoren ist die Darstellung als LK eindeutig und lautet x 1 x 2 x 3 = ( x 2 − x 1 ) 121 + (2 x 1 − x 2 ) 11 − 1 Im nächsten Beispiel ist die Linearkombination nicht mehr eindeutig: Beispiel 12.14 Gegeben seien die Vektoren a (1) = 12 , a (2) = 23 und a (3) = 22 . Welche Vektoren x = x 1 x 2 lassen sich als Linearkombination von a (1) , a (2) , a (3) darstellen? Auch hier muss wieder ein LGS gelöst werden, dessen Gleichungsmatrix lautet: 1 2 2 x 1 2 3 2 x 2 −→ 1 2 2 x 1 0 − 1 − 2 − 2 x 1 + x 2 −→ 1 2 2 x 1 0 1 2 2 x 1 − x 2 −→ 1 0 − 2 − 3 x 1 + 2 x 2 0 1 2 2 x 1 − x 2 Das LGS ist also lösbar ist mit allgemeiner Lösung ( − 3 x 1 + 2 x 2 + 2 α, 2 x 1 − x 2 − 2 α, α ), wobei der Skalar α ∈ R beliebig gewählt sein kann. Also lässt sich jeder Vektor x linear aus a (1) , a (2) kombinieren. Weiter kann man folgern: ■ Eine Darstellung von x ist x 1 x 2 = ( − 3 x 1 + 2 x 2 ) 12 + (2 x 1 − x 2 ) 23 und allgemein x 1 x 2 = ( − 3 x 1 + 2 x 2 + 2 α ) 12 + (2 x 1 − x 2 − 2 α ) 23 + α 22 mit α ∈ R ■ a (3) = 22 lässt sich als LK von a (1) , a (2) darstellen: 22 = ( − 2) 12 + 2 23 Auch die anderen beiden Vektoren sind jeweils LK der übrigen zwei (nachrechnen! ). ■ Der Nullvektor lässt sich als LK von a (1) , a (2) und a (3) schreiben, und zwar speziell ( triviale Lösung) als 00 = 0 12 + 0 23 + 0 22 sowie allgemein (mit 48818_Terveer.indd 294 48818_Terveer.indd 294 18.07.2023 11: 58: 07 18.07.2023 11: 58: 07 <?page no="295"?> 12.2 Koordinatensysteme und Linearkombinationen 295 α ∈ R) 00 = (2 α ) 12 + ( − 2 α ) 23 + α 22 In Beispiel 12.14 gibt es neben der Darstellung ¯0 = 0 · a (1) + · · · + 0 · a ( m ) andere Linearkombinationen des Nullvektors (Dies gilt ebenso für jeden anderen darstellbaren Vektor). Außerdem lässt sich einer der drei Vektoren aus den anderen beiden linear kombinieren. Jede dieser drei Eigenschaften ist gleichwertig zu den anderen und hat zu einer Begriffsbildung geführt. Definition 12.8 (Lineare Abhängigkeit/ Unabhängigkeit) ! Vektoren a (1) , . . . , a ( m ) des R n heißen linear abhängig, kurz: l.a., wenn eine der folgenden gleichwertigen Eigenschaften zutrifft: A1. Einer der Vektoren a (1) , . . . , a ( m ) ist LK der übrigen Vektoren. A2. ¯0 lässt sich auf verschiedene Arten als LK von a (1) , . . . , a ( m ) schreiben. Andernfalls heißen a (1) , . . . , a ( m ) linear unabhängig (kurz: l.u.). Dies ist also der Fall, wenn eine der folgenden gleichwertigen Eigenschaften gilt: U1. Keiner der Vektoren a (1) , . . . , a ( m ) ist LK der übrigen Vektoren. U2. ¯0 = 0 · a (1) + · · · + 0 · a ( m ) lässt sich nur so als LK von a (1) , . . . , a ( m ) schreiben. Aus einem linear unabhängigen System lässt sich ein beliebiger Vektor auf genau eine Art linear kombinieren, falls dies überhaupt möglich ist. Linear unabhängige Vektoren sind der gängige Ersatz zur Festlegung von Koordinaten bzw. Koordinatenachsen, wenn auf die Einheitsvektoren aus sachlogischen Gründen nicht zurückgegriffen werden kann. Hierauf gehen wir im nächsten Abschnitt genauer ein. Ob ein System von Vektoren linear abhängig oder linear unabhängig ist, muss oft im Einzelfall nachgerechnet werden. Wegen A2./ U2. geht man wie folgt vor: Nachweis der linearen Abhängigkeit/ Unabhängigkeit [1] Die auf Abhängigkeit/ Unabhängig zu prüfenden Vektoren werden als Spalten in eine Koeffizientenmatrix geschrieben [2] Die Koeffizientenmatrix wird in Staffelform überführt. [3] Wenn die Staffelform nur Pivotspalten hat, ist das System l.u., anderenfalls ist es l.a. Jeder Vektor zu einer Nicht-Pivotspalte ist LK der anderen Vektoren. Beispiel 12.15 Die Vektoren a (1) = (1 , 2 , 1) T , a (2) = (1 , 1 , − 1) und a (3) = (0 , 1 , 2) sind linear abhängig. Die aus den Spaltenvektoren zusammengesetzte Matrix lässt sich nämlich in folgende Staffelform überführen: 1 1 0 2 1 1 1 − 1 2 → 1 1 0 0 1 − 1 0 0 0 Spalte 3 ist eine Nicht-Pivotspalte. Also lässt sich a (3) als LK von a (1) , a (2) schreiben. Damit sind die Vektoren linear abhängig. 48818_Terveer.indd 295 48818_Terveer.indd 295 18.07.2023 11: 58: 11 18.07.2023 11: 58: 11 <?page no="296"?> 296 12 Vektoren Beispiel 12.16 Die drei Vektoren a (1) = (1 , 2 , 1) T , a (2) = (1 , 1 , − 1) und a (3) = (0 , s, t ) mit s, t ∈ R sollen auf lineare Abhängigkeit/ Unabhängigkeit geprüft werden. Wir überführen die Koeffizientenmatrix in Staffelform 1 1 0 2 1 s 1 − 1 t → 1 1 0 0 − 1 s 0 − 2 t → 1 1 0 0 1 s 0 − 2 t → 1 1 0 0 1 s 0 0 t − 2 s Falls t = 2 s , so liegt eine Nullzeile und eine Nichtpivot-Spalte vor; dann ist das vorliegende System linear abhängig. Anderenfalls ist das System linear unabhängig. Im ersten durchgängig gerechneten Beispiel 12.10 vgl. S. 292 sind die drei Vektoren a (1) , a (2) , a (3) ∈ R 3 linear unabhängig; im zweiten Beispiel 12.14 vgl. S. 294 sind die drei Vektoren a (1) , a (2) , a (3) ∈ R 2 linear abhängig. Die Teilelisten-Vektoren aus Beispiel 12.7 vgl. S. 289 und die Produktlistenvektoren aus Beispiel 12.8 vgl. S. 290 sind jeweils linear abhängig, die Umsatzvektoren aus Beispiel 12.9 vgl. S. 290 sind linear unabhängig. Manchmal kann man aus übergeordneten Gründen ohne besondere Rechnung sehen, dass ein System von Vektoren linear abhängig ist: Satz 12.3 Ein System von mehr als n Vektoren des R n ist linear abhängig. Also besteht ein System linear unabhängiger Vektoren des R n aus höchstens n Vektoren. Stellt man nämlich den Nullvektor aus mehr als n Vektoren linear dar, so ergibt sich ein homogenes und daher lösbares LGS. Dieses hat aber gleichzeitig mehr Variablen als Gleichungen, ist also mehrdeutig lösbar. Der Nullvektor lässt sich also auf mehrere Arten linear kombinieren. Übungen zu Abschnitt 12.2 ? 5. Lässt sich x als LK der übrigen Vektoren a ( i ) schreiben? Wenn ja, wie? a) 13 , 25 , x = 32 b) 13 , 4 t , x = 3 t c) − 3 20 , 202 , 333 , x = 542 d) − 3 20 , 202 , 333 , 01 12 , x = 542 6. Ergänzen Sie x so, dass der Vektor als LK von a (1) , a (2) darstellbar ist. a) a (1) = 131 , a (2) = − 6 − 2 1 , x = 54 b) a (1) = 04 − 2 , a (2) = − 6 t 1 , x = 54 7. Stellen Sie die lineare Hülle der gegebenen Vektoren als Lösungsmenge eines geeigneten homogenen LGS dar. a) − 3 2 − 5 , 0 − 4 1 b) 21 − 5 4 , 32 − 1 1 8. Prüfen Sie, ob die folgenden (Systeme von) Vektoren jeweils linear abhängig oder linear unabhängig sind. a) − 3 2 − 5 , 0 − 4 1 , 110 48818_Terveer.indd 296 48818_Terveer.indd 296 18.07.2023 11: 58: 18 18.07.2023 11: 58: 18 <?page no="297"?> 12.3 Untervektorraum und Basis 297 b) − 3 2 − 5 , 0 − 4 1 , 3 − 10 7 c) 123 , 0 t 1 , 22 t 9. Zeigen Sie: Wenn a (1) und a (2) linear unabhängige Vektoren des R n sind, so sind auch folgende Vektoren linear unabhängig a) sa (1) und ta (2) mit s ̸ = 0 , t ̸ = 0, b) a (1) und a (1) + a (2) , c) a (1) und sa (1) + ta (2) mit t ̸ = 0. 12.3 Untervektorraum und Basis Mit der linearen Hülle Span ( a (1) , . . . , a ( m ) ) gegebener Koordinatenvektoren des R n lässt sich rechnen wie mit dem R n selbst. Satz 12.4 Für die lineare Hülle L = Span ( a (1) , . . . , a ( m ) ) zu Vektoren a (1) , . . . , a ( m ) ∈ R n gilt: [1] Der Nullvektor ¯0 liegt in L [2] Liegen x, y in L, so auch x + y . [3] Liegt x in L, so auch αx für beliebigen Skalar α ∈ R. Man sagt, die lineare Hülle ist abgeschlossen gegenüber den beiden elementaren Vektorraumoperationen. Beispiel 12.17 Im Anschauungsraum R 3 seien die beiden Vektoren a (1) = ( − 2 , 1 , 0) T , a (2) = ( − 4 , 0 , 1) T gegeben. Es sei L = Span ( a (1) , a (2) ) die lineare Hülle von a (1) , a (2) . Wir illustrieren die Vektorraumeigenschaften an drei Rechenbeispielen: [1] Es ist ¯0 = (0 , 0 , 0) T = 0 a (1) + 0 a (2) in der linearen Hülle von a (1) und a (2) [2] Die Vektoren x = ( − 6 , 1 , 1) T = a (1) + a (2) und y = (6 , 1 , − 2) T = a (1) − 2 a (2) liegen in L. Ebenso liegt dann die Vektorsumme x + y in L, denn sie lässt sich schreiben als x + y = ( a (1) + a (2) ) + ( a (1) − 2 a (2) ) = 2 a (1) − a (2) . [3] Der Vektor x = (0 , 2 , − 1) T = 2 a (1) − a (2) liegt in L. Jedes skalar Vielfache von x liegt ebenfalls in L, denn αx = (2 α ) a (1) − αa (2) Bei Span ( a (1) , a (2) ) handelt es sich um eine Ebene im R 3 vgl. Abbildung 12.3 . Definition 12.9 ! Eine Teilmenge L eines Vektorraumes, welche die Eigenschaften [1] bis [3] aus Satz 12.4 erfüllt, wird als Untervektorraum (UVR) bezeichnet. Jede Menge von Vektoren L, die sich als lineare Hülle schreiben lässt, ist nach dem bisher Gesagten ein Untervektorraum. Hierzu stimmt allerdings auch die Umkehrung. 48818_Terveer.indd 297 48818_Terveer.indd 297 18.07.2023 11: 58: 25 18.07.2023 11: 58: 25 <?page no="298"?> 298 12 Vektoren Abbildung 12.3: Die von ( − 2 , 1 , 0) T und ( − 4 , 0 , 1) T erzeugte Ebene durch (0 , 0 , 0) T (Ausschnitt). Satz 12.5 Jeder Untervektorraum L des R n lässt sich als lineare Hülle von endlich vielen Vektoren aus L darstellen. Es handelt sich hierbei nicht um eine konstruktive Aussage, d.h. damit ist kein konkretes Verfahren zur Ermittlung der erzeugenden Vektoren verbunden. Liegt ein Vektorraum L als lineare Hülle Span ( a (1) , . . . , a ( m ) ) vor, so sagt man auch, dass die Vektoren die Menge L „aufspannen“, d.h. man interpretiert a (1) , . . . , a ( m ) als Achsen eines Koordinatensystems. Damit könnte man nun verbinden, dass die Koordinaten eines Vektors bezüglich dieser Achsen eindeutig abgelesen werden können, d.h. dass sich ein Vektor in L in eindeutiger Weise linear kombinieren lässt. Wenn aber a (1) , . . . , a ( m ) linear abhängig sind, so ist dies nicht möglich. Beispiel 12.18 Im Anschauungsraum seien die drei Vektoren a (1) = ( − 2 , 1 , 0) T , a (2) = ( − 4 , 0 , 1) T und a (3) = (2 , 1 , − 1) T gegeben. Es sei L = Span ( a (1) , a (2) , a (3) ). Die drei Vektoren sind linear abhängig, denn es ist a (3) = a (1) − a (2) . Zur Darstellung eines Vektors in L sind deshalb bereits zwei der Vektoren ausreichend. Beispielsweise hat der Vektor x = ( − 6 , 1 , 1) T u.a. die beiden Darstellungen ■ − 6 11 = 1 · − 2 10 + 1 · − 4 01 + 0 · 21 − 1 ■ − 6 11 = 2 · − 2 10 + 0 · − 4 01 + ( − 1) · 21 − 1 Vielleicht fragen Sie sich jetzt, ob es aus Anwendungssicht überhaupt problematisch ist, wenn die erzeugenden Vektoren einer Linearkombination linear abhängig sind. Betrachten wir hierzu noch einmal das Umsatzbeispiel 12.9. Beispiel 12.19 (Fortsetzung von Beispiel 12.9) Angenommen, die Kraftstoffumsätze würden lauten u (1) = (4 , 2 , 6 , 2 , 4) T , während die Umsätze aus dem sonstigen Angebotssortiment durch u (2) = (2 , 1 , 3 , 1 , 2) T gegeben sind. Wegen u (1) = 2 u (2) sind die beiden Vektoren linear abhängig. Gehen Sie davon aus, dass rechnerischen Gewinnanteile von jeweils α 0 = 1 Euro Sockelgewinn, α 1 = 14 Euro beim Kraftstoff und α 2 = 12 Euro beim sonstigen Sortiment vorliegen. 48818_Terveer.indd 298 48818_Terveer.indd 298 18.07.2023 11: 58: 30 18.07.2023 11: 58: 30 <?page no="299"?> 12.3 Untervektorraum und Basis 299 Dann entspricht den beiden Umsatzvektoren ein rechnerischer Gewinnvektor u (0) + 1 4 u (1) + 14 u (2) = 11111 + 14 42624 + 14 21312 = 5 / 2 7 / 4 13 / 4 7 / 4 5 / 2 Derselbe rechnerische Gewinnvektor ergibt sich jedoch auch beispielsweise mit den Koeffizienten α 0 = 1 , α 1 = 38 , α 2 = 0 oder α 0 = 1 , α 1 = 0 , α 2 = 34 ; es gibt unendlich viele Möglichkeiten, diesen Gewinnvektor zu „ generieren“. Umgekehrt ist es deshalb unmöglich die Gewinnanteile der beiden Umsatzsparten, für einen gegebenen Gewinnvektor verlässlich zu ermitteln. Das diesem Beispiel zugrunde liegende Problem der Regressionsrechnung wird als Kollinearität bezeichnet. Sie muss vermieden werden, wenn die errechneten Koeffizienten interpretierbar sein sollen. In der Statistik ist selbst „näherungsweise“ Kollinearität unerwünscht, weil bei der Berechnung der Koeffizienten numerische Schwierigkeiten auftreten können. In manchen Situationen ist es also problematisch, einen Untervektorraum durch ein l.a. System aufzuspannen. Man versucht dann, mit weniger, dafür aber l.u. Vektoren auszukommen. Ein solches Erzeugendensystem wird als Basis bezeichnet: Definition 12.10 ! Wird ein Untervektorraum L des R n von einem System linear unabhängiger Vektoren a (1) , . . . , a ( m ) aufgespannt, so nennt man dieses System eine Basis von L. In der linearen Optimierung haben wir schon den Begriff der Basis im Zusammenhang mit den Lösungen des zugehörigen LGS Ax = b eingeführt. Dieser Begriff passt wie folgt zur Basis eines Untervektorraums: Eine Basislösung eines LOP legt Basisvariablen des LGS fest und diese wiederum bestimmte Spalten in der Gleichungsmatrix A . Diese Spalten bilden eine Basis von Span( a (1) , . . . , a ( n ) ), wobei a (1) , . . . , a ( n ) genau die Spalten von A bezeichnen). 12.3.1 Gewinnung einer Basis aus einem Erzeugendensystem Streicht man aus einem l.a. Erzeugendensystem a (1) , . . . , a ( m ) sukzessive Vektoren, die sich durch die übrigen Vektoren linear kombinieren lassen, so erhält man schließlich eine Basis. Dabei kann das GEV wieder helfen: Bestimmung einer Basis aus einem Erzeugendensystem Bei einem Untervektorraum in der Darstellung L = Span ( a (1) , . . . , a ( m ) ) [1] bildet man aus den Spalten(vektoren) a (1) , . . . , a ( m ) eine Matrix A . [2] überführt man die erhaltene Matrix in Staffelform (oder in Zeilenstufenform). Vektoren a ( i ) , die zu Pivotspalten der Staffelform gehören, bilden eine Basis von L. 48818_Terveer.indd 299 48818_Terveer.indd 299 18.07.2023 11: 58: 35 18.07.2023 11: 58: 35 <?page no="300"?> 300 12 Vektoren Beispiel 12.20 Es sei L = Span ( a (1) , a (2) , a (3) , a (4) , a (5) , a (6) ) mit a (1) = 121 − 1 , a (2) = 222 − 2 , a (3) = − 1 0 − 1 1 , a (4) = 20 − 1 0 , a (5) = − 1 111 , a (6) = 01 − 1 2 Man bildet die Koeffizientenatrix A und berechnet die Zeilenstufenform zu A : A = 1 2 − 1 2 − 1 0 2 2 0 0 1 1 1 2 − 1 − 1 1 − 1 − 1 − 2 1 0 1 2 → 1 0 1 0 0 1 0 1 − 1 0 0 − 1 0 0 0 1 0 1 0 0 0 0 1 1 Man liest die Pivotspalten 1 , 2 , 4 , 5 ab. Eine Basis von L ist also a (1) , a (2) , a (4) , a (5) . Sie werden an dem obigen Beispiel bemerkt haben, dass die Anzahl der Basisvektoren durch die Anzahl der Pivotspalten festgelegt wurde. Man könnte nun fragen, ob es andere Verfahren zur Basisbestimmung gibt, die zu einer abweichenden Anzahl von Basisvektoren gelangen. Dies ist nicht der Fall. Satz 12.6 Zwei verschiedene Basen eines Untervektorraumes L ⊆ R n haben stets dieselbe Anzahl von Vektoren. Diese Zahl wird auch Dimension von L genannt. Als mögliche Dimensionen eines UVR des R n kommen nur 0 , 1 , 2 , . . . , n in Frage: ■ Der einzige Untervektorraum der Dimension 0 ist die Menge L = { ¯0 } . Zum Erzeugen von L ist kein Vektor erforderlich (der Vektor ¯0 für sich ist linear abhängig). ■ Ein UVR der Dimension 1 ist eine Gerade. Er besteht aus der Menge L = Span ( a ) = { αa : a ∈ R } aller skalar Vielfachen eines geeigneten Vektors a ∈ R n . ■ Ein UVR L der Dimension 2 ist eine Ebene. Er besteht aus der Menge L = Span ( a (1) , a (2) ) zweier geeigneter l.u. Vektoren a (1) , a (2) des R n . ■ Der einzige UVR der Dimension n ist der R n selbst. Eine Basis dieses UVR ist beispielsweise das System der Einheitsvektoren e (1) , . . . , e ( n ) . 12.3.2 Gewinnung einer Basis zur Lösungsmenge eines homogenen linearen Gleichungssystems Untervektorräume müssen nicht ausschließlich als linearen Hülle vorliegen. Beispielsweise ist die Lösungsmenge Kern ( A ) eines homogenen LGS mit Koeffizientenmatrix A gemäß Satz 12.2 vgl. S. 287 ein Untervektorraum. Auch für solche UVR kann man eine Basis angeben. Diese benötigen wir u.a. bei der Berechnung von Eigenvektoren vgl. Abschnitt 13.5 . Beispiel 12.21 Gegeben sei das homogene LGS x 1 +3 x 2 + x 3 +5 x 4 = 0 x 1 +3 x 2 +2 x 3 +4 x 4 +9 x 5 = 0 2 x 1 +6 x 2 +9 x 3 +12 x 4 +27 x 5 = 0 48818_Terveer.indd 300 48818_Terveer.indd 300 18.07.2023 11: 58: 42 18.07.2023 11: 58: 42 <?page no="301"?> 12.3 Untervektorraum und Basis 301 Schema für Erzeugendensystem von Kern(A) Gesucht ist ein Erzeugendensystem der Lösungsmenge zu Ax = ¯0 . 1. Überführe A in Zeilenstufenform Z mit k Pivotspalten · · · 1 · · · 0 · · · z 1 · · · 0 · · · · · · 0 · · · 1 · · · z 2 · · · 0 · · · · · · 0 · · · 0 · · · ... 0 · · · · · · 0 · · · 0 · · · z k 1 · · · ↓ ↓ ↓ ↓ j 1 j 2 j k ↓ ↓ ↓ ↓ · · · − z 1 · · · − z 2 · · · 1 · · · − z k · · · Z = x = ( ) T 2. Jede Nicht-Pivotspalte ergibt einen Erzeugenden-Vektor x : 2.1 Einträge x j 1 = − z 1 , . . . ,x j k = − z k gemäß obigem Schema 2.2 Eintrag x = 1 . 2.3 Alle übrigen Einträge in x werden gleich Null gesetzt. Alternative: Jeder beliebige Vektor αx mit α = 0 , z.B. − x . 4-7 Matrizen LGS LOP Vektoren Quadratische Matrizen Folgen Differentialrechnung Optimierung Ergänzungen Abbildung 12.4: Berechnung einer Basis von Kern ( A ) aus der ZSF, Schema Die Lösungsmenge L wird als UVR mit Hilfe einer Basis dargestellt: 1 3 1 5 0 1 3 2 4 9 2 6 9 12 27 ZSF → 1 3 0 0 15 0 0 1 0 5 0 0 0 1 − 4 In Gleichungen geschrieben ergibt die ZSF x 1 +3 x 2 +15 x 5 =0 x 3 +5 x 5 =0 x 4 − 4 x 5 =0 Wir stellen die Basisvariablen frei: x 1 = − 3 x 2 − 15 x 5 x 3 = − 5 x 5 x 4 = 4 x 5 Lösung ist also jeder Vektor x = ( x 1 , x 2 , x 3 , x 4 , x 5 ) T ∈ R 5 , der die genannten Gleichungen für die Basisvariablen erfüllt. Die Nicht-Basisvariablen dürfen beliebig gesetzt werden. Substituieren wir jetzt die Lösungsterme der Basisvariablen, so erhalten wir: x Subst. = − 3 x 2 − 15 x 5 x 2 − 5 x 5 4 x 5 x 5 Spreizen = − 3 x 2 x 2 000 + − 15 x 5 0 − 5 x 5 4 x 5 x 5 Faktorisieren = x 2 − 3 1000 + x 5 − 15 0 − 5 41 Jede Lösung des LGS lässt sich mit den Schritten Substitution, Spreizung und Faktorisierung also als LK der Vektoren a (1) = − 3 1000 , a (2) = − 15 0 − 5 41 schreiben; umgekehrt ist jede Linearkombination auch eine Lösung des Gleichungssystems. Es ist also L = Span ( a (1) , a (2) ). Der Nullvektor lässt sich nur in der Form 00000 = 0 − 3 1000 + 0 − 15 0 − 5 41 darstellen, denn für die zweite bzw. fünfte Komponente ist jeweils a (1) bzw. a (2) „allein verantwortlich“. Die beiden Vektoren sind also l.u. Insgesamt bilden a (1) , a (2) eine Basis des R n . Die Basisvektoren kann man offenbar schematisch aus der ZSF des LGS ablesen: 48818_Terveer.indd 301 48818_Terveer.indd 301 18.07.2023 11: 58: 52 18.07.2023 11: 58: 52 <?page no="302"?> 302 12 Vektoren Satz 12.7 (Bestimmung einer Basis von Kern ( A )) Gegeben sei eine Koeffizientenmatrix A mit n Spalten und Zeilenstufenform Z , die k Pivotspalten und n − k Nichtpivot-Spalten hat. Dann gilt: [1] Dimensionsformel: dim( Kern ( A )) = n − k . [2] Eine spezielle Basis von Kern ( A ) bekommt man, indem man jeder Nicht-Pivotspalte ℓ von Z schematisch einen Basisvektor x wie folgt zuordnet vgl. Abbildung 12.4 : [a] An den Stellen j 1 , . . . , j k in x werden die Einträge von Z in Spalte ℓ mit umgekehrtem Vorzeichen eingetragen. [b] An Stelle ℓ in x wird der Wert 1 eingetragen. [c] Alle übrigen Einträge im Basisvektor werden gleich Null gesetzt. Beispiel 12.22 (Fortsetzung von Beispiel 12.21) Die Zeilenstufenform in Beispiel 12.21 lautet 1 3 0 0 15 0 0 1 0 5 0 0 0 1 − 4 Sie hat fünf Spalten, dabei drei Basisspalten, nämlich die Spalten 1 , 3 , 4 und zwei Nicht-Basisspalten, nämlich die Spalten 2 , 5. Wir konstruieren beide Basisvektoren nach der obigen Blaupause: ■ zur Nicht-Basisspalte 300 : ××××× [a] −→ − 3 × 00 × [b] −→ − 3 100 × [c] −→ − 3 1000 ■ zur Nicht-Basisspalte 15 5 − 4 : ××××× [a] −→ − 15 × − 5 4 × [b] −→ − 15 × − 5 41 [c] −→ − 15 0 − 5 41 Zu dieser schematischen Vorgehensweise wollen wir einige Anmerkungen machen: ■ Beim Füllen der Basisvektoren kann man im Schritt [2][a] die Einträge ohne Umkehrung des Vorzeichens und dafür in Schritt [2][b] den Eintrag − 1 vornehmen. Der sich ergebende Vektor ist dann der skalar Negative des obigen. ■ Jeder Basisvektor x kann durch ein beliebiges skalar Vielfaches αx mit α ̸ = 0 ersetzt werden. Das kann hilfreich sein, wenn ganzzahlige Komponenten oder aber eine bestimmte „Länge“ vgl. Unterabschnitt 12.4 gefordert ist. ■ Das Schema kann auch auf Basisformen vgl. Unterabschnitt 11.3.6, S. 273 der Matrix A angewendet werden. Die Stellen j 1 , . . . , j k im Basisvektor x , an denen die Einträge − z 1 ℓ , . . . , − z kℓ gesetzt werden, entsprechen dann den Basisspaltenindizes. Sie haben am vorangegangenen Beispiel gesehen, dass sich die Lösungsmenge eines homogenen linearen Gleichungssystems stets als Untervektorraum mit Hilfe von erzeugenden (Basis-)Vektoren schreiben lässt. Umgekehrt kann man aber auch zeigen, dass es zu jedem Untervektorraum in der Form L = Span ( a (1) , . . . , a ( k ) ) ein homogenes lineares Gleichungssystem gibt, dessen Lösungsmenge gerade L ist. 48818_Terveer.indd 302 48818_Terveer.indd 302 18.07.2023 11: 58: 58 18.07.2023 11: 58: 58 <?page no="303"?> 12.4 Vektorgeometrie 303 Beispiel 12.23 Wir betrachten die beiden Vektoren a (1) = ( − 2 , 1 , 0) T , a (2) = ( − 4 , 0 , 1) T und wollen den von ihnen aufgespannten Raum L als Lösungsmenge eines homogenen linearen Gleichungssystems schreiben. Welche Vektoren x = ( x 1 , x 2 , x 3 ) T des R 3 sich als Linearkombinationen von a (1) , a (2) darstellen lassen, ist gleichwertig zu der Frage, für welche x 1 , x 2 , x 3 ∈ R das zu α 1 a (1) + α 2 a (2) = ( x 1 , x 2 , x 3 ) T gehörige LGS in den Unbekannten α 1 , α 2 lösbar ist. Mit zwei Zeilenvertauschungen und zwei Additionsschritten wird die zugehörige Gleichungsmatrix in eine Staffelform (hier schon in die Zeilenstufenform) überführt: − 2 − 4 x 1 1 0 x 2 0 1 x 3 −→ 1 0 x 2 0 1 x 3 − 2 − 4 x 1 −→ 1 0 x 2 0 1 x 3 0 0 x 1 + 2 x 2 + 4 x 3 also ist x als LK von a (1) , a (2) darstellbar genau dann, wenn x 1 + 2 x 2 + 4 x 3 = 0. Die Darstellbarkeit ist gleichbedeutend mit der Lösbarkeit eines geeigneten homogenen LGS. Die Lösungsmenge dieses LGS ist genau die lineare Hülle von a (1) , a (2) . Im allgemeinen erhält man an dieser Stelle mehrere homogene lineare Gleichungen, also insgesamt ein homogenes LGS. Wir halten fest: Untervektorräume des R n und Lösungsmengen von homogenen linearen Gleichungssystemen in n Variablen entsprechen einander in eindeutiger Weise. Übungen zu Abschnitt 12.3 ? 10. Berechnen Sie eine Basis von a) Span( 12 , 21 , − 3 6 , 15 ) b) Span( 30 − 1 , 21 − 2 , 1 − 1 1 , 154 ) c) Span( 30 − 1 , 21 t , 1 − 1 1 , 154 ) 11. Berechnen Sie für die folgenden Matrizen A eine Basis von Kern ( A ). a) 1 2 − 3 2 1 0 3 1 1 b) 1 2 − t 2 1 t 3 1 2 t c) 1 0 0 2 0 1 − 2 3 0 − 1 0 7 − 2 1 2 1 0 9 − 1 − 3 3 1 2 4 12. Von einer Matrix A ist bekannt: ■ A = 1 0 0 1 0 0 liegt in Zeilenstufenform vor. ■ Eine Basis von Kern ( A ) ist ( − 1 , − 7 , 3 , 0 , 0) T und ( − 2 , 6 , 0 , − 1 , 0) T . Bestimmen Sie die fehlenden Einträge. 13. Stellen Sie Span( a (1) , a (2) ) als Lösungsmenge eines homogenen LGS dar: a) a (1) = 241 , a (2) = 3 − 1 − 2 b) a (1) = 4221 , a (2) = − 2 0 − 1 1 12.4 Vektorgeometrie Die geometrische Darstellung von Vektoren des R 2 bzw. R 3 im kartesischen Koordinatensystem führt dazu, dass man dort die Orientierung von Vektoren zueinander mit 48818_Terveer.indd 303 48818_Terveer.indd 303 18.07.2023 11: 59: 06 18.07.2023 11: 59: 06 <?page no="304"?> 304 12 Vektoren Abbildung 12.5: Länge, Abstand und rechter Winkel in der Anschauungsebene Abbildung 12.6: Winkel zwischen Vektoren im R 2 elementargeometrischen Begriffen bzw. Kennzahlen beschreibt bzw. misst. Wir rekapitulieren die wichtigsten Begriffe für die Anschauungsebene vgl. Abbildung 12.5 . Beispiel 12.24 (Geometrische Grundbegriffe im R 2 , Teil 1) ■ Unter der (euklidischen) Länge eines Vektors x = ( x 1 , x 2 ) T ∈ R 2 versteht man den Wert ∥ x ∥ : = √ x 21 + x 22 . ■ Unter dem (euklidischen) Abstand zwischen Vektoren x , y ∈ R 2 versteht man ∥ x − y ∥ = √ ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 , d.h. die Länge des Vektors x − y . ■ Zwei Vektoren x = ( x 1 , x 2 ) T und y = ( y 1 , y 2 ) T stehen senkrecht (im rechten Winkel) aufeinander genau dann wenn in dem von ¯0, x und y erzeugten Dreieck der Satz des Pythagoras gilt, d.h. ∥ x ∥ 2 + ∥ y ∥ 2 = ∥ x − y ∥ 2 . Ausgeschrieben bedeutet dies x 21 + x 22 + y 2 1 + y 2 2 = ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 . Wenn man die Klammern ausmultipliziert und auf beiden Seiten alle quadratischen Aussdrücke substrahiert, so führt dies zu x 1 y 1 + x 2 y 2 = 0. Auch Winkel zwischen beliebigen Vektoren sind mit deren Koordinaten darstellbar: Beispiel 12.25 (Geometrische Grundbegriffe im R 2 , Teil 2) Mit φ sei der Winkel zwischen den beiden Vektoren x = ( x 1 , x 2 ) T ∈ R 2 , y = ( y 1 , y 2 ) T ∈ R 2 bezeichnet. Wir führen den Kosinus dieses Winkels rechnerisch auf x, y zurück. Der Einfachheit halber sollen beide Vektoren x, y ∈ R 2 die Länge 1 haben, d.h. es gelte x 21 + x 22 = 1 = y 2 1 + y 2 2 . Mit den Bezeichnungen in Abbildung 12.6 48818_Terveer.indd 304 48818_Terveer.indd 304 18.07.2023 11: 59: 11 18.07.2023 11: 59: 11 <?page no="305"?> 12.4 Vektorgeometrie 305 folgt aufgrund des Additionstheorems 6.7 vgl. S. 115 : cos( φ ) = cos( φ 2 − φ 1 ) = cos( φ 2 ) cos( − φ 1 ) − sin( φ 2 ) sin( − φ 1 ) = cos( φ 2 ) cos( φ 1 ) + sin( φ 2 ) sin( φ 1 ) = y 1 x 1 + y 2 x 2 Wenn x, y ∈ R 2 zwei beliebige Vektoren ungleich ¯0 sind, stimmt der Winkel zwischen x und y mit dem Winkel zwischen den Vektoren ˜ x, ˜ y überein, wobei ˜ x = (˜ x 1 , ˜ x 2 ) T = 1 ∥ x ∥ x = x 1 ∥ x ∥ , x 2 ∥ x ∥ T = x 1 x 21 + x 22 , x 2 x 21 + x 22 T ˜ y = (˜ y 1 , ˜ y 2 ) T = 1 ∥ y ∥ y = y 1 ∥ y ∥ , y 2 ∥ y ∥ T = y 1 y 2 1 + y 2 2 , y 2 y 2 1 + y 2 2 T denn ˜ x, ˜ y haben jeweils dieselbe „Richtung“ wie x, y . Sie haben andererseits jeweils die Länge 1, daher kann man ihren Winkel wie oben angegeben berechnen cos φ = ˜ x 1 ˜ y 1 + ˜ x 2 ˜ y 2 = x 1 ∥ x ∥ y 1 ∥ y ∥ + x 2 ∥ x ∥ y 2 ∥ y ∥ = x 1 y 1 + x 2 y 2 ∥ x ∥ · ∥ y ∥ Grundbegriffe in Anschauungsebene und -raum lassen sich also offenbar auf Summen- Ausdrücke des Typs x 1 y 1 + x 2 y 2 bzw. x 21 + x 22 4 und y 2 1 + y 2 2 zurückführen. Die erste Summe wird als Skalarprodukt der beiden Vektoren x, y bezeichnet. Mit der Erweiterung auf Vektoren x, y im nicht mehr anschaulich vorstellbaren Vektorraum R n können dann die geometrischen Grundbegriffe der (euklidischen) Länge und des (euklidischen) Abstandes im R n ebenso wie die Winkelmessung rechnerisch beschrieben werden. Definition 12.11 (Skalarprodukt und euklidische Norm im R n ) ! [1] Für x = ( x 1 , . . . , x n ) T ∈ R n , y = ( y 1 , . . . , y n ) T ∈ R n ist das Skalarprodukt (bzw. inneres Produkt) von x und y definiert als ⟨ x, y ⟩ : = x 1 y 1 + · · · + x n y n [2] ∥ x ∥ : = ⟨ x, x ⟩ = x 21 + · · · + x 2 n heißt Euklidische Norm von x ∈ R n . [3] x , y ∈ R n heißen orthogonal (kurz: x ⊥ y ), wenn ⟨ x, y ⟩ = 0. Sie heißen orthonormal , wenn zusätzlich ∥ x ∥ = ∥ y ∥ = 1. Beispiel 12.26 Das Skalarprodukt ⟨ x, y ⟩ lässt sich nur bilden, wenn Vektoren x , y gleich viele Komponenten haben. Also kann beispielsweise das Skalarprodukt der Vektoren (1 , 2) T und (0 , 3 , 1) T nicht gebildet bzw. berechnet werden. Beispiel 12.27 Im R 3 seien folgende Vektoren gegeben: x = 1 , 4 − 0 , 8 2 , 3 , y = 4 , 1 1 , 2 − 0 , 4 , z = 1 , 2 2 , 1 0 . Skalarprodukte verschiedener Vektoren sind hier: ■ ⟨ x, y ⟩ = 1 , 4 · 4 , 1 + ( − 0 , 8) · 1 , 2 + 2 , 3 · ( − 0 , 4) = 3 , 86 = ⟨ y, x ⟩ 48818_Terveer.indd 305 48818_Terveer.indd 305 18.07.2023 11: 59: 20 18.07.2023 11: 59: 20 <?page no="306"?> 306 12 Vektoren 1 2 3 4 5 6 7 8 9 10 11 2 13 14 15 16 17 18 19 20 21 22 23 24 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 2 2 3 3 4 4 1 1 3 3 4 4 1 1 2 2 4 4 1 1 2 2 3 3 3 4 2 4 2 3 3 4 1 4 1 3 2 4 1 4 1 2 2 3 1 3 1 2 4 3 4 2 3 2 4 3 4 1 3 1 4 2 4 1 2 1 3 2 3 1 2 1 30 29 29 27 27 26 29 28 27 24 25 23 27 25 26 23 22 21 24 23 23 21 21 20 Tabelle 12.3: Skalarprodukt als Maßzahl für Gleich- und Gegenläufigkeit. Jede Spalte enthält in den Zeilen 2 bis 5 die Einträge eines Vektors y = ( y 1 , . . . , y 4 ) T , der durch Permutation der Zahlen 1 , . . . , 4 entsteht. In der sechsten Zeile steht jeweils das Skalarprodukt dieses Vektors mit dem Vektor (1 , 2 , 3 , 4) T . ■ ⟨ x, z ⟩ = 1 , 4 · 1 , 2 + ( − 0 , 8) · 2 , 1 + 2 , 3 · 0 = 0 = ⟨ z, x ⟩ , also sind x, z orthogonal, in Zeichen x ⊥ z . ■ ⟨ y, z ⟩ = 4 , 1 · 1 , 2 + 1 , 2 · 2 , 1 + ( − 0 , 4) · 0 = 7 , 44 = ⟨ z, y ⟩ Die euklidischen Längen der Vektoren betragen: ■ ∥ x ∥ = √ 1 , 4 2 + ( − 0 , 8) 2 + 2 , 3 2 ≈ 2 , 81 ■ ∥ y ∥ = √ 3 , 1 2 + 1 , 2 2 + ( − 0 , 4) 2 ≈ 4 , 29 ■ ∥ z ∥ = √ 1 , 2 2 + 2 , 1 2 + 0 2 ≈ 2 , 42 Beispiel 12.28 (Skalarprodukt als Maß für Gleichläufigkeit) Unter einem Ranking von n Objekten versteht man einen Vektor x ∈ R n , der aus einer Umordnung (Permutation) der Zahlen 1 , . . . , n besteht. Solche Rankings treten oft bei der Bewertung verschiedener Produkte auf. Jedes Produkt bekommt aufgrund quantitativer Kennzahlen, durch Kundenbeurteilung oder andere Instanzen eine Rangzahl zugewiesen.Derartige Rankings werden natürlich regelmäßig aktualisiert und der zeitliche Zusammenhang analysiert. Hierzu kann das Skalarprodukt der Rankingvektoren verschiedener Zeitpunkte herangezogen werden. Wir betrachten beispielhaft das Ranking von vier Objekten. In Tabelle 12.3 sind die 24 verschiedenen Rankings jeweils in den Zeilen 2 bis 5 dargestellt. In der sechsten Zeile finden Sie jeweils das Skalarprodukt des entsprechenden Vektors y mit dem Vektor x = (1 , 2 , 3 , 4). Beispielsweise ergibt sich der untere Eintrag in der ■ ersten Spalte als 〈 (1 , 2 , 3 , 4) T , (1 , 2 , 3 , 4) T 〉 = 1 2 + 2 2 + 3 2 + 4 2 = 30 ■ letzten Spalte als 〈 (1 , 2 , 3 , 4) T , (4 , 3 , 2 , 1) T 〉 = 1 · 4 + 2 · 3 + 3 · 2 + 4 · 1 = 20 Die Tabelle ist nach absteigender Größe dieses Skalarproduktes sortiert. Man sieht, dass die Fälle völliger Gleichläufigkeit bzw. Gegenläufigkeit von x und y die Tabellenränder d.h. die maximalen und minimalen Skalarprodukte festlegen. Außerdem kann man feststellen, dass bei zwei Vektoren, die sich nur durch eine Vertauschung zweier Elemente unterscheiden, derjenige das geringere Skalarprodukt mit x = (1 , 2 , 3 , 4) T hat, bei dem die vertauschten Elemente in absteigender Größe vorliegen (z.B. bei den hervorgehobenen Rankings) Das Skalarprodukt beschreibt also, wie „aufsteigend“ der Vektor y in seinen Komponenten ist, es ist eine Kennzahl für den Grad der Gleichläufigkeit mit dem - vollständig „aufsteigenden“ Vektor (1 , 2 , 3 , 4) T . Das Skalarprodukt zweier Rangreihen kann also als Maßzahl für die Gleichbzw. Gegenläufigkeit der Rangreihen dienen. Ein Wert nahe 30 bedeutet hier ungefähre Gleich- 48818_Terveer.indd 306 48818_Terveer.indd 306 18.07.2023 11: 59: 26 18.07.2023 11: 59: 26 <?page no="307"?> 12.4 Vektorgeometrie 307 läufigkeit, ein Wert nahe 20 hingegen ungefähre Gegenläufigkeit. Der in der Statistik häufig verwendete Pearson’sche Korrelationskoeffizient, mit dem der lineare Zusammenhang zwischen Datenreihen gemessen wird, ist eine „standardisierte“ Version des Skalarproduktes. Beispiel 12.29 Wiederum im R 3 betrachten wir a (1) = 3 / 5 4 / 5 0 , a (2) = 4 / 5 − 3 / 5 0 , a (3) = 001 . Je zwei dieser Vektoren sind orthonormal: ⟨ a ( j ) , a ( j ) ⟩ = 0 für i ̸ = j und ∥ a ( i ) ∥ = 1. Im vorangegangenen Beispiel sagt man auch, dass a (1) , a (2) , a (3) paarweise orthonormal sind. Ein weiteres Beispiel paarweise orthonormaler Vektoren sind im R n die Einheitsvektoren e (1) , . . . , e ( n ) . Satz 12.8 (Eigenschaften des Skalarproduktes) S1. Positivität: Für alle x ∈ R n gilt: ⟨ x, x ⟩ ≥ 0. Außerdem ist x = ¯0 ⇐⇒ ⟨ x, x ⟩ = 0 S2. Symmetrie: Für alle x , y ∈ R n gilt: ⟨ x, y ⟩ = ⟨ y, x ⟩ . S3. Bilinearität: Für alle x , y , z ∈ R n , α ∈ R gilt: a. ⟨ x, y + z ⟩ = ⟨ x, y ⟩ + ⟨ x, z ⟩ und ⟨ x + y, z ⟩ = ⟨ x, z ⟩ + ⟨ y, z ⟩ b. ⟨ x, αy ⟩ = α ⟨ x, y ⟩ = ⟨ αx, y ⟩ Bei der Motivation des Skalarproduktes im R 2 war bereits deutlich geworden, dass der Wert ⟨ x,y ⟩ ∥ x ∥∥ y ∥ selber als Kosinus des Winkels zwischen den Strahlen, die von x und y erzeugt werden, interpretiert werden kann. Damit dies auch im geometrisch nicht mehr darstellbaren R n möglich ist, muss sichergestellt sein, dass dieser Bruch auch in der allgemeinen Form stets zwischen − 1 und 1 liegt. Dies ist in der Tat der Fall. Satz 12.9 (Cauchy-Schwarz-Ungleichung) Für alle x , y ∈ R n gilt |⟨ x, y ⟩| ≤ ∥ x ∥ · ∥ y ∥ . Dabei gilt |⟨ x, y ⟩| = ∥ x ∥ · ∥ y ∥ genau dann, wenn x, y linear abhängig sind. Zur Begründung: Die Ungleichung ist sicher richtig für y = ¯0. ist y ̸ = ¯0, so folgt für alle α ∈ R mittels S2 und S3 die (Un)gleichungskette 0 ≤ ⟨ x − αy, x − αy ⟩ = ⟨ x, x ⟩ − 2 α ⟨ x, y ⟩ + α 2 ⟨ y, y ⟩ = ∥ x ∥ 2 − 2 α ⟨ x, y ⟩ + α 2 ∥ y ∥ 2 . Der letztgenannte Term ist also nichtnegativ. Speziell mit α = ⟨ x,y ⟩ ∥ y ∥ 2 erhält man die Ungleichung ∥ x ∥ 2 − ⟨ x,y ⟩ 2 ∥ y ∥ 2 ≥ 0. Daraus folgt die Cauchy-Schwarz-Ungleichung. Wenn x, y linear abhängig sind, also beispielsweise y = αx mit einem geeigneten Skalar α ∈ R gilt, so ist |⟨ x, y ⟩| = |⟨ x, αx ⟩| = | α ⟨ x, x ⟩| = | α | · ∥ x ∥ 2 = ∥ x ∥ · ∥ αx ∥ = ∥ x ∥ · ∥ y ∥ . Gilt umgekehrt die Gleichheit |⟨ x, y ⟩| = ∥ x ∥ · ∥ y ∥ , so bedeutet dies, dass in der oben stehenden Ungleichungskette mit α = ⟨ x,y ⟩ ∥ y ∥ 2 schon überall Gleichheit gelten muss, also gilt ⟨ x − αy, x − αy ⟩ = 0. Das ist nach S1 aber nur möglich, wenn schon x − αy = 0 gilt, also sind x, y linear abhängig. Die Cauchy-Schwarz-Ungleichung lässt sich für x ̸ = ¯0 , y ̸ = ¯0 in die Form − 1 ≤ ⟨ x,y ⟩ ∥ x ∥·∥ y ∥ ≤ 1 bringen. Wie in der Anschauungsebene können Sie daher diesen Ausdruck als Kosinus des Winkels interpretieren, der von x und y mit der Winkel-Basis ¯0 erzeugt wird. Mit der Cauchy-Schwarz-Ungleichung wird in der Analysis die Interpretation des 48818_Terveer.indd 307 48818_Terveer.indd 307 18.07.2023 11: 59: 35 18.07.2023 11: 59: 35 <?page no="308"?> 308 12 Vektoren so genannten Gradienten einer differenzierbaren Funktion als Richtung des steilsten Anstiegs möglich werden. Einen ersten Nutzen hat die Cauchy-Schwarz-Ungleichung beim folgenden Nachweis der Dreiecksungleichung der euklidischen Norm. Satz 12.10 (Eigenschaften der Norm) N1. Für alle x ∈ R n gilt: ∥ x ∥ ≥ 0. Ferner gilt: x = ¯0 ⇐⇒ ∥ x ∥ = 0. N2. Für alle x ∈ R n , α ∈ R gilt: ∥ αx ∥ = | α | · ∥ x ∥ . N3. Dreiecksungleichung: Für alle x , y ∈ R n gilt: ∥ x + y ∥ ≤ ∥ x ∥ + ∥ y ∥ . Zur Begründung: N1 und N2 sind unmittelbare Konsequenzen von S1 und S3. Die Dreiecksungleichung folgt mit Hilfe der Cauchy-Schwarz-Ungleichung: ∥ x + y ∥ 2 = ∥ x ∥ 2 + 2 ⟨ x, y ⟩ + ∥ y ∥ 2 CS ≤ ∥ x ∥ 2 + 2 ∥ x ∥ · ∥ y ∥ + ∥ y ∥ 2 = ( ∥ x ∥ + ∥ y ∥ ) 2 Die Norm des Vektors ( x 1 ) mit nur einer Komponente ist gleich √ x 21 = | x 1 | . Die Norm für n = 1 entspricht also dem Absolutbetrag einer reellen Zahl. Dann sind N1, N2 und N3 die wohlbekannte Eigenschaften des Absolutbetrages vgl. S. 119. Die Anschauungsebene und den Anschauungsraum kann man sich vermöge eines Systems von aufeinander senkrecht stehenden Koordinatenachsen vorstellen. Die Eigenschaft der Achsen, paarweise aufeinander senkrecht zu stehen, ermöglicht das effiziente Ablesen von Koordinaten, weil den Achsen die orthonormalen Einheitsvektoren zugrunde liegen. Sind zwei Vektoren x = ( x 1 , x 2 ) T , y = ( y 1 , y 2 ) T des R 2 zueinander orthogonal und vom Nullvektor verschieden, so liegt die Situation aus Abbildung 12.5 vgl. S. 304 vor.Die beiden Vektoren bilden eine um einen Winkel α aus dem Standard-Koordinatensystem „ gedrehte“ Basis des R 2 . Das Ablesen von Koordinaten in dieser Basis ist hier, aber vor allem bei Basen orthonomaler Vektoren im R n fast genau so einfach, als würde es sich bei der Basis um die Einheitsvektoren handeln. Satz 12.11 (Orthogonalität und Koordinatensysteme) [1] Sind a (1) , . . . , a ( m ) vom Nullvektor verschiedene Vektoren des R n und paarweise orthogonal, so sind sie linear unabhängig. Insbesondere gilt m ≤ n , d.h. das System besteht aus höchstens n Vektoren. [2] Sind a (1) , . . . , a ( n ) ∈ R n paarweise orthonormal, so gilt für jeden Vektor x ∈ R n die Koordinatendarstellung x = ⟨ a (1) , x ⟩ a (1) + · · · + ⟨ a ( n ) , x ⟩ a (1) . Zur Begründung: Es sei α 1 a (1) + . . . + α m a ( m ) = ¯0 eine Linearkombination des Nullvektors aus a (1) , . . . , a ( m ) ; zu zeigen ist α 1 = . . . = α m = 0. Für alle i ∈ { 1 , . . . , m } gilt: 0 = ⟨ α 1 a (1) + . . . + α m a ( m ) , a ( i ) ⟩ = α 1 ⟨ a (1) , a ( i ) ⟩ + . . . + α m ⟨ a ( m ) , a ( i ) ⟩ = α i ⟨ a ( i ) , a ( i ) ⟩ Wegen a ( i ) ̸ = ¯0 folgt ⟨ a ( i ) , a ( i ) ⟩ ̸ = 0, also α i = 0. Da i ∈ { 1 , . . . , m } beliebig war, folgt α 1 = . . . = α m = 0. Das ergibt den ersten Teil von 1. Mehr als n linear unabhängige Vektoren im R n kann es nicht geben, daher auch nicht mehr als n paarweise orthonormale. Zu 2. sei der Vektor y : = x − ( ⟨ a (1) , x ⟩ a (1) + · · · + ⟨ a ( n ) , x ⟩ a ( n ) ). Dann gilt für jedes i = 1 , . . . , n : ⟨ y, a ( i ) ⟩ = ⟨ x − ( ⟨ a (1) , x ⟩ a (1) + · · · + ⟨ a ( n ) , x ⟩ a ( n ) ) , a ( i ) ⟩ = ⟨ x, a ( i ) ⟩ − ( ⟨ a (1) , x ⟩⟨ a (1) , a ( i ) ⟩ − · · · − ⟨ a ( n ) , x ⟩⟨ a ( n ) , a ( i ) ⟩ = ⟨ x, a i ⟩ − ⟨ a i , x ⟩⟨ a i , a i ⟩ = 0 denn ⟨ a ( i ) , a ( i ) ⟩ = 1 aufgrund der Orthonormalität der a ( i ) . Also ist y ⊥ a ( i ) für alle i . y ist also orthonormal zu allen Vektoren a (1) , . . . , a ( n ) . Wäre nun y ̸ = ¯0, so wären a (1) , . . . a ( n ) , y linear unabhängig, aber wegen [1] kann es höchstens n linear unabhängige Vektoren geben; y muss daher der Nullvektor sein, d.h. x − ( ⟨ a (1) , x ⟩ a (1) + · · · + ⟨ a ( n ) , x ⟩ a ( n ) ) = ¯0, womit [2] folgt. 48818_Terveer.indd 308 48818_Terveer.indd 308 18.07.2023 11: 59: 47 18.07.2023 11: 59: 47 <?page no="309"?> 12.5 Abstandsmessung, Projektionen und KQ-Methode 309 Beispiel 12.30 Betrachtet werden noch einmal die drei paarweise orthonormalen Vektoren a (1) = ( 35 , 45 , 0) T , a (2) = ( 45 , − 35 , 0) T , a (3) = (0 , 0 , 1) T aus Beispiel 12.29 vgl. S. 307 . Für jeden Vektor x = ( x 1 , x 2 , x 3 ) T ∈ R 3 gilt: Die Koordinaten von x als LK von a (1) , a (2) , a (3) lesen sich dann ab als ⟨ x, a (1) ⟩ = 35 x 1 + 45 x 2 , ⟨ x, a (2) ⟩ = 45 x 1 − 35 x 2 , ⟨ x, a (3) ⟩ = x 3 . Übungen zu Abschnitt 12.4 ? 14. Es seien m 1 , m 2 ̸ = 0. Zeigen Sie mit Hilfe des Skalarproduktes in der Anschauungsebene: Geraden y = y 0 + m 1 ( x − x 0 ) und y = y 0 + m 2 ( x − x 0 ) durch einen Punkt P ( x 0 | y 0 ) stehen genau dann senkrecht aufeinander, wenn m 1 m 2 = − 1. 15. Es seien x, y ∈ R n Vektoren, deren Komponenten jeweils die Zahlen 1 , . . . , n in willkürlicher Reihenfolge sind. Welche Werte nimmt das Skalarprodukt ⟨ x, y ⟩ mindestens und höchstens an a) im Fall n = 5, n = 6? b) im Fall, dass n ∈ N beliebig ist? 16. Berechnen Sie den Winkel ϕ zwischen den Vektoren x und y a) x = (4 , 3) T , y = (7 , 24) T b) x = ( − 1 , 1 , − 1 , 1) T , y = (1 , 3 , 5 , 7) T 17. Für welche(s) t ∈ R sind die Vektoren x = (6 , 3 t, − t, 1) T und y = ( t, t, − 2 t, 1) T orthogonal? 18. Zeige: Sind a (1) , . . . , a ( n ) ∈ R n von ¯0 verschieden und paarweise orthogonal, gilt x = ⟨ x,a (1) ⟩ ⟨ a (1) ,a (1) ⟩ a (1) + · · · + ⟨ x,a ( n ) ⟩ ⟨ a ( n ) ,a ( n ) ⟩ a ( n ) für jeden Vektor x ∈ R n . 12.5 Abstandsmessung, Projektionen und KQ-Methode Wir wollen in diesem letzten Abschnitt das Konzept der Abstandsmessung zwischen Vektoren und seine Anwendungen in der Ökonomie genauer beleuchten. Auf der Zahlengerade R wird mit dem Absolutbetrag | x − y | der Abstand zwischen rellen Zahlen x , y gemessen. In der Anschauungsebene kann man über die euklidische Norm ∥ x − y ∥ = √ ( x 1 − y 1 ) 2 + ( x 2 − y 2 ) 2 die „Vogelflug-Distanz“ zwischen Vektoren x, y ∈ R 2 berechnen. Entsprechend lässt sich der Abstand im R n über die euklidische Norm erklären. Definition 12.12 ! Für x, y ∈ R n heißt d ( x, y ) : = ∥ x − y ∥ euklidischer Abstand zwischen x und y . Beispiel 12.31 Im R 3 haben x = (3 , 1 , 5) T , y = (0 , 5 , 5) T den euklidischen Abstand d ( x, y ) = √ (3 − 0) 2 + (1 − 5) 2 + (5 − 5) 2 = √ 9 + 16 = √ 25 = 5 Bei der Festlegung von Folgen-Grenzwerten, aber auch Funktionsgrenzwerten und letztlich dem Konzept der Stetigkeit und Differenzierbarkeit spielt die Ungleichung | y − x | ≤ r mit vorgegebenem x und r > 0 und die Frage, welche y diese Ungleichung erfüllen, eine Rolle. Aufgelöst nach y ergibt sich x − r ≤ y ≤ x + r , d.h. als Lösungsmenge das Intervall [ x − r ; x + r ]. Für die Analysis in mehreren Variablen benötigt man ein ähnliches Abstandskonzept. Weil die euklidische Norm als Verallgemeinerung des 48818_Terveer.indd 309 48818_Terveer.indd 309 18.07.2023 11: 59: 55 18.07.2023 11: 59: 55 <?page no="310"?> 310 12 Vektoren Abbildung 12.7: Offener Ball mit Radius 1 um (0 , 0) T (Einheitskreis) Kreditkunde Jahre Einkommen Tourenziel W/ O N/ S S. Arrus 19 16 E. Uklid 7 14 N. Ewton 18 22 T. Hales 14 7 L. Eibniz 21 14 Kreditkunde Jahre Einkommen Tourenziel W/ O N/ S H. Ilbert 37 7 C. Auchy 12 9 G. Auß 14 19 H. Esse 5 11 E. Uler 29 20 Tabelle 12.4: Daten zu den Beispielen 12.33 und 12.34 Betrages angesehen werden kann, bietet es sich im Zusammenhang mit Vektoren an, für einen Vektor x ∈ R n die Menge aller y ∈ R n zu betrachten, für die ∥ y − x ∥ < r . Definition 12.13 ! Für x ∈ R n , r ≥ 0 heißt B ( x, r ) : = { y ∈ R n : d ( x, y ) = ∥ x − y ∥ < r } offener Ball um x ∈ R n mit Radius r ≥ 0. B (¯0 , 1) heißt Einheitsball. Für n = 2 entsteht hieraus die Ungleichung √ ( y 1 − x 1 ) 2 + ( y 2 − x 2 ) 2 < r , welche einen Kreis mit Radius r und Mittelpunkt ( x 1 , x 2 ) T beschreibt. Für n = 3 lautet die Ungleichung √ ( y 1 − x 1 ) 2 + ( y 2 − x 2 ) 2 + ( y 3 − x 3 ) 2 < r und beschreibt eine Kugel mit Radius r und Zentrum ( x 1 , x 2 , x 3 ) T . Beispiel 12.32 Der zu x = (0 , 0) T , r = 1 gehörige Einheitsball B ( x, r ) im R 2 ist in Abbildung 12.7 skizziert. Üblich ist hier die Sprechweise „Kreis“anstelle von „Ball“. Achtung: die Kreislinie { y ∈ R n : d ( x, y ) = r } gehört definitionsgemäß nicht zu B ( x, r ), sie stellt vielmehr den Rand von B ( x, r ) dar. Abstände und Ball-Umgebungen spielen aber nicht nur in der Analysis mehrerer Variablen eine grundlegende Rolle, sondern sie werden auch in der Statistik verwendet, z.B. im Rahmen der so genannten Diskriminanzanalyse: Beispiel 12.33 Einer Bank liegt der Antrag von E. Uler auf Gewährung eines Kredites vor, darin unter anderem, in wie vielen Jahren der Kunde ins Rentenalter eintritt, sowie sein frei verfügbares Nettoeinkommen (in Tausend e ). Bei E. Uler ergibt dies sein Kundenprofil (29 | 20). Anhand der Darlehensunterlagen sollen die Bedingungen für das Darlehen festgelegt werden. Der Antrag wird mit den letzten neun abgeschlossenen Verträgen verglichen; aus demjenigen Vertrag, dessen Daten dem aktuellen Antrag 48818_Terveer.indd 310 48818_Terveer.indd 310 18.07.2023 12: 00: 01 18.07.2023 12: 00: 01 <?page no="311"?> 12.5 Abstandsmessung, Projektionen und KQ-Methode 311 Abbildung 12.8: Darstellung der zehn Kundenprofile aus Beispiel 12.33 Kunde/ Tourenziel Daten euklidische Distanz City-Block-Distanz S. Arrus (19 | 16) √ 116 14 E. Uklid (7 | 14) √ 520 28 N. Ewton (18 | 22) √ 137 13 T. Hales (14 | 7) √ 394 28 L. Eibniz (21 | 14) √ 100 14 H. Ilbert (37 | 7) √ 233 21 C. Auchy (12 | 9) √ 410 28 G. Auß (14 | 19) √ 226 16 H. Esse (5 | 11) √ 657 23 Tabelle 12.5: Distanzen zu (29 | 20) (E.Uler) in Beispielen 12.33 und 12.34 am nächsten liegen, werden die Konditionen für den neuen Vertrag entnommen. Die Daten der Altverträge und die von E.Uler liegen in Tabelle 12.4 vor, sie sind zugleich in Abbildung 12.8 visuell dargestellt. Die Affinität könnte man beispielsweise durch Berechnung des minimalen - euklidischen - Abstandes ermitteln. Die neun relevanten Abstandswerte sind in Tabelle 12.5 angegeben. Demnach sind die Konditionen des Vertrages mit L.Eibniz zu übernehmen, die kleinste Distanz beträgt √ (29 − 21) 2 + (20 − 14) 2 = 10 Einheiten. Alle anderen Kundenprofile liegen außerhalb des Kreises (der Kugel), dessen Mittelpunkt das Profil von E.Uler ist und auf dessen Rand das Profil von L.Eibniz liegt. Das Beispiel beschreibt typische Aufgaben der Diskriminanzanalyse: ■ Personen/ Objekte sollen anhand ihrer Profile in vorgegebene Klassen eingeordnet werden; ■ In jedem Fall ist die Affinität zu den Klassen anhand eines geeigneten Abstandsmaßes zu bestimmen. ■ Beim Idealtypen-Ansatz wird die Zuordnung zu den Klassen anhand der Affinität von Repräsentanten der Klassen (als Idealtypen bezeichnet) vorgenommen. Im Kreditbeispiel sind die Idealtypen gerade durch die Altverträge und deren Konditionen gegeben. Die Affinität wird mittels der euklidischen Distanz - auch „Vogelflugdistanz“ genannt - berechnet. Reale Kundenprofile enthalten in aller Regel wesentlich mehr Informationen, d.h. stammen aus höherdimensionalen Vektorräumen. Hierfür könnte man dann beispielsweise die euklidische Distanz im R n verwenden. Aber selbst bei einem einfachen Datensatz wie dem vorliegenden muss die Wahl des Abstandsmaßes oft aus sachlogischen Gründen doch noch genauer überlegt werden. Um dies zu verdeutlichen, verwenden wir die gleichen Zahlen in einem völlig anderen Kontext, nämlich der Routenplanung: 48818_Terveer.indd 311 48818_Terveer.indd 311 18.07.2023 12: 00: 04 18.07.2023 12: 00: 04 <?page no="312"?> 312 12 Vektoren Abbildung 12.9: Stadtplan mit Zielorten und Startpunkt aus Beispiel 12.34 Beispiel 12.34 Dem Fahrradkurier E. Uler liegen GPS-Daten seiner Position und von neun anzufahrenden Zielen als Koordinaten gemäß Tabelle 12.4 vor. E. Uler möchte das am nächsten liegende Ziel anfahren, wobei er dem Verlauf der Straßen vgl. Abbildung 12.9 folgen muss. Weglängen sind hier also nicht euklidische Distanzen, sondern City- Block-Distanzen, d.h. Summe der Teilwege in Ost-West- und Nord-Süd-Richtung. Nächstliegender Kunde zu E.Uler mit Distanz | 29 − 18 | + | 20 − 22 | = 13 ist N.Ewton. Alle City-Block-Distanzen zu E. Uler sind in Tabelle 12.5 dargestellt, in Abbildung 12.9 zusätzlich alle Punkte mit City-Block-Distanz 13 zum Startpunkt von E.Uler. Alle anderen Punkte liegen außerhalb dieses hierdurch festgelegten Quadrates, haben also eine größere City-Block-Distanz zu E.Uler. Der Kunde L.Eibniz ist hinsichtlich Vogelflugdistanz nächster Kunde, nicht aber hinsichtlich City-Block-Distanz. Im Beispiel der Routenplanung erfolgt die Auswahl des nächsten Zieles also ganz anders als bei der Kreditvergabe, obwohl die gleichen Zahlenwerte zugrunde liegen. Ursächlich hierfür ist allein das aus sachlogischen Gründen zu verwendende Distanzmaß. Bei der Auswahl könnten aber auch noch andere Aspekte zu berücksichtigen sein: ■ Im Kreditbeispiel ist das frei verfügbare Nettoeinkommen ggf. höher zu bewerten als die Zeit bis zum Renteneintritt. ■ In Routenbeispiel könnten Nord-Süd-Straßen vorrangig befahrbar sein. Fazit dieser Überlegungen und in vielen anderen Situationen zu berücksichtigen: Für die Klassifikation ist entscheidend, dass man mit einem dem Sachzusammenhang angemessenen Distanzmaß arbeitet. Als prominente, im Kontext der Diskriminanzanalyse oft verwendete Beispiele solcher Abstandsmaße zwischen Vektoren x, y ∈ R n seien genannt: ■ l p -Abstände für p > 0: d p ( x, y ) : = p √ | x 1 − y 1 | p + · · · + | x n − y n | p . In Statistik- Programmen wird d p Minkowski-Distanz genannt. Es fußt auf der l p -Norm ∥ x ∥ p : = p √ | x 1 | p + · · · + | x n | p . Der Fall p = 1 (Summe absoluter Differenzen) wurde in Beispiel 12.34 vgl. S. 312 eingeführt; d 1 heißt (City-)Block- oder Manhattan- Distanz. Der Fall p = 2 ist die anfangs besprochende euklidische Distanz. ■ l ∞ -Abstand: d ∞ ( x, y ) : = max {| x i − y i | : 1 ≤ i ≤ n } (Tschebyscheff-Distanz). Hierzu gehört die Norm ∥ x ∥ ∞ : = max {| x 1 | , . . . , | x n |} . 48818_Terveer.indd 312 48818_Terveer.indd 312 18.07.2023 12: 00: 08 18.07.2023 12: 00: 08 <?page no="313"?> 12.5 Abstandsmessung, Projektionen und KQ-Methode 313 p Name der Metrik Formel für die Einheitsbälle 12 √ | x | + √ | y | < 1 1 City-Block | x | + | y | < 1 2 Euklid x 2 + y 2 < 1 3 | x | 3 + | y | 3 < 1 ∞ Tschebyscheff max {| x | , | y |} < 1 Abbildung 12.10: l p -Einheitsbälle im R 2 für p = 12 (grau), p = 1 (weiß), p = 2 (dunkelgrau) , p = 3 (grau außen), p = ∞ (gestrichelt) Um zu illustrieren, wie l p -Abstände zwischen Vektoren gemessen werden, werden die Einheitsbälle B p (¯0 , 1) im R 2 dargestellt, die sich ergeben, wenn man anstelle der gewöhnlichen euklidischen Distanz eine l p -Metrik verwendet: Für p < ∞ liegt ein Punkt ( x, y ) T ∈ R 2 im Einheitsball B p (¯0 , 1), wenn ∥ ( x, y ) T − (0 , 0) T ∥ p < 1 gilt, d.h. p √ | x | p + | y | p < 1 ⇔ | x | p + | y | p < 1. Aus der Gleichung | x | p + | y | p = 1 erhält man unterschiedliche Formeln für die Begrenzungslinien der Einheitsbälle in den vier Quadranten des R 2 vgl. Abbildung 12.10 . Die l p -Metriken haben einige wichtige Eigenschaften: Satz 12.12 D1. Für alle x , y ∈ R n gilt: d p ( x, y ) ≥ 0. Ferner ist d p ( x, y ) = 0 ⇐⇒ x = y D2. Für alle x , y ∈ R n gilt: d p ( x, y ) = d p ( y, x ) D3. Für alle x , y , z ∈ R n gilt: d p ( x, z ) ≤ d p ( x, y ) + d p ( y, z ) D4. Für alle x , y , z ∈ R n gilt: d p ( x, z ) ≥ | d p ( x, y ) − d p ( y, z ) | Begründung für den Fall p = 2 der euklidischen Distanz: D1, D2 und D3 folgen aus den Eigenschaften N1, N2 und N3 vgl. S. 308. Für D4 nutzt man D2 und D3 aus: Einerseits ist d ( x, y ) ≤ d ( x, z )+ d ( z, y ) ⇒ d ( x, z ) ≥ d ( x, y ) − d ( y, z ). Andererseits ist d ( y, z ) ≤ d ( y, x )+ d ( x, z ) ⇒ − d ( x, z ) ≤ d ( x, y ) − d ( y, z ). Insgesamt ergibt sich − d ( x, z ) ≤ d ( x, y ) − d ( y, z ) ≤ d ( x, z ). Das ist aber gleichbedeutend mit D4. Für allgemeines p benötigt man eine Dreiecksungleichung der l p -Norm und eine Verallgemeinerung der Cauchy-Schwarz-Ungleichung, die Hölder-Ungleichung. Definition 12.14 ! Ein Abstandsmaß für Vektoren mit den Eigenschaften D1 bis D3 heißt Metrik. Abstandsmessung wird auch herangezogen, wenn ein Vektor x sich nicht als Linearkombination darstellen lässt und man die „nächstgelegene“ Linearkombination sucht. Definition 12.15 ! Gegeben sei ein Untervektorraum L = Span ( a (1) , . . . , a ( m ) ) des R n sowie ein Vektor x ∈ R n . Ein Vektor z ∗ = α 1 a (1) + · · · + α m a ( m ) ∈ L, für den ∥ x − z ∗ ∥ (bzw. ∥ x − z ∗ ∥ 2 ) minimal ist, heißt Projektion von x auf L. Ob man ∥ x − z ∥ = √ ( x 1 − z 1 ) 2 + · · · + ( x n − z n ) 2 oder ∥ x − z ∥ 2 = ( x 1 − z 1 ) 2 + · · · + ( x n − z n ) 2 minimiert, spielt aus Sicht des Ergebnisvektors z ∗ keine Rolle, in beiden Fällen ergibt sich derselbe Vektor. In der quadrierten Fassung ist aber der Rechenaufwand 48818_Terveer.indd 313 48818_Terveer.indd 313 18.07.2023 12: 00: 19 18.07.2023 12: 00: 19 <?page no="314"?> 314 12 Vektoren Abbildung 12.11: Projektion auf eine Gerade in Beispiel 12.35 geringer, denn man kann die Quadratwurzel, die sich in der euklidischen Distanz versteckt, außer Acht lassen. Die Minimierung dieses (quadrierten) euklidischen Abstands wird als „Methode der kleinsten Quadrate“ bezeichnet. Beispiel 12.35 Wir betrachten ein einfaches Beispiel in der Anschauungsebene. Gesucht ist die Projektion des Vektors x = (1 , − 1) T auf den von a = (2 , 1) T erzeugten Untervektorraum, d.h. auf die Gerade durch den Ursprung und den Punkt (2 | 1). Diese Projektion ist dasjenige skalar Vielfache z = αa = (2 α | α ) von a für das folgender Ausdruck minimal wird: ∥ x − z ∥ 2 = 1 − 2 − 2 α α 2 = (1 − 2 α ) 2 + ( − 1 − α ) 2 = 5( α − 15 ) 2 + 9 25 (Scheitelpunktform), der in α zu minimieren ist. Man erhält α = 15 und z ∗ = ( 45 , 15 ) T als Projektion vgl. Abbildung 12.11 . Der Lösungsvektor z ∗ bildet mit x und a einen rechten Winkel, d.h. x − z ∗ und a sind orthogonal. Wird L von m Vektoren aufgespannt, so sind bei der Minimierung von ∥ z − x ∥ Linearkombinationen z = α 1 a (1) + · · · + α m a ( m ) zu betrachten, es muss in m Koeffizienten α 1 , . . . α m minimiert werden. Wie bei Geraden gilt für den Projektionsvektor z ∗ , dass der Differenzvektor z ∗ − x jeweils orthogonal zu den einzelnen, den Untervektorraum L erzeugenden Vektoren a (1) , a (2) , . . . , sein muss, d.h. ⟨ z ∗ − x, a ( i ) ⟩ = 0. Löst man die Skalarprodukte auf, so gilt also jeweils ⟨ z ∗ , a ( i ) ⟩ = ⟨ x, a ( i ) ⟩ . Setzt man in jede Gleichung die Linearkombination für z ∗ ein, so folgt ⟨ α 1 a (1) + α 2 a (2) + · · · , a ( i ) ⟩ = ⟨ x, a ( i ) ⟩ , i = 1 , 2 , . . . Jetzt kann man das linke Skalarprodukt als Summe schreiben und erhält α 1 ⟨ a (1) , a ( i ) ⟩ + α 2 ⟨ a (2) , a ( i ) ⟩ + · · · = ⟨ x, a ( i ) ⟩ , i = 1 , 2 , . . . . Dies ist ein ein LGS in α 1 , α 2 , . . . , dessen Koeffizienten Skalarprodukte der beteiligten Vektoren sind: Definition 12.16 ! Es seien x, a (1) , . . . , a ( m ) Vektoren des R n und L die lineare Hülle von a (1) , . . . , a ( m ) . Unter den Normalgleichungen versteht man das LGS mit der Gleichungsmatrix ⟨ a (1) , a (1) ⟩ . . . ⟨ a (1) , a ( m ) ⟩ ⟨ a (1) , x ⟩ ... ... ... ⟨ a ( m ) , a (1) ⟩ . . . ⟨ a ( m ) , a ( m ) ⟩ ⟨ a ( m ) , x ⟩ Jede Lösung ( α 1 , . . . , α m ) dieses LGS liefert eine mögliche Darstellung des Projektionsvektors z ∗ = α 1 a (1) + · · · α m a ( m ) . Wenn a (1) , . . . , a ( m ) linear unabhängig sind, so haben die Normalgleichungen eine eindeutige Lösung. 48818_Terveer.indd 314 48818_Terveer.indd 314 18.07.2023 12: 00: 27 18.07.2023 12: 00: 27 <?page no="315"?> 12.5 Abstandsmessung, Projektionen und KQ-Methode 315 Beispiel 12.36 Es sei x = (1 , 4 , 3) T und a (1) = (2 , − 1 , 0) T , a (2) = (1 , 0 , 1) T . Wir suchen die Projektion von x auf den von a (1) , a (2) erzeugten Untervektorraum L, also denjenigen Vektor z = α 1 a (1) + α 2 a (2) , der von x den kleinsten euklidischen Abstand ∥ x − z ∥ hat. Die Gleichungsmatrix der Normalgleichungen wird in Zeilenstufenform überführt: ⟨ a (1) , a (1) ⟩ ⟨ a (1) , a (2) ⟩ ⟨ a (1) , x ⟩ ⟨ a (2) , a (1) ⟩ ⟨ a (2) , a (2) ⟩ ⟨ a (2) , x ⟩ = 5 2 − 2 2 2 4 → 1 0 − 2 0 1 4 Die gesuchte Projektion z ∗ ist also z ∗ = ( − 2) 2 − 1 0 + 4 101 = 024 . Die Berechnung der Projektion ist eine in der Statistik oft verwenete Grundtechnik, sie wird dort als Methode der kleinsten Quadrate (KQ-Methode) bezeichnet und findet Eingang in zahlreiche ökonomische Anwendungen. Beispiel 12.37 (Fortsetzung von Beispiel 12.9 vgl. S. 290 ) Bei dem Versuch, den Gewinn an fünf Tankstellen auf die zwei Umsatzsparten „Kraftstoff“ und „Sonstige“ zurückzuführen, sollte eine Linearkombination g = 3423 3 , 5 = α 0 11111 + α 1 6 2 , 5 8 , 5 6 , 5 9 , 5 + α 2 7657 7 , 5 des links stehenden Gewinnvektors g mit Hilfe der rechts stehenden zwei Umsatzvektoren u (1) , u (2) , sowie eines - von den Spartenumsätzen unabhängigen - Sockelgewinnvektors u (0) (der erste Summand der Linearkombination) gefunden werden. Hier ist g sicher keine Linearkombination von u (0) , u (1) , u (2) ; im R 5 reichen dazu drei Vektoren in aller Regel nicht aus, die Koeffizienten α 0 , α 1 , α 2 sind schon durch drei der fünf Komponenten von g festgelegt, die zwei übrigen Komponenten kombinieren sich nur ausnahmsweise mit denselben Koeffizienten. Statt dessen sucht man eine Linearkombination, die g im Sinne des kleinsten Abstands bestmöglich erklärt, d.h. es wird die Projektion von g auf den von u (0) , u (1) , u (2) erzeugten Untervektorraum gesucht. Dazu werden die Normalgleichungen aufgestellt und in ZSF überführt: 5 33 32 , 5 15 , 5 33 247 216 , 25 97 , 75 32 , 5 216 , 25 215 , 25 102 , 25 1 0 0 1 , 35026 0 1 0 − 0 , 183097 0 0 1 0 , 455105 Für die Erklärung des Gewinns durch die Spartenumsätze u 1 , u 2 würde der Tankstellenbesitzer also den Näherungsterm 1 , 35 − 0 , 18 u 1 + 0 , 46 u 2 verwenden. Der Kraftstoffumsatz wirkt sich defizitär auf den Gewinn aus. Investitionen im Bereich des sonstigen Angebots könnten den Gewinn erhöhen. Bei der Interpretation dieses fiktiven Beispiels ist allerdings Vorsicht angebracht, denn die zugrunde liegende Datenbasis ist extrem klein (nur fünf Datensätze). Die berechneten Koeffizienten haben daher nur geringe Aussagekraft (wird fortgesetzt, vgl. S. 323 ). Im folgenden Beispiel soll zwischen zwei rellen ökonomischen Variablen ein Input- Output-Zusammenhang y = f ( x ) geklärt werden. Der strukturelle Zusammenhang 48818_Terveer.indd 315 48818_Terveer.indd 315 18.07.2023 12: 00: 35 18.07.2023 12: 00: 35 <?page no="316"?> 316 12 Vektoren x y 2 88 2 95 18 70 34 24 38 30 x y 28 15 21 25 25 25 39 34 33 33 Tabelle 12.6: Alter in Jahren x und Preis in Tausend Euro y von 10 gebrauchten Porsche 911. Rechts grafische Darstellung der Daten und der optimalen Regressionsgerade. (z.B. f linear, f ( x ) = ax + b oder f quadratisch, f ( x ) = ax 2 + bx + c ) muss gegeben sein, d.h. es müssen die richtigen Koeffizienten für die für die Funktion gefunden werden. Hierzu liegen Datensätze ( x 1 , y 1 ) T , . . . , ( x n , y n ) T vor - in der Ökonomie meist aus Beobachtungen, in den Naturwissenschaften häufiger aus geplanten Experimenten. Beispiel 12.38 Aus einer Erhebung von Gebrauchtwagendaten in einer Online-Verkaufsplattform stehen uns aus dem Jahr 2007 zehn Datenpaare „Alter in Jahren„ und “Preis in Tausend Euro“ des Fahrzeugtyps Porsche 911 zur Verfügung. Diese sind in Tabelle 12.6 angegeben. Zur Preisschätzung suchen wir eine lineare Funktion y = ax + b , mit der sich der Gebrauchtwagenpreis y durch das Alter x des Wagens prognostizieren lässt. Der Faktor a stellt den jährlichen Wertverlust (ggf. Wertsteigerung) dar. Um den Zusammenhang y = ax + b zu spezifizieren, müssen die noch nicht festgelegten Koeffizienten, d.h. Geradensteigung a und Achsenabschnitt b so bestimmt werden, dass der tatsächliche Input-Output-Zusammenhang möglichst gut beschrieben wird. Die Methode der kleinsten Quadrate legt nun durch die Datenpunkte ( x i , y i ) T eine „Ausgleichsgerade“ y = ax + b derart, dass die quadrierten Abstände der Datenpunkte zu der Gerade möglichst gering werden. Hierdurch werden alle Datenpunkte gleichermaßen berücksichtigt, ohne dass dabei Abweichungen nach unten und oben sich gegenseitig annullieren. Zusammengefasst besteht die KQ-Methode darin, den Ausdruck ( y 1 − ( ax 1 + b )) 2 + · · · + ( y n − ( ax n + b )) 2 = ∥ y − ( a x + b 1) ∥ 2 in den Parametern a, b zu minimieren, wobei x = ( x 1 , . . . , x n ) T , y = ( y 1 , . . . , y n ) T und 1 = (1 , . . . , 1) T ∈ R n . Es liegt also wieder ein Projektionsproblem mit den erzeugenden Vektoren x und 1 vor. Die Normalgleichungen hierzu lauten in Matrixschreibweise ( ⟨ x , x ⟩ ⟨ x , 1 ⟩ ⟨ x , y ⟩ ⟨ 1 , x ⟩ ⟨ 1 , 1 ⟩ ⟨ 1 , y ⟩ ) = ( x 21 + · · · + x 2 n x 1 + · · · + x n x 1 y 1 + · · · + x n y n x 1 + · · · + x n n y 1 + · · · + y n ) Beispiel 12.39 (Fortsetzung von Beispiel 12.38) Im Gebrauchtwagenbeispiel erhalten wir als Normalgleichungs-Matrix ( ⟨ x , x ⟩ ⟨ x , 1 ⟩ ⟨ x , y ⟩ ⟨ 1 , x ⟩ ⟨ 1 , 1 ⟩ ⟨ 1 , y ⟩ ) = ( 7392 240 7567 240 10 439 ) → ( 1 0 − 1 , 8192 0 1 87 , 5618 ) Der gesuchte Prognosezusammenhang lautet also y = 87 , 5618 − 1 , 8192 x . Pro Jahr verliert ein Porsche 911 also etwas mehr als 1819 Euro Wert. Auch hier ist bei der Interpretation Vorsicht geboten, da die Datenbasis wieder etwas „spärlich“ ist. Zudem 48818_Terveer.indd 316 48818_Terveer.indd 316 18.07.2023 12: 00: 42 18.07.2023 12: 00: 42 <?page no="317"?> 12.5 Abstandsmessung, Projektionen und KQ-Methode 317 sollte man weitere Faktoren wie Laufleistung etc. mit berücksichtigen, wodurch man weitere Spaltenvektoren und Koeffizienten in das Erklärungsmodell mit aufnimmt. Außerdem wird gerade beim betrachteten Fahrzeugtyp ein „Oldtimer-Effekt“zu berücksichtigen sein, vgl. die vertiefende Übungsaufgabe 26 vgl. S. 318 . Die gewählte Vorgehensweise der Geradenanpassung wird auch als einfache lineare Regression bezeichnet. Mittels der Differentialrechnung mehrerer Variablen vgl. S. 421 oder durch Zeilenumformungen an der obigen Gleichungsmatrix kann man zeigen: Satz 12.13 (Formeln der einfachen linearen Regression) ∥ y − ( a x + b 1) ∥ 2 wird minimal für a = ( ⟨ x , y ⟩− n ¯ x ¯ y ) ( ∥ x ∥ 2 − n ¯ x 2 ) = n i =1 x i y i − n ¯ x ¯ y n i =1 x i − n ¯ x 2 , b = ¯ y − a ¯ x (mit den Bezeichnungen ¯ x : = ( x 1 + · · · + x n ) / n und ¯ y : = ( y 1 + · · · + y n ) / n ) Besonders einfach wird die Berechnung der Projektion, wenn die erzeugenden Vektoren a (1) , . . . , a ( m ) paarweise orthonormal sind. Dann sind nämlich alle auftretenden Skalarprodukte auf der linken Seite der Normalgleichungen gleich Null bzw. Eins und die Normalgleichungen liegen schon in Zeilenstufenform vor. Satz 12.14 Für paarweise orthonormale a (1) , . . . , a ( m ) ∈ R n hat die Projektion von x ∈ R n auf L = Span ( a (1) , . . . , a ( m ) ) die Form z ∗ = ⟨ a (1) , x ⟩ · a (1) + · · · + ⟨ a ( m ) , x ⟩ · a ( m ) Beispiel 12.40 Es seien folgende Vektoren gegeben: x = 2 − 1 3 , a (1) = 0 , 36 0 , 48 0 , 8 , a (2) = − 0 , 48 − 0 , 64 0 , 6 , Die beiden Vektoren a (1) , a (2) sind orthonormal, denn 0 , 36 2 + 0 , 48 2 + 0 , 8 2 = 1 = ( − 0 , 48) 2 + ( − 0 , 64) 2 + 0 , 6 2 0 , 36 · ( − 0 , 48) + 0 , 48 · ( − 0 , 64) + 0 , 8 · 0 , 6 = 0 Die Projektion von x auf den von a (1) , a (2) erzeugten Untervektorraum wird durch die Skalarprodukte von x mit a (1) und mit a (2) festgelegt: ⟨ a (1) , x ⟩ = 2 , 64 , ⟨ a (2) , x ⟩ = 1 , 48, also lautet die Projektion z ∗ = 2 , 64 0 , 36 0 , 48 0 , 8 + 1 , 48 − 0 , 48 − 0 , 64 0 , 6 = 0 , 24 0 , 32 3 Übungen zu Abschnitt 12.5 ? 19. Zeigen Sie |∥ y ∥ − ∥ x ∥| ≤ ∥ x − y ∥ unter Verwendung der Dreiecksungleichung. 20. Geben Sie jeweils einen Vektor x ∈ R 3 an, der die angegebenen drei Eigenschaften hat: [1] ∥ x ∥ 2 = 5, ∥ x ∥ 1 = 7, ∥ x ∥ ∞ = 4 [2] ∥ x ∥ 1 = 42, ∥ x ∥ 2 = 42, ∥ x ∥ ∞ = 42 21. Welcher Vektor in L hat von x den kleinsten euklidischen Abstand? a) L = Span ((1 , 5 , 2) T )), x = (3 , − 3 , − 3) T b) L = Span (( − 2 , 2 , 2 , 1) T , (0 , 3 , 1 , − 3) T ), x = ( − 6 , 2 , 0 , 5) T c) L = Span (( − 2 , − 1 , 0) T , (3 , 1 , − 3) T ), 48818_Terveer.indd 317 48818_Terveer.indd 317 18.07.2023 12: 00: 52 18.07.2023 12: 00: 52 <?page no="318"?> 318 12 Vektoren x = ( − 13 − 3 t, 16 − t, − 3 + 3 t ) T 22. Begründen Sie: Sind a, x ∈ R n mit a ̸ = ¯0, so ist z ∗ = ⟨ a,x ⟩ ∥ a ∥ 2 · a die Projektion von x auf die Gerade Span ( a ). 23. Berechnen Sie die Projektion von ( x 1 , x 2 , x 3 ) T ∈ R 3 auf Span ( (1 , 2 , 1) T , (1 , 1 , − 1) T ) . 24. Aus früheren Marktkäufen möchte Hubert den Preis schätzen, um bei künftigen Einkäufen erfolgreich zu feilschen: kg Bananen 3 2 4 1 2 kg Orangen 2 1 1 1 Euro gezahlt 2,6 1,8 2,7 1,7 1,8 a) Stellen Sie den Sachverhalt als Projektionsaufgabe dar. b) Berechnen Sie die mutmaßlichen kg- Preise für Bananen und Orangen mit der KQ-Methode. c) Auf welchen Preis sollte sich Hubert einstellen, wenn er je 1 kg Bananen und Orangen kaufen will? 25. Leiten Sie die Formeln der einfachen linearen Regression aus den Normalgleichungen her (Satz 12.13) 26. Für die in Tabelle 12.6 vgl. S. 316 angegebenen Gebrauchtwagendaten soll nach der Methode der kleinsten Quadrate ein Zusammenhang der Form y = ax 2 + bx + c gefunden werden. a) Formulieren Sie eine geeignete Projektionsaufgabe und stellen Sie die Normalgleichungen auf. Lösen Sie diese anschließend (z.B. mit Hilfe eines wissenschaftlichen Schultaschenrechners). b) Stellen Sie die Daten zusammen mit dem gefundenen quadratischen Zusammenhang in einem Schaubild dar. Wie lässt sich der Verlauf der Parabel im Sachzusammenhang interpretieren? 27. Kann man die Aufgabe, x ∈ R n als LK von a (1) , . . . , a ( m ) ∈ R n zu schreiben, auch mittels Projektionen lösen? Zusammenfassung Mit dem Konzept des (Spaltenbzw. Zeilen-)Vektors können Sie ökonomische Variablen gebündelt bearbeiten. Nach der Bearbeitung dieses Kapitels sollten Sie in der Lage sein, ■ Vektoren im Sachzusammenhang zu verwenden (Bündelung ökonomischer Größen), ■ Verknüpfungen von Vektoren mit Grundrechenarten (Addition, skalare Multiplikation) durchzuführen und die Bündelung mit diesen Grundrechenarten zu erkennen (z.B. Spreizen von Vektoren), ■ Lineare Unabhängigkeit und Abhängigkeit von Vektorsystemen anhand der Untersuchung von Linearkombinationen zu erkennen, ■ Spezielle Untervektorräume wie den Kern und die lineare Hülle im Sachzusammenhang zu erkennen und für diese Erzeugendensysteme und Basen zu berechnen, ■ Skalarprodukte von Vektoren berechnen und interpretieren zu können, insbesondere hinsichtlich Orthogonalität und Orthonormalität von Vektoren, ■ Abstandskonzepte zu kennen und insbesondere im Zusammenhang mit der Projektion auf Untervektorräume verwenden zu können, ■ Die Projektion eines Vektors auf einen Untervektorraum, der als lineare Hülle vorliegt, berechnen zu können. 48818_Terveer.indd 318 48818_Terveer.indd 318 18.07.2023 12: 00: 55 18.07.2023 12: 00: 55 <?page no="319"?> 13 Matrizen Übersicht Wie Vektoren sind auch Matrizen unverzichtbare mathematische Objekte zur Modellierung in ökonomischen Fragestellungen. Sie helfen dabei, Produktionsstufen, Verschnittpläne, Wanderungsbewegungen, Risiko-Sachverhalte und viele weitere Anwendungssituationen auf strukturierte mathematische Modelle abzubilden. Daneben lassen sich auch viele statistische Datensätze mit Gewinn als Daten-Matrizen auffassen. Neben der unmittelbaren Verflechtung zwischen ökonomischen Profilen in Form des Matrix-Vektor-Produktes vgl. Abschnitt 13.1 werden wir mehrstufige Verflechtungen als Hintereinanderausführung von durch Matrizen beschriebenen linearen Abbildungen kennen lernen vgl. Abschnitt 13.2, S. 323 . Ein größerer Teil dieses Kapitels behandelt den Kalkül für quadratische Matrizen wie Inversion vgl. Abschnitt 13.3, S. 328 , Determinanten vgl. Abschnitt 13.4, S. 333 , Eigenwerte vgl. Abschnitt 13.5, S. 341 und Definitheit vgl. Abschnitt 13.6, S. 348 Mit den Leontief- und den Markoff-Modellen vgl. Abschnitt 13.7, S. 354 schließen zwei Anwendungsmodelle der mathematischen Ökonomie dieses Kapitel ab. 13.1 Matrix-Vektor-Verflechtungen Vektoren, auch solche die ökonomische Profile beschreiben, werden im Kontext oft in andere Vektoren überführt, wobei dieser Vorgang durch Matrizen beschreibbar ist. Beispiel 13.1 (Fortsetzung von Beispiel 10.1 vgl. S. 248 ) Bei der Herstellung der vier Regaltypen bezeichne x = ( x 1 , x 2 , x 3 , x 4 ) T bzw. y = ( y 1 , y 2 , y 3 ) T die Vektoren der herzustellenden Regalquantitäten bzw. der dafür benötigten Bauelementquantitäten. Die rechnerische Zuordnung zwischen x und y wird mit einer Funktion f : R 4 → R 3 beschrieben: y = y 1 y 2 y 3 = f x 1 ... x 4 = 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 x 1 + x 2 + 2 x 3 + 4 x 4 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 Zur Darstellung dieser drei Terme und damit zur Festlegung von f reicht die Angabe der Materialverflechtungsmatrix 2 3 4 5 1 1 2 4 5 10 15 20 48818_Terveer.indd 319 48818_Terveer.indd 319 18.07.2023 12: 00: 59 18.07.2023 12: 00: 59 <?page no="320"?> 320 13 Matrizen völlig aus. Der benötigte Rohstoffvektor ergibt sich durch eine rechnerische Verknüpfung der Materialverflechtungsmatrix mit dem Spaltenvektor der Endprodukte, welche man als Matrix-Vektor-Produkt bezeichnet. Beispiel 13.2 (Übergangsmatrizen in Marktforschungsmodellen) Ein spezielles Produkt wird von zwei Anbietern A 1 , A 2 auf dem Markt zur Verfügung gestellt. Durch eine detaillierte Marktbeobachtung über mehrere Monate ist man zu folgenden Schlüssen bezüglich der Markentreue der Kunden gekommen: ■ Von A 2 zu A 1 wechselt innerhalb eines Monats jeder dritte Kunde. ■ Von A 1 zu A 2 wechselt innerhalb eines Monats jeder fünfte Kunde. Sind x 1 , x 2 die Marktanteile der Anbieter, so erwartet man nach einem Monat neue Marktanteile y 1 = 45 · x 1 + 13 · x 2 und y 2 = 15 · x 1 + 23 · x 2 . Kaufen etwa zu Beginn x 1 = 13 aller Kunden bei A 1 und x 2 = 23 d A 2 , so ergeben sich folgende Marktanteile ■ nach einem Monat: y 1 = 45 · 13 + 13 · 23 = 22 45 , y 2 = 15 · 13 + 23 · 23 = 23 45 ■ nach zwei Monaten: z 1 = 45 · 22 45 + 13 · 23 45 = 379 675 , z 2 = 15 · 22 45 + 23 · 23 45 = 296 675 . Infolge der höheren Markentreue bei Anbieter 1 hat sich das anfängliche das Kundenverhältnis 1 : 2 in 379 : 296 geändert. Langfristig stelle sich ein stabiles Verhältnis 5 : 3 ein, und zwar unabhängig von der Anfangsverteilung. Ob Anbieter auf dem Markt bleiben, ist insofern eine Frage der ökonomischen Rentabilität des stabilen Verhältnisses. Die Kundenwanderung wird mit der Funktion f : R 2 → R 2 , f ( x 1 , x 2 ) = 45 x 1 + 13 x 2 15 x 1 + 23 x 2 modelliert, die sich mit Hilfe der Übergangsmatrix A = 45 13 1 5 23 schreiben lässt. Die Marktanteile des Folgemonats ergeben sich durch eine Verflechtung der Übergangsmatrix mit den Marktanteilen des aktuellen Monats, die ebenfalls als Produkt einer Matrix mit einem Vektor beschrieben werden kann. Definition 13.1 (Matrix und Matrix-Vektor-Produkt) ! [1] Ein Feld A = a 11 · · · a 1 n ... . . . ... a m 1 · · · a mn , bestehend aus m Zeilen und n Spalten mit Einträgen a ij ∈ R heißt m × n -Matrix. R m × n ist die Menge aller reellen m × n -Matrizen. [2] Sei A eine solche reelle m × n -Matrix und x = ( x 1 , . . . , x n ) T ∈ R n ein Vektor. Das Produkt von A und x ist ein Vektor im R m und erklärt als Ax : = a 11 x 1 + a 12 x 2 + . . . + a 1 n x n ... a m 1 x 1 + a m 2 x 2 + . . . + a mn x n Beispiel 13.3 ■ 0 3 3 9 2 2 6 0 6 1 8 5 · 7385 = 0 · 7 + 3 · 3 + 3 · 8 + 9 · 5 2 · 7 + 2 · 3 + 6 · 8 + 0 · 5 6 · 7 + 1 · 3 + 8 · 8 + 5 · 5 = 78 68 134 48818_Terveer.indd 320 48818_Terveer.indd 320 18.07.2023 12: 01: 07 18.07.2023 12: 01: 07 <?page no="321"?> 13.1 Matrix-Vektor-Verflechtungen 321 ■ 45 13 1 5 23 · 1323 = 45 · 13 + 13 · 23 15 · 13 + 23 · 23 = 22 45 23 45 ■ 4 5 13 1 5 23 · 5838 = 45 · 58 + 13 · 38 15 · 58 + 23 · 38 = 5 838 Das letzte Beispiel zeigt das stabile Gleichwicht in Beispiel 13.2. Die Multiplikation Ax einer Matrix mit einem Vektor darf nur durchgeführt werden, wenn A genauso viele Spalten besitzt, wie x Einträge hat. Beispiel 13.4 Das Produkt 1 2 2 4 8 6 · 62 10 kann nicht gebildet werden. Beachten Sie: Das Produkt einer Matrix A und eines Spaltenvektors x wird in der Form Ax und nicht in der Form xA geschrieben - zu letzterem vgl. S. 326 . Produkte von Matrizen und Vektoren treten in der Ökonomie u.a. in der Material- und Sektorenverflechtung, Kostenrechnung, Marktforschung, beim Portfoliomanagement (Volatilität, Korrelation von Aktienkursen), in der Marginalanalyse (Krümmungsverhalten von Funktionen mehrerer Variablen) und in der Risikotheorie (Verlustfunktionen) auf. Die kompakte Darstellung multipler Verflechtungen in Verbindung mit dem Kalkül im Umgang mit solchen Produkten ist der Hauptvorteil der neuen Notation. Zur Linearkombination besteht ein enger Zusammenhang: Ist A eine m × n -Matrix und bezeichnen a (1) , . . . , a ( n ) die Vektoren, welche die erste, zweite,. . . , n -te Spalte von A bilden, so gilt für jeden Vektor x = ( x 1 , . . . , x n ) T Ax = x 1 a (1) + · · · + x n a ( n ) Dies lässt sich auch von rechts nach links lesen, d.h. eine LK x 1 a (1) + · · · + x n a ( n ) von Spaltenvektoren kann man als Produkt Ax schreiben. Beispiel 13.5 ■ 0 3 3 9 2 2 6 0 6 1 8 5 · 7385 = 7 026 + 3 321 + 8 368 + 5 905 ■ ( − 5) 21 + 2 04 + 3 3 − 3 − 50 = 2 0 3 5 1 4 − 3 0 − 5 23 − 1 Die Rechenvorschrift des Matrix-Vektor-Produktes legt eine Abbildung f : R n → R m mit dem Funktionsterm f ( x ) : = Ax fest. Solche und weitere Funktionsterme in mehreren Variablen schreiben wir entweder in der Form f (( x 1 , . . . , x n ) T ) (wenn die Bündelung der Variablen zu einem Spaltenvektor betont werden soll) oder etwas einfacher als f ( x 1 , . . . , x n ). Die vorliegende Funktion „verträgt sich“ mit Vektoroperationen; Vektorsummen und skalare Multiplikationen werden „durchgereicht“. 48818_Terveer.indd 321 48818_Terveer.indd 321 18.07.2023 12: 01: 14 18.07.2023 12: 01: 14 <?page no="322"?> 322 13 Matrizen Satz 13.1 (Matrizen als lineare Abbildungen) Sei A eine m × n -Matrix und f : R n → R m , f ( x ) : = Ax . Dann gilt: L1. f ( x + y ) = f ( x ) + f ( y ) für alle x, y ∈ R n , d.h. A ( x + y ) = Ax + Ay . L2. f ( αx ) = αf ( x ) für alle x ∈ R n , α ∈ R, d.h. A ( αx ) = α ( Ax ). Man sagt: Die Abbildung f : R n → R m , f ( x ) = Ax ist linear. Die Eigenschaft einer Abbildung f : V → W , linear zu sein, hat zunächst einmal nichts mit Matrizen zu tun. Handelt es sich aber bei den Vektorräumen V, W um die (in der Ökonomie meist verwendeten) Spaltenräume V = R n und W = R m , so gehört zu einer linearen Abbildung zwischen V und W automatisch eine Matrix A ∈ R n × m , denn für x = ( x 1 , . . . , x n ) T folgt aus der Linearität f ( x ) = f ( x 1 e (1) + · · · + x n e ( n ) ) = x 1 f ( e (1) ) + · · · + x n f ( e ( n ) ) wobei man x als Linearkombination der Einheitsvektoren schreibt. Satz 13.2 Eine lineare Abbildung f : R n → R m hat stets die Form f ( x ) = Ax . Die Matrix A hat dabei als Spalten die Bilder f ( e (1) ) , . . . , f ( e ( n ) ) der Einheitsvektoren des R n . Beispiel 13.6 Wir betrachten die Funktion f : R 3 → R 2 , f ( x 1 , x 2 , x 3 ) = ( x 1 − 2 x 2 x 3 ) . f ist linear, denn es gilt für alle x = ( x 1 , x 2 , x 3 ) T ∈ R 3 , y = ( y 1 , y 2 , y 3 ) T ∈ R 3 und α ∈ R ■ f ( ( x 1 x 2 x 3 ) + ( y 1 y 2 y 3 ) ) = ( x 1 + y 1 − 2( x 2 + y 2 ) x 3 + y 3 ) = ( x 1 − 2 x 2 x 3 ) + ( y 1 − 2 y 2 y 3 ) = f ( ( x 1 x 2 x 3 ) )+ f ( ( y 1 y 2 y 3 ) ) ■ f ( α ( x 1 x 2 x 3 ) ) = ( αx 1 − 2 αx 2 αx 3 ) = ( α ( x 1 − 2 x 2 ) αx 3 ) = α ( x 1 − 2 x 2 x 3 ) = αf ( ( x 1 x 2 x 3 ) ) Die Spalten der zugehörigen Matrix A sind Bilder der Einheitsvektoren: f ( ( 100 ) ) = ( 10 ) , f ( ( 010 ) ) = ( − 2 0 ) , f ( ( 001 ) ) = ( 01 ) Die Matrix A , welche f beschreibt, lautet also A = ( 1 − 2 0 0 0 1 ) . Fazit: Lineare Abbildungen f : R n → R m und Matrizen A ∈ R m × n entsprechen einander in eindeutiger Weise. Mit dem Matrix-Vektor-Produkt kann ein LGS in n Unbekannten mit Gleichungsmatrix ( A | b ) in der Form Ax = b dargestellt werden, wobei x = ( x 1 , . . . , x n ) T . Zusammen mit dem weiter unten behandelten Matrix-Kalkül lassen sich „quadratische“ lineare Gleichungssysteme mit Hilfe von inversen Matrizen lösen. Auch für die Bestimmung einer Projektion kann das Matrix-Vektor-Produkt verwendet werden. 48818_Terveer.indd 322 48818_Terveer.indd 322 18.07.2023 12: 01: 24 18.07.2023 12: 01: 24 <?page no="323"?> 13.2 Matrix-Matrix-Verflechtungen 323 Satz 13.3 Gegeben sei ein UVR L = Span( a (1) , . . . , a ( m ) ) des R n sowie ein Vektor x ∈ R n . Weiter sei A die n × m -Matrix, die sich aus den m erzeugenden Spaltenvektoren zusammensetzt. Dann ist die Projektion von x auf L derjenige Vektor z ∗ = Aα ∗ mit α ∗ ∈ R m , welcher den Ausdruck ∥ x − Aα ∥ 2 in α ∈ R m minimiert. Beispiel 13.7 (Fortsetzung von Beispiel 12.37 vgl. S. 315 ) Um den Gewinn an fünf Tankstellen auf die zwei Umsatzsparten „Kraftstoff“ und „Sonstige“ zurückzuführen, muss der Gewinnvektor g = (3 , 4 , 2 , 3 , 72 ) T auf den von den Umsatzvektoren erzeugten UVR projiziert werden, d.h. eine Linearkombination z ∗ = α 0 11111 + α 1 6 2 , 5 8 , 5 6 , 5 9 , 5 + α 2 7657 7 , 5 gefunden werden, die von g kleinstmöglichen Abstand hat. Über den Zusammenhang zwischen LK und Matrix-Vektorprodukt stimmt diese Aufgabe damit überein, den Ausdruck ∥ g − Aα ∥ 2 durch geeignete Wahl von α = ( α 0 , α 1 , α 2 ) T ∈ R 3 zu minimieren. Dabei setzt sich A aus den Umsatz- und Sockelgewinnvektoren zusammen: A = 1 6 7 1 2 , 5 6 1 8 , 5 5 1 6 , 5 7 1 9 , 5 7 , 5 ( wird fortgesetzt vgl. S. 327 ) Übungen zu Abschnitt 13.1 ? 1. Berechnen Sie: a) 2 1 4 3 − 3 5 1 2 7 − 1 24 b) − t s − t s − t s s t s c) 1 1 1 . . . 1 1 2 3 . . . n n n − 1 . . . 2 1 T 2. Für welches A ist Ax a)= ( x 3 , x 2 , x 1 ) T b)= ( x 1 , tx 2 , x 3 ) T c) =( x 1 , x 2 , x 3 + tx 1 ) T ? (jeweils für alle x = ( x 1 , x 2 , x 3 ) T ∈ R 3 ) 3. Geben Sie für den Funktionsterm möglichst eine Matrix A mit f ( x ) = Ax an. a) f (( x 1 , x 2 ) T ) = ( x 1 − x 2 , x 1 + x 2 ) T b) f (( x 1 , x 2 ) T ) = ( x 1 + x 2 , x 2 − 1) T c) f (( x 1 , x 2 , x 3 ) T ) = ( x 1 , x 22 / x 3 ) T 13.2 Matrix-Matrix-Verflechtungen Matrizen können in der Ökonomie Prozesse wie Produktionsabläufe und Kundenwanderungen modellieren. Oft muss jedoch die zugehörige Verflechtung mehrstufig abgebildet werden, wobei auf jeder Stufe eine Modellmatrix zum Einsatz kommt. Die sequentielle Ausführung kann dann ebenfalls durch eine Matrix beschrieben werden. Beispiel 13.8 (Fortsetzung von Beispiel 10.1 vgl. S. 248 ) Die Ikebau-GmbH bietet interessierten Möbelhäusern zwei Muster-Zimmer, zum einen Zimmer Z 1 mit einem Regal Bill1 und drei Regalen Bill4, zum anderen Zim- 48818_Terveer.indd 323 48818_Terveer.indd 323 18.07.2023 12: 01: 33 18.07.2023 12: 01: 33 <?page no="324"?> 324 13 Matrizen mer Z 2 mit je zwei Regalen Bill2 und Bill3. Zu der Verflechtungsmatrix A zwischen Rohstoffen („Bauteile“) und Produkten („Regale“) vgl. S. 319 gesellt sich die Verflechtungsmatrix B = 1 0 0 2 0 2 3 0 , für den Zusammenhang zwischen Endprodukten („Zimmer“) und Zwischenprodukten („Regale“). Der Möbelhersteller benötigt den rechnerischen Zusammenhang zwischen den Zimmertypen und den drei Bauteilen Träger, Querstange und Boden. Dieser wird durch eine Matrix beschrieben, die sich spaltenweise gewinnen lässt: ■ Für Zimmer Z 1 werden Regale gemäß Zwischenproduktvektor x (1) = (1 , 0 , 0 , 3) T benötigt mit Rohstoffaufwand A · x (1) = 2 3 4 5 1 1 2 4 5 10 15 20 · 1003 = 17 13 65 ■ Für Zimmer Z 2 werden Regale gemäß Zwischenproduktvektor x (2) = (0 , 2 , 2 , 0) T benötigt mit Rohstoffaufwand A · x (2) = 2 3 4 5 1 1 2 4 5 10 15 20 · 0220 = 14 6 50 Die Verflechtungsmatrix zwischen Zimmern und Bauteilen ist also C = 17 14 13 6 65 50 . C ergibt sich also, indem man die Spalten von B als Vektoren auffasst, die Produkte von A mit diesen Vektoren bildet und die entstehenden Vektoren wieder zu einer Matrix zusammensetzt. Das Ergebnis wird Matrix-Produkt genannt. Beispiel 13.9 (Fortsetzung von Beispiel 13.2 vgl. S. 320 ) Die Kundenwanderung eines Monats für ein spezielles Produkt mit zwei Anbietern A 1 , A 2 ist gegeben durch die Übergangsmatrix A = 45 13 1 5 23 . Nun soll das Übergangsverhalten für zwei Monate modelliert werden. Aus einem Marktanteilvektor x = ( x 1 , x 2 ) T wird nach einem Monat der Anteilvektor y = ( y 1 , y 2 ) T mit y 1 y 2 = Ax = 45 13 1 5 23 · x 1 x 2 = 4 5 x 1 + 13 x 2 15 x 1 + 23 x 2 = x 1 4515 + x 2 1323 Nach zwei Monaten ergibt sich der Marktanteilvektor z = ( z 1 , z 2 ) T mit z = A x 1 4515 + x 2 1323 = x 1 A 4515 + x 2 A 1323 = x 1 53 75 22 75 + x 2 22 45 23 45 = 53 75 22 45 22 75 23 45 x 1 x 2 Der Anteilvektor nach zwei Monaten ist also Bx mit Übergangsmatrix B = 53 75 22 45 22 75 23 45 . Die Matrix B erhält man, indem jeweils das Produkt von A mit den Spalten(-vektoren) aus A gebildet wird und man die Ergebnisse zu einer Matrix zusammensetzt. Der 2- Monats-Übergang wird also durch eine Übergangsmatrix B beschrieben, die als Produkt der Matrix A mit sich selbst aufgefasst werden kann. 48818_Terveer.indd 324 48818_Terveer.indd 324 18.07.2023 12: 01: 40 18.07.2023 12: 01: 40 <?page no="325"?> 13.2 Matrix-Matrix-Verflechtungen 325 a 1 , 1 . . . . . . . . . a 1 ,k ... ... a i, 1 . . . a i,ℓ . . . a i,k ... ... a m, 1 . . . . . . . . . a m,k c 1 , 1 . . . . . . c 1 ,n ... ... c i,j ... ... c m, 1 . . . . . . c m,n b 1 , 1 . . . b 1 ,j . . . b 1 ,n ... ... ... ... b ℓ,j ... ... ... ... b k, 1 . . . b k,j . . . b k,n i -te Zeile j -te Spalte Abbildung 13.1: Falk-Schema zur Matrix-Multiplikation Definition 13.2 ! Das Matrix-Produkt A · B bzw. AB zweier Matrizen A ∈ R m × k , B ∈ R k × n ist diejenige Matrix C ∈ R m × n , welche sich ergibt, wenn die Matrix-Vektorprodukte von A mit jeder Spalte von B gebildet und zu einer Matrix zusammengefasst werden. Die Matrix C hat dann die Einträge c i,j = a i, 1 b 1 ,j + a i, 2 b 2 ,j + . . . + a i,k b k,j . Zur Einübung des Matrix-Produktes zweier konkreter Matrizen sollte anfangs auf das so genannte Falk-Schema in Abbildung 13.1 zurückgegriffen werden; hierbei steht die Matrix A links von der zu berechnenden Matrix C , die Matrix B oberhalb davon. A · B kann nur dann gebildet werden, wenn A genau so viele Spalten wie B Zeilen hat. Beispiel 13.10 ■ 3 2 0 1 1 0 2 0 4 4 − 1 − 3 · 3 2 3 5 1 0 2 0 = 3 · 3 + 2 · 3 + 0 · 1 + 1 · 2 3 · 2 + 2 · 5 + 0 · 0 + 1 · 0 1 · 3 + 0 · 3 + 2 · 1 + 0 · 2 1 · 2 + 0 · 5 + 2 · 0 + 0 · 0 4 · 3 + 4 · 3 − 1 · 1 − 3 · 2 4 · 2 + 4 · 5 − 1 · 0 − 3 · 0 = 17 16 5 2 17 28 ■ In der Regel können A · B und B · A nicht beide gebildet werden: 3 0 1 3 4 1 · 3 2 3 5 = 9 6 12 17 15 13 , aber 3 2 3 5 · 3 0 1 3 4 1 kann nicht gebildet werden. ■ Es muss nicht A · B = B · A gelten, auch wenn beide Ausdrücke existieren: 1 2 0 0 · 0 0 0 1 = 0 2 0 0 , aber 0 0 0 1 · 1 2 0 0 = 0 0 0 0 ■ Selbst wenn A · B und B · A existieren, haben sie verschiedene Dimensionen: 2 0 1 0 3 2 · 1 0 1 − 1 0 1 = 2 1 3 − 1 , aber 1 0 1 − 1 0 1 · 2 0 1 0 3 2 = 2 0 1 2 − 3 − 1 0 3 2 Mathematisch entspricht das Matrix-Produkt A · B der Bestimmung einer Matrix für die Verkettung bzw. Hintereinanderausführung zweier linearer Abbildungen, repräsentiert durch die Matrizen A und B . Die Notation ist konsistent mit dem 48818_Terveer.indd 325 48818_Terveer.indd 325 18.07.2023 12: 01: 50 18.07.2023 12: 01: 50 <?page no="326"?> 326 13 Matrizen ■ Produkt A · b einer Matrix A mit einem Spaltenvektor b (Matrix mit einer Spalte), ■ Produkt b · A eines Zeilenvektors b (Matrix mit einer Zeile) mit einer Matrix A , ■ Produkt a · b von Zeilenvektor und Spaltenvektor (vgl. Skalarprodukt) ( a 1 , . . . , a n ) b 1 ... b n = a 1 b 1 + · · · + a n b n = a 1 ... a n , b 1 ... b n Weiter gibt es für Matrizen die Operationen Addition, Skalarmultiplikation und Transposition, welche die Vektoroperationen verallgemeinern: ■ Für A = [ a i,j ] , B = [ b i,j ] ∈ R m × n ist A + B : = [ a i,j + b i,j ] 1 ≤ i ≤ m 1 ≤ j ≤ n . ■ Für α ∈ R und A = [ a i,j ] ∈ R m × n ist αA : = [ αa i,j ] 1 ≤ i ≤ m 1 ≤ j ≤ n . ■ Für A = [ a i,j ] ∈ R m × n ist A T : = [ b i,j ] 1 ≤ i ≤ n 1 ≤ j ≤ m ∈ R n × m mit b i,j = a j,i . Beispiel 13.11 ■ 2 3 − 1 6 − 5 1 + − 2 8 1 0 1 − 1 = 0 11 0 6 − 4 0 und 4 · 2 3 − 1 6 − 5 1 = 8 12 − 4 24 − 20 4 ■ 2 3 − 1 6 − 5 1 T = 2 6 3 − 5 − 1 1 Diese Operationen sind verträglich mit dem Matrixprodukt im folgenden Sinne: Satz 13.4 [1] (Distributivgesetze) Für A, B ∈ R m × k , C, D ∈ R k × n gilt ( A + B ) · C = ( A · C ) + ( B · C ) , A · ( C + D ) = ( A · C ) + ( A · D ) [2] Für alle A ∈ R m × k , B ∈ R k × n , α ∈ R gilt: α ( A · B ) = A ( α · B ) = ( αA ) · B [3] (Assoziativgesetz) Für alle A ∈ R m × k , B ∈ R k × n , C ∈ R n × p gilt ( A · B ) · C = A · ( B · C ) [4] Für alle A, B ∈ R m × k und α ∈ R gilt: ( A + B ) T = A T + B T und ( αA ) T = α ( A T ) [5] Für alle A ∈ R m × k , B ∈ R k × n gilt (! ) ( A · B ) T = B T · A T Vorsicht! Im Allgemeinen gilt AB ̸ = BA und ( AB ) T ̸ = ( A T B T ) ! Sollte AB = BA doch ausnahmsweise für zwei Matrizen gelten, so sagt man, dass diese beiden Matrizen kommutieren. Mit Hilfe von Matrixprodukt und Transposition lassen sich auch die Normalgleichungen in einer Projektionsaufgabe umschreiben: 48818_Terveer.indd 326 48818_Terveer.indd 326 18.07.2023 12: 02: 00 18.07.2023 12: 02: 00 <?page no="327"?> 13.2 Matrix-Matrix-Verflechtungen 327 Beispiel 13.12 (Projektionsaufgabe, Fortsetzung von Beispiel 13.7 vgl. S. 323 ) Der Gewinn g = (3 , 4 , 2 , 3 , 7 2 ) T an fünf Tankstellen soll auf die zwei Umsatzsparten „Kraftstoff“ und „Sonstige“ zurückgeführt werden. Dazu muss ∥ g − Aα ∥ 2 in α 0 , α 1 , α 2 minimiert werden, wobei sich A spaltenweise aus den Vektoren u (0) = 11111 , u (1) = 6 2 , 5 8 , 5 6 , 5 9 , 5 , u (2) = 7657 7 , 5 zusammensetzt. Die Lösung haben wir über das LGS mit der Gleichungsmatrix ⟨ u (0) , u (0) ⟩ ⟨ u (0) , u (1) ⟩ ⟨ u (0) , u (2) ⟩ ⟨ u (0) , g ⟩ ⟨ u (1) , u (0) ⟩ ⟨ u (1) , u (1) ⟩ ⟨ u (1) , u (2) ⟩ ⟨ u (1) , g ⟩ ⟨ u (2) , u (0) ⟩ ⟨ u (2) , u (1) ⟩ ⟨ u (2) , u (2) ⟩ ⟨ u (2) , g ⟩ = 5 33 32 , 5 15 , 5 33 247 216 , 25 97 , 75 32 , 5 216 , 25 215 , 25 102 , 25 d.h. über die Normalgleichungen bestimmt. Die Koeffizientenmatrix des LGS ergibt sich, indem man alle wechselseitigen Skalarprodukte der erzeugenden Vektoren u ( i ) miteinander bildet. Dies ist aber nichts anderes als das Matrix-Produkt A T A = 1 1 1 1 1 6 2 , 5 8 , 5 6 , 5 9 , 5 7 6 5 7 7 , 5 1 6 7 1 2 , 5 6 1 8 , 5 5 1 6 , 5 7 1 9 , 5 7 , 5 = 5 33 32 , 5 33 247 216 , 25 32 , 5 216 , 25 215 , 25 Die rechte Seite ist genau das Matrix-Vektor-Produkt A T g = 1 1 1 1 1 6 2 , 5 8 , 5 6 , 5 9 , 5 7 6 5 7 7 , 5 3423 3 , 5 = 15 , 5 97 , 75 102 , 25 (wird fortgesetzt vgl. S. 332 ). Ganz allgemein gilt: Satz 13.5 Für die Projektion von x ∈ R n auf L = Span ( a (1) , . . . , a ( m ) ) ⊆ R n sind die Normalgleichungen als LGS ( A T A ) α = A T x darstellbar ( A besteht spaltenweise aus a (1) , . . . , a ( m ) ). Übungen zu Abschnitt 13.2 ? 4. Es seien a = (1 , 2) T , b = (2 , 1 , 3) T , x = ( x, y, z ) T sowie A = 1 − 4 − 2 5 3 − 6 , B = 1 2 3 1 2 3 T , C = 1 0 0 0 2 0 0 0 3 , Berechnen Sie möglichst die Ausdrücke a) A T A, AA T , A 2 , AB, BA, AC, A T C, CA, BCA b) Aa, b T Aa, a T Bb, a T A T Aa, x T C x 5. Gegeben seien die Matrizen A = 1 3 2 4 2 6 3 3 4 2 1 0 , S = 2 0 0 0 1 0 0 0 1 , Q = 1 0 0 0 1 2 0 0 1 , P = 1 0 0 0 0 1 0 1 0 a) Bilden Sie: S · A, Q · A, P · A . Interpretieren Sie die Ergebnisse. b) Was ergibt sich bei S · ( Q · ( P · A ))? 48818_Terveer.indd 327 48818_Terveer.indd 327 18.07.2023 12: 02: 09 18.07.2023 12: 02: 09 <?page no="328"?> 328 13 Matrizen c) Welche Umformungen werden durch Matrixprodukte wie in a) dargestellt? 6. Die Logidig GmbH stellt zwei Varianten von CVD-Abspielgeräten her. In den Bedarfstabellen unten ist dargestellt, wie viele Bauteile T i zur Baugruppe G j (links) und wieviele Baugruppen G j dann zu Gerät P k (rechts) zusammengesetzt werden. G 1 G 2 G 3 T 1 4 2 1 T 2 1 3 0 P 1 P 2 G 1 3 1 G 2 0 3 G 3 2 4 a) Errechnen Sie die Bedarfsmatrix zwischen Bauteilen und Endprodukten. b) Berechnen Sie die Einkaufskosten der Produkte, wenn ein Bauteil T 1 2 Euro und ein Bauteil T 2 3 Euro kostet. c) Wie viele Bauteile T 1 und T 2 werden benötigt, um 10 Abspielgeräte P 1 und 5 Geräte P 2 zu produzieren? 13.3 Quadratische Matrizen In vielen Anwendungen der Matrizenrechnung haben die zugrundeliegenden Matrizen gleiche Zeilen- und Spaltenzahl, weil die Input- und Output-Vektoren der zugehörigen Verflechtungsmodelle gleich viele Komponenten haben. Das war z.B. der Fall in dem behandelten Kundenwanderungsmodell aus der Marktforschung. Daneben sind auch Produktionsmodelle zuweilen von einer derartigen Struktur. Später werden hierzu die so genannten Sektor-Verflechtungsmodelle (Leontief-Modelle, vgl. Unterabschnitt 13.7.1, S. 354 ) vorgestellt. Schließlich finden solche Matrizen mit identischer Zeilen- und Spaltenzahl Verwendung bei der Untersuchung ökonomischer Funktionen mehrerer Variablen im Rahmen der Analysis. Dort fasst man beispielsweise die Ableitungen zweiter Ordnung in den verschiedenen Variablen zu derartigen Matrizen zusammen. Im Folgenden sollen Eigenschaften und Operationen für derartige quadratische Matrizen behandelt werden. Formal bezeichnet man eine Matrix als quadratisch, wenn ihre Zeilenzahl m mit ihrer Spaltenzahl n übereinstimmt, d.h. m = n . Unter den quadratischen Matrizen gibt es einige wichtige Spezialfälle. Definition 13.3 ! [1] Eine quadratische Matrix A ∈ R n × n heißt symmetrisch, falls gilt A = A T . [2] Eine quadratische Matrix A ∈ R n × n heißt Diagonalmatrix, falls a ij = 0 für alle i ̸ = j , i , j ∈ { 1 , . . . , n } (d.h. höchstens die Einträge a 11 , . . . , a nn der sogenannten Hauptdiagonale sind von Null veschieden). [3] Die Diagonalmatrix mit 1-Einträgen auf der Hauptdiagonale heißt Einheitsmatrix I n : = 1 0 . . . . . . 0 0 1 0 ... . . . ... 0 0 . . . 1 0 0 0 . . . 0 1 ∈ R n × n I n setzt sich spaltenweise aus den Einheitsvektoren e (1) , . . . , e ( n ) zusammen. 48818_Terveer.indd 328 48818_Terveer.indd 328 18.07.2023 12: 02: 15 18.07.2023 12: 02: 15 <?page no="329"?> 13.3 Quadratische Matrizen 329 Beispiel 13.13 ■ Die folgenden Matrizen sind quadratisch mit zwei Zeilen und zwei Spalten: 1 2 − 1 1 , 0 5 5 4 , 3 0 0 − 2 , 1 0 0 1 ■ Die folgenden Matrizen sind quadratisch mit drei Zeilen und Spalten: 1 2 0 − 1 1 1 − 1 2 1 , 1 2 0 2 3 − 4 0 − 4 5 , 3 0 0 0 − 2 0 0 0 5 , 1 0 0 0 1 0 0 0 1 Es sind jeweils die zweite bis vierte Matrix symmetrisch, die dritte und vierte diagonal, und die vierte schließlich ist die Einheitsmatrix I 2 bzw. I 3 . Eine Besonderheit bei quadratischen Matrizen besteht darin, dass das Produkt C = AB zweier quadratischer n × n -Matrizen A, B wiederum eine quadratische n × n -Matrix ist. Wie bei der Addition, so bleibt man also auch bei der Multiplikation quadratischer n × n -Matrizen in der gleichen Menge von Matrizen. In Beispiel 13.2 vgl. S. 320 wurde bereits berechnet, dass durch das Produkt A · A = 45 13 1 5 23 · 45 13 1 5 23 = 53 75 22 45 22 75 23 45 die Zwei-Schritt-Übergangsmatrix bestimmt wird. Gerade für diese so genannten Markoff-Modelle sind Matrix-Potenzen von Interesse: Definition 13.4 (Matrixpotenz) ! Ist allgemein A ∈ R n × n , so vereinbart man daher die folgenden Potenzschreibweisen: A 0 : = I n sowie A k : = A · A · · · · · A (mit k Faktoren, lies: „ A hoch k “). Beim Umgang mit reellen Zahlen und den zugehörigen Grundrechenarten Addition und Multiplikation sind die Zahlen Null und Eins besonders ausgezeichnet als neutrale Elemente, die darüber hinaus die Zahlbereichserweiterung von den natürlichen zu den ganzen Zahlen und von den ganzen Zahlen zu den rationalen Zahlen motivieren, indem die Frage nach inversen Größen aufgeworfen wird. Gleiches kann man für quadratische Matrizen versuchen. Während die Null-Matrix - d.h. eine Matrix mit lauter Null-Einträgen - die Rolle des neutralen Elementes der Addition übernimmt, so leistet dies für die Matrix-Multiplikation die Einheitsmatrix; für jede (quadratische) Matrix A ∈ R n × n gilt A · I n = A, I n · A = A . An die Stelle der „Kehrwertbildung“ reeller Zahlen ̸ = 0 tritt im Matrix-Kalkül die Inversion. Definition 13.5 ! Wenn es zu einer Matrix A ∈ R n × n eine Matrix B ∈ R n × n gibt, so dass gilt A · B = I n = B · A, dann heißt A invertierbar und B heißt inverse Matrix zu A . Man verwendet das Symbol A − 1 , um die inverse Matrix zu A zu beschreiben („ A hoch minus 1“). 48818_Terveer.indd 329 48818_Terveer.indd 329 18.07.2023 12: 02: 20 18.07.2023 12: 02: 20 <?page no="330"?> 330 13 Matrizen Wenn B inverse Matrix zu A ist, so ist auch A inverse Matrix zu B . Von den beiden geforderten Eigenschaften AB = I n und BA = I n muss zudem nur eine zutreffen, dann ist die jeweils andere automatisch erfüllt. Ist B = A − 1 gesucht, so entspricht dies der Lösung eines linearen Gleichungssystems in den n 2 Unbekannten b 11 , . . . , b nn . Dessen n 2 Gleichungen lauten für i, j ∈ { 1 , . . . , n } a i 1 b 1 j + · · · + a in b nj = { 1 i = j 0 i ̸ = j Beispiel 13.14 ■ Die inverse Matrix zur Matrix A = ( 1 0 0 2 ) ergibt sich aus dem LGS 1 · b 11 + 0 · b 21 = 1 1 · b 12 + 0 · b 22 = 0 0 · b 11 + 2 · b 21 = 0 0 · b 12 + 2 · b 22 = 1 Es folgt A − 1 = B = ( b 11 b 12 b 21 b 22 ) = ( 1 0 0 12 ) . ■ Die inverse Matrix zur Matrix A = ( 2 3 1 1 ) ergibt sich aus dem LGS 2 · b 11 + 3 · b 21 = 1 2 · b 12 + 3 · b 22 = 0 1 · b 11 + 1 · b 21 = 0 1 · b 12 + 1 · b 22 = 1 Es folgt A − 1 = B = ( b 11 b 12 b 21 b 22 ) = ( − 1 3 1 − 2 ) . ■ Die Matrix A = ( 2 4 1 2 ) hat keine inverse Matrix B . Wegen AB = I 2 wäre sonst 2 b 11 + 4 b 21 = 1 und b 11 + 2 b 21 = 0, was nicht gleichzeitig möglich ist. Sie haben an den ersten beiden Beispielen gesehen, dass die Lösung des zugehörigen linearen Gleichungssystems einfacher ist, als es auf den ersten Blick aussieht. Es liegen dort zwar jeweils vier Gleichungen in vier Unbekannten vor, aber die Gleichungssysteme „zerfallen“ in zwei Gleichungssysteme zu je zwei Unbekannten. Zudem ist in beiden linearen Gleichungssystemen die Koeffizientenmatrix jeweils dieselbe. Im ersten Beispiel liegt eine Diagonalmatrix A vor. Hier wird die Inverse schematisch durch Kehrwertbildung auf der Hauptdiagonalen berechnet. Dies ist aber auch nur für Diagonalmatrizen so einfach möglich. Am zweiten Beispiel erkennen Sie, dass die Inversenbildung nichts mit komponentenweiser Kehrwertbildung zu tun hat. Die inverse Matrix hat hier sogar wie die Ausgangsmatrix A ausschließlich ganzzahlige Einträge (das muss aber nicht immer so sein). Am dritten Beispiel erkennen Sie, dass nicht jede quadratische Matrix invertierbar ist (selbst wenn alle ihre Einträge von Null verschieden sind), mithin kann man nicht immer die inverse Matrix bilden, insbesondere erfolgt die Inversion nicht durch komponentenweise Kehrwertbildung. Im folgenden betrachten wir Beispiele zur Inversion von 3 × 3-Matrizen. Hier prüfen wir zunächst nur die Inversen-Eigenschaft, indem wir die Gleichung AB = I n prüfen. 48818_Terveer.indd 330 48818_Terveer.indd 330 18.07.2023 12: 02: 26 18.07.2023 12: 02: 26 <?page no="331"?> 13.3 Quadratische Matrizen 331 Die Berechnung wie im vorangegangenen Beispiel der 2 × 2-Matrizen ersparen wir uns hier, denn man müsste analog zum ersten Beispiel ein lineares Gleichungssystem in 9 Gleichungen und 9 Unbekannten aufstellen. Wie man auf die inverse Matrix kommt, sehen wir später noch. Beispiel 13.15 ■ Es ist 3 0 0 0 2 0 0 0 4 13 0 0 0 12 0 0 0 14 = 1 0 0 0 1 0 0 0 1 , also 3 0 0 0 2 0 0 0 4 − 1 = 13 0 0 0 12 0 0 0 14 . ■ Es ist 1 1 2 2 1 3 1 − 1 − 1 2 − 1 1 5 − 3 1 − 3 2 − 1 = 1 0 0 0 1 0 0 0 1 , also 1 1 2 2 1 3 1 − 1 − 1 − 1 = 2 − 1 1 5 − 3 1 − 3 2 − 1 . ■ Es ist 1 1 0 1 0 3 0 1 0 1 0 − 1 0 0 1 − 13 13 1 3 = 1 0 0 0 1 0 0 0 1 , also 1 1 0 1 0 3 0 1 0 − 1 = 1 0 − 1 0 0 1 − 13 13 1 3 . Inverse Matrizen können zur Lösung von linearen Gleichungssystemen verwendet werden, die gleich viele Variablen und Gleichungen haben. Sie ermöglichen nämlich eine rein schematische Lösung der Gleichung Ax = b , ganz genau wie bei einer Gleichung ax = b in einer Variablen. Dazu muss lediglich die Matrix A invertierbar sein. Satz 13.6 Es sei A ∈ R n × n eine quadratische, invertierbare Matrix und b ∈ R n . Dann hat das lineare Gleichungssystem Ax = b genau eine Lösung, und zwar x = A − 1 b . Beide Seiten der Gleichung Ax = b können nämlich mit A − 1 multipliziert werden, aus LGS Ax = b folgt A − 1 ( Ax ) = A − 1 b . Weil aber gemäß Assoziativgesetz 13.4[3] gilt A − 1 ( Ax ) = ( A − 1 A ) x = I n x = x , ist das LGS Ax = b gleichwertig zu x = A − 1 b . Durch Multiplikation von x = A − 1 b mit A zeigt man umgekehrt völlig analog, dass Ax = b aus x = A − 1 b folgt. Beispiel 13.16 (Fortsetzung von Beispiel 10.2 vgl. S. 250 ) In der Herstellung von 1440 Papierrollen des Typs A , 2160 Rollen des Typs B und 1080 Rollen des Typs C gemäß Beispiel 10.2 sollen nur die Schnittmuster 1, 2 und 3 eingesetzt werden; dazu gehört das LGS 1 1 0 1 0 3 0 1 0 x 1 x 2 x 3 = 1440 2160 1080 . Mit der inversen Matrix aus Beispiel 13.15 ergibt sich x 1 x 2 x 3 = 1 1 0 1 0 3 0 1 0 − 1 1440 2160 1080 = 1 0 − 1 0 0 1 − 13 13 1 3 1440 2160 1080 = 360 1080 600 Es muss also 360-mal das erste, 1080-mal das zweite und 600-mal das dritte Schnittmuster ausgeführt werden. Ob eine n × n -Matrix A invertierbar ist und wenn ja, wie die inverse Matrix B lautet, ergibt sich wie gesagt als Lösung eines linearen Gleichungssystems. Wir haben auch schon an Beispielen von 2 × 2-Matrizen gesehen, wie dieses lineare Gleichungssystem „zerfällt“. Genau auf dieser Idee basiert das Standard-Lösungsverfahren zur Bestimmung der inversen Matrix B = A − 1 . Die Spalten b ( j ) ∈ R n der gesuchten Matrix B haben nämlich die Eigenschaft A · b ( j ) = e ( j ) ( j -ter Einheitsvektor) für j = 1 , . . . , n . 48818_Terveer.indd 331 48818_Terveer.indd 331 18.07.2023 12: 02: 35 18.07.2023 12: 02: 35 <?page no="332"?> 332 13 Matrizen Jede dieser Gleichungen stellt ein LGS in den unbekannten Komponenten von b ( j ) dar. Diese Gleichungssysteme unterscheiden sich nur in der rechten Seite, sie lassen sich daher allesamt mit denselben Zeilenumformungen lösen. Man schreibt also einfach alle rechten Seiten dieser Gleichungssysteme nebeneinander rechts in die Gleichungsmatrix und leitet hierfür dann die Zeilenstufenform her: Satz 13.7 (Verfahren zur Matrixinversion von A ∈ R n × n ) Man bilde aus A und der Einheitsmatrix I n die Matrix ( A | I n ) = a 11 . . . a 1 n 1 0 ... . . . ... . . . a n 1 . . . a nn 0 1 Diese Matrix wird durch elementare Zeilenumformungen auf Zeilenstufenform gebracht. Wenn die ZSF von der Form ( I n | B ) ist (d.h. links steht die Einheitsmatrix), so ist A invertierbar und B = A − 1 . Andernfalls ist A nicht invertierbar. Beispiel 13.17 (Fortsetzung von Beispiel 13.15) Wir berechnen die Inverse der Matrix A = 1 1 2 2 1 3 1 − 1 − 1 . Dazu stellen wir die Matrix ( A | I 3 ) auf und überführen diese in Zeilenstufenform: 1 1 2 1 0 0 2 1 3 0 1 0 1 − 1 − 1 0 0 1 → 1 1 2 1 0 0 0 − 1 − 1 − 2 1 0 0 − 2 − 3 − 1 0 1 → 1 1 2 1 0 0 0 1 1 2 − 1 0 0 − 2 − 3 − 1 0 1 → 1 1 2 1 0 0 0 1 1 2 − 1 0 0 0 − 1 3 − 2 1 → 1 1 2 1 0 0 0 1 1 2 − 1 0 0 0 1 − 3 2 − 1 → 1 1 0 7 − 4 2 0 1 0 5 − 3 1 0 0 1 − 3 2 − 1 → 1 0 0 2 − 1 1 0 1 0 5 − 3 1 0 0 1 − 3 2 − 1 Also ist 1 1 2 2 1 3 1 − 1 − 1 − 1 = 2 − 1 1 5 − 3 1 − 3 2 − 1 . Beispiel 13.18 Hingegen ist A = 0 4 1 2 1 1 2 5 2 nicht invertierbar, da Rang( A ) = 2 < 3; die Einheitsmatrix kann durch Zeilenumformungen nicht hieraus erzeugt werden. Beispiel 13.19 (Fortsetzung von Beispiel 13.7 vgl. S. 327 ) Wir hatten die Normalgleichungen in der Projektionsaufgabe „Darstellung des Gewinns anhand von zwei Umsatzsparten“ bereits als LGS ( A T A ) α = A T g dargestellt. Dabei ist g = (3 , 4 , 2 , 3 , 72 ) T der Gewinnvektor und A setzt sich spaltenweise aus den Vektoren u (0) = (1 , 1 , 1 , 1 , 1) T , u (1) = (6 | 2 , 5 | 8 , 5 | 6 , 5 | 9 , 5) T , u (2) = (7 | 6 | 5 | 7 | 7 | 5) T zusammen und es gilt A T A = 5 33 32 , 5 33 247 216 , 25 32 , 5 216 , 25 215 , 25 und A T g = 15 , 5 97 , 75 102 , 25 . Es ergibt sich (Schultaschenrechner) ( A T A ) − 1 ≈ 11 , 2587 − 0 , 132102 − 1 , 56721 − 0 , 132102 0 , 0351687 − 0 , 0153863 − 1 , 56721 − 0 , 0153863 0 , 256732 . Die Lösung der Normalgleichungen ist dann α = ( A T A ) − 1 ( A T g ) ≈ 1 , 3503 − 0 , 1831 0 , 4551 . Wir haben das Gewinnbeispiel über den Ansatz der Normalgleichungen einer Projektionsaufgabe jetzt unter Zuhilfenahme der Matrixinversion gelöst. Später werden wir 48818_Terveer.indd 332 48818_Terveer.indd 332 18.07.2023 12: 02: 45 18.07.2023 12: 02: 45 <?page no="333"?> 13.4 Determinanten 333 b a a + b c d c + d a c b d a + b c + d Abbildung 13.2: Illustration der Determinante als Flächenänderungsfaktor ohne Verwendung des Projektionsbegriffs noch einen optimierungstheoretischen Zugang beschreiben und dann mit Methoden der Differentialrechnung lösen vgl. S. 426 . Übungen zu Abschnitt 13.3 ? 7. Invertieren Sie möglichst (mit Probe): 7 8 9 4 5 6 − 1 2 3 , 1 2 3 2 3 4 3 5 7 , − 2 3 1 1 1 2 5 2 − 1 , 1 1 1 0 1 1 0 1 1 0 1 1 0 1 1 1 8. Die H. Elau GmbH stellt drei Typen von Luftschlangen her und setzt drei Grundfarbstoffe in unterschiedlichen Quantitäten ein: Je Palette Luftschlangen werden 1kg Rot und 2kg Gelb (Typ 1), 2kg Rot, 6kg Gelb und 3kg Blau (Typ 2) 3kg Gelb und 5kg Blau (Typ 3) eingesetzt. Es soll auch die Farbe verstärkt werden, indem die Farbmengen bei Typ 1 verdoppelt, bei Typ 2 verdreifacht und bei Typ 3 verfünffacht werden. a) Es seien A = 1 2 0 2 6 3 0 3 5 , B = 2 0 0 0 3 0 0 0 5 . Berechnen Sie die Matrizen 10 A, A + B, A 2 , AB, A − 1 und interpretieren Sie sie möglichst im Sachzusammenhang. b) Es sei C = B − 1 A − 1 . Vereinfachen Sie den Ausdruck ( AB ) C , ohne B − 1 und A − 1 explizit zu berechnen. In welcher Beziehung steht C zu AB ? 9. Für welche a, b ist 2 − 1 − 1 a 14 b 18 18 − 18 = 1 2 4 0 1 6 1 3 2 − 1 ? 13.4 Determinanten Die Determinante det( A ) ist eine Kennzahl einer quadratischen Matrix A mit vielfältigen Anwendungen. Auf ihr beruhen z.B. Volumen- und Inhaltsformeln der Geometrie: Beispiel 13.20 In der Anschauungsebene betrachten wir das Quadrat mit Eckpunkten x (1) = (0 , 0) T , x (2) = (1 , 0) T , x (3) = (0 , 1) T und x (4) = (1 , 1) T und dem Flächeninhalt 1. Mit einer Matrix A = a b c d und der Transformation y = Ax entsteht ein Parallelogramm mit Ecken (0 , 0) T , ( a, c ) T , ( b, d ) T und ( a + b, c + d ) T , vgl. Abbildung 13.2 . Wir nehmen an, dass a > b > 0 und d > c > 0. Das Parallelogramm hat den Inhalt ( a + b )( c + d ) − ac − bd − 2 bc = ad − bc ; Für allgemeine a, b, c, d ist der Parallelogramminhalt | ad − bc | . Den Wert ad − bc bezeichnet man als die Determinante det( A ) der Matrix A . Ein Rechteck mit Seitenlängen ℓ 1 und ℓ 2 wird durch die Transformation in ein Parallelogramm mit Flächeninhalt | det( A ) | ℓ 1 ℓ 2 überführt: die Determinante gibt also betragsmäßig den Inhalts-Änderungsfaktor bei linearer Transformation des Ausgangsrechtecks an. 48818_Terveer.indd 333 48818_Terveer.indd 333 18.07.2023 12: 02: 52 18.07.2023 12: 02: 52 <?page no="334"?> 334 13 Matrizen a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 11 a 12 a 21 a 22 a 31 a 32 Abbildung 13.3: Grafische Illustration der Sarrus-Regel In der linearen Algebra sind die Lösung linearer Gleichungssysteme, die Invertierbarkeit quadratischer Matrizen und die Eigenwertberechnung Hauptanwendungsfelder der Determinante. In der Analysis gibt die Determinante Aufschluss über die Krümmung sowie die Art der Extremwerte von Funktionen mehrerer Variablen. Schließlich findet man sie als Flächenänderungsfaktor in der Integralrechnung vgl. Satz 9.9, S. 234 . Matrizen mit bis zu drei Zeilen und Spalten haben explizite Determinantenformeln: Definition 13.6 (Determinanten von n × n -Matrizen für n ≤ 3) ! 1. n = 1, d.h. A = a 11 . Dann ist det( A ) : = a 11 2. n = 2, d.h. A = a 11 a 12 a 21 a 22 . Dann ist det( A ) : = a 11 a 22 − a 21 a 12 3. n = 3, d.h. A = a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 . Dann ist (Sarrus-Regel) det A = a 11 a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 − a 31 a 22 a 13 − a 32 a 23 a 11 − a 33 a 21 a 12 Beispiel 13.21 1 2 2 5 hat die Determinante 1 · 5 − 2 · 2 = 1 und 3 1 0 2 1 2 1 5 3 hat die Determinante 3 · 1 · 3 + 1 · 2 · 1 + 0 · 2 · 5 − 1 · 1 · 0 − 5 · 2 · 3 − 3 · 2 · 1 = 9 + 2 + 0 − 0 − 30 − 6 = − 25. Die Sarrus-Regel orientiert sich an dem - nur im Falle n = 3 anwendbaren - „Jägerzaun“-Schema aus Abbildung 13.3. Die Werte jeweils längs der Diagonalen werden multipliziert. Die Ergebnisse werden addiert (Diagonalen von links oben nach rechts unten) bzw. subtrahiert (Diagonalen von links unten nach rechts oben). Allgemein besteht die Determinante einer n × n -Matrix nach der Leibniz-Formel aus n ! = 1 · 2 · · · · n Summanden, die jeweils Produkte von n Faktoren sind, welche so ausgewählt werden, dass aus jeder Zeile und Spalte genau ein Eintrag kommt, und die anschließend ggf. noch mit einem Faktor ( − 1) multipliziert werden. Das Bildungsschema lässt sich anhand von 3 x 3-Matrizen verdeutlichen. Die 6 Summanden der Sarrusregel entsprechen den in Tabelle 13.1 hervorgehobenen Auswahlen in Spalte 1. Die markierten Einträge werden multipliziert (Spalte 2). Nun wird geprüft, wieviel Zeilenvertauschungen minimal nötig sind, damit die markierten Einträge auf der Diagonale stehen. Diese Anzahl heißt Fehlstand der Auswahl in Spalte 1 und wird in Spalte 3 angezeigt. Beispielsweise hat die dritte Auswahl den Fehlstand 2, weil man einmal die ersten beiden Zeilen und dann die zweite und dritte Zeile vertauschen muss, um die markierten Einträge auf die Diagonale zu bringen: a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 I ↔ II −→ a 21 a 22 a 23 a 11 a 12 a 13 a 31 a 32 a 33 II ↔ III −→ a 21 a 22 a 23 a 31 a 32 a 33 a 11 a 12 a 13 Der Summand der Determinante (Spalte 4) ergibt sich bei geradem Fehlstand als Wert aus Spalte 2, bei ungeradem Fehlstand wird dieser mit ( − 1) multipliziert. Die Determinante ist Summe aller Einträge in Spalte 4. Für größere Matrizen ( n > 3) ist diese 48818_Terveer.indd 334 48818_Terveer.indd 334 18.07.2023 12: 03: 01 18.07.2023 12: 03: 01 <?page no="335"?> 13.4 Determinanten 335 Positionen Produkt Fehlstände Summand der Determinante a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 11 a 22 a 33 0 a 11 a 22 a 33 a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 12 a 23 a 31 2 a 12 a 23 a 31 a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 13 a 21 a 32 2 a 13 a 21 a 32 a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 13 a 22 a 31 1 − a 13 a 22 a 31 a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 12 a 21 a 33 1 − a 12 a 21 a 33 a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 11 a 23 a 32 1 − a 11 a 23 a 32 Tabelle 13.1: Die Sarrusregel als Spezialfall der Leibniz-Regel Formel sehr aufwändig, anhand von ihr lassen sich aber die nachfolgend beschriebenen und häufig praktizierten Wege der Determinantenberechnung motivieren: Das eine Verfahren verwendet im Wesentlichen Zeilenumformungen bis zur Staffelform bzw. Zeilenstufenform, das andere entwickelt die Matrix nach einer Zeile und Spalte und führt die Determinante so auf Determinanten kleinerer Matrizen zurück. 13.4.1 Berechnung der Determinante mittels Zeilenumformungen Bei Zeilenumformungen verändert sich die Determinante höchsten um einen Faktor: Satz 13.8 (Determinante und elementare Zeilenumformungen) Die Determinante det( A ) hat die folgenden (charakteristischen) Eigenschaften: [1] Wenn B ∈ R n × n aus A ∈ R n × n durch eine Zeilenvertauschung entsteht, so gilt det( B ) = − det( A ). [2] Wenn B ∈ R n × n aus A ∈ R n × n durch Multiplikation einer Zeile mit einer Konstanten α entsteht, so gilt det( B ) = α · det( A ). [3] Wenn B ∈ R n × n aus A ∈ R n × n durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile entsteht, so gilt det( B ) = det( A ). [4] det( I n ) = 1. Alle Regeln leiten sich aus der Leibniz-Regel her: [1] Bei Zeilenvertauschungen kehrt sich der Fehlstand jeder Auswahl um, statt einer geraden ist eine ungerade Anzahl von Vertauschungen bis zur Diagonalform nötig. [2] Bei Multiplikationen lässt sich der Faktor aus der Summe faktorisieren. [3] Nach der Addition des α -fachen der j -ten zur ℓ -ten Zeile von A ist jeder Summand der Leibniz- Regel ein Produkt a 1 j 1 a 2 j 2 · · · ( a ℓj ℓ + αa jj ℓ ) · · · a nj n = a 1 j 1 a 2 j 2 · · · a ℓj ℓ · · · a nj n + αa 1 j 1 a 2 j 2 · · · a jj ℓ · · · a nj n Durch Umordnung der 2 n ! Summanden bekommt man einen Ausdruck det( A ) + α det( A ′ ), wobei A ′ zwei identische Zeilen j und ℓ hat. Dann ist det( A ′ ) = 0, denn für A ′ sind je 2 Summanden nach Leibniz-Regel bis auf das Vorzeichen identisch. [4] Bei der Einheitsmatrix gibt es nur einen Leibniz-Summanden ungleich Null, gebildet aus der Hauptdiagonale mit 1-Einträgen. 48818_Terveer.indd 335 48818_Terveer.indd 335 18.07.2023 12: 03: 09 18.07.2023 12: 03: 09 <?page no="336"?> 336 13 Matrizen Berechnung von det( A ) mit Zeilenumformungen [1] Man überführt die Matrix A in Zeilenstufenform Z . [2] Man berechne die Determinante von Z . [3] Es gilt det( A ) = ( − 1) k · det( Z ) c . Bezogen auf die Zeilenumformungen in [1] ist [a] k die Anzahl der Vertauschungsschritte, [b] c das Produkt der Faktoren aus den Multiplikationsschritten. Also ist bei einer geraden Anzahl von Zeilenvertauschungen det( A ) = det( Z ) / c und bei einer ungeraden Anzahl von Zeilenvertauschungen det( A ) = − det( Z ) / c . Wir illustrieren die Vorgehensweise an Matrizen mit bis zu fünf Zeilen/ Spalten. Die Matrizen werden jeweils in Zeilenstufenform überführt und die Determinante der Ausgangsmatrix dann rückwärts rekonstruiert. Dazu wird jede Umformung in zwei Richtungen hervorgehoben und im Falle von Multiplikations- oder schritten (Vertauschungsschritten) auf dem „Hinweg bzw. mit dem Faktor bzw. auf dem Rückweg “ mit dessen dessen Kehrwert mit ( − 1) versehen. Ein oder mehrere Additionsschritte bleiben unmarkiert, weil die Determinante sich nicht ändert. Beispiel 13.22 Wir beginnen mit den beiden Determinanten aus Beispiel 13.21 ■ A = 1 2 2 5 ⇌ 1 2 0 1 ⇌ 1 0 0 1 = I 2 = Z Es wurden nur Additionsschritte verwendet, welche die Determinante nicht verändern. Also gilt det( A ) = det( Z ) = 1. ■ A = 3 1 0 2 1 2 1 5 3 − 1 ⇌ − 1 1 5 3 2 1 2 3 1 0 ⇌ 1 5 3 0 − 9 − 4 0 − 14 − 9 − 1 / 9 ⇌ − 9 1 5 3 0 1 4 / 9 0 − 14 − 9 ⇌ 1 5 3 0 1 4 / 9 0 0 − 25 / 9 − 9 / 25 ⇌ − 25 / 9 1 5 3 0 1 4 / 9 0 0 1 ⇌ 1 0 0 0 1 0 0 0 1 = I 3 = Z Ausgehend von der Zeilenstufenform Z ergibt sich die Determinante von A als det( A ) = ( − 25 9 ) · ( − 9) · ( − 1) = − 25 ■ A = 1 2 2 2 1 1 2 1 1 1 1 0 1 3 0 0 ⇌ 1 2 2 2 0 − 1 0 − 1 0 − 1 − 1 − 2 0 1 − 2 − 2 − 1 ⇌ − 1 1 2 2 2 0 1 0 1 0 − 1 − 1 − 2 0 1 − 2 − 2 ⇌ 1 2 2 2 0 1 0 1 0 0 − 1 − 1 0 0 − 2 − 3 − 1 ⇌ − 1 1 2 2 2 0 1 0 1 0 0 1 1 0 0 − 2 − 3 ⇌ 1 2 2 2 0 1 0 1 0 0 1 1 0 0 0 − 1 − 1 ⇌ − 1 1 2 2 2 0 1 0 1 0 0 1 1 0 0 0 1 ⇌ 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 = I 4 = Z , also det( A ) = ( − 1) 3 = − 1. ■ A = 1 2 1 2 1 2 3 4 3 3 1 2 2 2 1 1 2 3 3 1 1 2 0 2 0 ⇌ 1 2 1 2 1 0 − 1 2 − 1 1 0 0 1 0 0 0 0 2 1 0 0 0 − 1 0 − 1 ⇌ 1 2 1 2 1 0 − 1 2 − 1 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 − 1 Mit zwei weiteren Zeilenmultiplikationen mit ( − 1) und Additionsschritten erreicht man I 5 . Die Determinante von A ist also det( A ) = ( − 1) 2 = 1. In den Beispielen ergibt sich eine Determinante ungleich Null, am Ende ist die Zeilenstufenform stets die Einheitsmatrix. Es kommt aber auch vor, dass die Zeilenstufenform nicht den vollen Rang hat, also mindestens eine Null-Zeile. Gemäß der Leibniz-Regel hat jeder Summand in der Determinante dann den Wert Null, weil er stets einen 48818_Terveer.indd 336 48818_Terveer.indd 336 18.07.2023 12: 03: 18 18.07.2023 12: 03: 18 <?page no="337"?> 13.4 Determinanten 337 Eintrag aus dieser Nullzeile enthält. Also ist auch die Determinante Null. Die Ausgangsmatrix muss dann ebenfalls die Determinante Null haben. Dabei muss man nicht bis zur Zeilenstufenform gehen, es genügt, eine Matrix mit einer Nullzeile herzuleiten. Beispiel 13.23 A = 0 4 1 2 1 1 2 5 2 − 1 ⇌ − 1 2 1 1 0 4 1 2 5 2 ⇌ 2 1 1 0 4 1 0 0 0 Die Ausgangsmatrix A hat Determinante det( A ) = 0 · ( − 1) = 0. Mit der folgenden Regel berechnet sich die Determinante oft schneller: Satz 13.9 Liegt eine Matrix A in der so genannten oberen bzw. unteren Dreiecksform α 1 ∗ ∗ ∗ 0 α 2 ∗ ∗ ... . . . ∗ 0 . . . 0 α n bzw. α 1 0 . . . 0 ∗ α 2 . . . 0 ... ∗ . . . 0 ∗ ∗ ∗ α n vor, bei der die ∗ -Einträge oberhalb bzw. unterhalb der Hauptdiagonale beliebige reelle Zahlen bezeichnen, so gilt: det( A ) = α 1 · α 2 · · · · · α n Denn nach Leibniz-Regel hat die Determinante höchstens einen von Null verschiedenen Summanden, nämlich das Produkt der Einträge auf der Hauptdiagonale. In allen anderen Summanden tritt wenigstens ein Faktor aus dem Null-Bereich unterhalb oder oberhalb der Diagonale auf. Der vorstehende Satz führt nun zu folgender Heuristik: Die Determinante einer Matrix A lässt sich wie folgt berechnen: [1] Durch Additions- und falls notwendig - Vertauschungs- und Multiplikationsschritte wird die Matrix in obere (oder untere) Dreiecksform D überführt. [2] Die Determinante der Dreiecksform wird abgelesen. [3] Die Determinante der Ausgangsmatrix A wird durch „Verbuchung“ der Vertauschungssschritte und Multiplikationsschritte hieraus bestimmt. Beispiel 13.24 (Fortsetzung von Beispiel 13.22) Wir berechnen noch einmal die ersten drei Determinanten in Beispiel 13.22, wobei wir jeweils mit möglichst wenig Zeilenvertauschungen und -multiplikationen eine obere Dreiecksform herleiten. Deren Determinante lesen wir dann ab: ■ A = 1 2 2 5 ⇌ 1 2 0 1 = D . Es ist det( A ) = det( D ) = 1. ■ A = 3 1 0 2 1 2 1 5 3 − 1 ⇌ − 1 1 5 3 2 1 2 3 1 0 ⇌ 1 5 3 0 − 9 − 4 0 − 14 − 9 − 1 / 9 ⇌ − 9 1 5 3 0 1 4 / 9 0 − 14 − 9 − 1 ⇌ − 1 1 5 3 0 1 4 / 9 0 0 − 25 / 9 = D d.h. det( A ) = ( − 1)( − 9) det( D ) = ( − 1)( − 9)( − 25 9 ) = − 25. ■ A = 1 2 2 2 1 1 2 1 1 1 1 0 1 3 0 0 ⇌ 1 2 2 2 0 − 1 0 − 1 0 − 1 − 1 − 2 0 1 − 2 − 2 ⇌ 1 2 2 2 0 − 1 0 − 1 0 0 − 1 − 1 0 0 − 2 − 3 ⇌ 1 2 2 2 0 − 1 0 − 1 0 0 − 1 − 1 0 0 0 − 1 , d.h. det( A ) = − 1. 13.4.2 Laplace-Entwicklungsformel für Determinanten Beim Entwicklungsansatz wird die Determinante einer n × n -Matrix A auf Determinanten von Teilmatrizen mit n − 1 Zeilen und Spalten zurückgeführt. 48818_Terveer.indd 337 48818_Terveer.indd 337 18.07.2023 12: 03: 26 18.07.2023 12: 03: 26 <?page no="338"?> 338 13 Matrizen Dafür legt man zunächst eine beliebige Zeile i (oder Spalte j ) fest. Dann bestimmt man zunächst für diese i -te Zeile (bzw. j -te Spalte) sämtliche Streichungsmatrizen, die sich durch Streichen der i -ten Zeile und sukzessive der ersten, zweiten, . . . , n -ten Spalte (bzw. der ersten, zweiten, . . . , n -ten Zeile) ergeben. Schematisch bildet sich die Streichungsmatrix der i -ten Zeile und ℓ -ten Spalte wie folgt. A = B ... C · · · a iℓ · · · D ... E ⇒ A iℓ : = B C D E So hat A = 1 4 3 2 6 2 3 0 2 5 5 1 9 7 4 3 beispielsweise die Streichungsmatrix A 23 = 1 4 2 2 5 1 9 7 3 . Satz 13.10 (Entwicklungsformel von Laplace) Für A ∈ R n × n und i, j ∈ { 1 , . . . , n } ergibt sich det( A ) durch Entwicklung nach der [1] i -ten Zeile: det( A ) = ( − 1) i +1 a i 1 det( A i 1 ) + · · · + ( − 1) i + n a i 1 det( A in ) [2] j -ten Spalte: det( A ) = ( − 1) 1+ j a 1 j det( A 1 j ) + · · · + ( − 1) n + j a nj det( A nj ) Entwickelt man nun auch die in der Formel vorkommenden ( n − 1) × ( n − 1)-Determinanten nach diesem Schema und führt dies sukzessive fort, bis man zu 1 × 1-Determinanten gelangt ist, so erhält man (nach Auflösen aller auftretenden Klammern) n ! Summanden. Enwickelt man nach einer Zeile oder Spalte mit möglichst vielen Null-Einträgen, so kann sich hierdurch der Darstellungsaufwand stark reduzieren: Beispiel 13.25 det 1 2 2 2 1 1 2 1 1 1 1 0 1 3 0 0 = det 1 2 1 1 1 0 3 0 0 − 2 det 1 2 1 1 1 0 1 0 0 + 2 det 1 1 1 1 1 0 1 3 0 − 2 det 1 1 2 1 1 1 1 3 0 = 1 · ( − 3) − 2 · ( − 1) + 2 · 2 − 2 · 2 = − 1 Hierbei wird nach der ersten Zeile entwickelt. Es müssen vier Determinanten nach Sarrus berechnet werden. Je mehr Null-Einträge in einer Zeile bzw. Spalte stehen, um so besser eignet sie sich für die Entwicklung. So liefert die Entwicklung nach der vierten Spalte hier dasselbe Ergebnis, aber mit etwa dem halben Rechenaufwand: det 1 2 2 2 1 1 2 1 1 1 1 0 1 3 0 0 = ( − 2) det 1 1 2 1 1 1 1 3 0 + det 1 2 2 1 1 1 1 3 0 = − 1 13.4.3 Strategien zur Berechnung von Determinanten Vielleicht haben Sie anhand des letzten Beispiels den Eindruck gewonnen, dass es für allgemeine n × n -Matrizen viel einfacher ist, die Determinante durch Entwicklung zu berechnen. Das ist in dieser Form nicht ganz richtig, ab n = 5 steigt der Aufwand doch enorm bei gleichzeitigem Verlust an Übersichtlichkeit. Empfohlen sei die folgende Vorgehensweise, die Anleihen bei allen Grundtechniken macht: 48818_Terveer.indd 338 48818_Terveer.indd 338 18.07.2023 12: 03: 33 18.07.2023 12: 03: 33 <?page no="339"?> 13.4 Determinanten 339 Heuristik zur Determinantenberechnung: [1] Für Matrizen mit n ≤ 3 Zeilen/ Spalten wende man die expliziten Formeln an. [2] Für Matrizen mit n > 3 Zeilen/ Spalten prüfe man, ob Zeilen/ Spalten mit „vielen“ Null-Einträgen vorliegen. [a] Falls ja: Entwicklung nach einer dieser Zeilen/ Spalten. Erneute Anwendung der Heuristik auf die gewonnenen ( n − 1) × ( n − 1)-Determinanten. [b] Falls nein: Erzeugen einer Spalte mit möglichst vielen Null-Einträgen durch Zeilenumformungen gemäß der Idee des Gauß-Algorithmus. Danach Entwicklungsformel oder Fortführung des Eliminationsverfahren. Schließlich seien noch zwei Rechenregeln für Determinanten erwähnt, von denen besonders die erste mit Gewinn innerhalb der obigen Heuristik verwendet werden kann: Satz 13.11 (Determinanten von speziellen Matrizen) [1] Ist A ∈ R n × n eine Blockmatrix der Gestalt A = B ∗ 0 C mit quadratischen Matrizen B, C , so gilt det( A ) = det( B ) · det( C ). [2] Sind A, B zwei quadratische n × n -Matrizen, so gilt: det( AB ) = det( A ) det( B ). Beispiel 13.26 Die Ausnutzung der Blockmatrix-Gestalt sei anhand der bereits früher schon einmal untersuchten 5 × 5-Matrix erläutert. Durch die zuerst durchgeführten Additionsschritte erzeugt man eine Einheitsspalte A = 1 2 1 2 1 2 3 4 3 3 1 2 2 2 1 1 2 3 3 1 1 2 0 2 0 → B = 1 2 1 2 1 0 − 1 2 − 1 1 0 0 1 0 0 0 0 2 1 0 0 0 − 1 0 − 1 Dabei entsteht eine Block-Gestalt, aus der sich die Determinante über die Grundformeln für n = 2 bzw. 3 (bzw. über die Formeln für Dreiecksmatrizen) bestimmen lässt: det( A ) = det( B ) = det 1 2 0 − 1 det 1 0 0 2 1 0 − 1 0 − 1 = (1 · ( − 1)) · (1 · 1 · ( − 1)) = 1 Bei alleiniger Verwendung der Entwicklungsformeln (selbst bei Entwickeln nach der fünften Zeile) wäre der Rechenaufwand erheblich größer. Abschließend sei das Verhalten der Determinante bei Transposition erwähnt: Satz 13.12 Ist A eine n × n -Matrix, so gilt det( A ) = det( A T ) Diese Regel bedeutet, dass man analog zu Zeilenumformungen mit demselben Resultat auch Spaltenumformungen auf einer Matrix durchführen kann. Diese Regel kann z.B. in Aufgabe 12 vgl. S. 341 mit Gewinn verwendet werden. 48818_Terveer.indd 339 48818_Terveer.indd 339 18.07.2023 12: 03: 37 18.07.2023 12: 03: 37 <?page no="340"?> 340 13 Matrizen 13.4.4 Anwendungen der Determinante Die Determinante kann beim Lösen quadratischer linearer Gleichungssysteme mittels der Cramer’schen Regel und bei der Matrixinversion eingesetzt werden. Mit der Cramer’schen Regel kann man bei einem linearen Gleichungssystem Ax = b mit quadratischer invertierbarer Koeffizientenmatrix A einzelne Komponenten des Lösungsvektors x berechnen, ohne die anderen mitbestimmen zu müssen. Satz 13.13 Für alle A = a 11 . . . a 1 n ... . . . ... a n 1 . . . a nn ∈ R n × n und b = b 1 ... b n ∈ R n gilt: [1] A ist invertierbar ⇐⇒ det( A ) ̸ = 0 [2] Cramer’sche Regel: Falls det( A ) ̸ = 0, so hat das lineare Gleichungssystem Ax = b genau eine Lösung x = ( x 1 , . . . , x n ) T = A − 1 b und es gilt für j = 1 , . . . , n : x j = det a 1 , 1 . . . a 1 ,j − 1 b 1 a 1 ,j +1 . . . a 1 ,n ... . . . ... ... . . . . . . ... a n, 1 . . . a n,j − 1 b n a n,j +1 . . . a n,n det( A ) d.h. in der Zählerdeterminante wurde die j -te Spalte von A durch den Vektor b ersetzt. Beispiel 13.27 Für die Matrix A = 1 2 − 1 0 3 2 1 1 0 gilt (etwa mit der Sarrus-Regel) det( A ) = 5 , d.h. A ist invertierbar. Für b = (3 , 2 , 4) T hat das LGS Ax = b mit x = ( x 1 , x 2 , x 3 ) T die Lösungen x 1 = det 3 2 − 1 2 3 2 4 1 0 det A = 20 5 = 4 x 2 = 1 3 − 1 0 2 2 1 4 0 det A = 0 5 = 0 x 3 = 1 2 3 0 3 2 1 1 4 det A = 5 5 = 1 Der Nutzen der Cramer-Regel sinkt mit der Anzahl der Komponenten von x , die auf diese Weise simultan berechnet werden müssen. Ist gar zur Berechnung der Determinante von A eine gleich große Anzahl von Zeilenumformungen erforderlich wie bei Durchführung des Gauß’schen Eliminationsverfahrens zur Bestimmung von A − 1 , so sollte man auf die Cramer’sche Regel verzichten. Weil die Inversion einer Matrix durch die Simultanlösung mehrerer linearer Gleichungssysteme behandelt wird, lässt sich aus der Cramer’schen Regel auch eine allgemeine Formel für die inverse Matrix auf Basis von Determinanten herleiten. Die entsprechenden Formeln sind aber eher aufwändig und sollen daher nur für 2 × 2-Matrizen geschildert werden, weil sie hier besonders häufig eingesetzt werden: Beispiel 13.28 Sei die Matrix A = a b c d ∈ R 2 × 2 invertierbar. Dann gilt: A − 1 = 1 ad − bc · d − b − c a Die Determinante der Matrix A tritt als normierender Faktor der Inversen auf, ähnlich wie bei der Cramer-Regel. Dies ist charakteristisch für die allgemeine Determinantenformel von A − 1 , die man in Standard-Lehrbüchern der Linearen Algebra findet. 48818_Terveer.indd 340 48818_Terveer.indd 340 18.07.2023 12: 03: 45 18.07.2023 12: 03: 45 <?page no="341"?> 13.5 Eigenwerte und Eigenvektoren 341 Übungen zu Abschnitt 13.4 ? 10. Berechnen Sie die Determinanten von 2 3 7 1 , 3 2 3 2 7 2 9 11 9 , 1 2 2 4 3 7 1 4 1 , t − t 1 − t t 1 1 − t t , 8 8 10 4 7 2 0 0 1 0 3 0 7 8 9 4 , − a − a a a a b − b a a − b b a a a a − a 11. Berechnen Sie die Determinante der folgenden Matrix möglichst geschickt: a 1 ( a 1 − 1) x 21 a 1 a 2 x 1 x 2 a 1 a 3 x 1 x 3 a 1 a 4 x 1 x 4 a 2 a 1 x 2 x 1 a 2 ( a 2 − 1) x 22 a 2 a 3 x 2 x 3 a 2 a 4 x 2 x 4 a 3 a 1 x 3 x 1 a 3 a 2 x 3 x 2 a 3 ( a 3 − 1) x 23 a 3 a 4 x 3 x 4 a 4 a 1 x 4 x 1 a 4 a 2 x 4 x 2 a 4 a 3 x 4 x 3 a 4 ( a 4 − 1) x 24 12. Neues aus Stenkelfeld: Friedhelm Pötter, Leiter der „Jürgen-Koppelin-Bildungsstätte“ veranstaltet ein siebentägiges Esoterik-Seminar, dessen 7 Teilnehmer der Reihenfolge ihrer Anmeldung nach von 1 bis 7 durchnummeriert sind. Die Sitzordnung folgt einer 7 x 7-Matrix A ; jede Zeile steht für die Sitzordnung eines Tages, erfasst also jeweils die Zahlen von 1 bis 7 in einer geeigneten Reihenfolge. Um dem Seminar ein geeignetes esoterisches „Flair“ zu verleihen, möchte Pötter einen Sitzplan erarbeiten, bei dem det( A ) = 7 ist. Kann Herrn Pötter geholfen werden? 13. Berechnen Sie die Lösung mit der Cramer’schen Regel, falls möglich: a) 1 3 2 4 x 1 x 2 = 55 b) 1 3 3 2 4 6 7 9 1 x 1 x 2 x 3 = 555 c) t − t 1 − t t 1 1 − t t x 1 x 2 x 3 = t 0 t 13.5 Eigenwerte und Eigenvektoren Verflechtungen mit quadratischen Matrizen A überführen Vektoren x in andere Vektoren Ax mit gleicher Komponentenzahl. Dabei sind manchmal solche Vektoren x von Interesse, die sich bei der Verflechtung nicht verändern, d.h. für die Ax = x gilt, z.B. ■ der „steady-state“ bei der Kundenwanderung, ■ das geschlossene Sektor-Verflechtungsmodell nach Leontief. Beide Themen werden wir im nächsten Abschnitt besprechen. Eine etwas allgemeinere Form von Stabilität liegt vor, wenn Input- und Output-Vektor kollinear (d.h. linear abhängig) sind. Die Suche nach derartigen Input-Vektoren für eine gegebene Matrix ist ein Hilfsmittel bei der Berechnung von Matrix-Produkten hoher Ordnung ebenso wie in der Marginalanalyse ökonomischer Funktionen mehrerer Variablen. Aber auch in Modellen mit Übergangsmatrizen kann Kollinearität eine Bedeutung haben. Beispiel 13.29 (Fortsetzung von Beispiel 13.2 vgl. S. 320 ) Wir betrachten nochmals das Beispiel eines Produktes, welches von zwei Herstellern auf dem Markt angeboten wird. Es sei jetzt zusätzlich angenommen, dass der Markt für dieses Produkt expandiert: Zusätzlich zu den Bestands- und Wechselkunden gewinnt jeder fünfte Kunde jedes Anbieters einen Neukunden für den folgenden Monat. Sind x 1 bzw. x 2 die Anteile der Anbieter am Markt, lauten die Kundenzahlen in der folgenden Periode also y 1 y 2 = 45 x 1 + 13 x 2 + 15 x 1 1 5 x 1 + 23 x 2 + 15 x 2 = x 1 + 13 x 2 15 x 1 + 13 15 x 2 = 1 13 15 13 15 x 1 x 2 In dieser Situation können sich die absoluten Kundenanteile natürlich nicht stabi- 48818_Terveer.indd 341 48818_Terveer.indd 341 18.07.2023 12: 03: 54 18.07.2023 12: 03: 54 <?page no="342"?> 342 13 Matrizen lisieren. Ein einmal erreichtes Kundenverhältnis 5: 3 verändert sich aber auch hier nicht mehr. Es gilt nämlich für t ∈ R ( 1 13 15 13 15 )( 5 t 3 t ) = ( 6 t 18 5 t ) = 6 5 · ( 5 t 3 t ) und beide Marktanteil-Vektoren haben Komponenten im Verhältnis 5: 3. Gleichzeitig haben sich die Kundenanteile um 20% erhöht. Informell gesprochen liegt dann ein Wachstumsprozess vor, bei dem die Kundenverhältnisse zwischen den Anbietern konstant bleiben, und innerhalb einer Periode jeweils um den gleichen Prozentsatz steigen. Definition 13.7 ! Man nennt λ ∈ R einen Eigenwert von A ∈ R n × n , wenn es einen vom Nullvektor verschiedenen Vektor x ∈ R n gibt, so dass gilt Ax = λx . Ein solcher Vektor heißt dann Eigenvektor zum Eigenwert λ . Wie bei Matrix-Inversion und Determinantenrechnung ergibt es nur Sinn, von Eigenwerten bzw. Eigenvektoren einer Matrix zu sprechen, wenn diese Matrix quadratisch ist. Auch sind Eigenvektoren keine Nullvektoren, denn es gilt stets A ¯0 = ¯0 = λ ¯0 (d.h. jede Zahl λ ∈ R wäre Eigenwert), und es wären bei Anwendungen der Eigenwerte stets Fallunterscheidungen erforderlich. Das Anwendungsspektrum für Eigenwerte ist breit gefächert: So stellen Eigenvektoren die Achsen eines Koordinatensystems dar, welche unter der linearen Abbildung A erhalten bleiben, sie erleichtern die numerische Berechnung von Matrixpotenzen der Form A n , sie ermöglichen einen sinnvollen numerischen Umgang mit dem Krümmungsverhalten von Funktionen mehrerer Veränderlichen. Ihr Anwendungsbereich umfasst nahezu alle ökonomisch relevanten Teilgebiete der Mathematik und Statistik: (numerische) Optimierung, Faktorenanalyse, Hauptkomponentenzerlegung, Diskriminanzanalyse, Versuchsplanung und viele weitere Bereiche. Eigenwerte und Eigenvektoren sind allerdings in aller Regel nicht händisch, sondern nur noch numerisch unter Einsatz von geeigneter Software zu berechnen. Dennoch lohnt es sich, mit diesem Bereich der linearen Algebra ein wenig vertraut zu werden. Beispiel 13.30 Betrachtet werde nochmals das modifizierte Marktwanderungsbeispiel mit der Übergangsmatrix A = ( 1 13 15 13 15 ) . ■ Hier ist λ = 65 ein Eigenwert von A . Ein Eigenvektor ist u.a. (5 , 3) T . ■ Ein weiterer Eigenwert von A ist µ = 23 . Es gilt nämlich ( 1 13 15 13 15 )( − 1 1 ) = ( − 23 10 15 ) = ( − 23 2 3 ) = 2 3 · ( − 1 1 ) Ökonomisch ist dieser Eigenwert eher nutzlos, da jeder Eigenvektor hierzu ein Vielfaches des berechneten Eigenvektors ist und damit mindestens eine negative Komponente hat, also nicht als Marktanteil interpretiert werden kann. 48818_Terveer.indd 342 48818_Terveer.indd 342 18.07.2023 12: 03: 58 18.07.2023 12: 03: 58 <?page no="343"?> 13.5 Eigenwerte und Eigenvektoren 343 13.5.1 Bestimmung von Eigenwerten und Eigenvektoren Zur Bestimmung von Eigenwerten sind folgende Überlegungen hilfreich: ■ Eine Zahl λ ∈ R ist genau dann ein Eigenwert von A zum Eigenvektor x ̸ = ¯0, wenn gilt x ̸ = ¯0 und Ax = λx . ■ Man bringt λx auf die linke Seite der Gleichung Ax = λx und erhält Ax − λx = ¯0. Weil mit der Einheitsmatrix I n gilt x = I n x , schreibt man dies als Ax − λI n x = ¯0. ■ Klammert man x in Ax − λI n x = ¯0 nach rechts aus, so schreibt sich die Gleichung Ax = λx schließlich als homogenes LGS ( A − λI n ) x = ¯0. ■ x ̸ = ¯0 ist also genau dann Eigenvektor zum Eigenwert λ , wenn x dieses LGS löst, d.h. wenn es mehrdeutig lösbar ist (¯0 ist auch eine Lösung). ■ Das LGS ist dann und nur dann mehrdeutig lösbar, wenn det( A − λI n ) = 0. Definition 13.8 ! Die Determinante der Matrix A − λI n ist ein Polynom n -ten Grades in der Variablen λ . Es heißt charakteristisches Polynom. Wir halten das Hauptresultat der obigen Überlegungen fest: Satz 13.14 Eigenwerte der Matrix A sind die Nullstellen des charakteristischen Polynoms von A . Beispiel 13.31 Das charakteristische Polynom der Matrix A = ( 1 13 15 13 15 ) lautet det( A − λI 2 ) = det ( ( 1 13 15 13 15 ) − λ ( 1 0 0 1 ) ) = det ( 1 − λ 13 1 5 13 15 − λ ) = (1 − λ ) ( 13 15 − λ ) − 13 · 1 5 = λ 2 − 28 15 λ + 45 = 1 15 (3 λ − 2) (5 λ − 6) Nullstellen und damit Eigenwerte von A sind die oben angegebenen Werte 65 und 23 . Um Eigenvektoren zu bestimmen, muss man für jeden Eigenwert λ das zur Matrix A − λI n gehörige homogene LGS A − λI n lösen, etwa durch Angabe einer Basis des Kerns der Matrix A − λI n mit der in in Satz 12.7 vgl. S. 302f. besprochenen Vorgehensweise. Beispiel 13.32 Im vorigen Beispiel ist der Ansatz für den Eigenvektor zu λ = 65 A − λI 2 = ( − 15 1 3 1 5 − 13 ) → ( 15 − 1 3 0 0 ) → ( 1 − 53 0 0 ) Lösung ist also jeder skalar vielfache Vektor von x (1) = ( 53 , 1) T , d.h. auch der vorher angegebene Vektor (5 , 3) T , der die Darstellung (5 , 3) T = 3 · ( 53 , 1) T hat. Im folgenden Beispiel hat die Matrix nur einen Eigenwert: 48818_Terveer.indd 343 48818_Terveer.indd 343 18.07.2023 12: 04: 05 18.07.2023 12: 04: 05 <?page no="344"?> 344 13 Matrizen Beispiel 13.33 Das charakteristische Polynom der Matrix A = − 1 1 1 − 8 4 0 1 0 1 ist det ( A − λI 3 ) = det − 1 − λ 1 1 − 8 4 − λ 0 1 0 1 − λ = − λ 6 − 4 λ + λ 2 Einzige Nullstelle des Polynoms ist λ = 0. Der Faktor 6 − 4 λ + λ 2 hat keine reelle Nullstelle. Null ist also der einzige Eigenwert von A . Für einen Eigenvektor von A überführt man A − λI 3 = A (hier mit λ = 0) zunächst in Zeilenstufenform: − 1 − λ 1 1 − 8 4 − λ 0 1 0 1 − λ = − 1 1 1 − 8 4 0 1 0 1 → 1 0 1 0 1 2 0 0 0 Ein Eigenvektor von A ist gerade ein Basisvektor von Kern ( A − 0 I n ) = Kern ( A ), also beispielsweise x (1) = (1 , 2 , − 1) T . Zur Bestimmung von Eigenwerten ist also die Berechnung der Nullstellen („Wurzeln“) von Polynomen erforderlich. Hierzu einige Anmerkungen: ■ Nicht jedes Polynom hat Nullstellen in der Menge der reellen Zahlen, daher gibt es auch Matrizen, die keine Eigenwerte haben. ■ Nullstellen von Polynomen sind nicht unbedingt elementar berechenbar: ab Polynomgrad 5 gibt es kein Verfahren, um Nullstellen explizit zu berechnen. ■ Eigenwerte werden daher meist numerisch gewonnen; hierfür werden z.B. das Newton- Verfahren vgl. S. 192 oder die Regula falsi vgl. S. 176 eingesetzt. 13.5.2 Eigenschaften von Eigenwerten und Eigenvektoren Eine quadratische n × n -Matrix A hat nach dem bisher Gesagten höchstens n verschiedene Eigenwerte. Es können auch weniger (vgl. Beispiel 13.33) oder gar keine Eigenwerte sein, weil entsprechend auch Polynome nicht zwangsläufig (reelle) Nullstellen haben müssen oder aber mehrfache Nullstellen vorkommen. Zu einem Eigenwert können mehrere Eigenvektoren gehören, die nicht skalare Vielfache voneinander sind. Beispiel 13.34 [1] A = 1 1 − 1 1 hat das charakteristische Polynom p ( λ ) = ( λ − 1) 2 + 1, welches keine (reelle) Nullstelle hat. Also hat A keine Eigenwerte. [2] A = 2 1 0 2 hat das charakteristische Polynom p ( λ ) = ( λ − 2) 2 . Dieses hat genau die Nullstelle 2, also hat A genau den einen Eigenwert 2. Wegen A − 2 I = 0 1 0 0 ist (1 , 0) T und jedes skalar Vielfache davon Eigenvektor zum Eigenwert 2. [3] A = 2 0 0 2 hat ebenfalls das charakteristische Polynom p ( λ ) = ( λ − 2) 2 und den einzigen Eigenwert 2. Hierzu gilt A − 2 I = 0 0 0 0 . Es sind deshalb sowohl (1 , 0) T als auch (0 , 1) T Eigenvektoren von A , diese sind zudem linear unabhängig. 48818_Terveer.indd 344 48818_Terveer.indd 344 18.07.2023 12: 04: 11 18.07.2023 12: 04: 11 <?page no="345"?> 13.5 Eigenwerte und Eigenvektoren 345 Satz 13.15 Es sei A eine n × n Matrix und λ ein Eigenwert von A . Dann gilt. Die Menge L aller Eigenvektoren von A zum Eigenwert λ zuzüglich des Nullvektors ist ein Untervektorraum von R n . Er wird Eigenraum von A und λ genannt. Denn Eigenschaften [1]-[3] eines UVR gemäß Definition 12.9 vgl. S. 297 sind erfüllt: [1] 0 ∈ L, weil das so festgelegt wurde. [2] für zwei x, y Vektoren in L gilt stets Ax = λx und Ay = λy , d.h. A ( x + y ) = Ax + Ay = λx + λy = λ ( x + y ), d.h. auch x + y ∈ L. [3] Für α ∈ R , x ∈ L ist A ( αx ) = α ( Ax ) = α ( λx ) = λ ( αx ), d.h. auch αx ∈ L. In den Anwendungen gibt es für jeden Eigenwert bis auf skalares Vielfaches oft genau einen Eigenvektor, d.h. der Eigenraum für diesen Eigenwert hat Dimension 1. Hat man hingegen Eigenvektoren zu verschiedenen Eigenwerten, so können diese nicht skalar Vielfache voneinander sein, im Gegenteil: Satz 13.16 Sind λ 1 , . . . , λ k paarweise verschiedene Eigenwerte einer n × n -Matrix A und a (1) , . . . , a ( k ) Eigenwerte zu λ 1 , . . . , λ k . Dann sind a (1) , . . . , a ( k ) linear unabhängig. Wir prüfen dies für k = 2 Eigenwerte λ ̸ = µ von A und die zugehörigen Eigenvektoren x, y . Um zu sehen, dass x, y l.u. sind, setzt man mit zwei Skalaren α, β die Gleichung αx + βy = ¯0 an und prüft, dass hieraus schon α = β = 0 folgt. Zum einen gilt dann auch ¯0 = A ( αx + βy ) = Aαx + Aβy = αAx + βAy = αλx + βµy . Zum anderen gilt natürlich auch ¯0 = λ ¯0 = λ ( αx + βy ) = λαx + λβy . Subtrahiert man die gewonnenen Ausdrücke voneinander so folgt ¯0 = αλx + βµy − ( λαx + λβy ) = ( µ − λ ) βy . Da aber µ − λ ̸ = 0 (denn µ ̸ = λ ) und y ̸ = ¯0 (da y ein Eigenvektor ist), folgt β = 0. Analog kann man auch α = 0 zeigen. Der allgemeine Nachweis kann z.B. induktiv über die Anzahl k der Eigenwerte bzw. Eigenvektoren erfolgen, wobei die Idee des gerade gerechneten Falls k = 2 ausgebaut wird. 13.5.3 Eigenwerte bei symmetrischen Matrizen In vielen ökonomischen Anwendungen arbeitet man mit symmetrischen Matrizen (z.B. Hesse-Matrizen, Kovarianz- und Korrelationsmatrizen,. . . ). Hier ist die Existenz von Eigenwerten nicht problematisch: Satz 13.17 Jede symmetrische Matrix A ∈ R n × n hat ausschließlich reelle Eigenwerte. Das charakteristische Polynom hat dann nämlich - prinzipiell - eine Faktorisierung det ( A − λI n ) = c ( λ − λ 1 ) · · · ( λ − λ n ) mit reellen Zahlen λ 1 , . . . , λ n , welche dann die Eigenwerte von A sind. Diese n Zahlen sind aber nicht unbedingt voneinander verschieden - man spricht dann von Eigenwerten mit Vielfachheit größer als 1. Zudem gibt es auch für symmetrische n × n -Matrizen ab n > 2 in aller Regel nur einen numerischen Zugang zu den Eigenwerten. Außerdem gibt es bei symmetrischen Matrizen einen überraschenden geometrischen Zusammenhang zwischen Eigenwerten verschiedener Eigenvektoren: 48818_Terveer.indd 345 48818_Terveer.indd 345 18.07.2023 12: 04: 20 18.07.2023 12: 04: 20 <?page no="346"?> 346 13 Matrizen Satz 13.18 Eigenvektoren zu verschiedenen Eigenwerten einer symmetrischen Matrix sind orthogonal. Denn sind λ ̸ = µ solche Eigenwerte einer symmetrischen Matrix A und x bzw. y Eigenvektoren zu den Eigenwerten λ bzw. µ , so bedeutet dies zunächst Ax = λx und Ay = µy . Multipliziert man Ax von links mit y T und Ay von links mit x T , so folgt aus der Symmetrie von A : y T ( λx ) = y T ( Ax ) = ( y T Ax ) T = x T ( A T ) T ( y T ) T = x T Ay = x T ( Ay ) = x T ( µy ) also ¯0 = y T ( λx ) − x T ( µy ) = λy T x − µx T y = ( λ − µ ) ⟨ x, y ⟩ . Da aber λ − µ ̸ = 0, muss ⟨ x, y ⟩ = 0 gelten, d.h. x, y sind orthogonal. Hieraus folgt sofort: Satz 13.19 Sei A eine symmetrische n × n -Matrix und x (1) , . . . , x ( n ) Eigenvektoren der Norm 1 zu n verschiedenen Eigenwerten λ 1 , . . . , λ n von A . Setzt man x (1) , . . . , x ( n ) zu einer Matrix M zusammen, und ist ∆ die Diagonalmatrix, deren Diagonalelelemente die Eigenwerte λ 1 , . . . , λ n sind, so gilt: [1] M T M = I n , [2] M T AM = ∆, [3] A = M ∆ M T [1] besagt nichts anderes als x ( i ) ⊥ x ( j ) für i ̸ = j und ∥ x ( i ) ∥ = 1. [2] ist lediglich eine Zusammenfassung der Eigenvektor-Eigenschaften. Denn AM ist eine Matrix, welche die Spalten Ax ( j ) = λ j x ( j ) enthält. Multipliziert man M T mit AM so treten deshalb lauter Skalarprodukte x ( i ) T ( λ j x ( j ) ) auf, die nur für j = i nicht gleich Null sind und dann den Wert λ i ergeben. M T AM = ∆ ist also die genannte Diagonalmatrix. [3] folgt aus [2], wenn man von links mit M und von rechts mit M T multipliziert und die erste Aussage verwendet. Definition 13.9 ! Die Darstellung A = M ∆ M T heißt Hauptachsentransformation von A . Sie ist ein wichtiges Hilfsmittel in vielen Anwendungen der Analysis und Statistik im Rahmen komplizierterer ökonomischer Probleme. Beispielsweise kann man mit Hilfe der Hauptachsentransformation Matrixpotenzen symmetrischer Matrizen ausrechnen. Mit einem „Teleskop-Trick“ lässt sich nämlich das Matrixprodukt A k einer symmetrischen Matrix A auf das Matrixprodukt ∆ k zurückführen. ∆ k ist wiederum eine Diagonalmatrix mit den k -Potenzen der Eigenwerte. Beispiel 13.35 Für die symmetrische Matrix A = ( 1 2 2 4 ) wollen wir die Matrix-Potenz A k mit k ∈ N berechnen. Dazu suchen wir zunächst die Eigenwerte und -vektoren von A und stellen damit die Hauptachsentransformation von A auf. Das charakteristische Polynom von A ist λ → λ 2 − 5 λ mit den Wurzeln 0 und 5. Die den Eigenvektoren zugehörigen homogenen LGS haben Koeffizientenmatrizen ( 1 − 0 2 2 4 − 0 ) = ( 1 2 2 4 ) → ( 1 2 0 0 ) , ( 1 − 5 2 2 4 − 5 ) = ( − 4 2 2 − 1 ) → ( 1 − 12 0 0 ) Durch Ablesen einer Basis ergeben sich die beiden orthogonalen Eigenvektoren x (1) = (2 , − 1) T , x (2) = ( − 1 / 2 , − 1) T Normiert man nun diese beiden Vektoren mit ihren respektiven Längen, d.h. geht 48818_Terveer.indd 346 48818_Terveer.indd 346 18.07.2023 12: 04: 28 18.07.2023 12: 04: 28 <?page no="347"?> 13.5 Eigenwerte und Eigenvektoren 347 über zu den Vektoren y (1) : = 1 ∥ x (1) ∥ x (1) = 1 √ 5 2 − 1 , y (2) : = 1 ∥ x (2) ∥ x (2) = 1 √ 5 − 1 − 2 , so erhält man ein System orthonormaler Eigenvektoren, die zu M = 1 √ 5 2 − 1 − 1 − 2 zusammengesetzt werden. Dann gilt M M T = M T M = 1 0 0 1 und die Hauptachsentransformation 1 2 2 4 = M 0 0 0 5 M T . Beide Gleichungen sollten Sie nachrechnen. Mit dieser Hauptachsentransformation berechnen wir jetzt die Matrixpotenz A k . Für die vorliegende Matrix A gilt wegen M T M = I 2 1 2 2 4 k = M 0 0 0 5 M T k = ( M 0 0 0 5 M T )( M 0 0 0 5 M T )( M 0 0 0 5 M T ) · · · ( M 0 0 0 5 M T ) k Klammern = M 0 0 0 5 ( M T M ) 0 0 0 5 ( M T M ) 0 0 0 5 · · · ( M T M ) 0 0 0 5 M T = M 0 0 0 5 k M T = M 0 0 0 5 k M T = 5 k − 1 1 2 2 4 Die im Beispiel nach dem Einsetzen von A in der ersten Zeile entstehenden „Paar-Produkte“ M T M können dabei durch I 2 ersetzt werden und wegfallen, weil Multiplikation mit der Einheitsmatrix keine Veränderung im Produkt bewirkt. Eine derartige Darstellung wird „Teleskop-Produkt“ genannt, weil sich der lange Ausdruck wie ein Hand-Teleskop „zusammenschieben“ lässt. Zwischen den Eigenwerten und den Diagonalelementen einer symmetrischen Matrix besteht ein wichtiger Zusammenhang, mit dem dieser Abschnitt beschlossen werden soll, dazu wird das Konzept der Die Spur einer Matrix benötigt: Definition 13.10 ! spur( A ) ist die Summe der Diagonalelemente einer quadratischen Matrix A . Beispiel 13.36 Wir bestimmen die Spur für die in diesem Abschnitt vorkommenden Matrizen: [1] spur 1 13 15 13 15 = 1 + 13 15 = 28 15 [2] spur − 1 1 1 − 8 4 0 1 0 1 = − 1 + 4 + 1 = 4 [3] spur 1 1 − 1 1 = 2 [4] spur 2 1 0 2 = spur 2 0 0 2 = 2+2 = 4 [5] spur 1 2 2 4 = 1 + 4 = 5 Die folgenden Spur-Regeln ergeben sich aus den Regeln für Matrixoperationen: Satz 13.20 Es seien A, B quadratische n × n -Matrizen und α, β ∈ R. Dann gilt [1] spur( αA + βB ) = α spur( A ) + β spur( B ) [2] spur( AB ) = spur( BA ) Während AB und BA in der Regel nicht übereinstimmen, ist dies für die Spur der beiden Matrizen also sehr wohl der Fall. 48818_Terveer.indd 347 48818_Terveer.indd 347 18.07.2023 12: 04: 36 18.07.2023 12: 04: 36 <?page no="348"?> 348 13 Matrizen Satz 13.21 Für eine symmetrische Matrix A ist spur( A ) gleich der Summe ihrer Eigenwerte, gerechnet mit Vielfachheit. Wir prüfen diese Aussage zunächst anhand der obigen Beispiele: Beispiel 13.37 (Fortsetzung von Beispiel 13.36) [1] spur 2 0 0 2 = 2 + 2 = 4. Die Matrix hat den Eigenwert 2 mit Vielfachheit 2, was in der Summe ebenfalls 4 ergibt. [2] spur 1 2 2 4 = 1 + 4 = 5. Die Matrix hat die Eigenwerte 0 und 5, was in der Summe ebenfalls 5 ergibt. Die Aussage des vorigen Satzes ist prinzipiell auch für beliebige reelle n × n -Matrizen richtig. Man sieht dies in Beispiel 13.36[1] und [4]. In den anderen Beispielen ist das nicht erkennbar, weil nicht genug reelle Eigenwerte vorliegen und man auch die komplexen Eigenwerte berücksichtigen muss. Wir wollen die Aussage kurz für symmetrische Matrizen begründen. Nimmt man nämlich die Darstellung aus der Hauptachsentransformation A = M ∆ M T gemäß Satz 13.19, so folgt spur( A ) = spur( M ∆ M T )) = spur(∆( M M T )) nach Satz 13.20[2], dabei ist aber M M T = I nach Satz 13.19[1], also spur( A ) = spur(∆ I ) = spur(∆). Nun enthält ∆ auf der Diagonalen aber gerade die Eigenwerte von A mit Vielfachheit, und spur(∆) bestimmt deren Summe. Übungen zu Abschnitt 13.5 ? 14. Bestimmen Sie die Eigenwerte der Matrizen 1 2 2 3 , 2 1 0 1 1 0 0 0 1 , 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 0 15. Vervollständigen Sie die folgenden Angaben (d.h. ergänzen Sie jeweils durch geeignete Werte). Dabei soll x ein Eigenvektor von A zum Eigenwert λ sein. a) A = 2 1 4 2 , x = 12 , λ = bzw. A = 1 2 0 2 4 0 1 1 1 , x = 483 , λ = . b) A = − 2 0 2 4 , x = 6 , λ = − 2 bzw. A = 3 3 3 1 1 − 1 − 3 − 3 − 3 , x = 9 , λ = − 2 c) A = 3 3 3 2 1 − 1 − 6 − 6 − 6 , x = 12 , λ = d) A = , x = 12 − 2 , λ = 1 16. Wie viele Eigenwerte hat 1 − t t t ? 17. Zeigen Sie, dass eine symmetrische Matrix a b b c einen Eigenwert besitzt. 18. Berechnen Sie 1 2 2 1 10 . 19. Zeigen Sie ohne Rückgriff auf die Hauptachsentransformation, dass für eine symmetrische Matrix A = a b b c die Summe der Eigenwerte a + c ist. 13.6 Definitheit von Matrizen Bei den bisher behandelten Themen rund um quadratische Matrizen spielte stets das „lineare“ Verhalten dieser Matrizen eine Rolle. Mit quadratischen Matrizen können jedoch auch quadratische Terme gebildet werden, insbesondere quadratische Formen: 48818_Terveer.indd 348 48818_Terveer.indd 348 18.07.2023 12: 04: 43 18.07.2023 12: 04: 43 <?page no="349"?> 13.6 Definitheit von Matrizen 349 Definition 13.11 ! Für eine symmetrische Matrix n × n -Matrix H heißt der Ausdruck ⟨ d, Hd ⟩ mit d ∈ R n quadratische Form zu H . Genauer ist die quadratische Form die Zuordnung d → ⟨ d, Hd ⟩ , also eine Funktion. Der Einfachheit halber wollen wir hier aber nicht zwischen Funktion und Funktionsterm unterscheiden. Eine spezielle quadratische Form haben wir bereits im Kapitel über Vektoren im Zusammenhang mit dem Skalarprodukt kennen gelernt, nämlich das Skalarprodukt ⟨ x, x ⟩ = ⟨ x, Ix ⟩ , dessen Wurzel genau die euklidische Norm ist vgl. S. 305 . Generelle quadratische Formen und insbesondere ihr Vorzeichenverhalten spielen in der Differentialrechnung mehrerer Variablen eine Rolle, weil damit das Verhalten der Ableitungen zweiter Ordnung und damit das Krümmungsverhalten von Funktionen mehrerer Variablen untersucht werden kann. Es lassen sich damit z.B. hinreichende Bedingungen für lokale Extrema formulieren. Außerdem besteht ein Zusammenhang zwischen quadratischen Formen und den Eigenwerten symmetrischer Matrizen, der zur Berechnung der Eigenwerte ausgenutzt werden kann und eine Rolle in der multivariaten Statisik bei der Dimensionsreduktion von Datensätzen spielt: Satz 13.22 Es sei H eine symmetrische Matrix. Der maximale (minimale) Wert von ⟨ d, Hd ⟩ , wobei ∥ d ∥ = 1, stimmt überein mit dem größten (kleinsten) Eigenwert von H . Der zugehörige Vektor d ist jeweils ein Eigenvektor zu diesem Eigenwert. 13.6.1 Definitheit Die Definitheit einer Matrix wird durch das Vorzeichenverhalten der zugehörigen quadratischen Form festgelegt: Definition 13.12 (Definitheit symmetrischer Matrizen) ! Eine symmetrische Matrix H ∈ R n × n heißt [1] positiv definit, wenn für alle d ∈ R n , d ̸ = ¯0, gilt: ⟨ d, Hd ⟩ > 0 [2] positiv semidefinit, wenn für alle d ∈ R n gilt: ⟨ d, Hd ⟩ ≥ 0 [3] negativ definit, wenn für alle d ∈ R n , d ̸ = ¯0, gilt: ⟨ d, Hd ⟩ < 0 [4] negativ semidefinit, wenn für alle d ∈ R n gilt: ⟨ d, Hd ⟩ ≤ 0 [5] indefinit, wenn keiner der ersten vier Fälle vorliegt. Beispiel 13.38 Betrachtet werde die Matrix H = ( 1 2 2 a ) , wobei a ∈ R zunächst nicht weiter spezifiziert ist. Für d 1 , d 2 ∈ R gilt 〈 ( d 1 d 2 ) , ( 1 2 2 a )( d 1 d 2 ) 〉 = d 21 + 4 d 1 d 2 + ad 22 = ( d 1 + 2 d 2 ) 2 + ( a − 4) d 22 . Deshalb ist H ■ für a > 4 positiv definit, denn für alle d ̸ = ¯0 ist das Skalarprodukt strikt positiv. ■ für a = 4 positiv semidefinit, aber nicht positiv definit. Denn für alle d ∈ R 2 ist 48818_Terveer.indd 349 48818_Terveer.indd 349 18.07.2023 12: 04: 49 18.07.2023 12: 04: 49 <?page no="350"?> 350 13 Matrizen das Skalarprodukt größer oder gleich Null, aber beispielsweise ist ( − 2 , 1) T ein Richtungsvektor ̸ = ¯0, für den das Skalarprodukt gleich Null ist. ■ für a < 4 indefinit, denn für d = (1 , 0) ergibt sich das Skalarprodukt zu 1 > 0, während es für d = ( − 2 , 1) T zu a − 4 < 0 wird. An diesem Beispiel kann man schon erkennen, dass die Überprüfung der Definitheit aufgrund von Definition 13.12 nicht sehr gangbar ist. Dafür gibt es einfache Definitheitskriterien auf Basis der so genannten Haupt-Unterdeterminanten. Satz 13.23 (Definitheitstest mittels Hauptunterdeterminanten) Sei H = ( h ij ) 1 ≤ i,j ≤ n eine symmetrische n × n -Matrix mit den Haupt-Untermatrizen H k : = h 11 . . . h 1 k ... . . . ... h k 1 . . . h kk , 1 ≤ k ≤ n . Dann gilt [1] H ist positiv definit ⇔ det( H k ) > 0 für alle 1 ≤ k ≤ n . [2] H ist negativ definit ⇔ ( − 1) j det( H k ) > 0 für alle 1 ≤ k ≤ n . [3] H ist positiv semidefinit ⇒ det ( H k ) ≥ 0 für alle 1 ≤ k ≤ n [4] H ist negativ semidefinit ⇒ ( − 1) k det( H k ) ≥ 0 für alle 1 ≤ k ≤ n . Insbesondere gilt: Eine symmetrische Matrix H mit det( H 2 ) < 0 ist indefinit. Determinanten einer quadratischen Teilmatrix werden auch Minoren genannt. Die hier durch sukzessives Auffüllen der Matrix nach rechts und unten betrachteten Minoren heißen auch Hauptminoren. Bei Verwendung des oben genannten Determinantenkriteriums können Situationen auftreten, in denen man aus dem Vorzeichenverhalten der Hauptunterdeterminanten nicht auf die Definitheit schließen kann. Dennoch ist es das gängigste Verfahren und soll anhand des oben bereits behandelten Beispiels noch einmal illustriert werden. Beispiel 13.39 Sei wieder H = 1 2 2 a mit a ∈ R. Hauptuntermatrizen und Hauptminoren lauten: ■ H 1 = [1] und det( H 1 ) = 1 > 0 . ■ H 2 = H und det( H 2 ) = a − 4. Hieraus liest man ab: ■ H ist positiv definit für a > 4 ■ H ist nicht negativ definit und nicht negativ semidefinit (für beliebiges a ) ■ H ist indefinit für a < 4 ■ Wenn H positiv semidefinit ist, muß a ≥ 4 gelten . Man beachte, dass der Fall a = 4 mittels des allgemeinen Determinantenkriteriums nicht entschieden werden kann. Für 2 × 2-Matrizen H kann man jedoch auch im Fall det( H ) = 0 noch Nutzen aus der Determinante gewinnen: 48818_Terveer.indd 350 48818_Terveer.indd 350 18.07.2023 12: 04: 55 18.07.2023 12: 04: 55 <?page no="351"?> 13.6 Definitheit von Matrizen 351 Satz 13.24 (Spezielles Determinantenkriterium für 2 × 2-Matrizen) Eine symmetrische Matrix H = ( a b b c ) mit a > 0 und ac − b 2 = 0 ist positiv semidefinit. Dies folgt, weil dann zwangsläufig c ≥ 0 ist und der Ausdruck 〈 ( d 1 d 1 ) , ( a b b c )( d 1 d 2 ) 〉 = ad 21 + 2 bd 1 d 2 + cd 22 = ( √ ad 1 + √ cd 2 ) 2 für beliebige d 1 , d 2 nichtnegativ ist. Für symmetrische Matrizen mit mehr als zwei Zeilen und Spalten kann man allerdings die Definitheit nicht mehr erschließen, wenn einer der Hauptminoren gleich Null ist: Beispiel 13.40 H = ( 1 2 0 2 4 0 0 0 − 1 ) ist indefinit, denn 〈 ( 100 ) , H ( 100 ) 〉 = 1 , 〈 ( 001 ) , H ( 001 ) 〉 = − 1. Die Hauptminoren lauten hier det(1) = 1 , det ( 1 2 2 4 ) = 0 , det H = 0, was also nicht auf positive Semidefinitheit von H schließen lässt. Das Determinantenkriterium ist hier also nicht anwendbar. Man könnte das Determinantenkriterium noch verallgemeinern, um auch derartige Situationen zu untersuchen - sind nämlich sämtliche Hauptminoren aller durch simultane Umordnung von Zeilen und Spalten erhältlichen Matrizen größer oder gleich Null, so ist die Matrix positiv semidefinit. Dieses Kriterium ist aber nicht sehr praktikabel, denn schon bei drei Zeilen und drei Spalten sind die Hauptminoren von insgesamt 3! = 6 Matrizen zu prüfen, insgesamt also 18 Determinanten. Bei Matrizen mit 4 Zeilen und Spalten wären das schon 4 · 4! = 96 Determinanten. Das nächste Definitheitskriterium kommt ohne Determinanten aus und vermeidet diesen Aufwand. Es untersucht die Eigenwerte der zu prüfenden Matrix und ist deshalb aber für Matrizen höherer Dimensionen in aller Regel nur numerisch verwendbar. Satz 13.25 Sei H eine symmetrische Matrix mit Eigenwerten λ 1 , . . . , λ n . Dann gilt: [1] H ist positiv definit ⇔ λ 1 > 0 , . . . , λ n > 0 [2] H ist negativ definit ⇔ λ 1 < 0 , . . . , λ n < 0. [3] H ist positiv semidefinit ⇔ λ 1 ≥ 0 , . . . , λ n ≥ 0 [4] H ist negativ semidefinit ⇔ λ 1 ≤ 0 , . . . , λ n ≤ 0. H ist indefinit genau dann, wenn H einen strikt positiven und einen strikt negativen Eigenwert hat. Beispiel 13.41 Sei wieder H = ( 1 2 2 a ) mit a ∈ R. Das charakteristische Polynom von H lautet det ([ 1 − λ 2 2 a − λ ]) = (1 − λ )( a − λ ) − 4 = λ 2 − ( a + 1) λ + ( a − 4) 48818_Terveer.indd 351 48818_Terveer.indd 351 18.07.2023 12: 05: 02 18.07.2023 12: 05: 02 <?page no="352"?> 352 13 Matrizen Eigenwerte von H sind die Nullstellen des charakteristischen Polynoms, d.h. λ 1 , 2 = a + 1 2 ± √( a + 1 2 ) 2 − ( a − 4) = a + 1 ± √ ( a − 1) 2 + 16 2 Ist nun a > 4, so ist √ ( a − 1) 2 + 16 < a + 1 und beide Eigenwerte sind positiv. H ist also positiv definit. Falls a = 4, so hat H die Eigenwerte 0 und 5 und ist positiv semidefinit. Falls aber a < 4 , so ist √ ( a − 1) 2 + 16 > a + 1. H hat dann einen positiven und einen negativen Eigenwert, ist also indefinit. 13.6.2 Definitheit unter Nebenbedingungen Mit Hilfe der Definitheit von Matrizen lassen sich hinreichende Bedingungen für lokale Extrema in mehreren Variablen formulieren, die wir uns in Abschnitt 15.1.2 genauer anschauen werden. Diese Bedingungen können aber nicht angewandt werden, wenn die Optimierung unter Nebenbedingungen vorgenommen wird. In diesem Fall benötigt man ein etwas allgemeineres Konzept der Definitheit, bei dem die Nebenbedingungen in lineare Gleichungssysteme übersetzt werden, welches dann in Abschnitt 15.3.1 verwendet wird. Definition 13.13 (Definitheit unter Nebenbedingungen) ! Gegeben seien eine symmetrische n × n -Matrix H und eine n × r -Matrix G . [1] Die Matrix H heißt positiv definit unter Gx = 0 (bzw. negativ definit unter Gx = ¯0), wenn für alle x ̸ = ¯0 mit Gx = ¯0 gilt: ⟨ x, Hx ⟩ > 0 (bzw. ⟨ ax, Hx ⟩ < 0). [2] Die Matrix H heißt positiv semidefinit (bzw. negativ semidefinit) unter Gx = ¯0, wenn für die oben genannten x gilt: ⟨ x, Hx ⟩ ≥ 0 (bzw. ⟨ x, Hx ⟩ ≤ 0). Wie bei der „pauschalen“ Definitheit gibt es verschiedene Möglichkeiten, Definitheit unter Nebenbedingungen zu überprüfen. Eine Methode verwendet eine Basis der Lösungsmenge des linearen Gleichungssystems Gx = ¯0 gemäß Satz 12.7 vgl. S. 302 , eine andere arbeitet mit Minoren einer aus H und G zusammengesetzten Blockmatrix. Satz 13.26 (Reduktionskriterium für Definitheit unter Nebenbedingungen) Mit dem nachstehenden Verfahren kann nachgewiesen werden, dass eine symmetrische Matrix H ∈ R n × n definit unter der Nebenbedingung Gx = ¯0 ist: [1] Setze die Vektoren einer Basis von Kern ( G ) zu einer n × ℓ -Matrix A zusammen. [2] Üüberprüfe mit den herkömmlichen Methoden, dass die Matrix A T HA definit ist. Denn nehmen wir beispielsweise an, dass A T HA positiv definit ist. Sei jetzt x ∈ Kern ( G ) mit x ̸ = ¯0. Es gilt dann auch ⟨ x, Hx ⟩ > 0, denn x ist LK einer Basis von Kern ( A ) und lässt sich in der Form x = Ab mit b ∈ R ℓ , b ̸ = ¯0, schreiben vgl. S. 321. Dann gilt aber ⟨ x, Hx ⟩ = x T Hx = ( Ab ) T H ( Ab ) = ( b T A T ) H ( Ab ) = b T ( A T HA ) b = ⟨ b, ( A T HA ) b ⟩ Der zuletzt erhaltene Ausdruck ist aber größer als Null, weil A T HA als positiv definit vorausgesetzt und b ̸ = 0 ist. Also ist auch ⟨ x, Hx ⟩ > 0. 48818_Terveer.indd 352 48818_Terveer.indd 352 18.07.2023 12: 05: 10 18.07.2023 12: 05: 10 <?page no="353"?> 13.6 Definitheit von Matrizen 353 Beispiel 13.42 ■ Es soll die Definitheit von H = 2 3 1 3 1 0 1 0 1 unter der Nebenbedingung Gx = ¯0 mit G = 0 , 1 , 12 geprüft werden. Eine Basis von Kern( G ) ist (1 , 0 , 0) T und (0 , 1 , − 2) T . Das ergibt die positiv definite Matrix 1 0 0 0 1 − 2 2 3 1 3 1 0 1 0 1 1 0 0 1 0 − 2 = 2 1 1 5 . ■ Es soll die Definitheit derselben Matrix H unter der Nebenbedingung Gx = ¯0 mit G = 1 1 0 0 1 12 geprüft werden. G hat die Zeilenstufenform 1 0 − 12 0 1 12 . Eine Basis von Kern( G ) ist also z.B. (1 , − 1 , 2) T . Damit ergibt sich die positiv definite Matrix 1 − 1 2 2 3 1 3 1 0 1 0 1 1 − 12 = 5 Die Basisvektoren von Kern ( G ) darf man durch skalare Multiplikation auf eine vorteilhafte Form bringen. Weiter gibt es auch ein Determinanten-Kriterium [Mann, 1943]: Satz 13.27 (Kriterium der geränderten H-Matrix) [1] Man bilde die geränderte H-Matrix, d.h. die ( r + n )-zeilige und ( r + n )-spaltige Block-Matrix R H,G = 0 r × r G G T H . [2] Wenn alle Hauptminoren von R H,G zu einer Zeilen- und Spaltenzahl größer als 2 r das Vorzeichen ( − 1) r haben, so ist H positiv definit unter Gx = ¯0. Beispiel 13.43 (Fortsetzung von Beispiel 13.42) ■ Für H = 2 3 1 3 1 0 1 0 1 und G = 0 , 1 , 12 ist R H,G = 0 0 1 12 0 2 3 1 1 3 1 0 12 1 0 1 . Zu berechnen sind det 0 0 1 0 2 3 1 3 1 = − 2 < 0, det 0 0 1 12 0 2 3 1 1 3 1 0 12 1 0 1 = − 94 < 0. H ist positiv definit auf Gx = ¯0. ■ Für H = 2 3 1 3 1 0 1 0 1 und G = 1 1 0 0 1 12 ist R H,G = 0 0 1 1 0 0 0 0 1 12 1 0 2 3 1 1 1 3 1 0 0 12 1 0 1 mit (einzig zu berechnender) Determinante 54 > 0. H ist positiv definit unter den Nebenbedingungen. Übungen zu Abschnitt 13.6 ? 20. a) Welche der Matrizen sind positiv (negativ) definit bzw. indefinit? A = 42 0 0 17 , B = − 1 2 2 − 3 , C = − 2 3 3 − 5 , D = − 2 3 3 − 2 , E = − 4 4 − 1 4 − 6 2 − 1 2 − 1 , F = 3 2 − 2 2 3 − 4 − 2 − 4 5 , G = 1 0 1 0 0 0 1 0 1 . Prüfen Sie soweit möglich alle drei behandelten Kriterien. 21. Wann ist A = a 2 a 2 a 4 positiv definit? 22. Prüfen Sie H auf pauschale Definitheit und auf Definitheit unter Gx = ¯0 48818_Terveer.indd 353 48818_Terveer.indd 353 18.07.2023 12: 05: 21 18.07.2023 12: 05: 21 <?page no="354"?> 354 13 Matrizen an Sektor Endnachfrage Produktion von Sektor 1 2 · · · n (Output,Konsum) (Input) 1 x 11 x 12 x 1 n y 1 x 1 ... ... ... . . . ... ... n x n 1 x n 2 x nn y n x n Tabelle 13.2: Darstellung der Sektorverflechtung als Input-Output-Tabelle a) H = 1 − 3 − 3 2 , G = 1 2 b) H = 1 − 3 − 3 2 , G = 1 − 2 c) H = 1 − 3 − 3 t , G = 5 3 d) H = 0 − 3 2 − 3 1 1 2 1 4 , G = 5 3 1 2 0 − 1 e) H = 0 1 1 1 1 1 1 1 0 , G = 5 3 1 f) H = − 5 0 − 3 2 0 1 0 1 − 3 0 1 − 1 2 1 4 2 , G = 2 0 1 1 2 1 1 1 13.7 Exkurs: Anwendungen der Matrizenrechnung Zu den bekanntesten ökonomischen Modellen, welche den Matrix-Kalkül ausnutzen, gehören die Ein-Schritt-Übergangsmodelle für theoretische und empirische Wahrscheinlichkeiten und die Leontief-Modelle. Deren Entdecker Wassily Leontief brachten seine Überlegungen 1973 den Nobelpreis für Wirtschaftswissenschaften ein. 13.7.1 Input-Output-Analysen und Leontief-Modelle Leontief unterstellte einen Wirtschaftsbereich, der in verschiedene Sektoren zerfällt; jeder dieser Sektoren stellt ein individuelles Gut her und benötigt zu dessen Herstellung seinerseits wechselseitig Güter der anderen Sektoren. Im Sinne der Produkt-Rohstoff- Verflechtung lassen sich diese Güter dann als Rohstoff-Inputs interpretieren. Eines der bekanntesten Resultate von Leontiefs Studien war das nach ihm benannte Paradoxon, er wies entgegen der damaligen Meinung nach, dass der Export der USA im Jahr 1947 hauptsächlich aus arbeitsintensiven Gütern bestand ([Leontief, 1954]). Den Ansatzpunkt eines Leontief-Modells stellt die Ist-Analyse der Verwendung der Produktion x 1 , . . . , x n der verschiedenen Sektoren dar, d.h. die Darstellung der sektoralen Bewegung der Wirtschaftsgüter in der so genannten Input-Output-Tabelle (Tabelle 13.2): Die Restproduktion eines Sektors nach Abzug aller Anteile, die in anderen Sektoren benötigt werden, wird als Endnachfrage (Konsum) des Sektors bezeichnet. Beispiel 13.44 Auf der Wiwinesischen Insel Costania treten die drei Mobilfunkanbieter Tekom, E- Minus und D2 12 auf, deren Netzverfügbarkeit dort nicht überall gleich hoch ist. Daher benötigen sie im Rahmen des „Roaming“ Netzkapazitäten von ihren jeweiligen Mitkonkurrenten. Andererseits wird ein Teil der Netzkapazität jedes Anbieters als „interne Reserve“ nicht oder nur für Zwecke der „maintenance“ verwendet. Für einen konkreten Tag ergab sich folgende Gesamtbilanz (in Gesprächsstunden) 48818_Terveer.indd 354 48818_Terveer.indd 354 18.07.2023 12: 05: 26 18.07.2023 12: 05: 26 <?page no="355"?> 13.7 Exkurs: Anwendungen der Matrizenrechnung 355 von an Anbieter geführte Gespräche gesamt Anbieter Tekom E-Minus D2 12 (Output,Konsum) (Input) Tekom 200 0 160 640 1000 E-Minus 0 1000 0 1000 2000 D2 12 400 0 320 80 800 Im Leontief-Modell resultieren die in den Konsum gelangenden Quantitäten y 1 , . . . , y n aus der um den internen Bedarf reduzierten Produktion, d.h. y i = x i − ( x i 1 + · · · + x in ). Dabei kann der interne Bedarf jedes Sektors an der Produktion eines anderen Sektors anhand der Ist-Werte - innerhalb plausibler Bereiche der Produktion - als proportional zu seiner eigenen Produktion veranschlagt werden. Infolge der Leontief-Annahme gibt es also für alle i, j ein a ij mit x ij = a ij x j (sofern x i,j und x j innerhalb sinnvoll gewählter Bereiche variieren). Die Input-Output-Tabelle lautet also von Sektor an Sektor 1 2 · · · n Output Input 1 a 11 x 1 a 12 x 2 a 1 n x n y 1 x 1 ... ... ... . . . ... ... n a n 1 x 1 a n 2 x 2 a nn x n y n x n Definition 13.14 ! Die Matrix A = [ a i,j ] 1 ≤ i,j ≤ n ∈ R n × n mit a i,j = x i,j x j wird auch technologische Matrix oder Input-Matrix genannt. Beispiel 13.45 (Fortsetzung von Beispiel 13.44) Unterstellt man im Mobilfunk-Beispiel ein Leontief-Modell, lautet die Input-Matrix: A = 200 1000 0 160 800 0 1000 2000 0 400 1000 0 320 800 = 15 0 15 0 12 0 25 0 25 Für das Leontief-Modell ist eine Darstellung in Matrix-Form möglich, die eine bequeme Global-Betrachtung des Modells ermöglicht: Mit der Input-Matrix A lautet der Zusammenhang zwischen Input und Output im Leontief-Modell y = y 1 ... y n = x 1 ... x n − a 1 , 1 x 1 + a 1 , 2 x 2 + · · · + a 1 ,n x n ... a n, 1 x 1 + a n, 2 x 2 + · · · + a n,n x n = x − Ax = ( I n − A ) x Satz 13.28 Zwischen Produktion x und Endnachfrage y besteht im Leontief-Modell der Zusammenhang y = ( I n − A ) x , wobei A die technologische Matrix des Leontief-Modells beschreibt. Leontief war an der Beantwortung der Frage interessiert, mit welcher Produktion x ein gegebener Endnachfragevektor y erreicht werden kann. Falls ( I n − A ) invertierbar ist, so lautet die Antwort y = ( I n − A ) x ⇐⇒ x = ( I n − A ) − 1 y . Definition 13.15 ! Falls im Leontief-Modell die Matrix ( I n − A ) invertierbar ist, so wird ( I n − A ) − 1 als Leontief-Inverse zur Input-Matrix A bezeichnet. Die Leontief-Inverse lässt sich auf vielfältige Art nutzen: 48818_Terveer.indd 355 48818_Terveer.indd 355 18.07.2023 12: 05: 35 18.07.2023 12: 05: 35 <?page no="356"?> 356 13 Matrizen ■ Bei gleichbleibendem Leontief-Ansatz können unterschiedliche Endnachfragevektoren darauf geprüft werden, ob sie im vorliegenden Sektormodell (mit positiven Produktionsquantitäten der Sektoren) realisierbar sind. ■ Wenn man die Möglichkeit hat, die einzelnen Sektoren hinsichtlich ihrer Produktion zu steuern, ist es möglich, eine Optimierung des Konsums z.B. durch Methoden der linearen Programmierung durchzuführen; die Zielfunktion des LP-Ansatzes wird dann eine lineare Nutzenfunktion c T y des Konsumvektors sein, die Nebenbedingungen ergeben sich als System ( I − A ) − 1 y ≤ x max linearer Ungleichungen mit typischen Produktionskapazitäten x max ,i in den einzelnen Sektoren i . Beispiel 13.46 (Fortsetzung von Beispiel 13.44) Mit der Input-Matrix des auf dem Mobilfunk-Markt von Costania unterstellten Leontief-Modell lautet die Leontief-Inverse: 1 0 0 0 1 0 0 0 1 − 15 0 15 0 12 0 25 0 25 − 1 = 45 0 − 15 0 12 0 − 25 0 35 − 1 = 32 0 12 0 2 0 1 0 2 Das Leontief-Modell y = ( I n − A ) x hat etliche Spezialfälle. Es heißt z.B. ■ geschlossen für x , wenn gilt ( I n − A ) x = 0, ■ produktiv für x , wenn alle Sektoren nichtnegative Endnachfrage haben. Im Mobilfunkbeispiel etwa werden die genannten Gesprächsstunden auf Costania durch ein produktives Leontief-Modell beschrieben. 13.7.2 Übergangsmatrizen und Markoff-Ketten Verflechtungsmodelle, die sich durch Fortschreibung von Anteilsvektoren ergeben, sind in der Mathematik besonders genau untersucht worden. Das Matrix-Produkt wird hier eingesetzt, um das langfristige Verhalten solcher Modelle zu untersuchen. Beispiel 13.47 (Fortsetzung aus Abschnitt 12.1 vgl. S. 282 ) Im Mobilfunkbeispiel aus Abschnitt 12.1 wurden vier Anbieter eines Standard-Tarifes hinsichtlich ihrer Marktanteile verglichen. Die Kunden in Wiwinesien können die Verträge jeweils zum Quartalsende kündigen und zu einem anderen Anbieter wechseln. Aufgrund dessen haben Marktforscher das Wechselverhalten der Kunden über mehrere Quartale beobachtet und folgende durchschnittlichen Übergänge festgestellt: Es wechseln nach von Tekom E-Minus D2 1 2 Intracom Tekom 34 1 8 1 2 0 E-Minus 0 34 0 0 D2 12 18 0 12 1 4 Intracom 18 1 8 0 34 Definition 13.16 ! Eine Matrix P = [ p i,j ] ∈ R n × n heißt stochastisch, wenn gilt: [1] p ij ≥ 0 für alle i, j = 1 , . . . , n und [2] p 1 j + · · · + p nj = 1 für alle j = 1 , . . . , n ´ Anstelle des Begriffs „stochastische Matrix“ verwendet man auch den bereits eingangs dieses Kapitels genannten Begriff Übergangsmatrix. In der Literatur werden auch 48818_Terveer.indd 356 48818_Terveer.indd 356 18.07.2023 12: 05: 41 18.07.2023 12: 05: 41 <?page no="357"?> 13.7 Exkurs: Anwendungen der Matrizenrechnung 357 1 2 3 4 18 18 34 18 18 34 12 12 14 34 0 1 1 16 15 16 1 16 15 16 Abbildung 13.4: Zustandsgraphen der Beispiele 13.47 und 13.49 Matrizen als stochastisch bezeichnet, bei denen die Zeilensumme jeweils 1 ist, d.h. die Zeilen stochastische Vektoren sind. Stochastische Matrizen treten z.B. als Modell bei Marktanalysen, bei der Beschreibung von Systemen, deren Zustand sich regelmäßig verändert, z.B. Bedienungs-, Lagerhaltungssystemen, aber auch bei stochastischen Verfahren zur Optimierung, wie dem Simulated Annealing [Aarts/ Korst, 1989] und den Genetischen Algorithmen [Nissen, 1997] auf. Sie beschreiben zufällige Zustandsänderungen abhängig vom aktuellen Zustand, nicht aber vom aktuellen Zeitpunkt. Definition 13.17 ! [1] Ein System mit einer Zustandsmenge S = { 1 , . . . , n } , dessen Übergangs-Mechanismus durch eine stochastische Matrix P festgelegt ist, heißt (homogene) Markoff-Kette. [2] Die Matrix P heißt (Ein-Schritt-)Übergangsmatrix. [3] Ein stochastischer Vektor x (0) ∈ R n , der die initiale Wahrscheinlichkeit für das Vorliegen des Zustandes i bzw. den Anteil an Objekten des betrachteten Systems, die sich anfangs in Zustand i befinden, beschreibt, heißt Startverteilung. Wenn ein solches Markoff-System einen eindeutig gekennzeichneten Startzustand i ∈ { 1 , . . . , n } hat, so ist die Startverteilung durch den i -ten Einheitsvektor gegeben. Die - oft willkürlich - kodierte Menge S = { 1 , . . . , n } der realen „Zustände“ des Systems wird Zustandsraum genannt. Mit ihr lässt sich eine andere Repräsentation einer stochastischen Matrix in Form des sogenannten Zustandsgraphen realisieren: Dieser ist ein gerichteter Graph mit der Knotenmenge S und der Menge K = { ( i, j ) ∈ S 2 : p ij > 0 } bewerteter Kanten. Umgekehrt legt ein Zustandsgraph mit Bewertungen p ij ≥ 0 derart, dass die Bewertungen, die von einer Kante wegführen, sich zu Eins summieren, stets eine stochastische Matrix fest. Beispiel 13.48 (Fortsetzung von Beispiel 13.47 vgl. S. 356 ) Im Mobilbeispiel etwa könnte man die Anbieter wie folgt kodieren: Tekom ˆ = 1, E- Minus ˆ = 2, D2 12 ˆ = 3, Intracom ˆ = 4. Mit der zugehörigen Übergangsmatrix P = 34 18 12 0 0 34 0 0 18 0 12 14 1 8 18 0 34 ergibt sich der Zustandsgraph aus Abbildung 13.4, links. Ein Beispiel für die Anwendung von Markoff-Ketten stellen Glücksspielgeräte (Walzenautomaten) dar. Es ist vorgeschrieben, vor der Zulassung die mittlere Auszahlung bei „Blindspiel“, die mittlere Auszahlung bei „Optimalstrategie“ oder die mittlere Gewinnhäufigkeit anzugeben. Diese Geräte lassen sich als „materialisierte Markoff-Ketten“ in geeigneter Weise darstellen: 48818_Terveer.indd 357 48818_Terveer.indd 357 18.07.2023 12: 05: 47 18.07.2023 12: 05: 47 <?page no="358"?> 358 13 Matrizen Walze 1 Walze 2 Wahrscheinlichkeit Ausz. Ausz. in SSP Apfel Apfel 1 16 10 Cent 30 Cent Erdbeere Erdbeere 1 16 20 Cent 30 Cent Banane Banane 1 16 30 Cent 30 Cent „Obst“ Joker 3 16 10 Cent 30 Cent Joker „Obst“ 3 16 10 Cent 30 Cent Joker Joker 1 16 20 Cent + 1 SSP 30 Cent+ 1 SSP Tabelle 13.3: Gewinnplan zum Beispiel 13.49 Beispiel 13.49 Wir gehen von einem Glücksspielgerät aus, welches zwei rotierende Walzen mit je vier gleich großen Sektoren besitzt, auf denen die Symbole Joker, Apfel, Erdbeere, Banane angebracht sind. Die Walzen stoppen zufällig; in einem Sichtfenster erscheint je ein Sektor jeder Walze. Der Gewinnplan für die Walzenresultate befindet sich in Tabelle 13.3. Erzielte Sonderspiele werden für die jeweils nächste Runde in einem Sonderspielzähler festgehalten; wird ein Sonderspiel erzielt, so findet dieses in der nächsten Runde statt, andernfalls findet in der nächsten Runde kein Sonderspiel statt. Falls der Zufallsmechanismus der Walzen keine sich beeinflussenden Walzenstellungen liefert, so bildet die Folge der Sonderspiel-Zählerstände eine homogene Markoff- Kette zum Zustandsraum S = { 0 , 1 } mit der Übergangsmatrix P = 15 16 15 16 1 16 1 16 und es gilt P n = P für alle n ∈ N. Der Übergangsgraph ist in Abbildung 13.4 rechts angegeben. Stochastische Vektoren beschreiben oftmals, wie die Ausprägungen eines Merkmals (z.B. in Bezug auf ein Gut die Wahl der Marke) innerhalb einer Population verteilt sind. In regelmäßigen Zeitabständen verändert sich dieser Anteilsvektor. Die Gesetzmäßigkeiten hierfür sind oft durch Übergangsmatrizen beschrieben und mittels des Matrix-Vektor-Produktes zu berechnen. Zumeist interessiert man sich aber für die längerfristige Entwicklung der Merkmalsausprägungen und insbesondere dafür, ob es einen stabilen Systemzustand gibt, der sich nicht verändert. Beispiel 13.50 (Fortsetzung von Beispiel 13.47 vgl. S. 356 ) Es ergibt sich aus dem Marktanteilvektor x = ( x 1 , x 2 , x 3 , x 4 ) = 35 , 1 10 , 9 50 , 3 25 T die Prognose für den Marktanteilvektor des nächsten Quartals, indem für jeden Anbieter die Kundenanteile saldiert werden, die bei ihm verbleiben und die von anderen Anbietern kommen. Dies ergibt den nachstehenden neuen Marktanteilvektor y 1 y 2 y 3 y 4 = 34 · 35 + 18 · 1 10 + 12 · 9 50 + 0 · 3 25 0 · 35 + 34 · 1 10 + 0 · 9 50 + 0 · 3 25 1 8 · 35 + 0 · 1 10 + 12 · 9 50 + 14 · 3 25 1 8 · 35 + 18 · 1 10 + 0 · 9 50 + 34 · 3 25 = 34 18 12 0 0 34 0 0 18 0 12 14 1 8 18 0 34 351 10 9 50 3 25 Der neue Marktanteilvektor ergibt sich also als y = P x . Bleibt die Marktübergangsmatrix für die folgenden Quartale erhalten, so ergibt sich ausgehend vom aktuellen Marktanteilvektor x = x (0) ∈ R n die nachstehende Folge von Marktanteilvektoren: x (1) = P x (0) , x (2) = P x (1) = P ( P x (0) ) = P 2 x (0) bzw. allgemein x ( k ) = P x ( k − 1) = · · · = P k x (0) 48818_Terveer.indd 358 48818_Terveer.indd 358 18.07.2023 12: 05: 55 18.07.2023 12: 05: 55 <?page no="359"?> 13.7 Exkurs: Anwendungen der Matrizenrechnung 359 Die dabei auftretenden Matrix-Potenzen P k haben eine einfache Bedeutung: Es bezeichne p ( k ) ij den Eintrag in P k an der i -ten Zeile und j -ten Spalte. Für eine Markt- Übergangsmatrix P gibt p ( k ) ij denjenigen Anteil der Kunden von Anbieter j an, der nach k Quartalen bei Anbieter i ist. Beispiel 13.51 Im Beispiel 13.47 vgl. S. 356 des Mobilfunkmarktes sei etwa der Anteil der Kunden des Anbieters Tekom (Zustand 1) gesucht, der nach zwei Quartalen bei D2 12 (Zustand 3) ist. Aus dem Zustandsgraph in Abbildung 13.4 ergeben sich folgende Möglichkeiten, nach zwei Quartalen von „T“ zu „D“ zu gelangen: ■ T → T → D: 34 der Kunden von „T“ verbleiben erst bei „T“; von diesen wechseln dann 18 der Kunden zu D . Insgesamt 34 · 18 = 3 32 der Kunden von „T“ nehmen diesen Weg. ■ T → D → D: 18 der Kunden von „T“ wechseln sofort zu „D“; von diesen verbleiben dann 1 2 bei D. Insgesamt 18 · 12 = 1 16 der Kunden von „T“ nehmen diesen Weg. ■ T → I → D: 18 der Kunden von „T“ wechseln sofort zu „I“, von diesen wechseln 14 zu „D“. Insgesamt 18 · 14 = 1 32 der Kunden von „T“ nehmen diesen Weg. Es wechseln insgesamt 34 · 18 + 18 · 12 + 1 8 · 14 = 3 16 der Kunden von Anbieter „T“ innerhalb von zwei Quartalen zu Anbieter „D“. Dieser Wert ergibt sich auch als Eintrag in der ersten Zeile und 3. Spalte des Matrix-Produktes P 2 , wie man dem Falk-Schema zum Matrix-Produkt P 2 entnehmen kann. In einem durch eine Übergangsmatrix beschriebenen System gibt es meist keinen Zustand, der unverändert bleibt. Vielmehr findet man oft eine sogenannte stabile Verteilung, d.h. eine Zustandsverteilung, die beim 1-Schritt-Übergang unverändert bleibt. Es handelt sich hierbei um einen stochastischen Vektor x mit x = P x . Dies ist gleichwertig zu dem linearen Gleichungssystem ( I n − P ) x = ¯0. Beispiel 13.52 Im Beispiel 13.47 des Mobilfunkmarktes mit der Übergangsmatrix P = 34 18 12 0 0 34 0 0 18 0 12 14 1 8 18 0 34 hat das lineare Gleichungssystem zum Gleichgewicht die Koeffizientenmatrix I 4 − P = 14 − 18 − 12 0 0 14 0 0 − 18 0 12 − 14 − 18 − 18 0 14 → 1 0 0 − 2 0 1 0 0 0 0 1 − 1 0 0 0 0 Ein stochastischer Vektor x , der die stabile Verteilung darstellt, ist also von der Form z = t 2 , 0 , 1 , 1 T (vgl. das Schema aus Satz 12.7 mit t ∈ R. Gleichzeitig muss die Komponentensumme gleich 1 sein, also 1 = 2 t + 0 t + t + t = 4 t ⇔ t = 1 / 4. Ein stabiles Gleichgewicht auf dem Mobilfunktmarkt liegt also vor, wenn „Tekom“ 50% und „D2 12 “ sowie „Intracom“ je 25% Marktanteil haben. Im Gleichgewicht ist der Anbieter „E-Minus“ vom Markt verschwunden. 48818_Terveer.indd 359 48818_Terveer.indd 359 18.07.2023 12: 06: 02 18.07.2023 12: 06: 02 <?page no="360"?> 360 13 Matrizen Das berechnete Gleichgewicht stellt tatsächlich die langfristige Perspektive für den genannten Markt dar. Um dies abschließend zu zeigen, sind aber weitere theoretische Grundlagen über Markoff-Ketten und ihre Zustandsgraphen erforderlich. Übungen zu Abschnitt 13.7 ? 23. Bäcker Becker kämpft mit den Konkurrenten Doppel und Back um die Gunst der Kunden. 45% der Gesamtkunden kaufen bei Bäcker Becker, 30% bei Doppel und 25% bei Back. Durch aggressive Werbestrategien wechseln jede Woche je 10% von Bäcker Becker zu beiden Konkurrenten. Aber auch Bäcker Doppel muss 20% seiner Kunden an Bäcker Becker abgeben und 15% an Becker Back. Letzterer verliert wöchentlich 15% der Kunden an Bäcker Becker und 5% an Bäcker Doppel. a) Stellen Sie die Änderungen der Kundenzahlen in einer Matrix dar. b) Wie sieht der Marktanteil nach einer Woche aus, wie nach zwei Wochen? c) Bei welcher Marktsituation würden sich die Marktanteile nicht ändern? 24. Im Inselstaat Wiwinesien erzeugen die Elektrizitätskonzerne E-Off, Jello und Viba Strom. Um die Abgabemengen y E , y J , y V ≥ 0 erzeugen zu können, müssen sich die Anbieter aufgrund gelegentlicher Engpässe einzelner Anbieter bei der Abgabe an die Wiwinesischen Kunden gegenseitig unterstützen. Jeder der Anbieter muss auch einen Teil seiner Produktion als Rücklage speichern, um seine Engpässe zumindest teilweise auszugleichen. Die faktischen Produktionsmengen x E , x J , x V ≥ 0 der drei Anbieter bei Abgabe von y E y J , y V ≥ 0 in den Export sind von der Form x E = 2 y E + y J + y V x J = 2 y E + 4 y J + 3 y V x V = 2 y E + 3 y J + 4 y V Die maximale Produktionskapazität beträgt bei E-Off 200 Megawatt, bei Jello 1000 Megawatt und Viba 1000 Megawatt. a) Der Wiwinesischen Energieverflechtung liegt ein Leontiefmodell der Form y = ( I − A ) x mit y = ( y E , y J , y V ) T und x = ( x E , x J , x V ) T zugrunde. Bestimmen Sie die technologische Matrix. b) Gibt es einen Produktionsvektor x , für den das Leontief-Modell produktiv ist? c) Für welchen Produktionsvektor ( x E , x J , x V ) T ist die Abgabe y E + y J + y V in den Export maximal? Zusammenfassung Matrizen finden Anwendung z.B. in der Materialverflechtung, bei Zustandsübergangsmechanismen oder auch der Verknüpfung von Wirtschaftsbereichen. Nach Bearbeitung dieses Kapitels sollten Sie in der Lage sein: ■ wichtige ökonomische Situationen (Produktionsverflechtungen, Marktübergänge,. . . ) mit Hilfe von Matrizen zu modellieren, ■ Matrixprodukte zu berechnen und im Sachkontext zu verwenden, ■ die Inverse einer quadratischen Matrix zu berechnen und im Sachkontext zu nutzen, ■ Determinanten quadratischer Matrizen mit verschiedenen Verfahren (kleine Matrizen, Zeilenumformungen, Entwicklungsformeln) zu berechnen und anzuwenden, ■ Eigenwerte und Eigenvektoren von quadratischen Matrizen zu berechnen, ■ Matrizen mit Determinanten- und Eigenwertkriterium auf Definitheit zu prüfen. 48818_Terveer.indd 360 48818_Terveer.indd 360 18.07.2023 12: 06: 07 18.07.2023 12: 06: 07 <?page no="361"?> Lineare Wirtschaftsalgebra 48818_Terveer.indd 245 48818_Terveer.indd 245 19.07.2023 09: 09: 17 19.07.2023 09: 09: 17 <?page no="362"?> 48818_Terveer.indd 362 48818_Terveer.indd 362 18.07.2023 12: 06: 07 18.07.2023 12: 06: 07 <?page no="363"?> 14 Differentialrechnung in mehreren Variablen Übersicht Die Dynamik betriebs- und volkswirtschaftlicher Vorgänge erschließt sich zumeist durch die Gegenüberstellung von Änderungen zweier oder mehrerer mutmaßlich in Beziehung stehender ökonomischer Variablen. Werden etwa von einem Produkt für den Preis p 0 insgesamt y 0 Einheiten und für den Preis p 1 insgesamt y 1 Einheiten abgesetzt, so ist das Verhältnis ∆ y ∆ p = y 1 − y 0 p 1 − p 0 ein Näherungswert für die Nachfrageänderung je Änderung des Preises um eine Einheit. Bei geringen Preisänderungen wird direkte Proportionalität von Nachfrage- und Preisänderung mit dem Proportionalitätsfaktor lim p 1 → p 0 ∆ y ∆ p angenommen. Er entspricht der Steigung der gestrichelt gezeichneten Tangente an den angenommenen Verlauf der Nachfragekurve im Punkt p 0 und wird auch als „marginale“ Nachfrage bezeichnet. Änderungen der Nachfrage werden als proportional zur Änderung des Preises mit der marginalen Nachfrage als Proportionalitätsfaktor angesehen. Diese Sichtweise entspricht einer Linearisierung des Zusammenhanges zwischen Preisänderung und Nachfrageänderung und bildet die Grundlage der Differentialrechnung einer Variablen, vgl. Kapitel 8. Die den obigen Überlegungen zugrunde liegende Funktion p → y = y ( p ) ergibt sich oft durch Auflösung einer Gleichung f ( p, y, . . . ) = 0, wobei f eine geeignete Funktion von mehreren Variablen ist. Diese und andere Funktionen mehrerer Variablen sowie ihr Änderungsverhalten spielen gleichzeitig eine wichtige Rolle z.B. in der Optimierung. In diesem Kapitel erläutern wir entsprechende Ableitungskonzepte für Funktionen mehrerer Variablen, die in allen wirtschaftswissenschaftlichen Anwendungen benötigt werden. Zunächst wird der Funktionsbegriff für mehrere Variablen vgl. Abschnitt 14.1, S. 364 und seine Anwendung in der Ökonomie besprochen vgl. Abschnitt 14.2, S. 370 . Im Zentrum des dann folgenden Abschnitts über Ableitungskonzepte bei mehreren Variablen vgl. Abschnitt 14.3, S. 377 stehen der Gradient und das Differential. Wie man mit Differential und Gradient ökonomische Fragestellungen über das Änderungsverhalten von ökonomischen Variablen beschreiben kann, erläutern wir anschließend vgl. Abschnitt 14.4, S. 390 . Das Krümmungsverhalten von Funktionen mehrerer Variablen lässt sich mit Ableitungen zweiter Ordnung erfassen vgl. Abschnitt 14.5, S. 404 . Das Kapitel schließt mit einer Einführung in die Integralrechnung mehrerer Veränderlichen vgl. Abschnitt 14.6, S. 412 , wobei vor allem der Fall von Funktionen zweier Variablen illustriert wird. 48818_Terveer.indd 363 48818_Terveer.indd 363 18.07.2023 12: 06: 10 18.07.2023 12: 06: 10 <?page no="364"?> 364 14 Differentialrechnung in mehreren Variablen 14.1 Funktionen mehrerer Variablen Aus den vielfältigsten Gründen sind Funktionen einer Variablen als Modelle für ökonomische Anforderungen oft nicht mehr ausreichend: ■ Zur Produktion eines Gutes sind i.d.R. mehrere Rohstoffe erforderlich. Meist wird auch die Herstellung mehrerer Produkte simultan geplant. ■ Bei den Gesamtkosten in der Produktion müssen u.a. die variablen Kosten aus der Herstellung jedes der Unternehmensprodukte berücksichtigt werden. ■ Der Absatz eines Produktes hängt neben dem eigenen Preis auch von dem Preis anderer Konkurrenz-Produkte ab. ■ Selbst Zusammenhänge zwischen zwei ökonomischen Variablen lassen sich oft nur implizit unter Berücksichtigung einer Funktion mehrerer Variablen beschreiben. Daher muss man zur Modellierung auch Funktionen verwenden, deren Funktionsterme mehrere variable Argumente x 1 , . . . , x n beinhalten. Zudem werden sich oft hieraus gleich mehrere Werte y 1 , . . . , y m ergeben müssen. Definition 14.1 ! Eine m -wertige Funktion f : D( ⊆ R n ) → W( ⊆ R m ) von n Variablen ist gegeben durch [1] einen Definitionsbereich D ⊆ R n und einen Wertebereich W ⊆ R m , [2] insgesamt m Funktionsterme ( x 1 , . . . , x n ) → y i = f i ( x 1 , . . . , x n ), i = 1 , . . . , m , mit ( f 1 ( x ) , . . . , f m ( x )) T ∈ W für alle x ∈ D. f = ( f 1 , . . . , f m ) T heißt auch Vektor der Funktionsterme oder (kurz) Funktionsvektor. Als Wertebereich einer m -wertigen Funktion mehrerer Variablen schreibt man meist W = R m . Unter dem Bild von f versteht man die Menge der Funktionswerte { f ( x ) : x ∈ D } (als Teilmenge von W) vgl. S. 38 . Die Funktionsterme f 1 , . . . , f m einer m wertigen Funktion werden oft wie einwertige Funktionen f i : D → R 1 behandelt und separat diskutiert. Falls nicht anders beschrieben, meinen wir im Folgenden immer einwertige Funktionen, wenn wir von Funktionen mehrerer Variablen sprechen. 14.1.1 Definitionsbereiche für Funktionen mehrerer Variablen Für den Definitionsbereich einer Funktion mehrerer Variablen gibt es eine viele ökonomisch relevante Festlegungen. Die wichtigste ist das kartesische Produkt. Definition 14.2 ! Eine Menge D von Vektoren ( x 1 , . . . , x n ) T des R n , bei denen jede Variable x j frei aus einem vorgegebenen Bereich D j ⊆ R „ gewählt“ werden kann, heißt kartesisches Produkt (Schreibweise: D = D 1 × D 2 × · · · × D n ). Falls die Definitionsbereiche I j der Variablen jeweils (abgeschlossene bzw. offene bzw. beschränkte) Intervalle sind, dann heißt D = I 1 × · · · × I n auch (abgeschlossener bzw. offener bzw. beschränkter) Quader. 48818_Terveer.indd 364 48818_Terveer.indd 364 18.07.2023 12: 06: 16 18.07.2023 12: 06: 16 <?page no="365"?> 14.1 Funktionen mehrerer Variablen 365 Sind alle D j = A ⊆ R identisch, so schreibt man für das kartesische Produkt der n Mengen auch einfach A n . Wir haben diese Notation bereits für den Vektorraum R n aller Spaltenvektoren verwendet. Beispiel 14.1 In dieser Schreibweise ist D = [0; ∞ [ n die Menge aller Vektoren mit nichtnegativen Komponenten. Diese Menge ist häufig Definitionsbereich ökonomischer Funktionen, denn ökonomische Variablen nehmen in aller Regel keine negativen Werte an. Definitionsbereiche, bei denen die Variablen nicht frei voneinander variieren, treten ebenfalls häufig auf. Die Bindungen werden hier meist durch Gleichungen und/ oder Ungleichungen beschrieben: ■ In der Abstandsmessung vgl. Abschnitt 12.5 haben wir für z = ( z 1 , . . . , z n ) T und r > 0 die (offene) Kugel B ( z, r ) ⊆ R n besprochen d.h. die Menge aller x = ( x 1 , . . . , x n ) T ∈ R n , für die der (euklidische) Abstand ∥ x − z ∥ < r ist, d.h. für welche die Ungleichung ( x 1 − z 1 ) 2 + · · · + ( x n − z n ) 2 < r 2 erfüllt ist. Ersetzt man das < -Zeichen durch ein ≤ -Zeichen, d.h. betrachtet alle x mit ∥ x − z ∥ ≤ r , so spricht man von der abgeschlossenen Kugel. Die Menge D, welche durch die Gleichung ( x 1 − z 1 ) 2 + · · · + · · · ( x n − z n ) 2 = r festgelegt wird, heißt auch Oberfläche oder Rand der Kugel. ■ In Verallgemeinerung des Konzeptes der Kugel spielen zuweilen auch Ellipsoide eine Rolle, die z.B. durch eine Ungleichung ( x 1 − z 1 ) 2 r 2 1 + · · · + ( x n − z n ) 2 r 2 n ≤ 1 beschrieben werden. Allgemeiner versteht man unter einem Ellipsoid die Lösungsmenge der Ungleichung ⟨ ( x − z ) , H ( x − z ) ⟩ ≤ r zu vorgegebenem z ∈ R n , H ∈ R n × n , r > 0 (bzw. mit strikter Ungleichung oder strikter Gleichung). ■ Lösungsmengen linearer Gleichungssysteme Ax = b mit m × n -Koeffizientenmatrizen stellen ebenfalls Definitionsbereiche mit „ gebundenen“ Variablen dar. Man nennt sie auch Hyperebenen. Liegt anstelle von linearen Gleichungen ein System linearer Ungleichungen a i 1 x 1 + · · · + a in x n ≥ b i vor, i = 1 , . . . , m vor, so heißt der zugehörige Definitionsbereiche auch Polytop oder Simplex. Definitionsbereiche, bei denen Variablen durch Gleichungs- oder Ungleichungsrelationen aneinander gebunden werden, sind in ihrer Anwendung nicht immer sehr handlich. In der Optimierung ist es vorteilhaft, diese Relationen als Nebenbedingungen des eigentlichen Sachzusammenhangs aufzufassen und die Definitionsbereiche zunächst weiter als ungebundene kartesische Produkte zu modellieren. Wir werden dies im nächsten Kapitel im Rahmen der Lagrange-Methode der Optimierung besprechen. Bei den meisten der oben beschriebenen Definitionsbereiche D liegen Verbindungsstrecken zwischen zwei Punkten in D wieder vollständig in der Menge: Definition 14.3 ! Eine Teilmenge D ⊆ R n heißt konvex, wenn für alle x, y ∈ D und alle λ ∈ [0; 1] auch λx + (1 − λ ) y in D liegt. Abbildung 14.1 zeigt Beispiele einer konvexen und nicht konvexen Menge. Vektoren der Form λx + (1 − λ ) y mit λ ∈ [0; 1] stellen Punkte auf der Geraden durch x und y dar, die zwischen x und y liegen (z.B. ergibt λ = 0 den Vektor y und λ = 1 den Vektor x ). 48818_Terveer.indd 365 48818_Terveer.indd 365 18.07.2023 12: 06: 24 18.07.2023 12: 06: 24 <?page no="366"?> 366 14 Differentialrechnung in mehreren Variablen x y y x konvex nichtkonvex Abbildung 14.1: Konvexe und nichtkonvexe Mengen im R 2 Der Ausdruck λx + (1 − λ ) y mit λ ∈ [0; 1] wird auch als konvexe Linearkombination von x, y bezeichnet. Solche Linearkombinationen lassen sich auch mit mehr als zwei Vektoren a (1) , . . . , a ( m ) in der Form λ 1 a (1) + · · · + λ m a ( m ) bilden, dabei sind die λ i ≥ 0 und summieren sich zu Eins. Bei einer konvexen Menge D liegt jede konvexe Linearkombination von endlich vielen Vektoren aus D wieder in D. 14.1.2 Lineare und quadratische Funktionen mehrerer Variablen Im Folgenden seien einige wichtige mathematische Beispiele (einwertiger) Funktionen f : D → R von n Variablen (als Variablenvektor x = ( x 1 , . . . , x n ) T ) angegeben. Viele auch in der Ökonomie verwendete Funktionsterme haben eine (ggf. etwas verallgemeinerte) Gestalt, wie sie nachstehend beschrieben ist: ■ Unter der j -ten Koordinatenfunktion versteht man die Funktion f : R n → R mit dem Funktionsterm f ( x ) = f ( x 1 , . . . , x n ) = x j . Sie lässt sich auch mit dem j -ten Einheitsvektor e ( j ) und dem Skalarprodukt als f ( x ) = ⟨ e ( j ) , x ⟩ schreiben. ■ Eine lineare Funktion f : R n → R hat den Funktionsterm f ( x ) = f ( x 1 , . . . , x n ) = c 1 x 1 + · · · + c n x n = ⟨ c, x ⟩ , wobei c = ( c 1 , . . . , c n ) T ∈ R n ein fest vorgegebener Vektor ist. Mit c als Einheitsvektor ergibt sich die Koordinatenfunktion. ■ Eine Monomfunktion hat den Funktionsterm f ( x 1 , . . . , x n ) = c · x a 1 1 · · · x a n n , ein Monom mit c ∈ R und a 1 , . . . , a n ∈ N 0 . Die Zahl r = a 1 + · · · + a n heißt Grad des Monoms. Lässt man für a 1 , . . . , a n auch beliebige (positive) reelle Zahlen zu, so nennt man die Funktionen auch Cobb-Douglas-Funktionen vgl. S. 373 . ■ Ein Polynom vom Grad r ist eine Funktion, deren Funktionsterm eine Summe von Monomen ist, deren Grad jeweils kleiner oder gleich r ist. Speziell sind affin-lineare bzw. lineare Funktionen gerade die Polynome vom Grad 1 und quadratische Funktionen gerade die Polynome vom Grad 2. Enthält eine quadratische Funktion nur Monome vom Grad Zwei, so handelt es sich um eine quadratische Form vgl. Definition 13.11, S. 349 , also eine Funktion f : R n → R der Form f ( x ) = ⟨ x, Hx ⟩ , mit einer symmetrischen Matrix H . Beispiel 14.2 f ( x, y, z ) = x ist die erste Koordinatenfunktion bezogen auf den Variablenvektor ( x, y, z ) T . Sie ist gleichzeitig lineare Funktion und Polynom vom Grad 1. Beispiel 14.3 Die Funktion f ( x, y ) = xy − y 2 ist eine quadratische Funktion und gleichzeitig auch eine quadratische Form, denn f ( x, y ) = ⟨ ( x y ) , ( 0 1 / 2 1 / 2 − 1 )( x y ) ⟩ . 48818_Terveer.indd 366 48818_Terveer.indd 366 18.07.2023 12: 06: 33 18.07.2023 12: 06: 33 <?page no="367"?> 14.1 Funktionen mehrerer Variablen 367 14.1.3 Grenzwerte von Funktionen mehrerer Variablen Wie bei Funktionen einer Variablen, lassen sich auch in mehreren Variablen Funktionsgrenzwerte erklären. Man benötigt sie etwa beim manchmal erforderlichen Randwertvergleich in der Optimierung mehrerer Variablen. Definition 14.4 ! Es sei D ⊆ R n und f : D → R m . Für ein x (0) = ( x 10 , . . . , x n 0 ) ∈ D ist der Funktionsgrenzwert g = lim x → x (0) f ( x ) ∈ R m erklärt, wenn für alle Folgen ( x 1 k ) k ∈ N 0 , . . . , ( x nk ) k ∈ N 0 mit ( x 1 k , . . . , x nk ) ∈ D und lim k →∞ x jk = x j 0 gilt lim k →∞ f ( x 1 k , . . . , x nk ) = g , Beispiel 14.4 Wir wollen lim ( x,y ) → (2 , 3) ( x 3 − y 2 ) bestimmen. Dazu betrachten wir Folgen x n → 2 und y n → 3 und erhalten lim n →∞ ( x 3 n − y 2 n ) = (lim n →∞ x n ) 3 − (lim n →∞ y n ) 2 = 2 3 − 3 2 = − 1. Es gilt also lim ( x,y ) → (2 , 3) ( x 3 − y 2 ) = − 1. Bei mehrwertigen Funktionen rechnet man die Grenzwerte komponentenweise aus. Auch uneigentliche Grenzwerte, bei die Koordinatenfolgen ( x nj ) n ∈ N sämtlich oder in Teilen divergieren, sowie das Grenzwertverhalten in Definitionslücken x (0) kann man analog zu den entsprechenden Konzepten bei Funktionen einer Variablen beschreiben. Schließlich überträgt sich noch das Konzept der Stetigkeit: Definition 14.5 ! Eine Funktion f : D → R m mit D ⊆ R n heißt stetig in x (0) ∈ D, wenn der Grenzwert lim x → x (0 f ( x ) existiert und mit f ( x (0) ) übereinstimmt. f heißt stetig in D, wenn f in jedem Punkt x (0) ∈ D stetig ist. Bei stetigen Funktionen ist oft sichergestellt, dass sie Extremwerte besitzen. Deshalb ist es gut zu wissen, ob die verwendete Funktion stetig ist. Allerdings ist der Umgang mit Funktionsgrenzwerten und deshalb auch der Stetigkeitsnachweis anhand der Definition ein mühsames Geschäft. Ohne genauere Rechnung sei festgehalten: [1] Alle Polynome sind stetig. [2] Alle Funktionen, die sich durch die Grundoperationen Addition, Subtraktion, Multiplikation, Division aus anderen stetigen Funktionen mehrerer Variablen zusammensetzen, sind innerhalb ihrer Definitionsbereiche stetig. [3] Die Verkettung (Hintereinanderausführung) stetiger Funktionen ergibt wieder eine stetige Funktion. Die letzte Regel gebraucht man oft für einwertige Funktionen f , auf die eine Funktion h einer Variablen angewendet wird, z.B. Wurzel, Normalparabel oder Absolutbetrag. Beispiel 14.5 Die euklidische Norm ∥ · ∥ = √ x 21 + · · · + x 2 n legt eine stetige Funktion fest. Zum einen ist die Funktion f : R n → R, f ( x 1 , . . . , x n ) = x 21 + · · · + x 2 n als Polynom zweiten Grades stetig. Die euklidische Norm ist dann die Verkettung mit der stetigen Quadratwurzelfunktion h : [0; ∞ [ → R , h ( t ) = √ t , d.h. ∥ x ∥ = √ x 21 + · · · + x 2 n = h ( f ( x 1 , . . . , x n )). Die Funktion g : R n → R, g ( x ) = ∥ x ∥ ist also stetig. 48818_Terveer.indd 367 48818_Terveer.indd 367 18.07.2023 12: 06: 42 18.07.2023 12: 06: 42 <?page no="368"?> 368 14 Differentialrechnung in mehreren Variablen Abbildung 14.2: Genese des Graphen der Funktion f ( x, y ) = x 2 + 12 y 3 14.1.4 Grafische Darstellung von Funktionen mehrerer Variablen Funktionen einer Variablen lassen sich in einem zweidimensionalen Koordinatensystem zeichnen. Dies ermöglicht vielfach eine anschauliche Beschreibung wichtiger Funktionseigenschaften. Für Funktionen mehrerer Variablen muss man sich verdeutlichen: ■ Jede Variable benötigt eine eigene Koordinatenachse, senkrecht zu den anderen, um den Einfluss der einzelnen Variablen darzustellen. ■ Auf einer weiteren Koordinatenachse werden die Funktionswerte abgetragen. Unter Verwendung des Anschauungsraum R 3 sind die einzigen darstellbaren Funktionen von mehr als einer Variablen genau die Funktionen zweier Variablen. Die Darstellung auf Papier und Bildschirm als Projektion in die Anschauungsebene erfolgt z.B. mittels Parallel- oder Fluchtpunktperspektive. Wir illustrieren dies anhand der Funktion f : [ − 3 2 ; 32 ] 2 → R , f ( x, y ) = x 2 + 12 y 3 . Der Funktionsgraph wird über einem Gitternetz von Punkten ( x, y ) der Anschauungsebene erzeugt vgl. Abbildung 14.2 links . Dazu werden die Punkte ( x, y, f ( x, y )) T im Anschauungsraum R 3 skizziert vgl. Abbildung 14.2 Mitte . Je vier Punkte ( x, y, f ( x, y )) T , die zu einem Rechteck benachbarter Gitter-Punkte im Definitionsbereich gehören, werden durch Linien zu einem räumlichen Viereck verbunden vgl. Abbildung 14.2 rechts . Diese Vierecke werden oft nicht-transparent oder halb-transparent gezeichnet, und man verstärkt durch Einsatz virtueller Lichtquellen den räumlichen Effekt (wobei das Gitternetz weggelassen werden kann). Dann allerdings müssen Teile des Graphen, die „hinter“ anderen verdeckt liegen, ausgeblendet werden, was den Berechnungsaufwand solcher Schaubilder stark erhöht - mit der Lösung dieses Sichtbarkeitsproblems beschäftigen sich zahlreiche Computer-Algorithmen. In Abbildung 14.3, links, ist eine solche Darstellung für die Funktion f ( x, y ) = x 2 + 12 y 3 mit Hilfe des professionellen Computeralgebra-Programms Mathematica angegeben. In den Schaubildern wird eine weitere Möglichkeit illustriert, wie man eine Funktion zweier Variablen in einem zweidimensionalen Schaubild darstellen kann: das Kontur-Diagramm. Es ist gleichsam eine topographische Karte der Funktion, in die Linien bzw. Kurven, auf denen der Funktionsgraph einen konstanten Verlauf hat, in moderater, d.h. die Lesbarkeit des Schaubildes unterstützender Form eingezeichnet werden. Diese Linien nennt man Niveau-Linien bzw. Iso-Quanten bzw. Iso-Höhenlinien. Sie kennen solche Darstellungen beispielsweise aus der Geographie als topographische Karten, in denen Höhenlinien eingezeichnet sind, oder aus der Meteorologie als Isobaren-Karten, welche die Linien gleichen Luftdrucks angeben. 48818_Terveer.indd 368 48818_Terveer.indd 368 18.07.2023 12: 06: 46 18.07.2023 12: 06: 46 <?page no="369"?> 14.1 Funktionen mehrerer Variablen 369 - 1.5 - 1.0 - 0.5 0.0 0.5 1.0 1.5 - 1.5 - 1.0 - 0.5 0.0 0.5 1.0 1.5 Abbildung 14.3: Erzeugung des Konturdiagramms der Funktion f ( x, y ) = x 2 + 12 y 3 Definition 14.6 ! Für eine Funktion f : D ⊆ R n → R und c ∈ R heißt N f ( c ) : = { x ∈ D : f ( x ) = c } die c -Niveaulinie bzw. Iso-Quante von f zum Niveau bzw. zur Höhe c . Ein Kontur-Diagramm ist die graphische Darstellung der Niveaulinien von f . In zwei Variablen x, y ist die c -Niveaulinie durch die Lösungen der Gleichung f ( x, y ) = c gegeben, welche sich meist zumindest lokal nach einer der Variablen y = h c ( x ) mit einer von c abhängigen Funktion h c auflösen lässt. Deshalb wirken einzelne Höhenlinien wie der Graph einer Funktion einer Variablen, die man implizite Funktion nennt. An Stellen, in denen die c -Niveaulinie „parallel“ zur y -Achse verläuft, ist aber eine explizite Darstellung y = h c ( x ) meist nicht möglich. In ökonomischen Anwendungen überlagert man oft Kontur-Diagramme verschiedener Funktionen. Beispielsweise werden so in der Optimierung die zu minimierende Funktion mit den Nebenbedingungen in Bezug gesetzt. Wir werden dies bei der Besprechung der Lagrange-Methode ausnutzen. Übungen zu Abschnitt 14.1 ? 1. Für t ∈ R seien D 1 = { ( x y ) ∈ R 2 : x 2 + ty 2 ≤ 1 } D 2 = { ( x y ) ∈ R 2 : tx ≤ y + 1 } a) Skizzieren Sie D i für t = 1 , 2 , 0 , − 1. b) Welche dieser Mengen sind Kreise, Ellipsen oder Polytope? c) Welche dieser Mengen sind konvex? 2. Welche der nachfolgenden Funktionen mehrerer Variablen sind Polynome? Welche sind lineare bzw. quadratische Funktionen bzw. quadratische Formen auf D = [0; ∞ [ 2 ? a) f ( x, y ) = ax 2 − bxy + cy b) f ( x, y ) = ( x 2 y − y ) / ( x + 1) c) f ( x, y ) = x ( y t ) bzw. f ( x, y ) = ( x y ) t 3. Berechnen Sie lim ( x,y ) → ( x 0 ,y 0 ) f ( x, y ). Ist f in ( x 0 , y 0 ) stetig? a) f ( x, y ) = x 2 + y − 1, x 0 = 3 , y 0 = 2, b) f ( x, y ) = √ 1 + 2 x − y , x 0 = 1 , y 0 = 3, c) f ( x, y ) = x/ y , x 0 = t, y 0 = 2 t . 4. Gegeben seien folgende Funktionen f ( x, y ) = xy , g ( x, y ) = 2 xy , h ( x, y ) = x ( y + 1), u ( x, y ) = ( x − 1)( y + 1). Welcher Zusammenhang besteht zwischen den Höhenlinien a) von f und g , b) von f und h , c) von f und u ? 48818_Terveer.indd 369 48818_Terveer.indd 369 18.07.2023 12: 06: 56 18.07.2023 12: 06: 56 <?page no="370"?> 370 14 Differentialrechnung in mehreren Variablen 14.2 Funktionen mehrerer Variablen in der Ökonomie Neben den bisher behandelten Beispielen von Funktionen mehrerer Variablen verwendet man weitere Funktionstypen, die spezifische ökonomische Ansprüche erfüllen. 14.2.1 Lineare Funktionen mehrerer Variablen in der Ökonomie Wir besprechen typische ökonomische Beispiele, in denen lineare Funktionen mehrerer Variablen zur Modellierung verwendet werden. Beispiel 14.6 (Lineare Funktionen in der Ökonomie) Im Bereich der linearen Algebra wurden bereits Verflechtungsansätze behandelt, bei denen mehreren Argumenten (Input-Variablen) ein oder auch mehrere Ergebnisse zugewiesen wurden. Wir kommen noch einmal auf das Beispiel 10.1 der Materialverflechtung vgl. S. 248 zurück. Die Verflechtung zwischen den möglichen Regaltypen und den dafür benötigten Bauteilen wird durch die Matrix A ∈ R 4 × 4 gegeben mit A = 2 3 4 5 1 1 2 4 5 10 15 20 20 40 60 80 ∈ R 4 × 4 Anzahlen x 1 , . . . , x 4 der vier Regaltypen werden die erforderlichen Bauteile Regalträger, Regalboden, Querstange, Montagestift zugewiesen. Zugrunde liegt die Funktion f : R 4 → R 4 mit einwertigen Funktionen ■ f 1 ( x ) = 2 x 1 + 3 x 2 + 4 x 3 + 5 x 4 , ■ f 2 ( x ) = x 1 + x 2 + 2 x 3 + 4 x 4 , ■ f 3 ( x ) = 5 x 1 + 10 x 2 + 15 x 3 + 20 x 4 ■ f 4 ( x ) = 20 x 1 + 40 x 2 + 60 x 3 + 80 x 4 . Oft lassen sich auch Kostensituationen mittels linearer Funktionen darstellen; es mögen z.B. bei der Herstellung von n Produkten P 1 , . . . , P n je Einheit des Produktes P i variable Kosten c 1 , . . . , c n > 0 je Einheit entstehen. Die gesamten variablen Kosten stellen sich dann mit der linearen Funktion f : R n → R 1 , f ( x ) = f ( x 1 , . . . , x n ) = ⟨ c, x ⟩ = c 1 x 1 + . . . + c n x n mit c = ( c 1 , . . . , c n ) T dar. Dabei bezeichnen die x i die Quantitäten der Produkte P i . Beispiel 14.7 (Fortsetzung von 10.1 vgl. S. 248 ) Es werde angenommen, dass in der Situation des Regal-Herstellers ein Regalträger mit 5 e , eine Querstange mit 1 e , ein Regalboden mit 3 e und die Montagestifte mit 0 , 20 e je Stift in der Beschaffung veranschlagt werden. Die variablen Kosten der Herstellung lassen sich dann beschreiben durch den Kostenvektor c mit c = c 1 c 2 c 3 c 4 = 2 1 5 20 3 1 10 40 4 2 15 60 5 4 20 80 513 0 , 2 = 30 54 79 105 Jede Komponente beschreibt die Beschaffungskosten für ein Regal des betreffenden Typs. Unter Vernachlässigung von Verpackungsmaterial und Personalkosten erhält man die Funktion der variablen Kosten: f ( x 1 , x 2 , x 3 , x 4 ) = 30 x 1 +54 x 2 +79 x 3 +105 x 4 . Im Kosten-Sachzusammenhang sind alle Produktvariablen x i ≥ 0; es ist also mit dem eingeschränkten Definitionsbereich D = [0; ∞ [ n (hier: [0; ∞ [ 4 ) zu arbeiten. 48818_Terveer.indd 370 48818_Terveer.indd 370 18.07.2023 12: 07: 04 18.07.2023 12: 07: 04 <?page no="371"?> 14.2 Funktionen mehrerer Variablen in der Ökonomie 371 14.2.2 Nachfragefunktionen in mehreren Variablen Eine weitere Anwendungssituation für Funktionen mehrerer Variablen stellt die Modellierung von Produktbündel-Nachfragen dar. Hierbei müssen in aller Regel wenigstens die Preise sämtlicher beteiligten Produkte berücksichtigt werden. Man unterscheidet dabei zwei Typen von Abhängigkeiten: ■ Produkte, die in direkter Konkurrenz zueinander stehen, nennt man Substitutionsgüter. Steigt der Preis eines Gutes, so steigt die Nachfrage nach den anderen. ■ Falls die Produkte gegenseitig benötigt werden, nennt man sie Komplementärgüter. Beispiele hierfür stellen etwa Kraftfahrzeuge und Kraftstoffe oder Medienträger und die dafür benötigten Abspielgeräte dar. Steigt der (Durchschnitts-)Preis eines der beiden Güter, so bewirkt dies für beide Güter einen Absatzrückgang. Für beide Arten von Gütern benötigt man geeignete Typen von Nachfragefunktionen f i , deren Funktionsterme f i ( p 1 , . . . , p n ) abhängig von den Preisen aller relevanten Produkte modelliert werden. Die Nachfragefunktion f i ( p 1 , . . . , p j , . . . , p n ) des i -ten Produktes ist dabei i.a. in der Variablen p j ■ monoton fallend, falls Produkt i und Produkt j Komplementärgüter sind, und ■ monoton wachsend, falls Produkt i und Produkt j Substitutionsgüter sind. Wir betrachten im Folgenden ein Beispiel, in dem Substitutionsgüter auftreten: Beispiel 14.8 Der Möbelbauer Ikebau hat eine Erhöhung des Preises für sein Regal Bill1 von p = 90 auf p = 95 e durchgeführt, dabei aber festgestellt, dass dies nicht zur gewünschten Erhöhung des Gewinns geführt hat. Als Ursache hat eine Befragung bei Kunden ergeben, dass das Regal im Vergleich zu dem Regal Bill2 als zu teuer empfunden wird, weshalb die Kunden aufgrund des besseren Preis-Leistungsverhältnisses nun Bill2 bevorzugen. Gleichzeitig hat die erhöhte Nachfrage nach Bill2 zu Lieferengpässen bei diesem Regaltyp und zu erhöhten Lagermengen bei Bill1 geführt. Für Ikebau stellen sich die beiden Regaltypen daher als Substitutionsgüter dar, deren Preise so passend zueinander gewählt werden müssen, dass die genannten Probleme nicht mehr auftreten. Deshalb sollen der Deckungsbeitrag aus dem Absatz beider Regale maximiert und die ermittelten Absatzmengen zur Grundlage der Kapazitätsplanung gemacht werden. Zunächst ergeben sich für Bill2 die variablen Stückkosten 54 e , während sie für Bill1 30 e betragen, vgl. Beispiel 14.7. Danach muss bei Ikebau eine Nachfragefunktion f 1 ( p, q ) für die Nachfrage nach Bill1 bzw. f 2 ( p, q ) für die Nachfrage nach Bill2 ermittelt werden. Beide Funktionen müssen aufgrund der obigen Beobachtungen über die gegenseitige Einflussnahme der Absatzmengen sowohl vom Preis p des Typs Bill1 als auch vom Preis q des Regaltyps Bill2 abhängig sein. Mit f 1 , f 2 ermittelt sich dann der Deckungsbeitrag für den gemeinsamen Absatz der beiden Regale zu G ( p, q ) = ( p − 30) f 1 ( p, q ) + ( q − 54) f 2 ( p, q ) Die Bestimmung eines adäquaten Nachfragezusammenhangs kann eine schwierige Aufgabe sein. Grundsätzlich ist dabei für f 1 und f 2 separat zunächst ein Funktionstyp zu spezifizieren. Beide Funktionstypen müssen sowohl von p als auch von q abhängig sein. Danach kann wieder über Referenzwerte der Nachfrage (d.h. in Form 48818_Terveer.indd 371 48818_Terveer.indd 371 18.07.2023 12: 07: 08 18.07.2023 12: 07: 08 <?page no="372"?> 372 14 Differentialrechnung in mehreren Variablen einer Steckbriefaufgabe) oder durch Auswertung von Vergangenheitsdaten mittels der KQ-Methode die konkrete Gestalt der Nachfragefunktionen veranschlagt werden. Die erste dieser Vorgehensweisen sei exemplarisch vorgeführt. Angenommen die Produktionskapazitäten betragen 2030 Regalen Bill1 und 1095 Regale Bill2 und sind im Falle p = q = 0 auch vollständig absetzbar. Die Nachfragefunktionen seien linear, d.h. von der Form f 1 ( p, q ) = 2030 − b 1 ,p p + b 1 ,q q f 2 ( p, q ) = 1095 + b 2 ,p p − b 2 ,q q mit Nachfragekoeffizienten b 1 ,p , b 1 ,q , b 2 ,p , b 2 ,q > 0. Ferner seien - bei Absatz des jeweils anderen Regaltyps zum Preis 0 - die Preisgrenzen p min = 145, q min = 365 für die Nachfrage nach Bill1 und Bill2 bekannt, d.h. es gilt f 1 (145 , 0) = 0 und f 2 (0 , 365) = 0. Als absolute Preisobergrenze, oberhalb von der kein Absatz mehr erzielt wird, sei p max = 207, q max = 434 angenommen. Es ergeben sich die Gleichungen 2030 − 145 b 1 ,p + 0 · b 1 ,q = 0 ⇔ b 1 ,p = 14 2030 − 14 · 207 + 434 b 1 ,q = 0 ⇔ b 1 ,q = 2 1095 + 0 · b 2 ,p + − 365 b 2 ,q = 0 ⇔ b 2 ,q = 3 1095 + 207 · b 2 ,p − 3 · 434 = 0 ⇔ b 2 ,p = 1 Somit lauten die Nachfragefunktionen f 1 ( p, q ) = 2030 − 14 p + 2 q, f 2 ( p, q ) = 1095 + p − 3 q Ökonomisch sind nur diejenigen Preiskonstellationen p, q von Bedeutung, in denen beide Nachfragen nichtnegativ sind, d.h. f 1 ( p, q ) ≥ 0 und f 2 ( p, q ) ≥ 0. Durch diese beiden linearen Ungleichungen wird der in Abbildung 14.4, links, schraffiert dargestellte Bereich als ökonomisch sinnvoller Preisbereich D ausgezeichnet. Mathematisch handelt es sich bei D um ein konvexes Polytop. Setzt man die berechneten Nachfragefunktionen in die allgemeine Formel für den Deckungsbeitrag ein, so ergibt sich G ( p, q ) = ( p − 30)(2030 − 14 p + 2 q ) + ( q − 54)(1095 + p − 3 q ) = − 14 p 2 − 3 q 2 + 3 pq + 2396 p + 1197 q − 120030 Als Deckungsbeitrag ergibt sich eine Zielfunktion mit linearen und quadratischen Termen in p und q - in der oben eingeführten Sprechweise also eine quadratische Funktion zweier Variablen. Ziel des Möbelherstellers ist die Maximierung dieses Deckungsbeitrages durch geeignete Festlegung von p, q . Dies kann mit Ableitungskonzepten für Funktionen mehrerer Veränderlichen erreicht werden, welche wir später behandeln werden. Der Deckungsbeitrag wird maximal für p = 113 , q = 256, vgl. Beispiel 15.2 vgl. S. 421 . Der Definitionsbereich in Abbildung 14.4, links ist mit dem Konturdiagramm der Deckungsbeitragsfunktion G überlagert. Im rechten Schaubild ist der Graph von G räumlich mitsamt Konturen über dem Definitionsbereich von G dargestellt. Das Deckungsbeitragsmaximum im Bereich der innersten skizzierten Niveaukurve von G ist in beiden Darstellungen erkennbar. 48818_Terveer.indd 372 48818_Terveer.indd 372 18.07.2023 12: 07: 14 18.07.2023 12: 07: 14 <?page no="373"?> 14.2 Funktionen mehrerer Variablen in der Ökonomie 373 0 50 100 150 200 0 100 200 300 400 Abbildung 14.4: Deckungsbeitrags-Funktion G ( p, q ) = − 14 p 2 − 3 q 2 + 3 pq + 2396 p + 1197 q − 120030; links Definitionsbereich, Konturdiagramm; rechts räumliche Darstellung 14.2.3 Produktionsfunktionen in mehreren Variablen Lineare Materialverflechtungen zwischen Produkten und Rohstoffen gehen von festen Teilelisten für jedes Produkt aus. Oft lässt sich der Produktionsertrag eines Gutes aus mehreren Rohstoffen aber auch über diverse „Rezepturen“ aus mehreren Rohstoffen erzielen, wobei die Rohstoffe innerhalb gewisser Grenzen unabhängig voneinander variieren dürfen. Rohstoffe sind auch Inputs wie Energie, Arbeit, Kapital. Die n Rohstoffe mögen in den Mengen x 1 , . . . , x n vorliegen. Der Produktionsertrag y stellt sich dann in der Form y = f ( x 1 , . . . , x n ) ≥ 0 dar, wobei f : D → R, D ⊆ R n , eine geeignete Funktion ist. Eine solche Funktion wird dann Produktionsfunktion genannt. Meist ist dabei der Definitionsbereich D = [0; ∞ [ n oder D =]0; ∞ [ n , wobei x j = 0 dafür steht, dass Rohstoff j in der aktuellen Konstellation ( x 1 , . . . , x n ) T nicht eingesetzt wird. Kapazitätsgrenzen für den j -ten Rohstoff werden durch Verkleinerung des Intervalls auf [0; K j ] oder in einer Nebenbedingung x j ≤ K j erfasst Manchmal ergibt sich die Zuordnung des Produktionsertrags zu den Rohstoffen durch technische Spezifikationen; dann ist die Produktionsfunktion also nicht Gegenstand der ökonomischen Modellierung, sondern wird als „externe“ Bestimmungsgröße in die Modellierung eingebaut. Oft werden aber auch Ökonomen unmittelbar mit der Aufgabe betraut sein, ein Rohstoff-Produkt-Gefüge in eine geeignete Funktion mehrerer Variablen übersetzen zu müssen. In der klassischen Produktionstheorie betrifft dies vor allem Zusammenhänge, in denen die Produktionsfaktoren Arbeit und Kapital auftreten. Die tatsächlich verwendete Produktionsfunktion wird dann aus einer größeren Funktionsklasse durch geeignete Wahl von Parametern festgelegt. Dazu verwendet man bevorzugt die KQ-Methode anhand vorliegender empirischer Daten. Die wichtigsten Funktionstypen zur ökonomischen Modellierung des Produktionsertrages sind Cobb-Douglas- (CD-) und CES-Produktionsfunktionen: Definition 14.7 (Cobb-Douglas-Funktion) ! Eine CD-Funktion hat den Funktionsterm f ( x 1 , . . . , x n ) = c · x a 1 1 · . . . · x a n n für x 1 > 0 , . . . , x n > 0, wobei c > 0, a 1 > 0, . . . , a n > 0 geeignete Konstanten sind. Dieser Funktionstyp ist nach den Wirtschaftswissenschaftlern Cobb und Douglas benannt: 48818_Terveer.indd 373 48818_Terveer.indd 373 18.07.2023 12: 07: 21 18.07.2023 12: 07: 21 <?page no="374"?> 374 14 Differentialrechnung in mehreren Variablen Abbildung 14.5: Produktionsfunktionen ( L, C ) → 1 , 01 · L 34 C 14 (links), ( x, y ) → ( 12 x 12 + 12 y 12 ) 2 (Mitte), ( x, y ) → ( 12 x − 12 + 12 y − 12 ) − 2 (rechts), grafische Darstellung Beispiel 14.9 In [Cobb/ Douglas, 1928] motivierten die beiden Autoren durch Diskussion empirischer Daten, dass mit der Funktion ( L, C ) → P = 1 , 01 · L 34 C 14 der beiden ökonomischen Größen Arbeit L und Kapital C die Produktivität P in den Vereinigten Staaten von Amerika in der Zeit von 1899 bis 1922 in zufrieden stellender Weise modelliert werden konnte. Die Funktion ist in Abbildung 14.5, links, skizziert. Die von Cobb und Douglas verwendete Funktion hat die naheliegende Proportionalitätseigenschaft, dass eine gleichzeitige Vervielfachung aller Inputs um den gleichen Faktor zu einer eben solchen Vervielfachung des Outputs führt, denn es gilt 1 , 01 · ( λL ) 3 4 ( λC ) 14 = 1 , 01 · λ 34 L 34 · λ 14 C 14 = 1 , 01 · λ 34 + 14 L 34 C 14 = λ · 1 , 01 · L 34 C 14 . Dies liegt also daran, dass die Summe der Exponenten Eins ist. Allgemein wird diese Proportionalitätseigenschaft einer CD-Produktionsfunktion durch Parameterkonstellationen mit a 1 + · · · + a n = 1 berücksichtigt. Produktionsschwund hingegen kann durch Parameterwahlen mit a 1 + · · · + a n ≤ 1 erfasst werden. Dass die Exponentensumme größer als Eins ist, kommt eher selten vor, ist aber aus mathematischer Sicht nicht ausgeschlossen. Cobb-Douglas-Funktionen sind genau wie Monome definiert, der einzige Unterschied besteht darin, dass die Exponenten jetzt beliebige positive reelle Zahlen sein dürfen, während sie bei Monomen natürliche Zahlen sein müssen. Mathematisch sind auch negative Exponenten in CD-Funktionen zulässig, dann lassen sich die Terme nicht im Produktionskontext (ggf. aber als Nachfragefunktionen) verwenden. Definition 14.8 (CES-Funktion) ! Eine CES-Funktion hat den Funktionsterm f ( x 1 , . . . , x n ) = c · ( a 0 + a 1 x p 1 + . . . + a n x pn ) 1 p für x 1 > 0 , . . . , x n > 0, wobei c > 0, a 0 ≥ 0, a 1 > 0,. . . , a n > 0, und p ∈ R \ { 0 , 1 } geeignete Parameter sind. CES-Funktionen wurden erstmals in [Arrow et al., 1961] vorgestellt. Die Abkürzung steht für „constant elasticity of substitution“ - für diesen Funktionstyp ist die Substitutionselastizität vgl. S. 402f. konstant. Wir betrachten vier Beispiele von CES- Funktionen: Beispiel 14.10 [1] f : ]0 , ∞ [ 2 → R, f ( x, y ) = ( 12 x 12 + 12 y 12 ) 2 ist eine CES-Funktion mit n = 2, a 0 = 0 , a 1 = a 2 = 12 und p = 12 . Ihr Graph ist in Abbildung 14.5, Mitte, dargestellt. [2] f : ]0 , ∞ [ 2 → R, f ( x, y ) = ( 12 x − 12 + 12 y − 12 ) − 2 ist eine CES-Funktion mit n = 2, a 0 = 0 , a 1 = a 2 = 12 und p = − 12 . Ihr Graph ist in Abbildung 14.5, rechts, 48818_Terveer.indd 374 48818_Terveer.indd 374 18.07.2023 12: 07: 31 18.07.2023 12: 07: 31 <?page no="375"?> 14.2 Funktionen mehrerer Variablen in der Ökonomie 375 dargestellt. [3] f ( x 1 , x 2 , x 3 ) = ( 1 1+ 1 √ x 1 + 1 √ x 2 + 1 √ x 3 ) 2 = (1 + x − 1 / 2 1 + x − 1 / 2 2 + x − 1 / 2 3 ) − 2 ist eine CES-Funktion mit n = 3, c = 1, a 0 = 1, a 1 = a 2 = a 3 = 1, p = − 12 [4] f ( x 1 , x 2 ) = 5 · 3 √ 2 + x 31 + x 32 ist eine CES-Funktion mit n = 2, c = 5, a 0 = 2, a 1 = a 2 = 1, p = 3. Cobb-Douglas-Funktionen können als Grenzfall p = 0 der CES-Funktionen aufgefasst werden. Im Falle von a 0 = 0 und a 1 + · · · + a n = 1 gilt lim p → 0 p √ a 1 x p 1 + · · · + a n x pn = x a 1 1 · · · x a n n Dies folgt etwa mit Hilfe der Regel von L’Hospital vgl. Satz 8.27, S. 195 . Für den Spezialfall n = 2 vgl. hierzu Übungsaufgabe 5 vgl. S. 376 . 14.2.4 Homogene Funktionen in der Ökonomie Bei den Cobb-Douglas-Funktionen mit Exponentensumme Eins haben wir bereits die Proportionalität angesprochen. Oft lässt sich in ökonomischen Input-Output-Zusammenhängen ein charakteristisches Verhalten erkennen: Vervielfacht man einen Produktionsfaktor um den Faktor λ und behält man das Einsatzverhältnis der Faktoren bei (d.h. vervielfacht die übrigen Produktionsfaktoren mit demselben Faktor), dann wird auch der Output um einen Faktor vergrößert, der nur von λ , nicht aber von den Input- Variablen abhängt. Ist dieser Faktor von der Form λ r für ein r ≥ 0, so spricht man von r -homogenen Funktionen. Dies lässt sich grundsätzlich auch auf den Fall r < 0 übertragen, was z.B. für Nachfragefunktionen interessant werden kann. Bei r = 1 spricht man von proportionalen Beziehungen, bei r > 1 von überproportionalem und bei 0 < r < 1 von unterproportionalem Zusammenhang. Letzterer tritt regelmäßig im Produktionskontext auf, wenn mit erhöhter Produktionsintensität ein technisch bedingter Schwund verbunden ist. Es sollte nicht verwundern, dass homogene Zusammenhänge ein verhältnismäßig einfaches Änderungsverhalten des Output bei simultaner und proportionaler Änderung aller Inputvariablen bedingen; weil sich dieses Änderungsverhalten auf einen einzelnen Paramter, nämlich die Zahl r zurückführen lässt, sind homogene Modellansätze sehr beliebt unter Ökonomen. Funktionen, die diese Sachverhalte darstellen, nennt man dann ebenfalls homogen. Definition 14.9 ! [1] Eine Funktion f : D ⊆ R n → R heißt homogen vom Grad r , falls für alle x = ( x 1 , . . . , x n ) T ∈ D und λ ∈ R mit λx ∈ D gilt f ( λx ) = f ( λx 1 , . . . , λx n ) ! = λ r · f ( x 1 , . . . , x n ) = λ r · f ( x ) [2] f heißt linear-homogen, wenn f homogen vom Grad 1 ist, d.h. wenn für alle x ∈ D und λ ∈ R mit λx ∈ D gilt f ( λx ) = λ · f ( x ) 48818_Terveer.indd 375 48818_Terveer.indd 375 18.07.2023 12: 07: 39 18.07.2023 12: 07: 39 <?page no="376"?> 376 14 Differentialrechnung in mehreren Variablen Abbildung 14.6: Strahlverhalten der CD-Funktionen ( x, y ) → x 38 y 18 , ( x, y ) → x 34 y 14 , ( x, y ) → x 32 y 12 (von links nach rechts). [3] f heißt positiv-homogen vom Grad r , wenn für alle x ∈ D und λ > 0 mit λx ∈ D gilt: f ( λx ) = λ r · f ( x ) Homogene Funktionen treten vor allem bei der Modellierung von Produktionszusammenhängen (dann zumeist linear-homogen), aber auch im Nachfragekontext u.a.m. auf. Streng formal sind homogene Funktionen in ökonomischen Kontexten meist positiv homogen, da negative Werte von λ zu Vektoren λx führen, die nicht mehr im meist gegebenen ökonomischen Definitionsbereich D ⊆ [0; ∞ [ n liegen. Von den bisher behandelten Funktionstypen sind etliche homogen: ■ Lineare Funktionen sind linear homogen: Linearität bedeutet u.a. f ( λx ) = λ 1 f ( x ). ■ Quadratische Formen, d.h. quadratische Funktionen mehrerer Variablen der Form f : R n → R, f ( x ) : = ⟨ x, Ax ⟩ mit einer quadratischen Matrix A ∈ R n × n sind homogen vom Grad 2, denn für alle λ ∈ R und x ∈ R n gilt wegen Satz 12.8 vgl. S. 307 und Satz 13.1 vgl. S. 322 f ( λx ) = ⟨ λx, A ( λx ) ⟩ = ⟨ λx, λ ( Ax ) ⟩ = λ 2 ⟨ x, Ax ⟩ = λ 2 f ( x ) ■ Cobb-Douglas-Funktionen f : D = [0; ∞ [ n → R, f ( x ) = c · x a 1 1 · . . . · x a n n sind (positiv) homogen. Der Homogenitätsgrad ist r = a 1 + . . . + a n ; für alle x ∈ D, λ > 0 gilt: f ( λx 1 , . . . , λx n ) = c · ( λx 1 ) a 1 · . . . · ( λx n ) a n = c · λ a 1 x a 1 1 · . . . · λ a n x a n n = λ r · f ( x ) ■ CES-Funktionen der Form f : D =]0; ∞ [ n → R , f ( x ) = c · ( a 0 + a 1 x p 1 + . . . + a n x pn ) 1 p sind positiv linear homogen, wenn a 0 = 0. Für alle x ∈ D, λ > 0 gilt dann nämlich nach Ausklammern von λ p in der p -ten Wurzel: f ( λx ) = c · ( a 1 ( λx 1 ) p + . . . + a n ( λx n ) p ) 1 p = c · ( λ p ( a 1 x p 1 + . . . + a n x pn )) 1 p = λ · f ( x ) Eine (positiv) r -homogene Funktion verhält sich längs Halbgeraden { λx : λ ≥ 0 } durch den Ursprung und x wie die Potenzfunktion λ → cλ r mit c = f ( x ). Für r < 1 ist sie längs der Halbgeraden rechtsgekrümmt (konkav), für r > 1 linksgekrümmt, für r = 1 linear. In Abbildung 14.6 ist dies für verschiedene Cobb-Douglas-Funktionen skizziert. Übungen zu Abschnitt 14.2 ? 5. Zeigen Sie für für x, y > 0, α ∈ ]0; 1[ lim p → 0 ( αx p + (1 − α ) y p ) 1 / p = x α y 1 − α . 6. f ( x, y ) = c · min ( x a , y b ) r mit c, a, b, r > 0 heißt Leontief-Produktionsfunktion. a) Sei a = b = c = r = 1. Zeichnen Sie d - Isoquanten von f für d ∈ { 1 10 , 14 , 12 , 34 } . b) Welcher Sachverhalt wird durch eine Leontief-Produktionsfunktion erfasst? 48818_Terveer.indd 376 48818_Terveer.indd 376 18.07.2023 12: 07: 52 18.07.2023 12: 07: 52 <?page no="377"?> 14.3 Ableitungskonzepte für Funktionen mehrerer Variablen 377 c) Überprüfen Sie f auf Homogenität. 7. Überprüfen Sie die folgenden Funktionen auf (positive) Homogenität. a) f ( x, y ) = x 2 + xy b) f ( x, y, z ) = x 2 + xy + z c) f ( x, y ) = xy/ ( x 2 + y 2 ) d) f ( x, y, z ) = √ xy + x e) f ( x, y ) = max( x 2 , xy ) f) f ( x, y ) = 1 / ( x 2 + y 2 ) 8. Es seien α, β, γ, δ > 0 mit αδ − βγ ̸ = 0 und u, v > 0. Lösen Sie das Gleichungssystem x α y β = u, x γ y δ = v in x, y > 0. Tipp: Logarithmieren Sie die Gleichung. 9. Ein Gut wird aus zwei Rohstoffen in den Quantitäten x, y > 0 mit der Produktionsfunktion f ( x, y ) = 3 x 1 3 a y b +4 x 14 y 13 − b hergestellt, dabei seien a, b > 0. Leiten Sie eine Beziehung zwischen a und b her, die genau dann gilt, wenn f eine homogene Funktion ist. 14.3 Ableitungskonzepte für Funktionen mehrerer Variablen Für eine Funktion f : D ⊆ R → R einer Variablen und x 0 ∈ D, y 0 = f ( x 0 ) lässt sich die Ableitung m = f ′ ( x 0 ) auf zwei Arten erklären, die zum selben Ergebnis führen: ■ als Grenzwert m = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h von Differenzenquotienten vgl. Unterabschnitt 8.3.2, S. 178 . Mit diesem Ansatz lassen sich die grundlegenden Ableitungsregeln (Faktor-, Summen-, Produkt-, Quotienten- und Kettenregel) herleiten. ■ als Linearisierung von f in x 0 , vgl. Unterabschnitt 8.3.4, S. 183 : Es gilt f ( x + ∆ x ) ≈ f ( x ) + m · ∆ x für ∆ x ≈ 0. Die Steigung m ist dadurch charakterisiert, dass lim ∆ x → 0 f ( x +∆ x ) − f ( x ) − m · ∆ x ) ∆ x = 0. Damit folgt beispielsweise die notwendige Bedingung f ′ ( x ) = 0 für lokale Extrema vgl. Satz 8.28, S. 197 oder das Newton- Verfahren zur Bestimmung einer Nullstelle x 0 von f vgl. S. 192f. . Für Funktionen mehrerer Variablen gibt es jetzt ebenfalls beide Ansätze: ■ Der Grenzwertansatz führt zur partiellen Differenzierbarkeit, d.h. zu partiellen Ableitungen vgl. Definition 14.10, S. 379 , bei denen sich jeweils nur eine der Inputvariablen ändert. Z.B. bei zwei Variablen gibt es dann zwei partielle Ableitungen: [1] ∂f ∂x : = lim h → 0 f ( x + h,y ) − f ( x,y ) h , [2] ∂f ∂y : = lim h → 0 f ( x,y + h ) − f ( x,y ) h . Die bekannten Ableitungsregeln in einer Variablen lassen sich dann unmittelbar auf partielle Ableitungen übertragen, so dass man diese nicht mit den obigen Grenzwerten ermitteln muss. Die partiellen Ableitungen nach allen Variablen bündelt man in Form eines Spaltenvektors, des Gradienten. ■ Der Linearisierungsansatz führt zur (totalen) Differenzierbarkeit. Bei zwei Variablen z.B. gilt f ( x + ∆ x, y + ∆ y ) ≈ f ( x, y ) + a 1 ∆ x + a 2 ∆ y , wenn ∆ x ≈ 0 und ∆ y ≈ 0. Das Tupel ( a 1 , a 2 ) wird als Differential bezeichnet. Funktionen, die sich in diesem Sinne linearisieren lassen, werden als (total) differenzierbare Funktionen bezeichnet vgl. Definition 14.11, S. 385 . Bei Funktionen mehrerer Variablen gibt es also dieselbe „Arbeitsaufteilung“ wie bei Funktionen einer Variablen. Die partielle Ableitung wird verwendet, um das Differential über die partiellen Ableitungen zu bestimmen die beiden stimmen im Prinzip überein während anhand des Differentials dann die Eigenschaften einer Funktion hergeleitet werden, beispielsweise in der Optimierung oder bei der Darstellung von 48818_Terveer.indd 377 48818_Terveer.indd 377 18.07.2023 12: 08: 02 18.07.2023 12: 08: 02 <?page no="378"?> 378 14 Differentialrechnung in mehreren Variablen 3 4 x - 40 - 30 - 20 - 10 10 g ( x ) = f ( x,1 ) 3 4 y - 60 - 50 - 40 - 30 - 20 - 10 10 h ( y ) = f ( 1,y ) Abbildung 14.7: Typische Bewegungsrichtungen und Schnittfunktionen bei einer Funktion zweier Variablen Niveaulinien. Im Gegensatz zu Funktionen einer Variablen, bei denen die Ableitungskonzepte gleichwertig sind, gibt es aber bei Funktionen mehrerer Variablen kleine Unterschiede zwischen den Ansätzen. Total differenzierbare Funktionen sind allerdings partiell differenzierbar und Differential und Gradient stimmen überein; außerdem sind partiell differenzierbare Funktionen, deren partielle Ableitungen selber wieder stetige Funktionen aller Variablen sind, total differenzierbar. Die Unterschiede in den beiden Konzepten zeigen sich nur in vergleichsweise „pathologischen“ Beispielen, d.h. sind in wirtschaftswissenschaftlichen Anwendungen in der Regel zu vernachlässigen. 14.3.1 Die partielle Ableitung Das Änderungsverhalten in einer Variablen lässt sich mit der partiellen Ableitung beschreiben. Wir betrachten f ( x, y ) = x 3 − 6 x 2 − 6 y 2 + 5 xy + 10 y im Punkt (1 , 1) T : ■ Hält man die Variable y bei 1 fest und verändert nur die Variable x , entsteht die Schnittfunktion g 1 ( x ) = f ( x, 1) = x 3 − 6 x 2 − 6 · 1 2 +5 x · 1+10 · 1 = x 3 − 6 x 2 +5 x +4 mit g 1 (1) = f (1 , 1) = 4 Der Verlauf dieser Funktion ist in Abbildung 14.7, Mitte dargestellt. Zum Vergleich sind links die entsprechenden Funktionswerte f ( x, 1) als (parametrische) Kurve auf dem Funktionsgraphen eingezeichnet. g ist in x = 1 differenzierbar mit Ableitung g ′ 1 (1) als Grenzwert (via Kürzen und Einsetzen) lim h → 0 g 1 (1+ h ) − g 1 (1) h = lim h → 0 f (1+ h, 1) − f (1 , 1) h = lim h → 0 h 3 − 3 h 2 − 4 h h = lim h → 0 ( h 2 − 3 h − 4) = − 4. Natürlich kann g ′ 1 (1) einfacher auch über die Ableitungsregeln g ′ 1 ( x ) = 3 x 2 − 12 x +5 und Einsetzen zu g ′ 1 (1) = − 4 bestimmt werden. Die Vorgehensweise, erst zum Schluss den konkreten Wert einzusetzen, kann man konsequenterweise auch schon beim Einstieg, d.h. der Festlegung von y = 1 anwenden: Die Variable y im Ausdruck x 3 − 6 x 2 − 6 y 2 + 5 xy + 10 y wird wie eine Konstante aufgefasst, und es wird nach x abgeleitet. Für diesen Vorgang verwendet man die Symbolik ∂ ∂x , d.h. ∂f ∂x = ∂ ∂x ( x 3 − 6 x 2 − 6 y 2 + 5 xy + 10 y ) = 3 x 2 − 12 x − 0 + 5 y + 0 = 3 x 2 − 12 x + 5 y . Dabei ist zu beachten, dass - im Summand 5 xy = (5 y ) · x der Faktor 5 y wie eine Konstante zu behandeln ist, weshalb der Ausdruck mit der Faktorregel zu 5 y abgeleitet wird und - die Ausdrücke − 6 y 2 und 10 y in der Variable x als Konstante gelten, mithin bei Differenzieren nach x zu Null abgeleitet werden. 48818_Terveer.indd 378 48818_Terveer.indd 378 18.07.2023 12: 08: 10 18.07.2023 12: 08: 10 <?page no="379"?> 14.3 Ableitungskonzepte für Funktionen mehrerer Variablen 379 Nun setzt man x = 1 und y = 1 in den erhaltenen Ausdruck ein, dies schreibt man wie folgt: ∂f ∂x ∣∣ x =1 y =1 = 3 x 2 − 12 x + 5 ∣∣ x =1 y =1 = 3 · 1 2 − 12 · 1 + 5 = − 4 Man schreibt D 1 f ( x, y ) = 3 x 2 − 12 x + 5 y bezeichnet, konkret D 1 f (1 , 1) = − 4. ■ Hält man nun die Variable x bei 1 fest, so ergibt sich in der Veränderlichen y die Schnittfunktion g 2 ( y ) = f (1 , y ) = 1 3 − 6 · 1 2 − 6 y 2 +5 · 1 · y +10 y = − 6 y 2 +15 y − 5 mit g 2 (1) = f (1 , 1) = 4, deren Graph in Abbildung 14.7, rechts, und als parametrische Kurve in Abbildung 14.7, links (über der gestrichelten Linie) dargestellt ist. g 2 ist in y = 1 differenzierbar mit Ableitung g ′ 2 (1) als lim h → 0 g 2 (1+ h ) − g 2 (1) h = lim h → 0 f (1 , 1+ h ) − f (1 , 1) h = lim h → 0 − 6 h 2 +3 h h = lim h → 0 ( − 6 h + 3) = 3 Auch hier gibt es zwei alternative Wege mit den Ableitungsregeln. Zum einen ist g ′ 2 ( x ) = − 12 y + 15 und damit g ′ 2 (1) = 3. Außerdem kann man auch f ( x, y ) nach y ableiten und dabei jetzt x wie eine Konstante behandeln. Mit der ∂ ∂y -Notation gilt ∂f ∂y = ∂ ∂y ( x 3 − 6 x 2 − 6 y 2 + 5 xy + 10 y ) = 0 − 0 − 12 y + 5 x + 10 = 5 x − 12 y + 10 Dabei ist zu beachten, dass - im Summand 5 xy = (5 x ) · y jetzt der Faktor 5 x wie eine Konstante zu behandeln ist und der Ausdruck zu 5 x abgeleitet wird. - Die Ausdrücke x 3 und − 6 x 2 als Konstante in y zu Null abgeleitet werden. In den erhalten Ausdruck setzt man wieder x = 1 , y = 1 ein, insgesamt schreibt man dann ∂f ∂y | x =1 y =1 = − 12 y + 5 x + 10 | x =1 y =1 = − 12 · 1 + 5 · 1 + 10 = 3 Man schreibt D 2 f ( x, y ) = 5 x − 12 y + 10 bezeichnet, konkret D 2 f (1 , 1) = 3. Im Beispiel gibt es bei der gegebenen Funktion f ( x, y ) zwei verschiedene Möglichkeiten, eine Variable als Veränderliche und die andere als Konstante aufzufassen. Keine von diesen ist vor den anderen besonders ausgezeichnet, sondern beide werden - auch mit Hinblick auf die späteren Ableitungskonzepte -benötigt und daher in einem Tupel bzw. Spaltenvektor gebündelt. Das ist auch bei mehr als zwei Variablen der Fall: Definition 14.10 (Partielle Ableitungen und Gradient) ! Es sei D ⊆ R n und f : D → R eine Funktion. [1] Für i ∈ { 1 , . . . , n } heißt f in x = ( x 1 , . . . , x n ) T ∈ D nach der i -ten Variable partiell differenzierbar, wenn der folgende Grenzwert existiert: D i f ( x ) : = lim h → 0 f ( x 1 , . . . , x i − 1 , x i + h, x i +1 , . . . , x n ) − f ( x 1 , . . . x i − 1 , x i , x i +1 , . . . , x n ) h [2] D i f ( x ) heißt i -te partielle Ableitung von f in x . [3] Falls in x ∈ D alle partiellen Ableitungen von f existieren, so heißt f in x partiell differenzierbar , und ∇ f ( x ) : = ( D 1 f ( x ) , . . . , D n f ( x )) T (sprich „Nabla f “) heißt Gradientenvektor von f (kurz: Gradient von f ) in x . [4] f heißt partiell differenzierbar in D, wenn f in jedem x ∈ D partiell differenzierbar ist. 48818_Terveer.indd 379 48818_Terveer.indd 379 18.07.2023 12: 08: 22 18.07.2023 12: 08: 22 <?page no="380"?> 380 14 Differentialrechnung in mehreren Variablen Beispiel 14.11 Gegeben sei f ( x, y ) = x 3 + 2 xy + e 7 y ■ Die partielle Ableitung von f nach x lautet ∂f ∂x = 3 x 2 + 2 y . Denn nach der Summenregel ist sie Summe der partiellen Ableitungen von ∂ ∂x x 3 bzw. ∂ ∂x 2 xy bzw. ∂ ∂x e 7 y nach x . Die erste dieser Ableitungen ist 3 x 2 , die zweite ergibt sich nach der Faktorregel als 2 y , denn in dem Produkt 2 xy wird der Term 2 y als Konstante interpretiert, wenn nach x abgeleitet wird. Die dritte Ableitung schließlich ist 0, da die Variable x gar nicht darin auftritt. ■ Die partielle Ableitung von f nach y ist entsprechend ∂f ∂y = 2 x + 7 e 7 y . Der erste Summand wird zu 0 abgeleitet, weil er gar nicht von y abhängt, der zweite Summand nach der Faktorregel zu 2 x , weil er linear in y mit Faktor 2 x ist. Der dritte Summand muss nach der Kettenregel differenziert werden, wodurch sich der Faktor 7 vor dem Exponential ergibt. Insgesamt hat f also den Gradienten ∇ f ( x, y ) = (3 x 2 + 2 y, 2 x + 7 e 7 y ) T . Beispiel 14.12 Bei der Funktion f : R 3 → R, f ( x, y, z ) = xz 1+ x 2 + y 2 benötigt man gleich mehrere der generischen Ableitungsregeln in einer Variable: ■ Die partielle Ableitung nach x wird mit der Quotientenregel bestimmt: ∂f ∂x = (1+ x 2 + y 2 ) · ∂ ∂x xz − xz · ∂ ∂x (1+ x 2 + y 2 ) (1+ x 2 + y 2 ) 2 = (1+ x 2 + y 2 ) · z − xz · 2 x (1+ x 2 + y 2 ) 2 = z (1+ y 2 − x 2 ) (1+ x 2 + y 2 ) 2 ■ Die partielle Ableitung nach y wird mit Faktorregel und Kettenregel berechnet: Zunächst wird der Faktor xz aus dem Ableitungsoperator gezogen, weil er hier wie eine Konstante behandelt werden kann: ∂f ∂y = xz · ∂ ∂y 1 1+ x 2 + y 2 Die Ableitung von 1 / (1 + x 2 + y 2 ) nach y wird berechnet, indem der Ausdruck als Verkettung von h ( t ) = 1 / t mit der Funktion y → 1 + x 2 + y 2 aufgefasst wird (d.h. der Ausdruck 1 + x 2 + y 2 in t eingesetzt wird). Die Ableitung von h ergibt h ′ ( t ) = ∂ ∂t 1 t = − 1 t 2 , die der inneren Funktion ist ∂ ∂y (1 + x 2 + y 2 ) = 2 y (hier ist x wie eine Konstante zu behandeln, weil nach y abgeleitet wird). Insgesamt folgt ∂f ∂y = xz · h ′ (1 + x 2 + y 2 ) · ∂ ∂y (1 + x 2 + y 2 ) = xz · ( − 1 (1+ x 2 + y 2 ) 2 ) · 2 y = − 2 xyz (1+ x 2 + y 2 ) 2 Die Rechnung ist wegen der Kettenregel schon etwas mühsamer, man muss sich bei jeder Ableitung genau überlegen, nach welcher der Variablen sie erfolgt. ■ Die partielle Ableitung nach z ist hier vergleichsweise einfach zu bestimmen, weil z nur als Faktor im Zähler des Bruches auftritt und beim Ableiten nach z der größte Teil des Bruches, nämlich x 1+ x 2 + y 2 wie ein konstanter Faktor aufgefasst werden kann. Deshalb ist ∂f ∂z = ∂ ∂z x 1+ x 2 + y 2 · z = x 1+ x 2 + y 2 . Zusammengefasst lautet der Gradient ∇ f ( x, y, z ) = ( z (1 + y 2 − x 2 ) (1 + x 2 + y 2 ) 2 , − 2 xyz (1 + x 2 + y 2 ) 2 , x 1 + x 2 + y 2 ) T 48818_Terveer.indd 380 48818_Terveer.indd 380 18.07.2023 12: 08: 33 18.07.2023 12: 08: 33 <?page no="381"?> 14.3 Ableitungskonzepte für Funktionen mehrerer Variablen 381 Regel für partielles Ableiten Man leitet eine Funktion partiell nach einer Variablen (etwa nach x ) ab, indem man im Funktionsterm alle anderen Variablen wie Konstanten auffasst und mit den „üblichen“ Ableitungsregeln einer Variablen nach dieser Variablen (etwa nach x ) differenziert. Entsprechend verfährt man mit jeder der auftretenden Variablen. Besonders häufig werden in Anwendungen lineare und quadratische Funktionen abgeleitet. Eine lineare Funktion einer Variablen f ( x ) = cx hat die Ableitung f ′ ( x ) = c , ist also konstant. Entsprechendes gilt für lineare Funktionen mehrerer Variablen: Beispiel 14.13 [1] f : R 2 → R, f ( x, y ) = 5 x − 3 y = ⟨ (5 , − 3) T , ( x, y ) T ⟩ hat die partiellen Ableitungen ∂f ∂x = 5 und ∂f ∂y = − 3. Der Gradient ist der in der Darstellung als Skalarprodukt auftretende Vektor, d.h. ∇ f ( x, y ) = (5 , − 3) T . [2] Es seien a, b, c ∈ R. Die Funktion f : R 3 → R, f ( x, y, z ) = ax + by + cz = ⟨ ( a, b, c ) T , ( x, y, z ) T ⟩ hat die partiellen Ableitungen ∂f ∂x = a , ∂f ∂y = b und ∂f ∂z = c . Wieder ist der Gradient der in der Darstellung als Skalarprodukt auftretende Vektor, d.h. ∇ f ( x, y, z ) = ( a, b, c ) T . Beachten Sie, dass im letzten Beispiel a, b, c Parameter sind, nach denen nicht abgeleitet wird. Beim partieller Ableiten muss man sich stets vergegenwärtigen, in welchen Variablen die Funktion f (d.h. der Funktionsterm) erklärt wurde und welche Unbekannten als Parameter aufzufassen sind. Die Rechnung des vorigen Beispiels lässt sich auf beliebige lineare Funktionen von n Variablen übertragen: Satz 14.1 Es sei c = ( c 1 , . . . , c n ) T ∈ R n . Die lineare Funktion f : R n → R, f ( x ) = ⟨ c, x ⟩ = c T x = c 1 x 1 + · · · + c n x n hat den Gradient ∇ f ( x ) = c für x = ( x 1 , . . . , x n ) T ∈ R n . Kurz gefasst lässt sich festhalten: Der Gradient einer linearen Funktion ist konstant. Für Monome zweiter Ordnung in einer Variablen, also f ( x ) = cx 2 ist f ′ ( x ) = 2 cx , die Ableitung ist also linear in x . Entsprechend gilt dies für Monome in mehreren Variablen und quadratische Formen, wie wir an einigen Beispielen erläutern: Beispiel 14.14 f, g : R 2 → R und u, v : R 3 → R seien die im folgenden definierten Funktionen. [1] Für f ( x, y ) = 2 xy gilt ∇ f ( x, y ) = ( y x ) = ( 0 2 2 0 )( xy ) . [2] Für g ( x, y ) = 2 x 2 − 6 xy + 4 y 2 gilt ∇ g ( x, y ) = ( 4 x − 6 y − 6 x + 8 y ) = ( 4 − 6 − 6 8 )( xy ) [3] Für u ( x, y, z ) = 4 xz gilt ∇ u ( x, y, z ) = ( 4 z 0 4 x ) = ( 0 0 4 0 0 0 4 0 0 )( xyz ) . Beachten Sie, dass u hier tatsächlich eine Funktion von drei Variablen ist. [4] Für v ( x, y, z ) = 3 xy − 2 xz + z 2 gilt ∇ v ( x, y, z ) = ( 3 y − 2 z 3 x − 2 x + 2 z ) = ( 0 3 − 2 3 0 0 − 2 0 2 )( xyz ) . 48818_Terveer.indd 381 48818_Terveer.indd 381 18.07.2023 12: 08: 43 18.07.2023 12: 08: 43 <?page no="382"?> 382 14 Differentialrechnung in mehreren Variablen Es fällt auf, dass der Gradient jeweils ein Matrix-Vektor-Produkt mit dem Variablenvektor ist. Die Matrix lässt sich aus der jeweiligen quadratischen Form herleiten: [1] f ( x, y ) = 2 xy = 〈 ( xy ) , ( 0 1 1 0 )( xy ) 〉 [2] g ( x, y ) = 2 x 2 − 6 xy + 5 y 2 = 〈 ( xy ) , ( 1 − 3 − 3 4 )( xy ) 〉 [3] u ( x, y, z ) = 4 xz = 〈 ( xyz ) , ( 0 0 2 0 0 0 2 0 0 )( xyz ) 〉 [4] v ( x, y, z ) = 3 xy − 2 xz + z 2 = 〈 ( xyz ) , ( 0 1 , 5 − 1 1 , 5 0 0 − 1 0 1 )( xyz ) 〉 Sie sehen, dass sich in jedem Beispiel der Gradient als Matrix-Vektor-Produkt schreiben lässt und dass die darin auftretende quadratische Matrix das 2-fache der Matrix in der Darstellung als quadratische Form ist, wenn man die quadratische Form mittels einer symmetrischen Matrix schreibt. Den Faktor 2 haben Sie bereits bei der quadratischen Funktion einer Variablen gesehen. Diese Rechnung