Kolloquium Straßenbau in der Praxis
kstr
expert Verlag Tübingen
91
2021
21
LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning
91
2021
Andreas Ellinger
Astrid Hautz
Christian Wörner
Mit der wachsenden Bedeutung von „Predictive Maintenance“ (vorausschauender Erhaltungsplanung) in Betrieb und Erhaltung von Infrastrukturobjekten wächst auch die Notwendigkeit für eine zuverlässigere, präzisere Methode zur Vorhersage der zukünftigen Entwicklung des Straßenzustands. In diesem Artikel wird eine Machine Learning gestützte Methode zur Verbesserung von Straßenzustandsprognosen vorgestellt. Diskutiert werden die technischen Grundlagen, mögliche
Vorgehensweisen bei der Modellbildung sowie Chancen und Grenzen eines Machine Learning gestützten Ansatzes; insbesondere in Hinblick auf die Verfügbarkeit der notwendigen Daten. Darüber hinaus wird ein Konzept vorgestellt, wie die verbesserte Zustandsprognose innerhalb einer Erhaltungs-Simulation zur Optimierung der Maßnahmenplanung genutzt werden kann.
kstr210427
„Machine Learning“ im Straßenbau - Methode und Anwendungsfälle 426 2. Kolloquium Straßenbau - September 2021 Nachdem die Cluster durch Label positioniert wurden, kann bei neuen gemessenen Daten durch diese Labels bestimmt werden, in welchem Cluster sie lokalisiert werden. An dieser Stelle wird ausdrücklich darauf hingewiesen, dass die vorgestellten Grenzen, Kategorien und Label aus einem rein datenbasierten Ansatz stammen, daher keine Allgemeingültigkeit besitzen und in höchstem Maße von der Datengrundlage abhängig sind. Die Wiedergabe der Daten und Werte dient hier lediglich zur Demonstration des Vorgehens. 6. Zusammenfassung Zerstörungsfreie Prüfungen (NDT) werden auf verschiedenen Ebenen eingesetzt, um verschiedene Fahrbahnbefestigungen hinsichtlich ihres Zustandes zu bewerten und ggf. daraus einen Erhaltungsbedarf abzuleiten. In dieser Arbeit wurde zwei verschiedene Fallbeispiele für das Machine Learning im Straßenbau dargestellt. Zunächst wurde gezeigt, dass das neuronale Netz als Supervised Learning in der Lage ist FWD-Deflexionen zu modellieren und sich das entwickelte Modell durch eine starke Generalisierbarkeit auszeichnet. Nach der Modellierung kann das Netz die bisher nicht verfügbaren Daten für alle Punkte zwischen den Messpunkten mit geringem Fehler liefern. Das beste Modell hatte einen MSE von 0,5 % und einen R-Wert von ca. 95 % für die Testdaten. Darüber hinaus wurden TSD-Daten durch die Anwendung von K-Means als Unsupervised Learning-Methode modelliert. Dabei wurden TSD-Slopes und SCI300-Werte in 1-D und 2-D Clustern modelliert. Für jedes Modell wurden vier verschiedene Cluster mit bestimmten Grenzen als Label (ausgezeichnet, gut, ausreichend, ungenügend) definiert. Die so bestimmten Cluster können dann zur Klassifizierung neuer Datensätze dienen. Die Abweichung von Durchschnitten und Grenzen der Modelle waren mit weniger als 1% sehr niedrig. Bei der Anwendung rein datenbasierter Auswertungen und Klassifizierungen wird dennoch empfohlen die Ergebnisse anhand von zum Beispiel mechanischer Modelle zu prüfen oder einzuordnen. Literaturverzeichnis [1] Kim, Y., Kim, Y. R. 1998. Prediction of layer moduli from falling weight deflectometer and surface wave measurements using artificial neural network. Transportation Research Record, 1639, 53-61. [2] Ceylan, H., Guclu, A., Tutumluer, E., Thompson, M. R., 2005. Backcalculation of full-depth asphalt pavement layer moduli considering nonlinear stress-dependent subgrade behavior. International Journal of Pavement Engineering, 6(3), 171-182. [3] Li, M. Y., Wang, H. 2019. Development of ANN- GA program for backcalculation of pavement moduli under FWD loading with viscoelastic and nonlinear parameters. International Journal of Pavement Engineering, 20(4), 490-498. [4] Rahimi Nahoujy, M., 2020. An Artificial Neural Network approach to model and predict asphalt deflections as a complement to experimental measurements by Falling Weight Deflectometer. Doctoral dissertation, Ruhr-Universität Bochum, Germany. [5] Huang, Y. H., 2004. Pavement design and analysis. Upper Saddle River, NJ. Pearson/ Prentice Hall. [6] Jansen, D., 2009. Temperaturkorrektur von mit dem Falling-Weight-Deflectometer gemessenen Deflexionen auf Asphaltbefestigungen. Dissertation, Institute für Straßenbau und Verkehrswesen, Universität Duisburg-Essen, Schriftenreihe Heft 2, Essen, Germany. [7] FGSV, 2008. Arbeitspapier Tragfähigkeit von Verkehrsflächenbefestigungen Teil B 2.1.Falling Weight Deflectometer (FWD): Gerätebeschreibung, Messdurchführung -Asphaltbauweisen. FGSV-Verl. Köln, 2008, FGSV 433 B 2.1 [8] Rasmussen, S., 2002. Development of a high speed deflectograph (Report 117). Roskilde: Danish Road Institute. [9] FGSV, 2015. Arbeitspapier- Tragfähigkeit für Verkehrsflächenbefestigungen Teil B 5. Schnell fahrendes Messsystem - Traffic Speed Deflectometer (TSD): Gerätebeschreibung, Messdurchführung. FGSV-Verl. Köln, 2015, FGSV 433 B 5. [10] Hildebrand, G., Rasmussen, S. & Andrés, R., 2000. Development of a laser-based high speed deflectograph. In S. D. Tayabji & E. O. Lukanen (Hrsg.), Nondestructive testing of pavements and backcalculation of moduli. Proceedings of the “Third International Symposium Nondestructive Testing of Pavements and Backcalculation of Moduli”, held Seattle, Washington, on 30 June - 1 July 1999 (ASTM STP, Bd. 1375, S. 457-469). Fredericksberg: American Society for Testing and Materials (ASTM). [11] Demuth, H., Beale, M., 2001. Neural network toolbox, user guide (version4). The MathWorks, Inc. [12] Principe, J. C., Euliano, N. R., Lefebvre, W. C., 2000. Neural and adaptive systems: fundamentals through simulations (Vol. 672). New York: Wiley. [13] Rumelhart, D. E.; Hinton, G. E.; Williams, R. J., 1986. Learning internal representations by error propagation. In: Parallel distributed processing: explorations in the microstructure of cognition, vol. 1, pp. 318-362. MIT Press. [14] Arthur, D., & Vassilvitskii, S., 2006. k-means++: The advantages of careful seeding. Stanford. 2. Kolloquium Straßenbau - September 2021 427 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Andreas Ellinger VIA IMC / TU Dresden, Berlin / Dresden, Deutschland Astrid Hautz VIA IMC, Berlin, Deutschland Christian Wörner VIA IMC, Berlin, Deutschland Zusammenfassung Mit der wachsenden Bedeutung von „Predictive Maintenance“ (vorausschauender Erhaltungsplanung) in Betrieb und Erhaltung von Infrastrukturobjekten wächst auch die Notwendigkeit für eine zuverlässigere, präzisere Methode zur Vorhersage der zukünftigen Entwicklung des Straßenzustands. In diesem Artikel wird eine Machine Learning gestützte Methode zur Verbesserung von Straßenzustandsprognosen vorgestellt. Diskutiert werden die technischen Grundlagen, mögliche Vorgehensweisen bei der Modellbildung sowie Chancen und Grenzen eines Machine Learning gestützten Ansatzes; insbesondere in Hinblick auf die Verfügbarkeit der notwendigen Daten. Darüber hinaus wird ein Konzept vorgestellt, wie die verbesserte Zustandsprognose innerhalb einer Erhaltungs-Simulation zur Optimierung der Maßnahmenplanung genutzt werden kann. 1. Einleitung „Making Predictions is difficult - especially about the future.“ Dieses unter anderen Niels Bohr zugeschriebene Zitat fasst auf humorvolle Weise zusammen, was es zu dem Versuch, die zukünftige Entwicklung komplexer Systeme vorauszusagen, zu berichten gibt. Es ist diesem Artikel vorangestellt, um gleich zu Anfang die Erwartungen an die „magischen Kräfte“ von künstlicher Intelligenz zu dämpfen. Doch auch wenn Machine Learning basierte Verfahren wohl nie eine exakte Vorhersage der Zukunft ermöglichen werden, so suchen sie bei der Erkennung von Mustern und Zusammenhängen in riesigen Datenmengen dennoch ihresgleichen. Zum bisherigen Stand: Seit 1992 werden in Deutschland regelmäßige normierte Zustandserfassungen der verschiedenen Straßenklassen durchgeführt. Die Erfassung erfolgt u.a. mittels hochgenauer Laser-Abtastung und erzeugt große Mengen sehr detaillierter Daten über den Zustand der Straßenoberfläche. Hauptziel dieser Erfassung ist aktuell eine bundesweit vergleichbare Bewertung des Ist-Zustandes der Straßen; die Vorhersage der zukünftigen Entwicklung des Straßenzustands spielt dabei derzeit noch eine eher untergeordnete Rolle. Mit dem Einzug von Big Data und Machine Learning in immer neue Industriezweige ergeben sich auch auf dem Gebiet der Straßenerhaltung neue Möglichkeiten, die klassischen Verhaltenskurven der Straßen zu hinterfragen, und gegebenenfalls zu ergänzen oder gar zu ersetzen [1],[2]. Abbildung 1: Prognose von Straßenzuständen (Visualisierung) [14], [15] 428 2. Kolloquium Straßenbau - September 2021 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Zu diesem Zweck werden im Rahmen dieses Projekts selbstlernende Algorithmen unter anderem auf Daten von historischen Messreihen trainiert. Diese Algorithmen sind in der Lage, Muster und Zusammenhänge zu erkennen, die klassische Berechnungsmethoden nicht - oder nur mit unverhältnismäßig hohem Aufwand - abbilden können. Sie ermöglichen es, eine große Anzahl von Parametern zu berücksichtigen, unabhängig davon, ob deren Wirkmechanismen und Einflüsse auf das gesuchte Ergebnis bekannt sind. Erste Untersuchungen auf Basis der Messdaten der A4, A3 sowie der Dauermessstrecke A5 in Deutschland legen nahe, dass selbstlernende Algorithmen gegenüber den klassischen Verhaltensmodellen bei der kurz- und mittelfristigen Zustandsprognose präziser sind - vorausgesetzt, die für das Anlernen des Prognosemodells notwendigen Daten sind in ausreichender Menge und Qualität vorhanden. 2. Stand der Technik Im Folgenden werden zunächst die Methoden zur Erfassung und Auswertung von Straßenzuständen beschrieben. Anschließend wird die aktuell gebräuchliche Methode zur Prognose von Straßenzustandsentwicklungen sowie deren Einschränkungen diskutiert. 2.1 Erfassung und Auswertung der Zustandswerte Die Zustandserfassung erfolgt deutschlandweit gemäß einheitlicher Regelwerke (ZTV ZEB-StB [4]; TP Griff-Stb [5], [6]; TP Eben [7],[8]) und wird mit Hilfe spezieller Messfahrzeuge durchgeführt. Dabei wird die Straßenoberfläche unter anderem von einem an der Unterseite der Fahrzeuge befestigten Laser abgetastet. Aus der Laufzeit des Laserstrahls wird ein Höhenmodell der Straßenoberfläche errechnet. Basierend auf diesem Höhengitter werden mittels mathematischer Formeln und Computersimulationen bestimmte Eigenschaften der Straßenoberfläche abgeleitet; beispielsweise die „Allgemeine Unebenheit“ oder die „Mittlere Spurrinnentiefe“. Weitere Sensoren messen zudem Werte wie den prozentualen Anteil vorhandener Flickstellen oder Risse an der Gesamtfläche [7],[8]. Für die qualitative Bewertung eines Straßenabschnitts werden die so ermittelten Messgrößen anhand genormter Formeln in dimensionslose, von ihrer Aussage her Schulnoten entsprechende, Zustandswerte umgewandelt [3], [4]. Wie in nachfolgender Abbildung schematisch dargestellt, werden diese pro Abschnitt zu einem Gesamtwert konsolidiert, der grundlegend für die weitere Bewertung des Abschnitts ist. Abbildung 2: Erfassung und Auswertung der Zustandswerte [1] Generell erfolgen die Messungen in regelmäßigen Abständen, die sich jedoch zwischen den einzelnen Projektstrecken unterscheiden. Die innerhalb dieses Projekts untersuchten zeitlichen Abstände bewegen sich zwischen sechs Monaten und vier Jahren. 2.2 Etablierte Methode zur Zustandsprognose Derzeitig wird die zu erwartende Entwicklung eines Straßenzustandes mittels sogenannter „Verhaltens-funktionen“ bestimmt. Dabei handelt es sich um Formeln (bzw. um die sich daraus ergebenden Graphen), die anhand bestimmter Eingangsgrößen die Entwicklung der im Vorangegangenen beschriebenen messbarer Eigenschaft der Straßenoberfläche vorhersagen. Konkrete Messbaren Eigenschaft sind hierbei u.a. der Anteil der gerissenen Oberfläche in Prozent, die Griffigkeit des Belags, die Unebenheiten der Oberfläche in Längs- und Querrichtung und die mittlere Spurrinnentiefe. Für jede dieser Größen existiert eine eigene Verlaufskurve. Abbildung 3: Veranschaulichung der Regelwerksbasierten Verhaltenskurve [10] Die bemessene Straße selbst wird basierend auf ihrem Alter und dem aktuell gemessenen Zustand einer Verhaltensklasse zugeordnet. Davon gibt es jeweils vier - je nach Schadenskategorie - unterschiedlich stark progressiv, teilweise degressiv entwickelnde Kurven. 2. Kolloquium Straßenbau - September 2021 429 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Abbildung 4: Regelwerksbasierte Bestimmung der Verhaltensklasse [9] Weitere Eingangsparameter für die Vorhersagefunktion sind derzeit bei regelwerkskonformer Umsetzung der Zustandsprognose nicht berücksichtigt. Es gibt jedoch zu verschiedenen Parametern weitere Forschungsprojekte, die teilweise in individuellen Berechnungen genutzt werden. Eine genormte Einbeziehung besteht bisher nicht. 2.3 Grenzen der klassischen Prognosemodelle und Chancen durch Machine Learning Die im Vorangegangenen beschriebenen Verhaltenskurven wurden von Experten anhand von Erfahrungswerten und mathematisch-statistischer Auswertung ermittelt. Auch wenn derartige Modelle eine gute Näherung des tatsächlichen durchschnittlichen Entwicklungsprozesses abbilden können, so können sie eines nicht: während ihrer Anwendung selbstständig aus ihren Fehlern lernen. Zwar können Expertengruppen ihre Prognosemodelle in regelmäßigen Abständen an neue Erkenntnisse anpassen; dies ist jedoch jedes Mal mit einem enormen Aufwand verbunden und nur durch Spezialisten mit tiefgehenden fachlichen Kenntnissen zu bewerkstelligen. Zudem ist die Menge der Parameter, die in eine derartige Prognose mit einfließen kann, voraussichtlich begrenzt. Zum einen müssen die Einflüsse aller gewählten Parameter im Voraus hinreichend bekannt sein, zum anderen ist die mit der Anzahl der Eingangs-Parametern steigende Komplexität der Modelle ab einem gewissen Punkt vermutlich nicht mehr praktikabel. Aufgrund steigender Vernetzung von Informationen im Infrastrukturbau-Sektor im Zuge der Digitalisierung sowie stetig hinzukommender Informationsquellen durch beispielsweise Sensor- und Maschinendaten ist jedoch zu erwarten, dass in Zukunft wesentlich mehr Informationen zu Eigenschaften, Belastungen und Zuständen von Infrastrukturbauwerken zu unterschiedlichen Zeitpunkten des Lebenszyklus zur Verfügung stehen werden als bisher. Im Folgenden wird erläutert, weshalb Machine-Learning basierte Verfahren dafür prädestiniert sind, sich an derartige veränderliche Rahmenbedingungen anzupassen und inwiefern Sie in der Lage sind, auch Parameter in ihre Prognose mit Einzubeziehen, deren Einfluss auf das gesuchte Ergebnis unbekannt sind. 3. Machine Learning basierte Prognosemodelle Im Gegensatz zu der im Vorangegangenen beschriebenen klassischen Methode werden die Einflüsse der Eingangsparameter auf das gesuchte Ergebnis im Falle eines Machine Learning (ML) basierten Prognosemodells nicht von Experten explizit beschrieben, sondern anhand historischer Messdaten von Algorithmen „selbstständig erlernt“. 3.1 Technische Grundlagen Bei Maschinellem Lernen wird zunächst unterschieden zwischen „überwachtem Lernen“ (engl. „superwised“), nicht-überwachtem Lernen“ (engl. „unsuperwised“) und „Bestärkendem Lernen“ (engl. „reinforcement learning) [12].Zur Prognose der Zustandswerte wurde im Rahmen dieses Projekts - wie für derartige Probleme üblich - der Ansatz des „überwachten Lernens“ gewählt. Das Grundprinzip ist für nahezu alle überwachten ML- Algorithmen gleich: Neben den Eingangsparametern, aus denen mittels einer Vielzahl verketteter Funktionen und Prozeduren ein Ergebnis abgeleitet wird, spielen bei ML-Modellen eine weitere, als „Modelparameter“ bezeichnete Art von Parametern eine entscheidende Rolle. Diese Parameter bestimmen, auf welche Weise aus den Eingangsparametern das Ergebnis errechnet wird. Während der Lernphase des Modells werden diese Parameter so lange iterativ angepasst, bis die vom Modell errechneten Ergebnisse so weit wie möglich mit den tatsächlichen, ebenfalls in der Trainingsdaten enthaltenen, Lösungswerte übereinstimmen. Während der Anwendungsphase des Modells bleiben die Modellparameter konstant, da das Model nun mit neuen Eingangswerten konfrontiert ist, deren tatsächliche Lösungswerte nicht bekannt sind. Abbildung 5: Maschinelles Lernen vs. klassische Programmierung 430 2. Kolloquium Straßenbau - September 2021 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Abbildung 6: Schematische Darstellung des Prozesses zur Erstellung eines Machine-Learning basierten Zustands-Prognosemodells Der entscheidende Vorteil dieser Methode besteht darin, dass die Zusammenhänge zwischen den Eingangsgrößen und den gesuchten Ergebnissen nicht bekannt sein müssen, sondern von den Algorithmen selbstständig gefunden werden - immer vorausgesetzt, es sind genügend aussagekräftige Lerndaten vorhanden. Die vom Modell „gelernten“ Zusammenhänge sind dabei jedoch nicht kausaler, sondern rein statistischer Natur: So ist ein ML Model beispielsweise in der Lage zu erkennen, dass ein direkter Zusammenhang besteht zwischen den äquivalenten 10-Tonnen-Achsübergängen auf einem bestimmen Streckenabschnitt und dem Zeitraum, in dem sich dort Spurrinnen bilden. Das System „weiß“ dabei jedoch nichts über die kausalen Zusammenhänge physikalischer Größen wie Masse, Gewichtskraft, Druckspannungen, plastischer Verformung und so weiter. 3.2 Allgemeines Vorgehen Vorangegangene Abbildung veranschaulicht schematisch das Vorgehen des Anlernens des im hier vorgestellten Projekt entwickelten Zustandsprognose-Modells. Neben den gängigen Arbeitsschritten während eines (überwachten) Machine Learning Projektes soll die Darstellung vor allem den Einfluss von Informationen zu vergangenen Instandsetzungsmaßnahmen verdeutlichen (vgl. Abschnitt 3.4). Die zu Verfügung stehenden Lerndaten werden zunächst in ein geeignetes Format konvertiert, auf inhaltliche Plausibilität und Vollständigkeit überprüft und ggf. bereinigt. Anschließend werden im Zuge des sogenannten „Feature Engineering“ jene Merkmale (im Zusammenhang von Machine Learning meist mit dem englischen Wort „Feature“ bezeichnet) explizit herausgearbeitet, die in Hinblick auf die Prognose der zukünftigen Zustandsentwicklung voraussichtlich besonders aussagekräftig sind; beispielsweise die zeitlich normierte Änderung des gesuchten Zustandswertes innerhalb der letzten zwei Messpunkten. Da im Vorfeld oft nicht klar ist, welche Kombinationen von Eigenschaften besonders aussagekräftige Feature ergeben, ist das Feature Engineering in der Regel ein sehr iterativer und damit zeitaufwendiger Prozess. Die bereinigten Daten, sowie den daraus abgeleiteten Features werden in einen Trainings- und einen Test- Datensatz aufgeteilt. Wie sich aus den Namen bereits ergibt, wird das Modell auf dem Trainingsdatensatz angelernt und auf dem Testdatensatz validiert. Diese Aufteilung ist entscheidend um sicher zu stellen, dass das Modell nicht schlichtweg die Trainingsdaten „auswendig lernt“ und repliziert, sondern in der Lage ist, allgemeingültige Zusammenhänge zu erkennen und somit auf neue, dem Modell „unbekannte“ Datensätze richtig anzuwenden [12],[13]. 3.3 Auswahl der Eingangsparameter („Feature“) Die bereits erwähnten Eingangsparameter eines Models entscheiden zum einen, welche Informationen dem Modell während der Lernphase zur Verfügung stehen und bestimmen zum anderen, welche Werte während des Einsatzes des Modells bereitgestellt werden müssen. Prinzipiell sind Maschine Learning Modelle in der Lage, basierend auf n Eingangsparametern m Lösungswerte zu errechnen [11]. 3.3.1 Anzahl der Eingangsparameter Im Rahmen dieses Projektes wurden unterschiedliche Modelle entwickelt, die basierend auf mehreren Eingangsparametern jeweils einen konkreten Zustandswert zu einem konkreten Zeitpunkt vorhersagen. Dabei können sowohl Eingangsparameter aus unterschiedlich vielen vergangenen Zeitpunkten berücksichtigt werden als auch unterschiedlich viele Parameter je Zeitpunkt. 2. Kolloquium Straßenbau - September 2021 431 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Abbildung 7: Berücksichtigung mehrere Merkmale zum Zeitpunkt t 0 zur Vorhersage eines Merkmals zum Zeitpunkt t 1 (Veranschaulichung) Abbildung 8: Berücksichtigung zweier vergangener Zeitpunkte t 0 und t -1 zur Vorhersage eines Merkmals zum Zeitpunkt t 1 (Veranschaulichung) 3.3.2 Arten von Eingangsparametern Eingangsparameter für Prognosen von zeitlichen Veränderungen lassen sich prinzipiell in zwei Kategorien unterteilen: Zum einen gibt es jene Parameter, die die vergangenen zeitlichen Entwicklungen des gesuchten Wertes selbst abbilden, zum anderen existieren eine Vielzahl weiterer Faktoren, die diese Veränderung über die Zeit beeinflussen. Diese „Einflussparameter“ können ihrerseits über die Zeit ebenfalls sowohl konstant als auch veränderlich sein. So können im Falle des Zustandsprognosemodells neben den historischen Messreihen sowohl zeitlich konstante Faktoren wie die Bauweise einer Straße mit einfließen als auch zeitlich veränderliche Faktoren wie beispielsweise die Verkehrsbelastung oder das lokale Klima. 3.4 Favorisiertes Prognosemodell Wie bei der Auswahl der Feature bestehen auch bei der Wahl der Prognosemethode unterschiedliche Möglichkeiten. Der innerhalb dieses Projekts favorisierte Ansatz besteht darin, ein Regressionsmodell auf die Vorhersage von Veränderung innerhalb des Zeitraums eines Messintervalls zu trainieren (0.5 bis 4 Jahre, abhängig von der jeweiligen Strecke). Diese Zeitspanne stellt den kürzesten möglichen Prognosezeitraum dar, da für kürzere Abstände keine Lerndaten vorliegen. Basierend auf dieser Vorhersage arbeitet sich das Modell iterativ in die Zukunft vor, wobei immer die Ergebnisse des aktuellen Iterationsschrittes als Eingangswerte in den nächsten Iterationsschritt mit einfließen. Nachfolgende Grafik veranschaulicht schematisch den auch als „Stacked Projection“ (zu Deutsch in etwa „gestapelte Projektion“) bezeichneten iterativen Ansatz. Dieses Iterative Vorgehen wurde gewählt, da es besonders gut für den Ausbau des „Verfallsprognose-Modells“ zu einer umfassenderen „Erhaltungssimulation“ geeignet ist (Vgl. Abschnitt 4). Der Grund hierfür besteht darin, dass bei einer auf der Verfallsprognose aufbauenden Maßnahmenoptimierung die räumlichen Beziehungen der einzelnen Abschnitte eine wichtige Rolle spielen und die Abschnitte daher nicht für sich allein betrachtet werden können. Das zyklische Vorgehen ermöglicht, nach jedem Iterationsschritt für alle Streckenabschnitte zu prüfen, ob die für das Auslösen einer Maßnahme festgelegten Bedingungen erreicht wurden. Ist dies der Fall, so können entsprechende Maßnahmen ausgelöst und die betroffenen Werte daraufhin auf die jeweiligen verbesserten Werte zurückgesetzt werden. Im nächsten Iterationsschritt fließen die zurückgesetzten Werte als fiktiver „Ist-Zustand“ in eine erneute Kurzzeit-Prognose Iteration ein. Abbildung 9: Schematische Darstellung „Stacked Projection“ während Lern- und Anwendungsphase bezogen auf einen einzelnen Datensatz 3.5 Das Problem unbekannter Instandsetzungsmaßnahmen Wie bereits erwähnt, soll das angestrebte Prognosemodell anhand historischer Messwerte lernen, wie sich der Zustand einer Straße entwickelt, wenn sie nicht zwischenzeitlich ausgebessert oder erneuert wird. Daher besteht eine der größten Herausforderungen beim Trainieren des Prognosemodells darin, die Trainingsdaten vorab 432 2. Kolloquium Straßenbau - September 2021 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning von Maßnahmen zu reinigen; sprich jene Datensätzen herauszufiltern, bei denen zwischen zwei betrachteten Messzeitpunkten Instandsetzungsmaßnahmen stattgefunden haben. Nachfolgende Grafik zeigt, welche unterschiedlichen Auswirkungen verschiedene Maßnahmen auf die einzelnen Zustandsgrößen haben können. Dabei zeigt sich deutlich, dass Maßnahmen vom Typ „Unterhaltungsmaßnahme“ (blau) wie zu erwarten einen wesentlich geringeren Einfluss auf die Entwicklung der „Mittleren Spurrinnentiefe“ haben als Maßnahmen vom Typ „Grundhafte Erneuerung“ (orange) oder „Deckschichterneuerung“ (grün). Abbildung 10: Unterschiedliche Auswirkungen verschiedener Maßnahmentypen auf die mittlere Spurrinnentiefe (Auszug aus der Datenanalyse) 3.6 Maßnahmendetektion Auf Basis der bisher gesichteten Daten ist davon auszugehen, dass durchgeführte Instandsetzungsmaßnahmen bei der Übertragung der Methode auf andere Strecken in vielen Fällen nicht oder nur unzureichend zur Verfügung stehen werden. Um dennoch Datensätze zum Training des Modells verwenden zu können, für die es keine hinreichende Maßnahmendokumentation gibt, wurde im Zuge dieses Projekts eine als „Maßnahmendetektor“ bezeichnete zusätzliche Komponente entwickelt. Dabei handelt es sich um eine weiteres ML-Model, dessen Aufgabe es ist, Maßnahmen zwischen zwei aufeinanderfolgenden Messreihen zu detektieren. 3.7 Vorläufige Auswertung des Maßnahmendetektors Ein entsprechender Detektor erreichte auf einem ausbalancierten Train/ Test-Set (gleich viele Stichproben je Kategorie) eine Trefferquote (engl. Recall) von ca. 90 %. Die Relevanz der Vorhersagen (engl. „Precision“) betrug ca. 93 % (vgl. den jeweils mittleren roten Balken in den nachfolgenden Abbildungen). Ein als Vergleichsmodel entwickelter „naiver“ Maßnahmendetektor, dessen Entscheidungskriterien manuell programmiert wurden und der immer dann eine Maßnahme meldete, wenn sich eine bestimmte Kombination von Messwerten gleichzeitig verbesserte, erreichte eine wesentlich schlechtere Genauigkeit. Bei der Detektion allgemeiner Erneuerungsmaßnahmen lag seine Trefferquote bei unter 50%; die Relevanz der Positiven Klassifikationen betrug dabei knapp über 70% (vgl. den jeweils mittleren grauen Balken in den nachfolgenden Abbildungen). Abbildung 11: Relevanz und Trefferquote des Maßnahmendetektors Ein potenzielles Problem stellt die möglicherweise fehlende Übertragbarkeit des Maßnahmendetektors von der Dauermesstrecke A5 auf andere Projektstrecken dar. Der Grund hierfür liegt in den auf anderen Streckenabschnitten wesentlich längeren zeitlichen Abständen zwischen den Zustandserfassungen. Auf Grund des sechs-Monate- Intervalls auf der Dauermesstrecke waren die Auswirkungen einer Instandsetzungsmaßnahme, die kurz nach einer Zustandserfassung stattgefunden hat, bei der nächsten Erfassung noch deutlich messbar. Es ist jedoch zu befürchten, dass dies nach einem Zeitraum von vier Jahren nicht in gleichem Maße der Fall sein wird, zumindest nicht im Falle von geringfügigen Verbesserungen von Zustandswerten, die sich besonders in der Anfangsphase sehr schnell verschlechtern (wie z.B. der Zustandswert der Mittleren Spurrinnentiefe). Da im Rahmen dieses Projekts außerhalb der DMS A5 jedoch keine hinreichend vollständige und verlässliche Maßnahmendokumentation zur Verfügung stand, konnte diese These nicht abschließend überprüft werden. Nachfolgende Grafik verdeutlicht schematisch die mögliche Auswirkung des Messintervalls auf ein eine von Maßnahmen betroffene Messreihe. 2. Kolloquium Straßenbau - September 2021 433 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning Abbildung 12: Schematische Darstellung der unterschiedlichen Einflüsse von Maßnahmen auf den Verlauf einer Messreihe in Abhängigkeit des Messintervalls 3.8 Vorläufige Auswertung des Prognosemodells Untersuchungen basierend auf den Daten der DMS A5 (Messintervall ca. 0.5 Jahre) haben ergeben, dass ein ML basiertes Prognosemodell auf einem Trainingsdaten Satz mit einer Stichprobengröße > 50.000 für kurzfristige Prognosen (1 bis 3 Jahre) für die Zustandsgrößen MSPT (Mittlere Spurrinnentiefe) sowie MSPH (Fiktive Wassertiefe) deutlich genauere Ergebnisse liefert als die etablierte Prognose anhand der Verhaltensfunktionen. Bei der Prognose der Griffigkeit (GRI_80) sowie der Allgemeinen Unebenheit (AUN) war die ML basierte Prognose im Schnitt ebenfalls genauer, wenn auch nur geringfügig. Die Zustandswerte „RISS“ und „FLI“ (Prozentualer Anteil von Gerissener Bereiche bzw. kleinflächig geflickter Bereiche bezogen auf die Straßenoberfläche) wurden vom etablierten Modell hingegen deutlich präziser vorhergesagt als von der ML-basierten Prognose (siehe nachfolgende Abbildung). Zu diesen vorläufigen Ergebnissen muss gesagt werden, dass das Fehlen der Information zum Alter der Straße für einige Streckenabschnitte dazu geführt hat, dass im Fall der etablierten Prognose von einem „Durchschnittlich schnellen Verfall“ der Abschnitte ausgegangen werden musste. Auf der anderen Seite Stand das Alter der Straße dem ML basierten Modell ebenfalls nicht als Feature zur Verfügung. Abbildung 13: Vergleich des mittleren absoluten Fehlers des etablierten Prognosemodells (grün), des ML basierten Models (blau) sowie Veranschaulichung des hybriden Modells (gelb) Um dem Umstand gerecht zu werden, dass das aktuelle ML-basierte Modell nur bestimmte Zustandswerte präziser voraussagen kann als das etablierte Modell, während es dem etablierten Modell bei anderen Zustandswerten noch unterlegen ist, wurde ein als „hybrides Modell“ bezeichneter Ansatz entwickelt. Dieser nutzt die zum aktuellen Stand jeweils präzisere Modellvariante für die Prognose der einzelnen Werte. Anschließend werden die Ergebnisse von beiden Modellen entsprechende dem aktuellen Regelwerk zu einer Gesamtnote je Bereich zusammengefasst. Vorangegangene Abbildung zeigt am Beispiel einer Ein-Jahres-Prognose basierend auf Daten der DMS A5 wie sich die Genauigkeiten des ML-Modells (blauer Balken) im Vergleich zum etablierten Modell (grüner Balken) für die einzelnen Messwerte verhalten. Der gelbe Balken veranschaulicht dabei das Prinzip des hybriden Modells sowie die daraus resultierende Genauigkeit bei der Gesamtwertung. Dargestellt ist jeweils der mittlere Absolute Fehler der Prognosen bezogen auf den jeweiligen Zustandswert. (Zustandswerte und Gesamtwert werden in Form einer den Schulnoten entsprechenden Skala von eins bis fünf ausgedrückt.) Der auf der vorangegangenen Abbildung dargestellte maximale mittlere Fehler der beiden Modelle lag bei etwa 0,4 Notenpunkten. Bezogen auf die (für die meisten Anwendungsfälle ausschlaggebenden) Gesamtwertung war das ML basierte Prognosemodell im Mittel knapp 20 Prozent genauer als das etablierte Modell. 3.9 Grenzen der Machine Learning basierten Prognose Die mit Abstand größte Herausforderung bei der Entwicklung einer auf Maschinellem Lernen basierenden Straßenzustandsprognose scheint in der Beschaffung von Lerndaten in ausreichender Menge und Qualität zu be- 434 2. Kolloquium Straßenbau - September 2021 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning stehen. Während die Daten vergangener Zustandsmessungen in vielen Fällen sowohl in großer Anzahl als auch in annähernd gleicher Qualität sowie einem genormten Format zur Verfügung stehen, stellt die Beschaffung der entsprechenden Maßnahmendokumentationen in der Praxis, sprich außerhalb von speziellen Dauermessstrecken, eine große Hürde dar. Des Weiteren scheint es zum aktuellen Zeitpunkt sehr schwierig, für einen ausreichend weit in die Vergangenheit reichenden Zeitraum der Zustandserfassungen an sowohl verlässliche als auch aussagekräftige Informationen zu Bauart und Materialeigenschaften der jeweiligen Straßenkörper zu erhalten. Das gleiche gilt für Informationen zu Einbauprozess und Einbaubedingungen und für Informationen zur Beschaffenheit des Baugrundes. Daher gestaltet es sich sehr schwierig, aussagekräftige Parameter zur „Widerstandsfähigkeit“ der Straße in die Prognose mit einfließen zu lassen. Bei der Verwendung von Parametern, die die Einwirkung auf eine Straße beschreiben, gestaltet sich die Herausforderung anders. Sowohl der Verkehr als auch das Wetter (bzw. das lokale Klima) sind größtenteils wesentlich ausführlicher, einheitlicher und maschinenlesbarer dokumentiert als die Straßenbau-spezifischen Parameter. Häufig sind entsprechende Informationen sogar über öffentliche Datenbanken frei zugänglich. Das Problem bei diesen Parametern besteht daher nicht in einer mangelnden Verfügbarkeit, sondern in der Tatsache, dass sie selbst über die Zeit stark veränderlich und auf lange Sicht nahezu unmöglich vorherzusagen sind. In beiden Fällen kann lediglich entweder von einer Fortsetzung des aktuellen Trends, einem über einen repräsentativen vergangenen Zeitraum gemittelten Wert oder einer separaten Prognose zurückgegriffen werden. Die Auswertung repräsentativer Untersuchungen hierzu stehen im Rahmen dieses Projektes jedoch noch aus. 4. Weiterführende Anwendungen und Ausblick Für eine aussagekräftige Prognose über einen längeren Zeitraum (z.B. 30 Jahre) müssen zusätzlich zum erwarteten Verfall zwangsläufig auch die geplanten Erhaltungsmaßnahmen im betrachteten Zeitraum mit einbezogen werden. Eine reine Zustandsprognose könnte lediglich die Entwicklung bis zum „erstmaligen Verfall“ aller betrachteten Streckenabschnitte vorhersagen. Hat ein Abschnitt diesen Wert einmal überschritten, ist eine Prognose des weiteren Verfalls jenseits der „Unbrauchbarkeit“ weder sinnvoll noch machbar. (Nicht machbar, da für dieses Szenario keine Lerndaten zur Verfügung stehen.) Eine auf Lerndaten trainiertes Modell zur Vorhersage des „ungebremsten Verfalls“ einer Straße stellt daher für sich alleine noch keinen praktischen Mehrwert dar, sondern bildet vielmehr die notwendige Voraussetzung für die Entwicklung einer weiterführenden, umfassenderen Erhaltungssimulation. 4.1 Konzept zu einer umfassenden Erhaltungssimulation Nachfolgende Abbildung stellt schematisch ein mögliches Konzept für eine solche Erhaltungssimulation dar. Das Modell zur Verfallsprognose prognostiziert dabei solange iterativ in fixen Zeitabständen auf den eigenen Vorhersagen aufbauend die Entwicklung des Straßenzustandes, bis ein in der Erhaltungsstrategie definierter Schwellenwert (oder eine Kombination aus mehreren Werten innerhalb eines bestimmten Bereiches) erreicht wird. Daraufhin wird eine ebenfalls in der Erhaltungsstrategie definierte Maßnahme ausgelöst, die alle von dieser Maßnahme betroffenen Zustandswerte auf (oder um) einen bestimmten Wert zurücksetzt. Die auf diese Weise veränderten Zustandswerte dienen darauf hin als Eingangswerte für den nächsten Iterationsschritt. Dieser Vorgang wiederholt sich, bis das Ende des Prognosezeitraums erreicht ist (vgl. Abschnitt 3.4). Abbildung 14: Schematische Darstellung des Konzepts zur Maßnahmenoptimierung 2. Kolloquium Straßenbau - September 2021 435 LESS WRONG - Verbesserung von Straßenzustandsprognosen mittels Machine Learning 4.2 Optimierung der geplanten Erhaltungsstrategie Hinterlegt man die in der oben beschriebenen Erhaltungssimulation ausgelösten Maßnahmen mit konkreten Werten wie beispielsweise Material- und Baukosten oder Sperrzeiten, können diese Werte über den betrachteten Strecken- und Zeitabschnitt aufsummiert werden und ergeben somit die Gesamtkosten aller zu erwartenden Erhaltungsmaßnahmen. Diese „Gesamtkosten“ - es sei dahingestellt, ob es sich dabei um tatsächliche Geldbeträge oder andere Größen wie die Gesamtdauer der zu erwartenden Verkehrsbeeinträchtigungen handelt - stehen in direktem Zusammenhang mit der Erhaltungsstrategie, die der Simulation zu Grunde liegt. Mit Hilfe geeigneter Optimierungsalgorithmen (z.B. evolutionärer Algorithmen) könnte eine, über numerische Parameter definierte, Erhaltungsstrategie so lange iterativ angepasst werden, bis eine innerhalb des Modells annähernd optimale Strategie gefunden wurde. Die zu optimierenden Parameter der Erhaltungsstrategie könnten dabei beispielsweise in räumlicher Distanz der für eine Zusammenlegung von Maßnahmen berücksichtigten Abschnitte bestehen, in dem zeitlichen Abstand der innerhalb dieses zusammengelegten Bereichs berücksichtigten Zustandswerte so wie in den jeweiligen Schwellenwerte (bzw. Wertekombinationen) der Zustandswerte selbst. 4.3 Vorhersage der Auswirkungen von Maßnahmen Um im Rahmen einer Erhaltungssimulation die Auswirkungen von Instandsetzungsmaßnahmen auf die Entwicklung der Zustandswerte möglichst realistisch abbilden zu können, wurde untersucht, inwiefern sich diese ebenfalls mit Hilfe eines angelernten Machine Learning Modells vorhersagen lassen. Zu diesem Zweck wurde eine ML Modell auf Daten von Zustandswerten unmittelbar vor- und nach einer Maßnahme trainiert. Die Auswertung der Genauigkeit dieser Vorhersagen ergab wie zu erwarten ein sehr ähnliches Bild, wie es bereits bei der Detektion unterschiedlicher Erhaltungsmaßnahmen zu beobachten war. Für jene Maßnahmen, die mit hoher Genauigkeit detektiert werden konnten, ließen sich auch die von diesen Maßnahmen verursachten Zustandsänderungen präzise Vorhersagen. Vorangegangene Grafik zeigt die Prognosegenauigkeit am Beispiel der Auswirkung von „Gesamterneuerung“ (links), „Deckschichterneuerung“ (Mitte) und „Unterhaltungsmaßnahmen“ (rechts) auf die Mittlere Spurrinnentiefe. Es wurden jeweils die vorhergesagten Werte (horizontale Achse) gegen die tatsächlichen Werte (vertikale Achse) geplottet. So zeigt der Vergleich des linken Plots mit dem mittleren Plot, dass sich die Auswirkungen des Maßnahmentyps „grundhafter Erneuerungen“ wesentlich präziser voraussagen lassen als die von Deckschichterneuerungen. Abbildung 15: Genauigkeit der Prognose der Auswirkung unterschiedlicher Maßnahmentypen auf die Entwicklung der mittleren Spurrinnentiefe zwischen zwei aufeinanderfolgenden Messzeitpunkten (Auszug aus der Datenanalyse)