Internationales Verkehrswesen
iv
0020-9511
expert verlag Tübingen
10.24053/IV-2024-0003
21
2024
761
KI zur Auswertung von Beteiligung?
21
2024
Laura Mark
Julia Romberg
Tobias Escher
Die Konsultation der Öffentlichkeit ist mittlerweile fester Bestandteil der häufig konfliktträchtigen Verkehrsplanung. In der Folge müssen jedoch oft große Mengen an Beiträgen manuell ausgewertet werden. Künstliche Intelligenz bietet die Aussicht, diesen Prozess zu unterstützen. Zur Untersuchung des Potenzials trainieren wir ein Sprachmodell zur Erkennung von Verkehrsmitteln. Unsere Ergebnisse zeigen, dass überwachtes maschinelles Lernen zuverlässig Verkehrsmittel in Texten identifizieren und damit in der Praxis die Auswertung von Konsultationsprozessen unterstützen kann.
iv7610012
Internationales Verkehrswesen (76) 1 ǀ 2024 12 DOI: 10.24053/ IV-2024-0003 POLITIK Künstliche Intelligenz Berücksichtigung von Beiträgen möglichst nahe zu kommen sowie in einigen Verfahrensarten die Rechtssicherheit zu gewährleisten [1]. Der Mangel an Ressourcen bei initiierenden Institutionen und ihren Dienstleistern führt in der Folge regelmäßig zu Verzögerungen bei der Auswertung, und häufig kann das volle Potenzial der Daten nicht ausgeschöpft werden [2, 3]. Seit Langem wird versucht, die Auswertungsschritte durch Automatisierung zu unterstützen. Große Hoffnungen werden dabei in die sich in den letzten Jahren rapide entwickelten Methoden der Künstlichen Intelligenz (KI) gesetzt. Diese sollen die Beiträge so vorsortieren und auf bereiten, dass sie effizienter durch die verantwortlichen Personen begutachtet werden können, denn klar ist: Am Ende muss die finale Entscheidung immer durch Menschen getroffen werden. Vielversprechende Ansätze entstammen dem Bereich der natürlichen Sprachverarbeitung (Natural Language Processing / NLP). Dazu zählen unter anderem Sprach- Sprachmodelle zur Auswertung von Beteiligungsbeiträgen Die Konsultation der Öffentlichkeit ist zu einem festen Bestandteil der räumlichen Planung geworden. Gerade in konfliktträchtigen Bereichen wie der Verkehrsplanung wird sie von öffentlichen Institutionen oder Vorhabenträgern zunehmend genutzt, nicht zuletzt in der Hoffnung, dadurch bessere Lösungen zu entwickeln und die Akzeptanz von Maßnahmen zu erhöhen. Allerdings führen insbesondere die häufig eingesetzten Online-Formate regelmäßig zu großen und kaum strukturierten Datenmengen. Diese müssen im Anschluss aufwendig manuell geprüft und anhand verschiedener Merkmale kategorisiert werden, um relevante Informationen sowie daraus möglicherweise resultierende Handlungsbedarfe zu identifizieren und diese für Politik, Verwaltung und Öffentlichkeit aufzubereiten. Dabei gelten hohe Anforderungen an Fairness, Transparenz und Sorgfalt, um dem demokratischen Ideal der gleichwertigen modelle wie beispielsweise BERT, RoBERTa oder auch ChatGPT. Gemein haben diese verschiedenen Ansätze, dass Modelle zunächst auf einer sehr großen Datenmenge trainiert werden, um ein umfassendes Sprachverständnis und Kontextwissen über Wörter zu erlangen. Wir konzentrieren uns im Folgenden auf ein konkretes Konzept, das sogenannte überwachte maschinelle Lernen zur Textklassifikation. Dabei werden die vortrainierten Modelle mithilfe kleinerer Datensätze nachtrainiert (sog. Fine-Tuning), um diese gezielt auf den jeweiligen Anwendungskontext anzupassen. Dafür werden Trainingsdaten benötigt, die für eine Menge von Texten angeben, zu welcher vorher festgelegten Kategorie ein Beitrag durch das Sprachmodell zugeordnet werden soll. Die Kategorien können sich dabei z. B. auf einen im Text genannten Inhalt wie ein Verkehrsmittel beziehen oder auf eine Eigenschaft des Textes, wie dessen Verständlichkeit. Die Erstellung (Kodierung) solcher Trainingsdaten erfolgt in der Regel durch Personen und KI zur Auswertung von Beteiligung? Das Potenzial von Sprachmodellen zur Erkennung von Verkehrsmitteln in Beteiligungsbeiträgen Beteiligung, KI, Verkehrsmittel, Auswertungshilfe, Sprachmodelle Die Konsultation der Öffentlichkeit ist mittlerweile fester Bestandteil der häufig konfliktträchtigen Verkehrsplanung. In der Folge müssen jedoch oft große Mengen an Beiträgen manuell ausgewertet werden. Künstliche Intelligenz bietet die Aussicht, diesen Prozess zu unterstützen. Zur Untersuchung des Potenzials trainieren wir ein Sprachmodell zur Erkennung von Verkehrsmitteln. Unsere Ergebnisse zeigen, dass überwachtes maschinelles Lernen zuverlässig Verkehrsmittel in Texten identifizieren und damit in der Praxis die Auswertung von Konsultationsprozessen unterstützen kann. Laura Mark, Julia Romberg, Tobias Escher Internationales Verkehrswesen (76) 1 ǀ 2024 13 DOI: 10.24053/ IV-2024-0003 Künstliche Intelligenz POLITIK ist damit relativ arbeitsintensiv. Gleichzeitig ermöglicht sie die Anpassung an die konkrete Klassifikationsaufgabe. Trotz des großen Potenzials solcher Modelle wurde deren Anwendbarkeit in der Planungspraxis bislang jedoch noch nicht ausreichend untersucht [4]. Unser Anliegen ist es daher, eine konkrete Anwendungsmöglichkeit von KI in der Auswertung von Beteiligungsbeiträgen zu evaluieren. Wir konzentrieren uns dafür auf Konsultationen zu Verkehrsplanungsprozessen und schlagen vor, deren manuelle Auswertung zu unterstützen, indem wir die öffentlichen Beiträge automatisch nach Verkehrsmitteln kategorisieren. Im Folgenden stellen wir zunächst das zu diesem Zweck von uns entwickelte Kategorisierungsschema dar. Anhand dieses Schemas wurden insgesamt 1.700 Beiträge aus sieben verschiedenen Konsultationsverfahren in Deutschland kodiert und anschließend in Teilen zum Training und in Teilen zur Evaluation eines Sprachmodells genutzt. Auf dieser Grundlage bewerten wir das Potenzial moderner Textklassifikationsmodelle für die Zuordnung von deutschsprachigen Textbeiträgen zu Verkehrsmitteln. Die hier präsentierten Ergebnisse zeigen, dass moderne Sprachmodelle sehr zuverlässig Verkehrsmittel kategorisieren können und dass das hier entwickelte Modell auch erfolgreich auf Verfahren anwendbar ist, die nicht Teil des Trainings waren. Dies deutet darauf hin, dass die Verwendung unseres Modells in der Praxis den Ressourcenaufwand für die Vorstrukturierung der Beiträge der Öffentlichkeit nach Verkehrsmitteln erheblich reduzieren und somit die Auswertung von Konsultationsprozessen unterstützen kann. Kategorisierungsschema nach Verkehrsmitteln Das Kategorisierungsschema dient als Grundlage für die Kodierung der Trainingsdaten, mit denen anschließend der Klassifikationsalgorithmus trainiert wird. Das verwendete Schema definiert, nach welchen Aspekten bei einer automatisierten Auswertung kategorisiert wird und in der Folge priorisiert oder gefiltert werden kann. Es bildet somit die Basis für eine sinnvolle KI-gestützte Auswertung. Das hier genutzte Kategorisierungsschema wurde mit dem Ziel entwickelt, auf verschiedene Planungs- und Konsultationsverfahren mit Verkehrsbezug universell anwendbar zu sein, unabhängig vom genauen Thema, dem räumlichen Bezug und Maßstab und der genauen Fragestellung. Damit ist die Hoffnung verbunden, dass die Klassifikationsgenauigkeit eines auf den kodierten Beiträgen von wenigen Verfahren trainierten Sprachmodells auch für andere Verfahren mit Verkehrsbezug beständig bleibt und somit der Aufwand einer manuellen Kodierung stark reduziert werden kann. Als wichtigste Kategorisierungsdimension wurden die in Beiträgen angesprochenen Verkehrsmittel gewählt, da davon ausgegangen wird, dass eine solche Unterscheidung für die Auswertung verkehrsbezogener Beteiligungsverfahren immer relevant und oft der erste Schritt ist. Um alle relevanten Verkehrsmittel abzudecken und das Schema damit möglichst allgemeingültig anzulegen, wurde es auf Basis bestehender Auswertungen von verkehrsbezogenen Konsultationsverfahren und in einem gemeinsamen Prozess mit Praktiker*innen aus deutschen Verwaltungen und Planungsbüros entwickelt [5]. Zwar sind in vielen gängigen Verkehrsplanungsverfahren nicht alle Verkehrsmittel quantitativ relevant, können aber in einzelnen Verfahren oder in Zukunft sehr relevant sein und werden deswegen im Sinne einer umfassenden Abdeckung mit aufgenommen. Das Schema ist hierarchisch aufgebaut, sodass eine Auswertung in verschiedenen Detailgraden erfolgen kann (siehe Abbildung 1). Wichtig ist, dass ein Beitrag beliebig vielen Kategorien zugeordnet sein kann. Es ist auch möglich, dass ein Beitrag keiner der Kategorien zugeordnet wird, nämlich wenn er sich auf kein Verkehrsmittel bezieht. Zunächst ist relevant, ob sich der Beitrag auf motorisierten oder nicht-motorisierten Verkehr bezieht, oder auch auf beide oder keine von beiden Kategorien. In der Folge kann genauer nach Verkehrsmittel spezifiziert werden, bei nicht-motorisiertem Verkehr nach Fahrradverkehr, Fußverkehr, Rollern und nicht-motorisiertem Wirtschafts- und Lieferverkehr, bei motorisiertem Verkehr nach ÖPNV, öffentlichem Fernverkehr und motorisiertem Wirtschafts- und Lieferverkehr. Private Pkw sind dabei nicht als Spezifizierung enthalten, weil normalerweise kaum Beiträge rein für den privaten Pkw- Verkehr verfasst werden, sondern sich die Beiträge meist auf den motorisierten Verkehr im Allgemeinen beziehen. Wenn ein Beitrag einem Verkehrsmittel zugeordnet ist, muss er weiter spezifiziert werden in fließenden oder ruhenden Verkehr. Als optionale zusätzliche Spezifizierung kann er zudem den Kategorien der „Neuen Angebote“ oder der „Intermodalität“ zugeordnet werden. Erstere bezeichnen Angebote, die in den letzten Jahren relevant geworden sind für den täglichen Verkehr bzw. aktuell an Bedeutung gewinnen, wie etwa Elektromobilität oder „Mobility as a Service“, Zweiteres die Kombination verschiedener Verkehrsmittel für einen Weg. Das Schema bietet sowohl die Möglichkeit einer groben Kategorisierung von Beiträgen, beispielsweise nach motorisiertem und nicht-motorisiertem Verkehr, als auch einer detaillierten Auswertung. Letzteres ergibt besonders bei großen Datenmengen Bild 1: Kategorisierungsschema nach Verkehrsmitteln Internationales Verkehrswesen (76) 1 ǀ 2024 14 DOI: 10.24053/ IV-2024-0003 averaged F 1 ). Diese gibt als Durchschnitt über die verschiedenen Kategorien an, welcher Anteil an Beiträgen korrekt als einer Kategorie zugehörig bzw. nicht zugehörig klassifiziert wurde. Alle Werte stellen den Durchschnitt aus fünf Trainingsläufen dar (fünffache Kreuzvalidierung). Im Ergebnis zeigt sich eine hervorragende Leistung: Wie aus Tabelle 2 ersichtlich, wurden für das auf den Beteiligungsbeiträgen aus Hamburg trainierte und evaluierte Modell im Durchschnitt 97 % der Kategorien korrekt zugeordnet. Darüber hinaus zeigt die Spalte „Hamburg“ die Ergebnisse für die einzelnen Klassen. Wir sehen, dass viele Kategorien fast perfekt automatisiert zugeordnet werden können, während nur wenige vom Sprachmodell nicht so gut erfasst werden können. Dabei handelt es sich um die Kategorien, die seltener vergeben wurden, wodurch auch weniger Trainingsdaten zur Verfügung standen. In diesem ersten Schritt wurde das Modell auf denselben Daten trainiert, auf die es dann auch angewendet wurde, nämlich den beiden Verfahren aus Hamburg. Indem wir die Praktikabilität in den Vordergrund stellen, fragen wir zweitens, inwieweit unser Modell auch auf andere mobilitätsbezogene Konsultationsverfahren anwendbar ist. Um die Robustheit des Modells zu messen, wenden wir das zuvor auf den Beiträgen aus Hamburg trainierte Modell auf Stichproben von Beiträgen aus den anderen wir den öffentlichen Fernverkehr mit dem ÖPNV als neue Kategorie für öffentlichen Verkehr zusammen. Als Erstes untersuchen wir die Frage, wie gut Sprachmodelle die Kategorisierung von Verkehrsmitteln erlernen können. Hierzu setzen wir auf das leistungsfähige RoBERTa Sprachmodell [6] und verwenden eine vortrainierte deutschsprachige Version [7]. Dieses vortrainierte Modell wird mithilfe der kodierten Daten der beiden Mobilitätsplanungsprojekte in Hamburg nachtrainiert, um eine Kategorisierung entsprechend unseres Schemas zu ermöglichen. Um die Güte der erlernten Vorhersage zu ermitteln, trainieren wir das Modell zunächst auf 80 % der Daten. Dann vergleichen wir die Vorhersage des Sprachmodells für die restlichen 20 % der Beiträge mit den manuellen Kodierungen. Um zu messen, wie gut das Modell die jeweilige Kategorie erkennt, verwenden wir das F 1 -Maß [8]. Dieses berücksichtigt sowohl, wie viele der Vorhersagen des Modells tatsächlich eine korrekte Zuordnung des Beitrags zu dessen Kategorie darstellen (Precision), als auch, wie viele der Beiträge einer Kategorie gefunden wurden (Recall). Das F 1 -Maß nimmt den Maximalwert von 1 an, wenn das Sprachmodell perfekt die manuell kodierten Daten vorhersagt. Auf Ebene eines gesamten Verfahrens mit Beiträgen verschiedener Kategorien berichten wir als Gütemaß die Genauigkeit (Micro- Sinn oder wenn ein Verkehrsmittel oder ein Thema spezifisch betrachtet werden sollen. Auf Basis des Schemas wurde eine detaillierte Kodieranweisung erstellt, anhand derer alle 1.700 Beiträge von drei Personen unabhängig voneinander kodiert wurden. Die Personen waren zuvor in einem iterativen Prozess geschult worden. In den meisten Kategorien wiesen die drei Kodierungen eine hohe Übereinstimmung auf. Das bedeutet, dass sich die drei Personen bei der Zuordnung der Beiträge zu Kategorien größtenteils einig waren und damit die Kodierung eine hohe Qualität aufweist. Nur bei selten vorkommenden Kategorien gab es teilweise voneinander abweichende Einschätzungen der Kodierenden. Die unterschiedlich kodierten Beiträge wurden durch zwei Supervisorinnen zu einer finalen Kodierung zusammengeführt, auf deren Basis die Sprachmodelle trainiert wurden. Datensätze und Ergebnisse In die Kodierung der Datensätze wurden sieben verschiedene Beteiligungsverfahren mit Verkehrsbezug einbezogen. Hierbei handelt es sich um Verfahren zur Umgestaltung der Elbchaussee in Hamburg („Elbchausseedialog“, 743 kodierte Beiträge), zur autoarmen Gestaltung des Quartiers Hamburg Ottensen („freiRaum Ottensen“, 697 kodierte Beiträge), zur Erarbeitung eines Mobilitätskonzepts in Krefeld („Krefeld bewegen“, 100 kodierte Beiträge) und Offenburg („OG 2035“, 100 kodierte Beiträge) sowie um drei Verfahren zur Radinfrastruktur in Bonn, Köln Ehrenfeld und Moers, die wir als „Raddialoge“ zusammengefasst betrachten (60 kodierte Beiträge). Tabelle 1 zeigt auf, wie sich die Kategorien über die manuell kodierten Datensätze zusammensetzen. Motorisierter und nichtmotorisierter Verkehr halten sich etwa die Waage mit 1073 und 947 Zuordnungen. Es wird zudem offensichtlich, dass in den kodierten Verfahren der fließende Verkehr eine weitaus höhere Relevanz für die Öffentlichkeit hatte als der ruhende Verkehr (1342 im Gegensatz zu 398 Beiträgen). Bei den Unterkategorien der Verkehrsmittel zeigen sich deutliche Unterschiede in der Verteilung. Einige Kategorien werden nur sehr selten thematisiert, beispielsweise der öffentliche Fernverkehr mit nur 2 und der nicht-motorisierte Wirtschafts- und Lieferverkehr mit 6 Zuordnungen. Um aussagekräftige Ergebnisse zu erhalten, werden seltene Kategorien für das Training des verwendeten Sprachmodells zunächst ausgeschlossen. Dies betrifft den nicht-motorisierten Wirtschafts- und Lieferverkehr, Inter- und Multimodalität und den öffentlichen Fernverkehr. Während die ersten beiden vollständig entfallen, fassen Kategorie Elbchausseedialog (Hamburg) freiRaum Ottensen (Hamburg) Krefeld bewegen OG 2035 (Offenburg) Raddialoge (Bonn, Köln Ehrenfeld und Moers) Gesamt Motorisierter Verkehr 487 394 88 81 23 1073 - ÖPNV 90 58 32 12 0 192 - Öffentlicher Fernverkehr 0 1 1 0 0 2 Motorisierter Wirtschafts- & Lieferverkehr 33 54 12 6 0 105 Nicht-motorisierter Verkehr 412 372 47 58 58 947 - Fahrrad 327 293 30 46 53 749 - Fuß 165 180 30 28 9 412 - Roller 0 17 1 0 0 18 Nicht-motorisierter Wirtschafts- & Lieferverkehr 0 5 1 0 0 6 Ruhender Verkehr 114 214 28 26 16 398 Fließender Verkehr 642 466 86 95 53 1342 Neue Angebote 23 26 4 8 1 62 Inter- und Multimodalität 3 1 6 4 0 14 Tabelle 1: Übersicht über die anhand des Schemas manuell vergebenen Kategorien in den kodierten Beiträgen der verschiedenen Beteiligungsverfahren. Logistik-Prozesse digitalisiert? POLITIK Künstliche Intelligenz lässig immer deutlich über 90 % der Beiträge korrekt den darin genannten Verkehrsmitteln zuordnen. Damit kann es eindeutig die ihm zugedachte unterstützende Rolle bei der Vorstrukturierung von Beiträgen erfüllen. Die wenigen verbleibenden Fehlklassifikationen werden dann bei der für jeden Beitrag nötigen „menschlichen Abwägung“ erkannt. Besonders bedeutsam ist, dass die Leistungen des Modells sich kaum verschlechtern, wenn es auf bislang unbekannte Daten aus verkehrsrelevanten Beteiligungen angewandt wird. Damit entfällt die Notwendigkeit, im Vorfeld ausgewählte Beiträge manuell zu kodieren, um diese Sprachmodelle zu trainieren - eine Voraussetzung von überwachtem maschinellen Lernen, die in der Beteiligungspraxis schnell dazu führen kann, dass die Effizienzgewinne durch Automatisierung verloren gehen. Zudem bietet ein solches standardisiertes Modell auch die Möglichkeit, verschiedene Beteiligungsverfahren miteinander vergleichen zu können und daraus Erkenntnisse über die Stimmung oder die Relevanz bestimmter Themen für die lokale Bevölkerung zu ziehen, beispielsweise über eine prozentuale Betrachtung der Werte in Tabelle 1. Unabhängig davon zeigen die Ergebnisse, dass gerade selten vorkommende Verkehrsmittel noch nicht ausreichend gut erkannt werden können. Während dies durch eine Erhöhung der Menge der Trainingsdaten verbessert werden kann, gehen wir davon aus, dass in der Praxis in vielen Verfahren auch spezifische Kategorien vorkommen beziehungsweise bedeutsam sind, die in einem allgemeingültigen Modell, wie es hier aufgestellt wurde, nicht berücksichtigt sind. Das bedeutet, dass immer auch eine gewisse Modell macht relativ selten Fehler bei der Klassifikation von Beiträgen, selbst bei der Analyse unbekannter Datensätze. Zusammenfassung und Diskussion Die Beteiligung der Öffentlichkeit an Planungsprozessen ist aus zahlreichen Gründen wünschenswert, jedoch nicht ohne zusätzlichen Aufwand für die durchführenden Institutionen umsetzbar. Wie wir hier zeigen konnten, können die großen Fortschritte in der natürlichen Sprachverarbeitung sinnvoll zur Unterstützung der Auswertung von Beteiligungsbeiträgen genutzt werden: Das von uns hier vorgestellte Modell kann zuverin Tabelle 1 aufgeführten Konsultationen („Krefeld bewegen“, „OG 2035“, „Raddialoge“) an. Es kann festgestellt werden, dass auch in diesen Fällen die Genauigkeit auf einem hohen Niveau von 91 % bis 94 % bleibt. Die Spalten „Krefeld bewegt“, „OG 2035“ und „Raddialoge“ in Tabelle 2 geben darüber hinaus Einblick in die Güte des Modells, um einzelne Kategorien zu erkennen. Zusammenfassend lässt sich feststellen, dass Sprachmodelle wie RoBERTa ein erhebliches Potenzial besitzen, Beiträge aus verkehrsbezogenen Verfahren äußerst zuverlässig automatisiert nach Verkehrsmitteln zu strukturieren. Das hier genutzte Kategorie Hamburg Krefeld bewegt OG 2035 (Offenburg) Raddialoge Motorisierter Verkehr 0.97 0.96 0.92 0.84 - ÖPNV 0.92 0.77 0.91 - Wirtschafts- & Lieferverkehr 0.87 0.70 0.80 Nicht-motorisierter Verkehr 0.97 0.89 0.94 0.94 - Fahrrad 0.98 0.90 0.93 0.98 - Fuß 0.92 0.87 0.79 0.78 - Roller 0.60 0.00* Ruhender Verkehr 0.96 0.88 0.92 0.97 Fließender Verkehr 0.98 0.98 0.98 1.00 Neue Angebote 0.83 0.75 0.55 0.00* Genauigkeit über alle Kategorien (Micro-averaged F1) 0.97 0.91 0.93 0.94 Tabelle 2: Übersicht über die Klassifikationsergebnisse des Sprachmodells für die verschiedenen Verfahren. Berichtet wird das F1-Maß (jeweils als Durchschnitt aus 5 Trainingsläufen). Die Ergebnisse basieren auf einem Sprachmodell, das ausschließlich auf Beteiligungsbeiträgen aus Hamburg trainiert wurde. Mit * markierte Kategorien traten nur einmal in den Daten auf. Ergebnisse sind in diesen Fällen nicht aussagekräftig. Leere Felder weisen auf Kategorien hin, die im jeweiligen Datensatz manuell nicht zugeordnet wurden. Logistik-Prozesse noch nicht durchgängig digitalisiert? Langjährige Erfahrung in Consulting, Systemintegration, Projektmanagement und Betrieb. Den perfekt ausgestatteten digitalen Logistik- Arbeitsplatz, in nahezu jedem Land der Erde: • IT-Leistungen (Cloud, SAP, Infrastruktur & Office-IT) • Logistik-Applikationen (CargoWise, TMS, WMS) • Cyber Security für alle Logistik-Prozesse und Daten • 24/ 7 Monitoring & internationaler Help Desk Unsere 150 IT- und Logistik- Expert: innen bieten Ihnen: Digitalisierung der Prozesse entlang Ihrer Logistik-Wertschöpfungskette Wir stehen bereit. Wann wollen Sie starten? www.logineer.com logineer — Ihr IT-Partner für internationale Logistik Künstliche Intelligenz POLITIK Anzeige Internationales Verkehrswesen (76) 1 ǀ 2024 16 DOI: 10.24053/ IV-2024-0003 Eingangsabbildung: © iStock.com/ filadendron Anpassung der Modelle an die jeweils spezifische Beteiligungssituation sinnvoll sein kann. Es wird also in Zukunft darum gehen, wie diese mit wenig Aufwand erfolgen kann. Zudem wäre es perspektivisch sinnvoll, noch weitere Kategorien in ein Auswertungsschema zu integrieren. Während das hier vorgestellte Schema stark infrastrukturell strukturiert ist, ist gerade in Planungs- und Konsultationsverfahren, die Verkehr als Teil einer integrierten räumlichen Entwicklung begreifen, eine Auswertung beispielsweise nach den Themen Aufenthaltsqualität, Lärmbelästigung oder Sicherheit sehr relevant. Diese Relevanz zeigt sich nicht zuletzt dadurch, dass z. B. 18 % aller Beiträge im Trainingsdatensatz freiRaum Ottensen keinem Verkehrsmittel zugeordnet werden konnten. Diese können also rein mit dem Verkehrsmittelschema nicht sinnvoll ausgewertet werden und müssen zukünftig noch besser integriert werden. Zusammenfassend ist zu sagen, dass KI unseren Ergebnissen zufolge für die Auswertung von Beteiligungsbeiträgen bereits jetzt ein großes Potenzial bereithält. Wie gezeigt wurde, kann diese bereits mit heute verfügbaren Sprachmodellen sinnvoll unterstützt werden. Nun ist die Herausforderung, die hier entwickelten Modelle in der Praxis anwendbar zu machen und so in die existierenden (Verwaltungs-)abläufe zu integrieren, dass diese einfach zur Verfügung stehen und direkt für die Auswertung nutzbar gemacht werden können. Dazu befindet sich aktuell ein Auswertungstool in Vorbereitung, das in Kürze online verfügbar sein soll. Dieses frei verfügbare Open Source Werkzeug soll in Zukunft die Planenden bei der Auswertung von mobilitätsbezogenen Beteiligungsbeiträgen unterstützen. Laura Mark Wissenschaftliche Mitarbeiterin an der Heinrich Heine Universität Düsseldorf, Institut für Sozialwissenschaften Laura.mark@hhu.de Bild ©Tilman-Schenk Julia Romberg Wissenschaftliche Mitarbeiterin bei GESIS - Leibniz-Institut für Sozialwissenschaften Julia.romberg@gesis.org Bild ©Tilman-Schenk Dr. Tobias Escher Juniorprofessor an der Heinrich Heine Universität Düsseldorf, Institut für Sozialwissenschaften tobias.escher@hhu.de Bild ©Tilman-Schenk LITERATUR [1] Livermore, M. A.; Eidelman, V.; Grom, B. (2018): Computationally assisted regulatory participation. In: Notre Dame Law Review, (93. Jg.) Heft 3, S. 977-1034. [2] Simonofski, A; Fink, J; Burnay, C. (2021): Supporting policy-making with social media and e-participation platforms data: A policy analytics framework. In: Government Information Quarterly, (38. Jg.) Heft 3. DOI: https: / / doi.org/ 10.1016/ j. giq.2021.101590. [3] Mahyar, N; Nguyen, D. V.; Chan, M.; Zheng, J.; Dow, S. P. (2019): The Civic Data Deluge: Understanding the Challenges of Analyzing Large-Scale Community Input. In: Proceedings of the 2019 on Designing Interactive Systems Conference, S. 1171-1181. DOI: https: / / doi. org/ 10.1145/ 3322276.3322354. [4] Romberg, J; Escher, T. (2023): Making Sense of Citizens’ Input through Artificial Intelligence: A Review of Methods for Computational Text Analysis to Support the Evaluation of Contributions in Public Participation. In: Digital Government: Research and Practice. DOI: https: / / doi. org/ 10.1145/ 3603254. [5] Romberg, J; Mark, L; Escher, T. (2022): A Corpus of German Citizen Contributions in Mobility Planning: Supporting Evaluation Through Multidimensional Classification. In: Proceedings of the Thirteenth Language Resources and Evaluation Conference, S. 2874-2883. [6] Liu, Y.; Ott, M.; Goyal, N.; Du J.; Joshi, M.; Chen, D.; Levy, O.; Lewis, M.; Zettlemoyer, L.; Stoyanov, V. (2019): RoBER- Ta: A Robustly Optimized BERT Pretraining Approach. Online: https: / / arxiv.org/ abs/ 1907.11692 (Abruf: 16.01.2024). [7] Minixhofer, B.; Paischer, F.; Rekabsaz, N. (2022): WECHSEL: Effective initialization of subword embeddings for cross-lingual transfer of monolingual language models. In: Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, S. 3992-4006. Online: https: / / aclantho logy.org/ 2022.naacl-main.293/ (Abruf: 16.01.2024). [8] Manning, C. D.; Raghavan, P.; Schütze, H. (2008): Introduction to Information Retrieval. Cambridge University Press, S. 156. POLITIK Künstliche Intelligenz
