eJournals Internationales Verkehrswesen 68/1

Internationales Verkehrswesen
iv
0020-9511
expert verlag Tübingen
10.24053/IV-2016-0024
21
2016
681

Big Data im Fernbusverkehr

21
2016
Goran Sejdić
Ute David
Corinna Fohrholz
Christian Glaschke
Großveranstaltungen wie Festivals oder Messen bieten Fernbusunternehmen die Möglichkeit, ihre Netze temporär zu erweitern und zusätzliche Umsätze zu generieren. Die Fernbusunternehmen stehen dabei vor der Herausforderung, die Nachfrage nach Fernbusverbindungen zu solchen Großveranstaltungen präzise abzuschätzen und zu planen. Dafür können die Unternehmen Informationen über Veranstaltungsbesucher und deren Transportpräferenzen in Social Media-Plattformen wie Facebook oder Twitter nutzen. Im Projekt „SmartTravel“ werden Instrumente zur Nutzung von Social Media-Daten für die Planung von Fernbusverbindungen entwickelt.
iv6810070
Internationales Verkehrswesen (68) 1 | 2016 70 MOBILITÄT Wissenschaft Big Data im Fernbusverkehr Planung von Fernbusverbindungen durch die Analyse von Informationen aus Social Media-Plattformen Fernbusverkehr, Fernbusverbindungen, Web 2.0, Social Media, Big Data Großveranstaltungen wie Festivals oder Messen bieten Fernbusunternehmen die Möglichkeit, ihre Netze temporär zu erweitern und zusätzliche Umsätze zu generieren. Die Fernbusunternehmen stehen dabei vor der Herausforderung, die Nachfrage nach Fernbusverbindungen zu solchen Großveranstaltungen präzise abzuschätzen und zu planen. Dafür können die Unternehmen Informationen über Veranstaltungsbesucher und deren Transportpräferenzen in Social Media-Plattformen wie Facebook oder Twitter nutzen. Im Projekt „SmartTravel“ werden Instrumente zur Nutzung von Social Media-Daten für die Planung von Fernbusverbindungen entwickelt. Autoren: Goran Sejdić, Ute David, Corinna Fohrholz, Christian Glaschke D urch die Novellierung des Personenbeförderungsgesetzes sind seit dem 1. Januar 2013 neben Bahngesellschaften auch Busunternehmen im innerdeutschen Personenfernverkehr zugelassen. Seit diesem Zeitpunkt wächst der Fernbusmarkt kontinuierlich. So stieg alleine im Jahr 2015 die Anzahl der Fernbuslinien um mehr als 25 % an [1]. Der Fernbusmarkt ist allerdings auch sehr wettbewerbsintensiv, was sich an diversen Marktaustritten zeigt [2]. Eine Antwort auf die hohe Wettbewerbsintensität bietet die Verbesserung der Angebotsplanung, um die Nachfrage nach Fernbusverbindungen gezielter auszuschöpfen. Potenzial bieten reiseintensive Ereignisse wie Festivals, Stadtfeste, Messen und Demonstrationen, über die in Social Media-Plattformen Informationen ausgetauscht werden. Diese reiseintensiven Ereignisse erhöhen die Nachfrage nach Personentransportkapazitäten u. a. mit Fernbussen. Die zielgerichtete Analyse der Nachfrage ermöglicht es, das Angebot an Fernbusverbindungen entsprechend des Bedarfs anzupassen, um zusätzliche Umsätze zu generieren und die Marktposition zu sichern und auszubauen. Bisher basiert die Planung von Fernbusverbindungen vorwiegend auf vergangenheitsbezogenen Informationen wie Erfahrungen. Die Planung kann verbessert werden, indem zukunftsorientierte Informationen über Anzahl, Herkunft und Verkehrsmittelwahl der Veranstaltungsteilnehmer berücksichtigt werden [3]. Informationen über die Transportnachfrage zu reiseintensiven Ereignissen sind zunehmend im Web 2.0 - insbesondere in Social Media-Plattformen - verfügbar. In sozialen Netzwerken angekündigte und diskutierte Veranstaltungen enthalten Informationen über potenzielle Teilnehmer (z.B. sozialer Status und Standort bzw. Wohnort). Über Facebook, Twitter, Foren und Blogs tauschen sich Nutzer über Zeitpunkt und Verkehrsmittel ihrer Reisen aus. Die Zusammenführung der unterschiedlichen Daten liefert entscheidungsunterstützende Erkenntnisse (z. B. Teilnehmerzahlen, Herkunft und Kaufkraft) für die Planung von Fernbusverbindungen [4]. Dies schließt Profitabilitätsanalysen von Fernbusangeboten ein. Bisher existieren keine Instrumente, die es Fernbusunternehmen ermöglichen, die Nachfrage nach Fernbuskapazitäten zu reiseintensiven Ereignissen gezielt zu analysieren. Dies wird erst durch die Analyse der Nachfrage auf Basis von Web 2.0-Daten mit Hilfe von Big Data-Technologien (z. B. In-Memory-Datenbanken, Web Analytics, Apache Mahout) möglich. Im Rahmen des aktuell laufenden Forschungsprojekts „SmartTravel“ wird diese Problemstellung aufgegriffen. In dem Projekt wird eine Software-Anwendung zur Analyse von Web 2.0-Daten entwickelt, mit der Fernbusverbindungen für reiseintensive Ereignisse geplant und auf Profitabilität geprüft werden können. Im Folgenden werden zunächst Potenziale des Web 2.0 für die Planung von Fernbusverbindungen beschrieben. Daraufhin wird erläutert, welche Big Data-Technologien zur Analyse von Web 2.0-Daten herangezogen werden können. Schließlich wird aufgezeigt, wie im Rahmen des Forschungsprojekts „SmartTravel“ diese Big Data-Technologien eingesetzt werden, um eine prototypische Software-Anwendung zu entwickeln. Potenziale von Web 2.0 für die Planung von-Fernbusverbindungen Die Planung von Fernbusverbindungen für reiseintensive Ereignisse setzt eine Prognose von Anzahl, Struktur und Verkehrsverhalten der Reisenden voraus. Dies erfolgt bisher vorwiegend auf Basis von Erfahrungen [5]. Internationales Verkehrswesen (68) 1 | 2016 71 Wissenschaft MOBILITÄT Dabei sind Informationen über Teilnehmer von reiseintensiven Ereignissen zunehmend im Web 2.0 verfügbar. Mit dem Begriff Web 2.0 werden eine Reihe von Technologien und Anwendungen sowie Verhaltensänderungen von Internetnutzern verbunden [6]. Aus Sicht der Nutzer steht Web 2.0 für eine spezifische Philosophie der Internetnutzung sowie einen veränderten Umgang mit Inhalten und Kommunikation [7]. In diesem Zusammenhang entwickelt sich das Internet von einer reinen Informationsquelle zur „Mitmach-Plattform“, bei der sich die Nutzer aktiv an der Erstellung von Inhalten beteiligen. Beispiele für Web 2.0-Plattformen sind Foren, Blogs und soziale Netzwerke wie Facebook und Twitter, in denen sich Nutzer über bevorstehende Ereignisse austauschen. Die Mengen an Daten, die im Web 2.0 zur Verfügung stehen, können erst mit den in den letzten Jahren entwickelten Big Data-Technologien qualifiziert und zeitnah genutzt werden [8]. Big Data ist ein technologisches Phänomen, das anhand von verschiedenen Eigenschaften beschrieben werden kann (Bild 1): „Big Data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.“ [9]. Big Data beschreibt große Datenmengen (Volume). Facebook hat täglich über 829 Mio. Nutzer und bei Twitter werden pro Tag mehr als 500 Mio. Tweets veröffentlicht. Die zur Verfügung stehenden Technologien wie Apache Hadoop oder In-Memory Datenbanken erlauben es, große Datenmengen zu halten und analysieren. Das zweite Merkmal ist die hohe Geschwindigkeit (Velocity), mit der die Daten generiert, verarbeitet und analysiert werden können. Die wesentliche Neuerung im Rahmen von Big Data ist die Realisierung in Echtzeit. Im betrieblichen Umfeld stellt die Generierung von Auswertungen und Analysen in Echtzeit eine bahnbrechende Neuerung dar und eröffnet Unternehmen die Möglichkeit, zeitnah auf Änderungen zu reagieren. Big Data beschreibt Daten in großer Vielfalt (Variety). Einträge in Blogs, Foren und anderen Plattformen liegen als unstrukturierte Daten in Form von Text, Bildern oder Audiodateien vor. Darüber hinaus ändern sich die Daten schnell. Unstrukturierte Daten bieten besonderes Informationspotenzial, stellen allerdings zugleich hohe Anforderungen an die gezielte Nutzung. Zur Analyse und Interpretation von Big Data (Analytics) sind Methoden der automatisierten Erkennung und Nutzung von Mustern, Bedeutungen und Zusammenhängen wie statistische Verfahren, Optimierungsmodelle, Data Mining, Text- oder Bildanalytik erforderlich. Durch den Einsatz solcher Methoden werden bisherige Verfahren der Datenanalyse erheblich erweitert [8]. Diese Merkmale von Web 2.0-Daten bieten besonderes Potenzial für die Prognose der Nachfrage nach Fernbusverbindungen zu reiseintensiven Ereignissen. Blogs, Foren und soziale Medien werden immer stärker genutzt. Besondere Veranstaltungen werden zunehmend im Web 2.0 angekündigt, beworben und diskutiert. Damit ist im Web 2.0 eine große Menge zukunftsbezogener Informationen u.a. über die Besucher von Veranstaltungen und deren Transportpräferenzen vorhanden. Diese Informationen werden bisher größtenteils nicht zur Kapazitätsplanung genutzt [10]. Big data-Technologien zur Analyse von-Web-2.0-daten Zentrale Herausforderung für die Nutzung von Web 2.0-Daten in der Planung von Fernbusverbindungen ist deren Aufbereitung und Auswertung. Lösungen wie Data Warehouse oder Statistik-Software stoßen in der Verarbeitung von großen, unstrukturierten Datenmengen an ihre Grenzen. Die manuelle Auswertung ist nur begrenzt möglich. In den letzten Jahren wurden neue Technologien und Verfahren entwickelt und unter der Bezeichnung Big Data-Technologien subsummiert (Bild 2). Diese Technologien generieren aus einer Vielzahl von strukturierten und unstrukturierten Daten neue Erkenntnisse und Zusammenhänge in Echtzeit. Dies ermöglicht schnellere und bessere Entscheidungen. Für die Datenhaltung und den Datenzugriff steht z. B. die Anwendung Apache Hadoop zur Verfügung. Apache Hadoop ermöglicht es entgegen dem verbreiteten Konzept der redundanzfreien Datenhaltung, Daten in mehreren Datenbanken redundant zu halten. Bei einer konkreten Anfrage wird entschieden, aus welchem der Systeme die Daten bereitgestellt werden. Analysen werden auf viele Rechnerknoten verteilt, sodass Datenvolumina im Petabytebereich verarbeitet werden können. Der MapReduce-Algorithmus zerlegt die Rechenaufgaben in kleine Teile (Map), um diese parallelisiert abzuarbeiten. Anschließend werden die Ergebnisse wieder zusammengeführt (Reduce). So lässt sich der Prozess der Datenverarbeitung besonders effizient gestalten. Dies ist eine wesentliche Voraussetzung für die Analyse großer Datenmengen. Zur Sicherstellung der Datengrundlage werden im Rahmen von Search & Discovery Informationen in unstrukturierten Datenbeständen durchsucht. Dies erfolgt zielgerichtet auf spezifische Anfragen und ermöglicht das Aufzeigen von neuen Zusammenhängen. Dadurch können relevante Informationen über bestimmte reiseintensive Ereignisse und Teilnehmergruppen im Web 2.0 gefunden werden. Bei der analytischen Verarbeitung von Web 2.0-Daten müssen strukturierte und unstrukturierte Daten aus verschiedenen Quellen berücksichtigt werden. Dies schließt geographische Informationen, Texte, Bilder, Audiodateien, Videos und Inhalte von Webseiten sowie strukturierte Daten aus Datenbanksystemen ein. Im Rahmen von Web Analytics werden insbesondere Daten Analytics Datenvielfalt (Variety) Geschwindigkeit (Velocity) Datenmenge (Volume) Anzahl von Datensätzen und Files Yottabytes Zettabytes Exabytes Petabytes Terabytes Datengenerierung in hoher Geschwindigkeit Übertragung der konstant erzeugten Daten Echtzeit Millisekunden Sekunden│Minuten│Stunden Erkennen von Zusammenhängen, Bedeutungen, Mustern Vorhersagemodelle Data Mining Text Mining Bildanalytik | Visualisierung | Realtime Fremddaten (Web etc.) Firmendaten unstrukturierte, semi-strukturierte, strukturierte Daten Texte | Videos | Bilder | Tweets | Blogs Kommunikation zwischen Maschinen Big Data Bild 1: Merkmale von Big Data [8] Internationales Verkehrswesen (68) 1 | 2016 72 MOBILITÄT Wissenschaft aus dem Internet gesammelt, analysiert und ausgewertet. Hierfür stehen Methoden wie Page Tagging, Logfile Analyse, Multivariates Testing, Onlineumfragen und Benutzerbeobachtungen zur Verfügung. Aus der Kombination der Methoden können komplette Pfade von Benutzern analysiert sowie ihr Verhalten und ihre Entscheidungen verfolgt werden [11]. Zentraler Bestandteil der analytischen Verarbeitung ist das Data Mining. Data Mining beschreibt die effiziente Suche nach verborgenen, aber wertvollen Mustern in großen unternehmensinternen und unternehmensexternen Datenmengen sowie deren Interpretation und Anwendung [12]. Apache Mahout ist eine Anwendung für das Data Mining mit einer Vielzahl von Algorithmen. Dabei handelt es sich besonders um skalierbare, maschinell lernende Algorithmen auf dem Gebiet des kollaborativen Filterns, Clusterns und der Klassifizierung. Predictive Analytics ist eine Anwendung aus dem Data Mining und umfasst die Prognose von zukünftigen Ereignissen. Unter Einsatz des maschinellen Lernens werden Vorhersagen entwickelt. Dabei werden statistische Algorithmen und Modellierungstechniken angewendet, um aus aktuellen und historischen Daten Muster zu erkennen. Das maschinelle Lernen ist ebenfalls eine Anwendung des Data Mining und zielt darauf ab, Muster und Regelmäßigkeiten zu erlernen. Beispiele für diese Verfahren sind lineare Regressionen, neuronale Netze, Entscheidungsbaumverfahren, Nachbarschaftsklassifizierer und Support Vector Maschines [11]. Big Data-Technologien bieten großes Potenzial für die Analyse von Web 2.0-Daten, um die Nachfrage nach Fernbusverbindungen für reiseintensive Ereignisse zu prognostizieren. Für Analysen und Auswertungen zu spezifischen Problemstellungen sind darauf ausgerichtete technische Anwendungen notwendig. Für die Planung von Fernbusangeboten unter Berücksichtigung von Web 2.0-Daten ist bisher keine Anwendung vorhanden. Fernbusunternehmen nutzen bisher keine Big Data-Technologien zur Analyse von Web 2.0-Daten für die Planung ihrer Fernbusangebote. Im Rahmen des aktuellen Forschungsprojekts „SmartTravel“ wird eine geeignete Software-Anwendung entwickelt. Angestrebte Ergebnisse des Projekts „SmartTravel“ Das Ziel des Projekts „SmartTravel“ ist die Verbesserung der Angebotsplanung für Fernbusverbindungen für reiseintensive Ereignisse durch die Anwendung von Big Data-Technologien zur Analyse zukunftsorientierter Daten aus dem Web 2.0. Im Rahmen dieses Forschungsprojekts wird eine prototypische Anwendung auf Basis der Apache-Anwendung Hadoop und der Data Mining-Anwendung Apache Mahout entwickelt. Diese schließt einen Webcrawler ein, der das Web systematisch nach relevanten Daten durchsucht. Die ausgewählten Webinhalte werden aufgenommen und aufbereitet. Die Ergebnisse werden in einer Datenbank gespeichert und gehen auch in die zukünftigen Analysen ein. Bild 3 zeigt den Aufbau der prototypischen Anwendung. Grundlage ist die Anwendung Hadoop, die frei zugänglich ist und unabhängig vom verwendeten Betriebssystem eingesetzt werden kann. Dies ermöglicht die unmittelbare Umsetzung der Forschungsergebnisse in der Praxis. Für die Speicherung wird ein Hadoop Distributed File System verwendet, ein leistungsfähiges Dateisystem Analytische Verarbeitung Video Audio Geospatial Web Text Semantics Predictive Data Mining Machine Learning Reporting Datenzugriff Batch Processing (Hadoop, MapReduce) Streaming & CEP Search & Discovery Query Visualisierung Dashboards Fortgeschrittene Visualisierung Real-time Intelligence Datenhaltung Hadoop HDFS NoSQL Datenbanken In-Memory Datenbanken Analytische Datenbanken (DW, etc.) Daten- Governance & -Sicherheit Governance Multimandantenfähigkeit Datenverschlüsselung Identity & Access Management Datenintegration Data Ingestion (ETL, ELT) Datenkonnektivität Transaktionale Datenbanken (OLTP) Bild 2: Taxonomie von Big Data- Technologien [11] iNFO Das Projekt „smartTravel“ Das Projekt wird vom International Performance Research Institute (IPRI) in Stuttgart und dem Lehrstuhl für Wirtschaftsinformatik und Electronic Government (LSWI) der Universität Potsdam in Kooperation mit mehreren Fernbusunternehmen bearbeitet. Es ist offen für interessierte Unternehmen. Fernbusunternehmen haben die Möglichkeit zur kostenfreien Mitwirkung. Kontakt und weitere Informationen: Goran Sejdić, Tel. (0711) 6203268-8022, E-Mail gsejdic@ipri-institute.com. Internationales Verkehrswesen (68) 1 | 2016 73 Wissenschaft MOBILITÄT zur Speicherung großer Datenmengen auf mehreren Rechnern. Die Ergebnisdatenbank wird in Form eines Dashboards zur Visualisierung von Ergebnissen aufgebaut. Im Projekt werden solch eine Anwendung aufgebaut, ein Algorithmus zur Analyse der Nachfrage und Planung des Angebots für Fernbusverbindungen zu reiseintensiven Ereignissen entwickelt und in die Anwendung prototypisch implementiert. Fazit Auf Basis von Daten aus Social Media-Plattformen können Fernbusunternehmen ihre Angebotsplanung optimieren und nachfrageorientiert gestalten. Hinsichtlich der Verarbeitung dieser Informationen stoßen konventionelle Softwarelösungen allerdings an ihre Grenzen. Erst durch den Einsatz von Big Data-Technologien kann eine Software-Anwendung entwickelt werden, die die Verarbeitung von Informationen aus Social Media-Plattformen ermöglicht. Im Rahmen des Projekts „SmartTravel“ wird solch eine Software-Anwendung entwickelt. ■ FÖRDERHiNwEis Dieser Beitrag entstand im Rahmen des Forschungsprojekts SmartTravel. Das IGF-Vorhaben 18722 BG der Forschungsvereinigung Verkehrsbetriebswirtschaft und Logistik e. V. - GVB, Wiesenweg 2, 93352 Rohr wurde über die AiF im Rahmen des Programms zur Förderung der Industriellen Gemeinschaftsforschung (IGF) vom Bundesministerium für Wirtschaft und Energie aufgrund eines Beschlusses des Deutschen Bundestages gefördert. liTERATuR [1] IGES-Institut (2015), Presseinformation - Fernbusmarkt wächst weiter, Berlin. [2] IGES-Institut (2014), IGES Kompass Mobilität - Fokus Fernbus, Berlin. [3] Schad, H. und De Tommasi, R. (2010), Mobilitätsmanagement bei kleinen und mittleren Veranstaltungen, ITW Working Paper Mobilität, Luzern. [4] LaValle, S., Hopkins, M., Lesser, E., Shockley, R. und Kruschwitz, N. (2010), Analytics - The new path to value, in: IBM Institute for Business Value (Hrsg. 2010), Research Report (Fall 2010), New York, S. 3-16. [5] Röhling, W. (2004), Abschätzung der Besucherpotenziale, in: Dienel, H.-L. und Schmithals, J. (Hrsg.), Handbuch Eventverkehr - Planung, Gestaltung, Arbeitshilfen, Berlin, S.-96-102. [6] Cyganski, P. und Hass, B. (2007), Potenziale sozialer Netzwerke für Unternehmen, in: Hass, B., Walsh, G. und Kilian, T. (Hrsg.), Neue Perspektiven für Marketing und Medien, Berlin und Heidelberg, S. 101-120. [7] Stanoevska-Slabeva, K. (2008), Web 2.0 - Grundlagen, Auswirkungen und zukünftige Trends, in: Meckel, M. und Stanoevska-Slabeva, K. (Hrsg.), Web 2.0 - Die nächste Generation, Baden-Baden, S. 13-38. [8] BITKOM (2012), Big Data im Praxiseinsatz - Szenarien, Beispiele, Effekte, Berlin. [9] Gartner (2015), Big Data - IT Glossary, http: / / www.gartner.com/ it-glossary/ big-data/ , abgerufen am 23.11.2015. [10] Bartram, P. (2013), The value of data, in: Financial Management, März 2013, S. 26-31. [11] BITKOM (2014), Big Data-Technologien - Wissen für Entscheider, Berlin. [12] Gabriel, R., Gluchowski, P. und Pastwa, A. (2009), Data Warehouse und Data Mining, Witten. Bild 3: Prototypische Anwendung als Ergebnis des-Projekts „SmartTravel“ Salesforce - Cloud Webcrawler Dashboard Profitabilitätsanalyse Ergebnis Datenbank Datenbankintegration Social- Media Beiträge Standort Informationen Konkurrenz Angebot Wetter Log- Dateien Dispodaten • Vorhersage Fahrgäste • Kapazitätsplanung • Kosten- / Erlösrechnung Apache Mahout - Data Mining Apache Hadoop - Plattform verteiltes Rechnen Rechencluster 1 Rechencluster n … Ute david, Dipl.-Vw. Mitglied der Institutsleitung, International Performance Research Institute gGmbH, Stuttgart udavid@ipri-institute.com Goran Sejdić, Dipl.-Kfm. techn. Wissenschaftlicher Mitarbeiter, International Performance Research Institute gGmbH, Stuttgart gsejdic@ipri-institute.com Corinna Fohrholz, Dipl.-Kffr. Wissenschaftliche Mitarbeiterin, Universität Potsdam - Lehrstuhl für Wirtschaftsinformatik und E-Government, Potsdam corinna.fohrholz@wi.uni-potsdam.de Christian Glaschke, Dipl.-Inform. Wissenschaftlicher Mitarbeiter, Universität Potsdam - Lehrstuhl für Wirtschaftsinformatik und E-Government, Potsdam christian.glaschke@wi.uni-potsdam.de