Bikesharing - eine Geodatenanalyse von Nextbike in Köln

Das Konzept der offenen Daten ist ein sehr spannender Bereich, der vielen Unternehmen und auch Städten einen großen Mehrwert bieten kann, wenn es richtig eingesetzt wird. Es bietet eine vielfältige Datengrundlage für statistische Auswertungen und Machine Learning Verfahren.

Seit längerem bieten Städte, Bundesländer, Behörden und auch Deutschland Portale an, auf denen sie unter dem OpenData Konzept Datensätze und API-Schnittstellen zu vielen verschiedenen Themenbereichen bereitstellen. Auch die Stadt Köln stellt eins dieser Portale bereit (OffeneDaten-Köln). Unter diesen Daten findet sich auch eine API, welche es jedem ermöglicht, die Geodaten der KVB-Bikesharing Fahrräder der Firma Nextbike zu erhalten (KVB-Räder API).   

Wie können diese Daten für die Stadt Köln genutzt werden?
Wir haben die Bikesharing-Daten gesammelt und ausgewertet. Den Code dazu könnt ihr auf Github finden: GitHub

Umsetzung

Bei der Anfrage der offenen Daten erhalten wir den Standort jedes abgestellten Fahrrades. Die Standorte werden nicht geteilt, wenn das Fahrrad in Bewegung ist bzw. genutzt wird. Unter Betrachtung eines ganzen Tages kann man somit, für jedes Fahrrad auswerten, wann es in Bewegung war und übergreifend den Start- und Endstandort eines Fahrrades bei umgesetzter Fahrt bestimmen.

Mit Hilfe der Python Bibliothek OSMnx (https://github.com/gboeing/osmnx) können wir auf die API von OpenStreetMap (https://www.openstreetmap.de/) zugreifen und den idealen Weg zwischen beiden Geopunkten errechnen. Hierbei greift OSMnx nicht nur auf das Straßennetz zu, sondern kann auch auf die in OpenStreetMap dokumentierten, für Fahrräder zugängliche Wege nutzen. Anschließend können wir uns über die Bibliothek die Karte von Köln und den optimalen Weg zwischen beiden Punkten ausgeben lassen.

Hierbei können wir zwar nicht den genauen Weg des Radfahrers analysieren, jedoch die für den Fahrradfahrer bestmögliche und damit wahrscheinlichste Fahrrad-Route annehmen.

Fragt man die öffentliche Nextbike-API über einen längeren Zeitraum ab und wiederholt die Umrechnung in die entsprechenden Routen, erhält man eine spannende Möglichkeit, die Daten auszuwerten. Unter diesem Aspekt kann man beispielsweise die Visualisierung aller Routen an einem Tag betrachten:

Zusätzlich können wir diese Routen zeitlich clustern und in einer Heatmap visualisieren, um die Nutzung unter der zeitlichen Dimension zu betrachten:

Mit den Metadaten, die wir von OSMnx und OpenStreetMap erhalten, können wir uns auch die befahrenen Straßen einer Route herausgeben lassen. Dies ermöglicht eine Analyse der meist genutzten Straßen in Köln über den Tag hinweg.

Fazit

Wir können also nur durch den Abruf der aktuellen Geodaten der Fahrräder und durch Hinzuziehen externer Bibliotheken und Karten eine vielschichtige Analysemöglichkeit schaffen, indem wir über den Tellerrand der einzelnen Daten hinaus Zusammenhänge bilden. Aufbauend auf die reine Statistik und dem Einsatz von Machine Learning könnte dieser Ansatz der OpenData-Analyse auch einen spannenden Themenhorizont bieten, mit dem Städte, Bundesländer und Unternehmen einen Mehrwert für sich und die Gesellschaft schaffen können.