Die politische Diskussion hat sich schon lange auf die Sozialen Netzwerke ausgeweitet. Sie ermöglichen es jedem, nicht nur an aktuellen politischen Gesprächen mit anderen Personen teilzunehmen, sondern auch direkt auf Aussagen von Politikern und bekannten Personen zu reagieren. Eine hierfür beliebte Plattform ist Twitter. Wir haben uns dazu entschlossen, diese Diskussionen zur kürzlich stattgefundenen Europawahl mitzuschneiden und die Aktivitäten rund um und während der Wahl auszuwerten.
Auf diesem PowerBI Dashboard, kannst du unsere aufbereiteten Ergebnisse sehen und die Daten selbst erforschen:
Die Daten und das Vorgehen
Um Tweets mitzuschneiden bietet Twitter eine API an, über die die aktuellen Tweets zu festgelegten Hashtags oder Accounts live gestreamt werden können. Mit der Python Bibliothek „Tweepy“ und einem API Schlüssel von Twitter konnten wir zu den Hashtags der Europawahl alle betreffenden Tweets sammeln und speichern.
Fest stand, dass nicht nur die Wahl, sondern auch die Phase vor und nach der Wahl berücksichtigt werden soll und als die Hashtags #artikel13 und #niewiederCDU Ende März gerade die Runde machten, war der richtige Zeitpunkt, damit zu beginnen.
Die über die API versendeten Daten enthalten zu jedem Tweet eine Vielzahl an Metadaten im JSON Format. Diese Daten beinhalten offensichtliche Informationen wie den Nutzernamen und den geposteten Text, aber auch tiefergehende Einblicke über welche Plattform der Tweet gepostet, welcher Link geteilt oder - falls eingeschaltet - von wo der Tweet versendet wurde. Um die wirklich interessanten Attribute herauszufiltern und in eine übersichtliche Struktur zu bringen, haben wir in Python die JSON Datensätze aufbereitet und in ein relationales Modell umgewandelt. Bei der Verarbeitung werden auch zusätzliche Attribute hinzugefügt. Zu diesen neuen Attributen gehört beispielsweise, ob der Tweet über einen Partei Account oder einen parteispezifischen Politiker verfasst oder geteilt wurde. Hierbei konnten wir leider nicht alle 41 Parteien berücksichtigen und haben uns auf die bekanntesten beschränkt.
Um die Accounts der jeweiligen Partei zuzuordnen, haben wir die Usernamen überprüft, ob sie den Namen einer der ausgewählten Parteien enthalten. Bei diesem Verfahren mussten jedoch auch einige Accounts aussortiert werden, da sie zwar den Namen einer Partei enthalten aber nicht die Partei repräsentieren. Hierzu gehören beispielsweise Accounts wie „FckAFD“ oder „NiewiederCDU“. Ähnlich wurden auch Informationen über Betriebssystem oder genutzte Schlüsselwörter aus den vorhandenen Informationen herausgearbeitet und in die neue Datenstruktur mit übergeben. Das dadurch entstandene relationale Modell konnte anschließend in PowerBI aufbereitet und visualisiert werden.
Ein Überblick über unser Dashboard
Falls du dich schon motiviert durch das Dashboard geklickt hast, sind dir sicher ein paar Fragen hier und da durch den Kopf geschossen. Ich möchte dir deshalb einen kleinen Überblick über die Funktionen und die Inhalte der einzelnen Seiten geben.
Filter und Elemente
Du kannst mit fast allen Elementen, Zahlen und Grafiken auf der Seite interagieren, um die Daten einzuschränken und abhängige Daten genauer zu betrachten. Klicke z.B. auf einen speziellen Tag oder auf das Feld „Retweet“, um nur Daten zu berücksichtigen, auf die das jeweilige Kriterium zutrifft. Wenn du dabei STRG oder CTRL drückst, kannst du auch mehrere Filter setzen.
Über das Feld rechts oben in der Ecke kannst du alle Daten für die Monate März, April und Juni durchlaufen und die Veränderungen beobachten.
Unten in der Mitte findest du die Pfeile, die dich auf die nächsten Seiten bringen.