arrow arrow--cut calendar callback check chevron chevron--large cross cross--large download filter kununu linkedin magnifier mail marker menu minus Flieger phone play plus quote share

#Europawahl2019

Klick dich auf unserem Dashboard durch fast 1 Millionen Tweets zur Europawahl 2019, die wir lückenlos über 2 Monate gesammelt, analysiert & aufbereitet haben.
Die politische Diskussion hat sich schon lange auf die Sozialen Netzwerke ausgeweitet. Sie ermöglichen es jedem, nicht nur an aktuellen politischen Gesprächen mit anderen Personen teilzunehmen, sondern auch direkt auf Aussagen von Politikern und bekannten Personen zu reagieren. Eine hierfür beliebte Plattform ist Twitter. Wir haben uns dazu entschlossen, diese Diskussionen zur kürzlich stattgefundenen Europawahl mitzuschneiden und die Aktivitäten rund um und während der Wahl auszuwerten.

Auf diesem PowerBI Dashboard, kannst du unsere aufbereiteten Ergebnisse sehen und die Daten selbst erforschen:

Foto von Benedikt Schröter
Benedikt Schröter

Lead Consultant - Data Engineering

Die Daten und das Vorgehen

Um Tweets mitzuschneiden bietet Twitter eine API an, über die die aktuellen Tweets zu festgelegten Hashtags oder Accounts live gestreamt werden können. Mit der Python Bibliothek „Tweepy“ und einem API Schlüssel von Twitter konnten wir zu den Hashtags der Europawahl alle betreffenden Tweets sammeln und speichern.

Fest stand, dass nicht nur die Wahl, sondern auch die Phase vor und nach der Wahl berücksichtigt werden soll und als die Hashtags #artikel13 und #niewiederCDU Ende März gerade die Runde machten, war der richtige Zeitpunkt, damit zu beginnen.

Die über die API versendeten Daten enthalten zu jedem Tweet eine Vielzahl an Metadaten im JSON Format. Diese Daten beinhalten offensichtliche Informationen wie den Nutzernamen und den geposteten Text, aber auch tiefergehende Einblicke über welche Plattform der Tweet gepostet, welcher Link geteilt oder - falls eingeschaltet - von wo der Tweet versendet wurde. Um die wirklich interessanten Attribute herauszufiltern und in eine übersichtliche Struktur zu bringen, haben wir in Python die JSON Datensätze aufbereitet und in ein relationales Modell umgewandelt. Bei der Verarbeitung werden auch zusätzliche Attribute hinzugefügt. Zu diesen neuen Attributen gehört beispielsweise, ob der Tweet über einen Partei Account oder einen parteispezifischen Politiker verfasst oder geteilt wurde. Hierbei konnten wir leider nicht alle 41 Parteien berücksichtigen und haben uns auf die bekanntesten beschränkt. 

Um die Accounts der jeweiligen Partei zuzuordnen, haben wir die Usernamen überprüft, ob sie den Namen einer der ausgewählten Parteien enthalten. Bei diesem Verfahren mussten jedoch auch einige Accounts aussortiert werden, da sie zwar den Namen einer Partei enthalten aber nicht die Partei repräsentieren. Hierzu gehören beispielsweise Accounts wie „FckAFD“ oder „NiewiederCDU“. Ähnlich wurden auch Informationen über Betriebssystem oder genutzte Schlüsselwörter aus den vorhandenen Informationen herausgearbeitet und in die neue Datenstruktur mit übergeben. Das dadurch entstandene relationale Modell konnte anschließend in PowerBI aufbereitet und visualisiert werden.

Ein Überblick über unser Dashboard

Falls du dich schon motiviert durch das Dashboard geklickt hast, sind dir sicher ein paar Fragen hier und da durch den Kopf geschossen. Ich möchte dir deshalb einen kleinen Überblick über die Funktionen und die Inhalte der einzelnen Seiten geben.

Filter und Elemente

Du kannst mit fast allen Elementen, Zahlen und Grafiken auf der Seite interagieren, um die Daten einzuschränken und abhängige Daten genauer zu betrachten. Klicke z.B. auf einen speziellen Tag oder auf das Feld „Retweet“, um nur Daten zu berücksichtigen, auf die das jeweilige Kriterium zutrifft. Wenn du dabei STRG oder CTRL drückst, kannst du auch mehrere Filter setzen. 

Über das Feld rechts oben in der Ecke kannst du alle Daten für die Monate März, April und Juni durchlaufen und die Veränderungen beobachten.

Unten in der Mitte findest du die Pfeile, die dich auf die nächsten Seiten bringen.

Seite 1 – Allgemeiner Überblick

Auf der ersten Seite kannst du einen kleinen Überblick über allgemeine Informationen finden, wie viele Tweets wurden an welchen Tagen gepostet und welche Hashtags oder Phrasen wurden im festgelegten Zeitraum am häufigsten verwendet. Hier fällt der leichte Anstieg der Tweets pro Tag hin zur Wahl auf, welcher sich dann zum Wahltag nochmal vervielfacht. Aber auch wieder ein sehr schneller Abfall nach dem Wahltag. Auffällig ist nach der Wahl, dass hier bereits Hashtags zur Bundestagswahl 2021 unter den Top Hashtags zu finden sind.

Seite 2 – User Aktivitäten

Auf der zweiten Seite ist zu sehen, welche Nutzer die meisten Aktionen auf Twitter durchgeführt und auf welche am meisten reagiert wurde. Ein sehr interessanter Aspekt ist hierbei, aus welcher Quelle heraus die Aktion durchgeführt wurde, wovon sich dann auch das Betriebssystem ableiten lässt. Während die meisten Tweets über Android verfasst oder geteilt wurden sind auch Automatisierungsanwendungen wie „IFTTT“ oder kryptische Quellen wie „Der Gutmenschbot“ über die Domain der Tagesschau. Was allgemein auffällt, ist die Vielzahl an Drittanbieter Anwendungen, die es ermöglichen, mit Twitter zu interagieren.

Seite 3 – Parteien

Auf der dritten Seite sind die Aktivitäten der jeweiligen ausgewählten Parteien aufgeführt. Aufgrund der vielen Retweets hat die AFD die meisten Interaktionen. Die meisten selbst verfassten Tweets haben jedoch die Grünen, dicht gefolgt von den Piraten. Alle anderen haben deutlich weniger Aktivität zum Thema der Europawahl auf Twitter. Wenn man nach einer Partei filtert, kann man sehen, welche Hashtags und Phrasen die jeweilige Partei verwendet hat.

Seite 4 – Links & Emojis

Da Emojis je nach Kontext auch eine starke symbolische Sprache ausdrücken, war es auf jeden Fall interessant, diese aus den einzelnen Tweets herauszufiltern und extra aufzuführen. Genauso spannend sind die geteilten externen Links. Sehr interessant ist, dass beide Youtube Videos des Youtubers „Rezo“ sehr weit oben aufgeführt werden, welche vor der Wahl eine weitreichende Diskussion angestoßen haben. Über die Filterboxen im Kopfbereich kann man auch nach speziellen Parteien filtern und sich ihre geteilten Links und Emojis betrachten.

Seite 5 – Netzwerk-Grafik

Die Netzwerkgrafik bietet einen Einblick in die Interaktionen einer gefilterten Partei. Hierbei werden alle Accounts berücksichtigt, mit denen die Partei Accounts unter den Hashtags der Europawahl interagiert hat. Antwortet oder retweetet ein Partei Account also einen anderen User, wird diese Verbindung hier dargestellt. Leider kann die Visualisierung leistungstechnisch nicht alle 143 Tausend Accounts abbilden, daher haben wir hier die Möglichkeit auf die Parteien beschränkt.

Fazit

Es war eine spannende Erfahrung, über einen so langen Zeitraum Live-Daten zu sammeln und auszuwerten. Auch wenn ein "echter Skandal" aus Daten-Sicht vermutlich spannender gewesen wäre, so konnte man dennoch ganz klar gesellschaftliche Diskussionen wie Artikel 13 oder das Rezo Video in den Daten wiederfinden. Auch die Aktivitäten der Parteien zu vergleichen und herauszufiltern, welche Hashtags verwendet wurden und welche externen Links geteilt wurden, sind sehr spannende Erkenntnisse.  

Viel Spaß noch mit unserem Dashboard und bis zur nächsten Wahl!