Vom 23. bis 25. April 2025 versammelte sich die deutschsprachige Python und Data Science Community in Darmstadt zur PyCon DE & PyData 2025. Unter dem Motto „Code, Analyze, Innovate“ erwartete die über 1.500 Teilnehmer*innen vor Ort (sowie zahlreiche weitere online) ein vielfältiges Programm mit Workshops, Keynotes und Fachvorträgen. Themenschwerpunkte waren unter anderem Künstliche Intelligenz, Machine Learning, Data Engineering, Webentwicklung, Open-Source-Tools sowie ethische Fragestellungen im Umgang mit Technologie. Wir waren als Silver-Sponsor mit einem siebenköpfigen Team aus Data Science, Data Engineering und Advanced Analytics vor Ort und haben für unseren Blog Eindrücke und Highlights zur Konferenz gesammelt.
Maurice: “Size matters: Inspecting Docker images for Efficiency and Security.” Auf den ersten Blick ein simples Thema, das überraschende Tiefe besitzt. Gleichzeitig wurde das Thema spannend und verständlich aufbereitet. Im Tagesgeschäft sehr verbreitet und einfach anwendbar.
Benedikt: Als Brettspielfan war „Board Games to teach Data Science“ ein erfrischendes Erlebnis, bei dem man reflektieren konnte, wie man Data Science mit Hilfe von Brettspielen vermitteln kann.
David: „The Future of AI: Building the Most Impactful Technology Together“ hat mir vor Augen geführt, weshalb offene Sprachmodelle relevant sind und dass diese den Performance-Gap zu proprietären Lösungen immer schneller schließen können. Vor dem Hintergrund der auf der Konferenz immer wieder angeschnittenen Problematiken mit geschlossenen Systemen (Bias, fehlende Transparenz) sehr erfrischend.
Lars: Der Vortrag „Building a Self-Hosted MLOps Platform with Kubernetes“ war besonders spannend, da der vorgestellte Technologie-Stack aus Feast, MLflow und Ray eine flexible Grundlage für den Aufbau von Machine-Learning-Projekten bietet. Hervorzuheben ist, dass verschiedene Teams damit unabhängig voneinander mit unterschiedlichen ML-Frameworks arbeiten können und zugleich die volle Kontrolle über ihre Pipelines behalten.
Robin: "They are not unit tests: a survey of unit-testing anti-patterns" von Stanislav Zmiev. Das Schreiben von Unit Tests ist gerade im Kontext von Datenpipelines oft schwierig. Durch den Vortrag habe ich ein besseres Gefühl bekommen, welche Tests überhaupt notwendig sind und wie ich sie mit Bibliotheken wie testcontainers und inline-snapshots besser umsetzen kann. Außerdem: "Size matters: Inspecting Docker images for Efficiency and Security" von Irena Grgic. Docker Images nutzen wir im Projekt jeden Tag. Der Vortrag war How-To und Checkliste für eine sichere und effiziente Nutzung zugleich. Viel nützliches Wissen in kurzer Zeit fantastisch präsentiert!
Dennis: „Machine Reasoning and System 2 Thinking“ von Andy Kitchen: Der Talk hat sich nicht, wie viele andere, ein spezifisches fachliches Problem oder Thema ausgesucht, sondern war vielmehr fokussiert auf die Vergangenheit und Zukunft von AI in Bezug auf System 2. In Summe habe ich nochmal einen guten Überblick bekommen und auch hier und da interessante Insights am Rande (die oft komplett themenfremd waren) mitnehmen können. Andy hat sein unglaubliches Wissen in einer sehr charmanten und witzigen Art verpackt.
Przemyslaw: "They are not unit tests: a survey of unit-testing anti-patterns" von Stanislav Zmiev. Unit Test sind im Datenkontext recht komplex. Der Vortrag hat super vermittelt, wie Test geschrieben werden könnten. Außerdem: „Building on-Air Sign with Open-Source“, ein sehr interessanter Vortrag über die Nutzung von Raspberry PI der zeigt, wie IoT Projekte aufgebaut und implementiert werden können mithilfe von Raspberry PI, Apache Kafka, Apache Iceberg, Polaris und Apache Flink.
Robin: Mit am interessantesten sind Storys von echten Projekten, welche Probleme dort aufgetreten sind und wie man sie gelöst hat. Oft sind diese sehr relatable und helfen bei der Ideenfindung bei eigenen Baustellen. Ich versuche in Zukunft mehr von Themen zu teilen in der Hoffnung, dass andere daraus einen Mehrwert ziehen.
Dennis: Tatsächlich war ich bei einem Talk, wo ein Package (Spacy Docling) vorgestellt wurde, das ich im Kundenprojekt direkt verproben kann. Generell würde ich aber sagen, dass der größte Mehrwert die Horizont-Erweiterung ist: Viele neue Insights in Packages, Stories von anderen Menschen und Unternehmen sowie Probleme und deren Lösungen.
David: Die von mostly AI vorgestellte Synthetic Data SDK kann ich unmittelbar im Projektkontext gebrauchen, um sicher und einfach brauchbare Testdaten erstellen zu können.
Benedikt: Wie wichtig die Open Source Community für unsere tägliche Arbeit ist!
Lars: Mehr Vielseitigkeit im Einsatz von Tools (insbesondere Open Source) im Bereich Machine Learning und Infrastruktur.
Maurice: Verbesserung der Sichtbarkeit durch Einbringung in Open Source Community. Mehr Bewusstsein für potenziell spannende Vorträge aus unserem Tagesgeschäft geschaffen.
Womit sich unsere Konferenzbesucher in ihrer Rolle bei Cologne Intelligence befassen? Hier geht's zum Portfolio:
Dennis: Es war interessant zu sehen, dass auch andere Menschen, sei es aus der Competition oder aus ganz anderen Feldern, ähnliche Problem wie wir/ich haben. Des Weiteren fand ich die lockere Atmosphäre in vielen Talks (u. A. Lightning Talks) sehr angenehm.
Maurice: Die sehr angenehme Atmosphäre: Viele Leute, die dasselbe machen wie wir, kombiniert mit spannenden Vorträgen aus diversen Anwendungsbereichen für Python.
David: Große Breite von Formaten und Themen. Von Research über Anwendung bis hin zu spontanen und mit Augenzwinkern versehenen Lightning Talks.
Robin: Interessante Anregungen zu den Themen Open Source vs. Closed Source, z.B. bei MLOps Platformen. Auch im großen Stil hat die Arbeit mit Daten dieselben Probleme. Beispiel: Verschiedene Datentypen für dieselbe Spalte aus unterschiedlichen Datenquellen im Lakehouse der Schwarz Gruppe.
Benedikt: Die vielen Menschen und Ausstellenden.
Lars: Der Austausch mit Menschen, die gleiche Interessen haben.
Przemyslaw: Es war interessant zu sehen, was andere Menschen in derselben Branch machen und mit welchen Themen sie sich beschäftigen.
Maurice:
David: Auch an den langen Konferenztagen Bewegung nicht vergessen ;) Zu Fuß vom Hotel zur Konferenz ist ein guter Start in den Tag.
Lars: Tauscht euch mit den Besuchern und Ausstellern aus und probiert Sachen, die ihr noch nicht kennt.
Dennis: Ganz wichtig: Vorher nach Themen UND Vortragenden googlen und einen Plan machen (viele Talks waren zwar thematisch interessant aber stilistisch nicht ertragbar). Pausen sind gut! Ich habe häufig am Nachmittag einen Slot ausgesetzt, um mein Gehirn ein wenig zu entspannen :D
Robin: Vorher überlegen wo man hin möchte. Pause machen ist ok, man kann auch mal einen Slot auslassen. Non-Stop Input war phasenweise sehr anstrengend. Abends ein bisschen runterkommen, bevor man aufs Zimmer geht, z. B. ne Runde in die Lounge oder ins Gym.
Przemyslaw: Man sollte sich Zeit nehmen zu schauen, welche Themen einen interessieren. Notizen sind gut, nach zwei Wochen kann man sich ggfs. nicht mehr an alles erinnern.
Benedikt: Auch wenn das Angebot sehr groß ist, sollte man sich davon nicht abschrecken lassen, über das Online Portal kann noch viel nachgeschaut werden.