Data Science

Data Science bedeutet für uns die Extraktion von Wissen aus Daten auf Basis statistischer und mathematischer Modelle in engem Austausch mit Ihren Fachabteilungen. Unsere Data Scientisten entwickeln und trainieren Machine Learning Algorithmen, um individuelle Lösungen zu vergangenen, aktuellen und zukünftigen Geschäftsvorgängen zu erarbeiten.

Der Data Scientist ist für uns ein Hybrid aus Programmierer, Statistiker/Mathematiker und einem fachlichen Berater. Gemeinsam mit Ihrem Fachbereich erarbeiten und lösen wir detaillierte Fragestellungen zu Ihrem Geschäftsgebiet. Egal ob einfache CSV Datei, Datenbank oder Big Data Umfeld - wir entwickeln die passenden Algorithmen, um Muster in Ihren Daten zu erkennen und diese sinnvoll zu nutzen. Typische Beispiele für solche Muster sind das Kundenverhalten vor einer Kündigung oder Druckschwankungen bevor eine Maschine kaputt geht.

Dazu verwenden wir mit Hilfe von Programmiersprachen wie Python und R Verfahren aus dem Machine Learning sowie Neuronale Netze. Der typische Arbeitsablauf richtet sich nach dem Cross-Industry Standard Process for Data Mining (CRISP-DM), dessen Phasen sich in der untenstehenden Graphik wiederfinden.

Die Phase des Business Understandings verläuft im engen Austausch mit dem Fachbereich, da die konkrete Aufgabenstellung, die Vorgehensweise und die Ziele des Projekts definiert werden. Im Data Understanding stehen erstmals die Daten im Fokus, die zunächst gesammelt, gesichtet und auf ihre Qualität hin überprüft werden. Mit dem Hintergrund des Business Understandings werden zusätzlich externe Daten (z.B. Wetter, Verkehr, Rohstoffpreise) mit einbezogen, um die Güte der späteren Analysen zu erhöhen. In der darauffolgenden Phase, der Data Preparation, werden die Daten in Hinblick auf in Frage kommende Modelle ausgewählt und zu einem finalen Datensatz aufbereitet. Das Modeling ist das Herzstück des Data Science Projekts, da hier geeignete Verfahren aus dem Machine Learning ausgewählt, trainiert und optimiert werden. In der Evaluation wird das Modell ausgewählt, das die definierte Fragestellung am besten beantwortet. Das Deployment dient als Abschluss, da das Ergebnis präsentiert und das Modell integriert wird.

Wir lesen Ihre Daten zwischen den Zeilen und helfen Ihnen dabei tiefer in Geschäftsprozesse einzutauchen sowie komplexe Zusammenhänge zu identifizieren. Mit Hilfe unserer Verfahren werden Sie nicht nur sehen was passiert ist, sondern verstehen warum es passiert ist und was daraus für die Zukunft abzuleiten ist.


Was steckt in Ihren Daten?

Mit Data Science und der richtigen Rezeptur finden wir es für Sie heraus! Unser CI AlgoLab bietet Ihnen einen kostengünstigen Proof of Concept, um vorhandene Ideen zu testen und Daten auf Zukunftsfähigkeit zu prüfen.

Mehr erfahren



Ihr Ansprechpartner