arrow arrow--cut calendar callback check chevron chevron--large cross cross--large download filter kununu linkedin magnifier mail marker media-audio media-blog media-video menu minus Flieger phone play plus quote share youtube

Magie mit Methode

Unsere Data Science Vorgehensweise

Unser Anspruch ist hoch. Wir wollen das Beste aus Ihren Daten herausholen und Ihnen ermöglichen, schnell von einer Automatisierung mittels KI zu profitieren. Doch die Qualität einer KI zeigt sich oft erst im Betrieb: Die Zusammensetzung von Daten ändern sich, die Anforderungen wandeln sich mit der Zeit und die KI muss mit anderen Komponenten und Systemen zusammenspielen.

Data Science bei Cologne Intelligence Arbeitsweise

Um jederzeit flexibel auf neue Herausforderungen reagieren zu können, arbeiten wir in einem an CRISP-DM und CRISP-ML(Q) angelehnten Vorgehensmodell. Der Data Science Kreislauf hilft dabei, iterativ das optimale KI-Modell zu entwickeln. Der MLOps Kreislauf gewährleistet den Betrieb und die Stabilität der KI in Produktion. Wurde ein vielversprechendes Modell im Data Science Kreislauf entwickelt, wechseln wir in den MLOps Kreislauf und bringen dieses live. Stellt sich im Betrieb heraus, dass die entwickelte KI Verbesserungspotential birgt, wechseln wir direkt wieder in den Data Science Kreislauf, um das Modell weiter zu optimieren.

Data Science Kreislauf

  1. Business Understanding: Im engen Austausch mit dem Fachbereich konkretisieren wir die Aufgabenstellung und bauen ein tiefes Verständnis des Use-Cases auf.
  2. Data Understanding:  Hier stehen erstmals die Daten im Fokus, die wir zunächst sammeln, analysieren und auf ihre Qualität für den Use-Case hin überprüfen und durch hilfreiche externe Daten (z.B. Wetter, Verkehr, Rohstoffpreise) anreichern.
  3. Data Preparation: Wir bereiten die identifizierten Daten für die AI vor. Hierbei wählen wir relevante Felder aus, erweitern fehlende Werte bestmöglich und erstellen unabhängige Datensätze für die Auswertung.
  4. Modeling: Im Herzstück des Data Science-Projekts wählen wir geeignete Verfahren aus dem Machine Learning aus oder entwickeln ein eigenes Modell. Diese werden dann trainiert und optimiert.
  5. Evaluation: Wir testen das trainierte Modell auf Herz und Nieren. Gemeinsam wählen wir das für die definierte Fragestellung am besten passende Modell aus.

Verbindung

  1. Deployment: Wir bereiten das Modell für eine Operationalisierung und den späteren Betrieb vor. Hierbei unterstützen wir die Bereitstellung auf einem lokalen Server oder in der Cloud.
  2. Zeigt sich im Monitoring oder bei der Wartung, dass das Modell nicht den gewünschten Effekt hat oder bei gewissen Eingaben nicht optimal funktioniert, wechseln wir zur Weiterentwicklung des Modells wieder auf den Data Science Kreislauf.

MLOps Kreislauf

  1. Integrationsphase: Wir entwickeln einen Service, der auf das Modell zugreifen kann und unterstützen die firmeninterne IT dabei, diesen Service in den bestehenden Workflow zu integrieren.
  2. Betrieb: Die spannendste Zeit, denn nun zeigt sich, wie das Modell sich in den Geschäftsprozess oder das Produkt einfügt.
  3. Monitoring: Wir überwachen den Betrieb des Modells, insbesondere die Performance, und analysieren die Qualität der Vorhersagen bzw. den Effekt auf den Workflow.
  4. Wartung: Treten im Betrieb am Service Probleme auf, werden diese direkt adressiert und der Service so schnell wie möglich gewartet, um einen reibungslosen Betrieb zu gewährleisten.

Data Governance

Der Erfolg einer Data Science Initiative steht und fällt mit der Nutzbarkeit und Qualität Ihrer Daten. Wir beraten und unterstützen Ihre Data Governance mit unserem Know-How in Architecture, Data Quality, Metadata Management und Security. 

Foto von Tobias Stumm
Tobias Stumm
Lead Consultant - Data Science

Ihr Ansprechpartner

Foto von Tobias Stumm
Tobias Stumm
Lead Consultant - Data Science
Foto von Tobias Stumm