arrow arrow--cut calendar callback check chevron chevron--large cross cross--large download filter kununu linkedin magnifier mail marker menu minus Flieger phone play plus quote share xing

Machine Learning für eine gesetzliche Krankenversicherung

Data Science und Machine Learning bieten ein gigantisches Business-Potenzial. Unser Kunde hat daher einen Innovationshub gegründet, der mit vielen jungen Mitarbeiter*innen unter der Betreuung erfahrener Kolleg*innen frischen Wind in die (Digitalisierungs)prozesse des Unternehmens bringen und die Chancen durch Data Science und Machine Learning ergreifen soll. Unser Team hat das Unternehmen auf diesem Weg in verschiedenen Projekten beraten und unterstützt.

Kick-Off mit CRISP-DM

Zu Beginn haben wir gemeinsam mit dem Kunden einige Ideen reflektiert und verprobt, um die besten Use Cases herauszuarbeiten. Dabei haben wir uns am CRISP-DM (Cross Industry Standard Process for Data Mining) orientiert, da dieser Prozess die experimentelle Phase der Machine Learning Modelle gut strukturiert und iterativ umsetzt. Neben der regelmäßigen Prüfung der Datenqualität stand der intensive Austausch mit dem Fachbereich über die Inhalte der Daten und das Ziel des Use Cases im Mittelpunkt.

CRISP-DM

So stellen wir sicher, dass die Modelle gezielt im Kontext des Unternehmens und mit einem besseren Verständnis der Daten umgesetzt werden. Im Anschluss jeder Modelliteration haben wir die Ergebnisse gemeinsam mit dem Kunden reflektiert und Verbesserungsmöglichkeiten für die Modelle eruiert.

Use Case: 360° Rechnungsprüfung

Im ersten Use Case ging es darum, falsche Krankenhausabrechnungen mit Hilfe von Machine Learning zu identifizieren und damit einen ebenso komplexen wie finanziell relevanten Prozess neu zu gestalten. 

Die Abrechnung stationärer Krankenhausaufenthalte erfolgt auf Basis des G-DRG-Systems, einem Katalog aus rund 13.000 Diagnosen und etwa 28.000 Behandlungsprozeduren. Jedes Jahr erhält die Krankenkasse eine hohe sechsstellige Zahl dieser Krankenhausrechnungen, von denen viele sehr umfangreich und kostenintensiv ausfallen. Rund 15 Prozent der eingereichten Krankenhausrechnungen sind fehlerhaft – soweit die Krankenkasse bisher weiß. Die Vermutung: Es sind noch einige mehr. 

Bislang überprüft eine Abteilung der Versicherung die eingehenden Rechnungen stichprobenartig auf Basis eines Regelwerks. Aufgrund von Masse und Komplexität ist der Aufwand für die manuelle Prüfung jedoch sehr hoch.

Krankenkasse Abrechnung Prüfprozess

Darüber hinaus müssen auffällige Rechnungen von einer dritten Instanz geprüft werden: dem MDK (Medizinischer Dienst der Krankenkassen). Er entscheidet, ob der Einspruch der Krankenkasse berechtigt ist und entsprechend Einsparungen möglich sind oder nicht. Bei der Weitergabe von Fällen an den MDK unterliegt die Krankenkasse einer sogenannten Prüfquote: Sie darf je Krankenhaus und Quartal maximal 12,5 (während der Coronapandemie nur fünf) Prozent der Fälle einreichen. Für fälschlicherweise reklamierte Rechnungen fallen zudem Prüfgebühren an. 

Machine Learning soll die Identifikation falsch abgerechneter oder medizinisch nicht notwendiger Behandlungen erleichtern. Das Ziel: fehlerhafte Rechnungen finden, die besonders viel Einsparpotenzial aufweisen und bei deren Reklamation der MDK im Sinne der Krankenkasse entscheidet.

Modellentwicklung für den Prüfprozess

Auf Basis der Rechnungsdaten haben wir einen Prozess entwickelt, der die relevanten Fälle herausfiltert. 

Ausschlaggebend sind die Höhe der möglichen Einsparungen sowie die Wahrscheinlichkeit, dass der Prüfungsverband zugunsten der Krankenkasse entscheidet. Aus diesen beiden Faktoren erstellen wir einen Relevanzscore. So können wir über ein Ranking die Fälle priorisieren, sodass die Krankenkasse die Fälle mit dem höchsten Potenzial zur Prüfung beim MDK einreicht. Geprüfte Fälle fließen über eine Feedbackschleife wieder in neue Modellrechnungen ein. So lernt das Modell ständig dazu.

Data Science Modellentwicklung

Tools und Technik

Der Prozess basiert auf drei verschiedenen Modellen. Für jedes werden die Entscheidungen auf Fallebene mit Hilfe von Techniken der Explainable AI transparent und interpretierbar gemacht. Die Grundlage der Modelle bilden Berechnungen anhand von anonymisierten Daten. Bei der Umsetzung der Artefakte haben wir Python mit den einschlägigen Bibliotheken und Frameworks, unter anderem sklearn und TensorFlow, eingesetzt. Hierbei wurden auch Techniken der Sprachverarbeitung angewendet. In der Operationalisierungsphase haben wir eine Anwendung zur Prädiktion entwickelt, die im Netz der Krankenkasse die datenschutzkonformen Vorhersagen erstellt.

Mehrwert durch Machine Learning

Unser Vorhersagemodell funktioniert: Die fachliche Prüfung ergab eine Verbesserung der Erfolgsquote bei der Vorhersage einsparungsfähiger Rechnungen von rund 45 auf rund 70 Prozent. Das entspricht einem enormen Einsparpotenzial. Ein Vorteil des Modells ist, dass es rein datengetrieben funktioniert und stetig weiter lernt. Je mehr Daten einfließen, desto genauer werden die Vorhersagen. Damit passt es sich besser an das sich ändernde G-DRG-System an und ist einer fachlich getriebenen Verbesserung des Prüfregelwerks klar überlegen. Wie hoch die Einsparungen tatsächlich ausfallen, wird sich im laufenden Betrieb zeigen.

Beratung und Begleitung

Nachdem wir erfolgreich Use Cases mit positiven Auswirkungen für das Unternehmen und dessen Kunden entwickelt hatten, mussten wir diese im Anschluss betriebsfähig umsetzen. Da die meisten Tools im Unternehmen die besonderen Herausforderungen bei der Produktivierung von Machine Learning Modellen nicht lösen können, haben wir gemeinsam mit dem Kunden Anforderungen definiert und eine Toolauswahl verprobt. Die Anforderungen umfassten mehrere Dimensionen, die eine Automatisierung des Trainings und Deployments der Modelle ermöglichen und eine Kollaboration der verschiedenen Rollen unterstützen sollten.

Toolberatung Data Science

Damit der Kunde die definierten Anforderungen verproben konnte, haben wir mehrere Tools vorselektiert und mit den entsprechenden Anbietern Testumgebungen bereitgestellt. Somit konnten alle Anforderungen anhand eines beispielhaften Use Cases geprüft und bewertet werden. Anschließend hatte der Kunde einen guten Überblick über die verfügbaren Tools und konnte sich für ein passendes entscheiden.

Foto von Benedikt Schröter
Benedikt Schröter
Lead Consultant - Data Engineering

Ihr Ansprechpartner

Foto von Benedikt Schröter
Benedikt Schröter
Lead Consultant - Data Engineering
Foto von Benedikt Schröter