Pflegebedürftige Patienten müssen zeitnah nach ihrer Entlassung aus dem Krankenhaus in den richtigen Pflegegrad eingestuft werden. Die Aufgabe der initialen Einschätzung des Pflegegrads übernimmt der Medizinische Dienst (MD) durch ein Gutachten in Papierform. Im Rahmen des ‚Healthcare Hackathon Bayern‘ entwickelte Arana AI auf künstlicher Intelligenz (KI) basierende Ansätze für die Prüfung und Bewertung der Plausibilität der initialen Einschätzung. Diese sichern in der Umsetzung eine verbesserte Effizienz und höhere Genauigkeit der Prozesse, bessere Patientenergebnisse sowie niedrigere Kosten.
‚Healthcare Hackathon Bayern‘: Technische Expertise für die Herausforderungen des Praxisalltags
Als noch junges Start-up beschäftigt sich Arana AI damit, Prozesse in Medizin und Gesundheit mit einer KI-gestützten Software ganzheitlich und effektiv zu verbessern. Dementsprechend bot uns der ‚Healthcare Hackathon Bayern‘ die Möglichkeit, unsere Erfahrungen und technische Expertise an einem praxisorientierten Beispiel einzubringen. Der Fokus lag hierbei auf der Frage, wie der Prozess der Erstellung des initialen Gutachtens pflegebedürftiger Menschen in den richtigen Pflegegrad durch den Einsatz von Software und KI optimiert werden kann. Zudem sollten Fehleinschätzungen reduziert und Fehler in Datenerhebungen minimiert werden.
Software- und KI-gestützte Lösung für Prozesse in Papierform entwickeln
Gemeinsam mit anderen Hackern machte sich Arana AI an die Herausforderung, aus in Papierform vorliegenden Dokumenten eine qualifiziertere und vor allem softwaregestützte Einschätzung zu generieren.
Ausgangspunkt war die aktuelle Vorgehensweise. Der MD erhält nach dem Krankenhausaufenthalt per Fax ein Papierformular des Sozialdiensts. Dieses enthält Diagnosen und Einschätzungen der ÄrztInnen. Es ist die Basis für das initiale Gutachten des MD, welches dieser nach der Entlassung pflegebedürftiger Menschen aus dem Krankenhaus zeitnah erstellen muss. Dieses ist entscheidend für die adäquate Pflege, bis das endgültige Pflegegutachten der Pflegekasse vorliegt.
Wir haben festgestellt, dass in diesem Prozess zahlreiche Probleme und Risiken liegen, die minimiert werden können:
Fehlerpotenzial beim Ausfüllen der Dokumente Das medizinische Fachpersonal füllt die Dokumente im Krankenhaus am Krankenbett und mit dem Patienten aus. Es steht häufig unter Zeitdruck, wurde eventuell erst vor kurzem angelernt oder sieht sich auch noch mit einer Sprachbarriere konfrontiert. Dadurch können Fehler in der Ersteinschätzung entstehen, die ohne direkten Patientenkontakt auf den ersten Blick nur sehr schwer sichtbar sind und nur durch eingehende Prüfung auffallen.
Manuelle Prüfungen der Formulare kosten Zeit Per Hand ausgefüllte und per Fax versandte Formulare sind noch nicht maschinenlesbar. Sie müssen einzeln auf Fehler oder Implausibilitäten geprüft werden. Große Mengen an Dokumenten oder auch ein zunehmender Personalmangel durch Renteneintritt ohne Nachbesetzung sowie die allgemeine Arbeitsmarktsituation führen dazu, dass ein großer Druck auf GutachterInnen entsteht und Verzögerungen in der Bearbeitung die Folge sind.
Prüfprozesse als Flaschenhals Papierbasierte Prüfprozesse sind ein Flaschenhals. Sie können dazu führen, dass Datenquellen, wie ausgefüllte Formulare, nur stichprobenartig geprüft werden. Mangelhafte Prüfprozesse führen zu Stress, reduzierter Qualität und wirtschaftlichen Einbußen. Um die Prüfenden zu entlasten müssen skalierbare Lösungen erarbeitet werden, welche qualitativ hochwertige Einschätzungen schon bei Start des Prüfprozesses zur Verfügung stehen.
GutachterInnen entlasten und Plausibilitätsbewertung verbessern
Im Rahmen des ‚Healthcare Hackathon Bayern‘ wurden für die Entwicklung einer Software- und KI-gestützten Lösung für einen Prozess in Papierform drei Teams gebildet. Arana AI war Teil des dritten Teams.
Team 1 ‚Ausgefüllte Formulare digitalisieren‘:
Um die Dokumente weiterverarbeiten zu können, müssen diese maschinenlesbar sein. Das Team hatte die Aufgabe herauszuarbeiten, wie ein eingescanntes Papierdokument in ein maschinenlesbares JSON-Format umgewandelt und für weitere Schritte verwendet werden kann.
Team 2 ‚Bestimmung des Pflegegrades‘:
Um künftig schneller eine Ersteinschätzung vornehmen zu können, sollte eine KI-gestützte Einschätzung des Pflegegrad vorgenommen werden.
Team 3 ‚Prüfung des Formulars und der Einschätzung aus Schritt 2 auf Plausibilität‘:
Im Arana AI-Team galt es herauszuarbeiten, wie die GutachterInnen entlastet werden können. Hierbei sollen sie Hinweise auf mögliche Implausibilitäten im ausgefüllten Formular erhalten, die eine Plausibilitätsbewertung des im Schritt 2 generierten Pflegegrads verbessert.
Plausibilitätsprüfung mithilfe von Deterministik, Sprachmodell und der ‚Retrieval-Augmented Generation‘
Für die Lösung unserer Aufgabe setzen wir die übliche ‚Top-To-Bottom‘-Vorgehensweise einer Dokumentenprüfung an.
Soll eine ExpertIn eine Einschätzung einer anderen medizinischen Fachkraft bewerten, liest diese im Allgemeinen die vorliegenden Informationen von oben bis unten durch. Dabei überfliegt sie ‚unwichtige‘ Aspekte und stellt enthaltene Informationen in Relation zueinander. Passen Informationen nicht zusammen, entsprechen sie nicht dem Fachwissen oder der Richtlinie, wird eine ExpertIn stutzig. Üblicherweise wird eine Implausibilität dann anhand von Zitaten aus dem Text und Fachdokumentation oder Richtlinien belegt.
Für eine Plausibilitätsprüfung haben wir deterministische Aspekte, Sprachmodelle (LLMs) und ‚Retrieval-Augmented Generation‘ (RAG) zugrunde gelegt.
Fokus unserer deterministischen Überprüfung lag vor allem auf Fragen zum korrekten und vollumfänglichen Ausfüllen von Pflichtfeldern sowie dem richtigen Ausfüllen der Unterschriftsfelder im Formular. Zur Verifizierung möglicher Kombinationen von Feldern und der plausiblen Überprüfung der vorgenommenen Angaben bietet sich die Likert-Skala (https://de.wikipedia.org/wiki/Likert-Skala) an. Diese wird angewandt, um insbesondere Meinungen, Einstellungen oder subjektiven Einschätzungen zu erfassen. Dabei drücken Befragte ihre Zustimmung oder Ablehnung zu einer Aussage auf einer mehrstufigen Skala aus, beispielsweise von "stimme voll zu" bis "stimme überhaupt nicht zu". Mittels einer numerischen Codierung entsteht dann aus subjektiven Einschätzungen eine quantitative Analyse und kontextbasierte Logikprüfung, beispielsweise für das Aktivitätslevels eines Patienten. Auf Basis der deterministisch verifizierten Angaben können dann KI-gestützte Prozesse zur Erkennung von Anomalien vorgenommen werden.
So können große Sprachmodelle (LLMs) helfen, Daten in Prozessen besser zu strukturieren und komplexe Sachverhalte zu bearbeiten. Optimiert werden kann dies mithilfe der Retrieval-Augmented Generation‘ (RAG). Durch diese Technik können relevante Zusatzinformationen, beispielsweise aus Richtlinien, gezielt zur Auswertung von Gutachten oder der Erklärung von Fachbegriffen hinzugefügt werden. Dadurch wird vermieden, dass komplette Richtlinien in Anfragen einbezogen werden müssen, was oft die Systemgrenzen sprengt oder die Kosten erheblich erhöht. Durch die Kombination eines LLMs mit Datenbanken oder Wissensbanken kann ein Sprachmodell gezielt auf strukturiertes Wissen zugreifen und dieses für eine verbesserte und kontextuell angepasste Antwort verwenden. Wie man diese Tools im Genauen einsetzen kann, werden in wir den folgenden Blogbeiträgen vorstellen.
Zahlreiche Vorteile für Anbieter und Patienten
Natürlich ist das Design einer Software- und KI-gestützten-System auf Basis der ‚Top-To-Bottom‘-Vorgehensweise ein sehr diffiziler Prozess. Es ist notwendig, die gesamte Aufgabe exakt zu definieren und in den nächsten Schritten in kleinere Abschnitte zu unterteilen. Um in jedem Schritt auf fundierte Daten zurückgreifen zu können, sollte eine Übersicht verfügbarer Datenquellen erstellt werden.
Beispielsweise Dokumente mit Richtlinien oder Fallbeispielen. Auf Basis einer genauen Erörterung des Arbeitsablaufes können dann einzelne Abschnitte definiert werden, welche eine Teilautomatisierung durch die KI ermöglichen und damit die Arbeitskräfte entlasten.
Unser Lösungsvorschlag, bietet mehrere entscheidende Vorteile, die sich positiv auf den Arbeitsablauf des MD und letztendlich auf die PatientInnen auswirken:
Verbesserte Effizienz Durch den Einsatz von Plausibilitätsprüfungen werden GutachterInnen erheblich entlastet. Eine automatisierte Vorprüfung von Formularen reduziert den manuellen Aufwand und beschleunigt den gesamten Prozess der Gutachtenerstellung. Neue GutachterInnen können schneller eingearbeitet werden, da sie durch das System unterstützt werden und Fehler leichter erkennen können.
Erhöhte Genauigkeit Die Kombination aus deterministischen Prüfungen und KI-gestützter Analyse sorgt für ein standardisiertes Prüfverfahren. Dies ergänzt die individuelle Bewertung der GutachterInnen und minimiert menschliche Fehler. Die Qualität der Gutachten wird dadurch erheblich gesteigert, was zu zuverlässigeren Einschätzungen führt.
Kosteneinsparungen Durch die Effizienzsteigerung und die Reduzierung von Fehlern können langfristig Kosten eingespart werden. Ressourcen werden optimal genutzt und der Bedarf an Nachbesserungen oder erneuten Bewertungen sinkt.
Bessere Patientenergebnisse Schnellere und genauere Einschätzungen des Pflegebedarfs ermöglichen es, zeitnah die passende Unterstützung für PatientInnen bereitzustellen. Dies trägt zu einer verbesserten Versorgung und höheren Zufriedenheit der Betroffenen bei.
Zukunftsaussichten und Chancen des Modellansatz für Plausibilität
Der Einsatz von KI-Technologien eröffnet neue Möglichkeiten in der Medizintechnik und im Gesundheitswesen. Unser beim ‚Healthcare Hackathon Bayern‘ erarbeiteter Plausibilitätsansatz könnte als Modell für zukünftige Entwicklungen bei der Erstellung von Gutachten, im Bereich der Fallprüfung und darüber hinaus dienen. Beispielsweise könnte durch die Implementierung spezifischer Nutzerprofile die Ausgabe des Systems an die individuellen Bedürfnisse und den Erfahrungsstand der AnwenderInnen angepasst werden. Auch könnten detailliertere Begründungen für potenzielle Fehler bereitgestellt werden, um weniger erfahrene GutachterInnen besser zu unterstützen.
Darüber hinaus lässt sich das erarbeitete Konzept einfach auf andere Bereiche im Gesundheitswesen übertragen. Durch eine kontinuierliche Innovation könnten zahlreiche Prozesse optimiert und an die sich verändernden Anforderungen des Gesundheitswesens angepasst werden. Auch könnten ähnliche Methoden genutzt werden, um verschiedene Formulartypen und Bewertungsinstrumente zu prüfen und zu optimieren. Darüber hinaus wäre der Einsatz bei einer Reihe weiterer Anwendungen möglich, unter anderem bei der Generierung von Textvorschlägen aus gegebenen (Patienten-)Daten, der Unterstützung in der Informationsfindung in großen Dokumenten oder Datenbanken sowie der Unterstützung der Patienten über den Krankenhausbesuch hinaus, indem beispielsweise Rückfragen mithilfe der vorhandenen Daten intelligent beantwortet werden.
Hohes Potenzial, um Arbeitsabläufe in Medizin und Gesundheit zu optimieren
Die Teilnahme am ‚Healthcare Hackathon Bayern‘ ermöglichte es uns, eine reale Herausforderung im Gesundheitswesen anzugehen: die effiziente und genaue Einschätzung von Pflegegraden nach der Entlassung aus dem Krankenhaus. Durch unsere innovative Lösung, die deterministische Prüfungen mit KI und LLMs kombiniert, konnten wir eine Methode entwickeln, die den MD entlastet und die Qualität der Gutachten verbessert.
Unsere Erfahrungen zeigen, dass ähnliche Herausforderungen mit diesen Technologien effektiv adressiert werden können. Die Anwendung von KI und strukturierten Prüfprozessen bietet ein enormes Potenzial, um Arbeitsabläufe im medizinischen Bereich zu optimieren und Fehlerquellen zu minimieren.
Mit fortlaufender Entwicklung von KI-Anwendungen im Gesundheitsbereich wollen wir einen innovativen und positiven Beitrag zur Entlastung des Personals beitragen und eine bessere Versorgung der Patienten ermöglichen. Unser Alleinstellungsmerkmal, die Kombination aus technischem Know-how und praktischer Erfahrung in der Gesundheitsbranche, ermöglicht es uns, effektive KI-Anwendungen zu implementieren, die Probleme ganzheitlich lösen.