KI auf Bildungsreise

by | Apr 2, 2024

Anhoren

Teilen

 

Am Ende des Forschungsprojekts dAIbetes steht idealerweise ein Medizingeräteprodukt. Bis dahin schicken die Forscher der Uni Hamburg ihre KI auf Bildungsreise. Was sich hinter diesem „föderierten Lernen“ verbirgt, erklärt Projektkoordinator Prof. Jan Baumbach.

 

Eine föderierte Gesundheitsdatenplattform mit den ersten international trainierten digitalen Zwillingsmodellen für eine personalisierte Vorhersage von Behandlungsergebnissen bei Typ-2-Diabetes – das ist das Ziel von „dAIbetes“. Das Forschungsprojekt, an dem ein internationales Konsortium arbeitet, ist Anfang 2024 gestartet und wird vom Institute for Computational Systems Biology der Universität Hamburg koordiniert. dAIbetes führt die Daten von rund 800.000 Typ-2-Diabetes-Patienten aus sieben Ländern und vier weltweit verteilten Kohorten zusammen, sodass die KI in diesem spezialisierten Datenbanknetzwerk anhand prognostischer digitaler Zwillingsmodelle trainiert werden kann. HealthCareTimes sprach mit Bioinformatiker Prof. Dr. Jan Baumbach, der auch die Gesamtkoordination des internationalen Projekts innehat.

Herr Prof. Baumbach, Ihr Forschungsprojekt dAIbetes konzentriert sich auf Typ-2-Diabetes. Über den Bedarf an wirkungsvollen Therapien müssen wir uns bei der Volkskrankheit sicher nicht unterhalten. Aber welchen Mehrwert können digitale Zwillinge, kann die KI hierzu beitragen?

Zunächst vielleicht einmal eine kurze Definition, weil digitale Zwillinge doch gerne unterschiedlich umrissen werden: Letztendlich handelt es sich um eine KI-Technologie, die wir als Menge definieren, die eine Person selbst oder jemand anderes über sich, respektive diese Person sammeln kann. Das Resultat ist eine Art digitales Spiegelbild oder eben der digitale Zwilling. Anfangen kann man mit diesem „Abbild“ immer dann etwas, wenn prognostische Modelle aus diesen Daten etwas lernen können. Nun sind die großen Volkskrankheiten immer komplexe systemische Erkrankungen und wir in der Bioinformatik schauen dabei gerne auf Marker. Heißt: Patienten mit einer der bekannten Volkskrankheiten lassen sich in verschiedene Subtypen klassifizieren. Wir wissen nur nicht immer wie. Und genau daran arbeiten wir – unter anderem auch im Projekt dAIbetes.

Wenn ich das noch mal zusammenfassen darf: Typ-2-Diabetes ist nicht gleich Typ-2-Diabetes. Es gibt also unterschiedliche Möglichkeiten, die Patienten zu behandeln. Und der digitale Zwilling soll Aufschluss über das Wie geben…

Ganz genau. Patienten mit chronischen Erkrankungen haben oft nicht nur einen langen Leidensweg hinter sich, sondern auch viele Behandlungsoptionen. Dabei gibt es wenig Ansätze für Ärzte, den richtigen Weg für einen einzelnen Patienten auszuwählen, geschweige denn den Therapieerfolg vorherzusagen. Es ist vielmehr eine Art „Trail and Error“ weshalb Medikamente oft gewechselt werden. Im Fall von Typ-2-Diabetes kommt noch hinzu, dass der „Erfolgsmarker“ für die Wirksamkeit eines Therapieansatzes, das glykierte Hämoglobin (HbA1c), relativ langsam reagiert. Wenn ich als Arzt also einen Patienten einstellte, sehe ich erst in ein paar Monaten, wie die Therapie anschlägt – zumal auch der Lebenswandel hier extrem mit reinspielt. Kurzum: Genau diese Dinge wollen wir anhand von Daten vorhersagen können.

Welche Daten braucht das Forschungsprojekt dafür?

Per Definition des digitalen Zwillings alle zur Verfügung stehenden Daten – also von Wearables, aus Fragebögen, medizinischen Behandlungen, aus der elektronischen Patientenakte. Für verlässliche Vorhersagen brauchen wir sehr schnell sehr große Datenmengen.

Wie schwer ist es, diese Menge an Daten zu bekommen?

Die Menge an sich ist weniger das Problem, sondern vielmehr die Tatsache, dass wir es mit multimodalen Daten zu tun haben, die schwer zu integrieren sind, weil es keine guten Standards gibt. Es gibt zwar in verschiedenen Ländern sogenannte Diabetes-Register, in denen Patienten erfasst werden, allerdings ist schon hier die Kompatibilität nicht besonders hoch – und diese Register sind verhältnismäßig gut standardisiert. Und wenn es dennoch gelingt, die Daten zu integrieren, gibt es allerspätestens dann ein Problem mit dem Datenschutz.

Wird die „Datenschutz-Problematik“ nicht künftig mit dem European Health Data Space, dem EHDS, gelöst?

Möchte man meinen. Das geht aber alleine schon deshalb nicht, weil die Patienten damals, als die Register aufgebaut wurden, nicht zugestimmt haben, dass ihre Daten irgendwo in Europa von irgendwem für Forschungszwecke verwenden werden dürfen. Das ist ein generelles Problem in der KI-gestützten Gesundheitsbranche, da bisher immer die Prämisse galt, dass die Daten zentral vorliegen müssen, damit die KI trainiert werden kann.

Wie lässt sich das Problem dann lösen?

Mit zwei verschiedenen Ansätzen: Entweder wird der Datenschutz aufgeweicht, indem ein neuer rechtlicher Rahmen geschaffen wird – das ist, was Länder wie Deutschland mit der elektronischen Patientenakte oder die EU mit dem EHDS machen. Aus unserer Sicht ist jedoch ein Ansatz besser, für den die Daten nicht zentral an einem Ort liegen müssen. Das ist der Kern unseres Forschungsprojekts dAIbetes: Federated Learning.

Heißt das, Sie schicken Ihre KI auf eine Art „Bildungsreise“ überall dorthin, wo Daten über Typ-2-Diabetes-Patienten vorhanden sind?

Richtig. Im Fall von dAIbetes verbleiben die Daten lokal in den einzelnen Registern und dennoch lässt sich die KI für die benötigten Vorhersagen trainieren. Vorstellen muss man sich das so: Eine kleine KI wird an einem Standort angelernt und wenn sie ihre Aufgabe grundsätzlich verstanden hat, wird sie dahin geschickt, wo die Daten sind und nicht umgekehrt. Was „reist“ sind quasi die Modellparameter der KI. Die Technologie dafür haben wir bereits vor rund sieben Jahren angefangen zu entwickeln – auch damals schon im Rahmen eines EU-Projekts namens „FeatureCloud“. Darauf bauen wir nun auf. Unser langfristiges Ziel über dAIbetes hinaus ist Federated Edge Learning, so dass die Daten also wirklich auf dem Smartphone der Patienten verbleiben und bei Bedarf selektiv geteilt werden können.

Edge als dezentrale Datenverwaltung bewusst als Gegenentwurf zu Initiativen wie der ePA oder dem EHDS?

Solche Initiativen sind schon wichtig, um überhaupt erst einmal Rahmenbedingungen zu schaffen und medizinische Daten für Forschung und Entwicklung nutzbar zu machen. Gleichzeitig gilt es aber auch, technologische Rahmenbedingungen zu schaffen, die es ermöglichen, auch dezentral die gleiche Daten- und Vorhersagegüte oder vielleicht auch KI-Qualität zu erreichen. Aus unserer Sicht ist das deshalb so wichtig, weil es den Datenschutz langfristig auf einem hohen Niveau hält und einen Missbrauch durch Big Data massiv erschwert, wie wir ihn in autokratischen Ländern in Ansätzen bereits jetzt sehen können. Man stelle sich vor, Adolf Hitler hätte Zugang zu einer Gendatenbank gehabt. Anfang der 1920er vielleicht noch kein großes Problem, knapp 20 Jahre später eine absolute Katastrophe.

Noch einmal zurück zu dAIbetes: Gibt es schon erste Erkenntnisse aus dem Forschungsprojekt?

Nein, hier sind wir erst gestartet und sind gerade dabei, die Daten zu integrieren, heißt konkret, wir machen die Daten der verschiedenen Register kompatibel. Mit wirklich konkreten Ergebnissen rechnen wir in 1,5 bis zwei Jahren. Bis zu einer potenziellen Zulassung – im Idealfall steht am Ende ein Medizingeräteprodukt – kann es sogar noch länger dauern. Die Europäische Arzneimittelagentur EMA unterstützt KI-getriebene Projekte zwar, dennoch sind die Anforderungen hoch und auch unsere Ergebnisse müssen sich in klinischen Studien erst einmal beweisen.

  

Prof. Dr. Jan Baumbach leitet seit 2021 das Institute for Computational Systems Biology an der Universität Hamburg, sowie seit 2012 in Teilzeit die Gruppe Computational BioMedicine an der University of Southern Denmark. Prof. Baumbach war zuvor unter anderem Lehrstuhlinhaber für Experimentelle Bioinformatik an der Technischen Universität München, Nachwuchsgruppenleiter am Max-Planck-Institut für Informatik und Postdoktorand an der University of California in Berkeley in der Algorithmengruppe von Richard Karp.

 

Das könnte Sie auch interessieren

Bosch schließt sich mit R-Biopharm zusammen

150 Millionen Euro wollen beide Unternehmen in die Molekulardiagnostik stecken – unter anderem in die Entwicklung neuer PCR-Tests für multiresistente gramnegative Backterien.

vdek veröffentlicht Basisdaten 2024

Zum 28. Mal veröffentlicht der Verband der Ersatzkassen die Basisdaten des Gesundheitswesens. Zentrale Erkenntnis: Die Leistungsausgaben sind seit Jahren im Aufwärtstrend.

Brexitnachwehen führen zu Medikamentenknappheit

Eine Studie des britischen Think-Tanks Nuffield Trust zeigt: Großbritannien und die Europäische Union haben immer häufiger mit Medikamentenengpässen zu kämpfen – eine Situation, die der Brexit deutlich verschärft hat.

Eine Studie des britischen Think-Tanks Nuffield Trust zeigt: Großbritannien und die Europäische Union haben immer häufiger mit Medikamentenengpässen zu kämpfen – eine Situation, die der Brexit deutlich verschärft hat.