Graphtechnologie am DZD

Datenzugriff und Datenschutz schließen sich nicht aus

< zurück

Seite: 2/2

Anbieter zum Thema

Der Datenschutz in Deutschland stellt die medizinische Forschung generell vor hohe Hürden. Wo sehen Sie hier Möglichkeiten, beide besser zu vereinen?

Preusse: Das ist schwierig zu beantworten. Fakt ist aber, dass weltweit die Studien tendenziell eher größer als kleiner angelegt sind. Das ist auch gut so: Je mehr Probanden zur Verfügung stehen, desto aussagekräftiger sind die Ergebnisse hinterher. Zudem muss sich der enorme Aufwand, der mit solchen Studien einhergeht, auch lohnen.
Aufgrund der vergleichsweise großen rechtlichen und bürokratischen Hürden in Deutschland können Studien hier zu Lande nur schwierig mit diesem Tempo mithalten. Und häufig leidet darunter auch die internationale Zusammenarbeit. Es besteht also durchaus die Gefahr, dass Deutschland in Bezug auf die klinische Forschung sukzessiv den Anschluss an den Rest der Welt verliert.
Auf der anderen Seite tut sich gerade sehr viel, um den Datenzugriff zu verbessern. Es gibt zum Beispiel Projekte von Unikliniken, die den disziplin- und standortübergreifenden Datenaustausch ermöglichen sollen. Wie viele Diabetes-Patienten sind an COVID erkrankt? Und wie viele davon hatten nach X Wochen noch Beschwerden? Solche Anfragen lassen sich zukünftig dann beantworten, ohne dass die identifizierenden Daten bewegt werden müssen.

Vereinfachte Darstellung eines möglichen Knoten-Kanten-Modells im Graphen.(©  Neo4j)
Vereinfachte Darstellung eines möglichen Knoten-Kanten-Modells im Graphen.
(© Neo4j)

Künstliche Intelligenz (KI) birgt für Medizin, Forschung und das ganze Gesundheitswesen enormes Potential. Wird KI auch im DZD Knowledge Graph zum Einsatz kommen?

Preusse: Wenn man so will, finden sich erste Ansätze von KI bereits im Knowledge Graphen. Anwender können über die Graph Data Science Library von Neo4j integrierte Algorithmen nutzen, um beispielsweise Patienten-Cluster automatisch zu erstellen. Für uns ist KI aber vor allem für die Datenprozessierung interessant. Das Konzept „Garbage in, garbage out“ gilt nämlich auch im Zeitalter von KI. Daten müssen im Vorfeld aufgeräumt und normalisiert werden. 80% unserer Datenaufbereitung entfällt so auf Entity Matching.
Wir verbringen also viel Zeit damit, Datensätze aus unterschiedlichen Studien zum Beispiel mit einer einheitliche Namenskonvention zu versehen. Dass Begriffe wie „Diabetes Typ 2“, „Typ 2, Diabetes“ und „T2D“ im Grunde ein und dasselbe sind, war für Maschinen lange sehr schwer zu erkennen. Eine Automatisierung war damit nahezu unmöglich. Large Language Models (LLMs) haben jedoch kein Problem mit solchen impliziten sprachlichen Verbindungen, weil diese in den Milliarden an Parametern als solche auch abgelegt sind. In den nächsten Monaten wollen wir daher testen, wie sich LLMs für die automatisierte Datenaufbereitung im Detail nutzen lässt.

Der Gesprächspartner

Dr. Martin Preusse ist Bioinformatiker und Data Scientist. Nach seiner Promotion an der TU München und einem Postdoktoranden-Aufenthalt am ICB Institute Computational Biology des Helmholtz Zentrum München gründete er das Unternehmen Kaiser & Preusse. Dort entwickelt er gemeinsam mit seinem Team Knowledge Graph-Anwendungen für die medizinische Forschung, Biotechnologie und Pharmazie und unterstützt Unternehmen und Institute bei der Analyse vernetzter Daten. Neben dem Projekt CovidGraph unterstützt Preusse eng das Deutschen Zentrum für Diabetesforschung (DZD) als Head of Data Management.

(ID:49862747)

Jetzt Newsletter abonnieren

Wöchentlich die wichtigsten Infos zur Digitalisierung im Gesundheitswesen

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung