Forschung mit sensiblen Gesundheitsdaten „Klassische Anonymisierungstechniken sind nicht geeignet“

Von Natalie Ziebolz 5 min Lesedauer

Anbieter zum Thema

Gesundheitsdaten können beispielsweise genutzt werden, um Erkenntnisse über Krankheiten zu erhalten und damit deren Behandlung zu verbessern. Der gesetzliche Rahmen ist bereits geschaffen, doch es fehlt (noch) an geeigneten Anonymisierungstechniken.

Die Bereitstellung von Gesundheitsdaten für die Forschung kann Leben retten. Gleichzeitig hat der Schutz dieser sensiblen Daten höchste Priorität.(Bild:  Feodora – stock.adobe.com)
Die Bereitstellung von Gesundheitsdaten für die Forschung kann Leben retten. Gleichzeitig hat der Schutz dieser sensiblen Daten höchste Priorität.
(Bild: Feodora – stock.adobe.com)

Sowohl das Gesundheitsdatennutzungsgesetz (GDNG) als auch der Europäische Gesundheitsdatenraum (kurz EHDS; European Health Data Space) sehen vor, dass Patientendaten dort für die medizinische Forschung genutzt werden dürfen, wo es von öffentlichem Interesse ist. Die Ergebnisse dieser Forschung sollen anschließend anonymisiert öffentlich gemacht werden. „Aus der Forschungsliteratur wissen wir, dass die Veröffentlichung vieler nicht-anonymisierter Statistiken über korrelierte Patientendatensätze genutzt werden kann, um Informationen über die Patienten zu rekonstruieren“, warnt jedoch Dr. rer. nat. Esfandiar Mohammadi, Professor an der Universität Lübeck und Leiter des vom Bund geförderte Forschungsprojekt AnoMed. Klassische und etablierte Anonymisierungstechniken, die auf Datensatzbereinigung basieren – wie k-Anonymität –, seien daher nicht für eine mehrmalige Nutzung korrelierter Datensätze geeignet. Was es stattdessen brauche, seien moderne Anonymisierungstechniken, die etwa (Epsilon-Delta) Differential Privacy garantieren. So seien auch bei großen Datenmengen die Patientendaten geschützt, selbst wenn korrelierte Datensätze mehrmals genutzt werden.

Zur Erklärung: Epsilon-Delta Differential Privacy (EDDP) bietet starke Datenschutzgarantien, indem es Berechnungen mit kontrolliertem Rauschen versieht, um die Privatsphäre der Teilnehmer zu schützen. Die Schlüsselparameter „Epsilon“ und „Delta“ beziehen sich dabei auf den Grad des Privatsphärenschutzes respektive die Wahrscheinlichkeit von Datenschutzverletzungen. Ein kleinerer Wert von Epsilon bedeutet stärkeren Schutz, während ein kleinerer Wert von Delta eine geringere Wahrscheinlichkeit für Datenschutzverletzungen anzeigt.

Die Bedeutung dieser Verfahren hob auch Christian Zimmermann, IT-Sicherheitsexperte bei Bosch Mobility, beim diesjährigen Kongress „Anonymisierung für eine sichere Datennutzung“ (AnoSiDat) in Lübeck hervor. Die Herausforderung liege schließlich nicht nur in der Handhabung der erfassten Daten, sondern vor allem in deren weiterer Verarbeitung. Als vielversprechenden Ansatz zur Lösung dieser Herausforderungen nannte er während einer Podiumsdiskussion „Differential Privacy“.

„Es ist allerdings noch substanzielle Forschung notwendig, um diese modernen Techniken für alle Anwendungen praktikabel zu gestalten“, so Mohammadi. Die Forschung an modernen Anonymisierungstechniken, die für eine Mehrfachnutzung der gleichen Daten oder korrelierter Daten vorgesehen sind, sei schließlich noch recht jung. „Diese Techniken basieren auf der Aggregierung von Daten von verschiedenen Personen. Aktuell sind diese Techniken nur nützlich für sehr große Datensätze. In den letzten 15 Jahren wurden diese Techniken zwar auch für immer kleinere Datensätze nützlich, allerdings ist noch substanzielle Forschung notwendig, um die Nützlichkeit für Datensätze zu gewährleisten, die so klein sind, wie man sie in mittelgroßen medizinischen Studien vorfindet.“

Das Problem bei Differental Privacy ist aktuell nämlich, dass bei Verwendung zufälligen Rauschens jedes Mal, wenn die gleichen Daten abgefragt werden, der Grad der Anonymisierung reduziert wird. Dies liegt daran, dass sich das Rauschen durch Mittelung herausfiltern lässt, vorausgesetzt man kann genügend Abfragen durchführen.

Forschungsnetzwerk Anonymisierung
Das Projekt

Seit Ende 2022 fördert das BMBF das „Forschungsnetzwerk Anonymisierung für eine sichere Datennutzung“, das in fünf Kompetenzclustern und 17 Projekten Anonymisierungstechnologien entwickelt, um technischen Datenschutz zu verbessern und datenbasierte Innovationen zu ermöglichen. Ziel ist es, personenbezogene Daten rechtskonform zu anonymisieren, um sie für digitale Dienste und Geschäftsmodelle nutzbar zu machen, dabei aber gleichzeitig den Datenschutz zu gewährleisten und die Digitalisierung voranzutreiben. Die Kompetenzcluster umfassen:

  • AnigeD – Rechtskonforme Anonymisierung bei der Kombination von Datensätzen mit Georeferenzierung
  • AnoMed − Anonymisierung für medizinische Anwendungen
  • ANYMOS − Anonymisierung für vernetze Mobilitätssysteme
  • AVATAR − Anonymisierung persönlicher Gesundheitsdaten durch Erzeugung digitaler Avatare in Medizin und Pflege
  • IIP − Intelligente Nutzung verschiedener Verkehrsmittel

Die Forschungsvorhaben sind:

  • AnGer – Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal Tech
  • AnoMoB – Anonymisierte Erfassung und Nutzung von Mobilitäts- und Bewegungsdaten
  • ANONY-MED – Rechtskonforme Nutzung von Gesundheitsdaten durch Anonymisierung
  • ATLAS – Datentreuhänder für anonymisierte Analysen in kommunalen Datenräumen
  • DARIA – Identitätsbetrug und Ausfallrisiko durch datenschutzkonforme Verwertung von Daten minimieren
  • EAsyAnon – Empfehlungs- und Auditsystem zur Anonymisierung
  • explanym – Erklärbare Anonymisierung intermodaler Mobilitätsdaten
  • FIIPS-at-Home – Frühwarn-, Informations- und Angriffserkennungssystem für Smart Home
  • GANGES – Gewährleistung von Anonymitäts-Garantien in Unternehmensanwendungen
  • KI-AIM – KI-basierte Anonymisierung in der Medizin
  • Medinym – KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen
  • NEMO – Nicht-Identifizierbarkeit von Daten aus Elektroenzephalografie für Open Science
  • PATH – Plattform für den Austausch von Gesundheits- und Wellnessdaten
  • PriSyn – Repräsentative, synthetische Gesundheitsdaten mit starken Privatsphärengarantien
  • PrivacyUmbrella – Privatheit von Daten sicherstellen durch umfassende Bereitstellung von Anonymisierungsverfahren
  • SAM-Smart – Sicherheitsassistenzmanager für das Smart Home
  • SynthiClick – Synthetische Datenerzeugung anhand von Nutzungsverhalten im World Wide Web

AnoMed-Cluster treibt Forschung voran

AnoMed, eines von bundesweit fünf Kompetenzclustern für Anonymisierung, setzt genau hier an. „Die Ziele des AnoMed Clusters sind die Erforschung neuartiger ‚Differentially Private Machine Learning‘-Techniken für medizinische Anwendungen sowie die Erforschung der Relevanz von Differential-Privacy-Verfahren für regulatorische Anforderungen“, erklärt Mohammadi. Dabei nutzen die Beteiligten vornehmlich öffentlich verfügbare Datensätze, um potenzielle Risiken aufzuzeigen. So können Anwender besser einschätzen, in welchen Anwendungskontexten herkömmliche Verfahren noch ausreichen und wann zuverlässigere Methoden notwendig sind. Auf diese Weise verhindert AnoMed, dass veraltete Anonymisierungsmaßnahmen unreflektiert in der Praxis bleiben und fördert eine dynamische Weiterentwicklung im Bereich „Datenschutz“.

Ein weiterer Baustein ist der Aufbau einer Wettbewerbsplattform und medizinischer Challenges für Privacy-Forschende. Aktuell befindet sich das Cluster hier in der Implementierungsphase. „Die Fertigstellung ist für das Ende des Projektes Ende 2025 vorgesehen“, so dessen Leiter, Esfandiar Mohammadi. Die Wettbewerbsplattform werde dabei für einen bestehenden Wettbewerb entwickelt, in dem zu Aufgaben aus der medizinischen Informatik – sogenannten Privacy Challenges – laufend neue Anonymisierungstechniken eingereicht werden können. „Diese Einreichungen sollen von der Plattform sowohl auf ihre Güte (‚Wie gut wird die vorgegebene Aufgabe erledigt?’) als auch auf ihre Resistenz gegen aktuell existierende Angriffe (‚Wie gut schützt die Anonymisierungstechnik gegen aktuelle Angriffe?’) untersucht werden. Gleichzeitig soll die Plattform es ermöglichen, neuartige Angriffe sowie auch neue Privacy Challenges einzureichen.“

Jetzt Newsletter abonnieren

Wöchentlich die wichtigsten Infos zur Digitalisierung im Gesundheitswesen

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Bis wann das Forschungscluster Ergebnisse liefern kann, und wann die modernen Anonymisierungstechniken zum Einsatz kommen können, ist jedoch noch unklar. „Ich wage es nicht, die Forschungsergebnisse der Zukunft vorauszusagen. Solche Voraussagen waren in der Vergangenheit oftmals inakkurat. Es ist jedoch klar, dass die Forschung an modernen Anonymisierungstechniken aktuell noch substanzielle Forschung benötigt“, so Mohammadi.

(ID:50102863)