Interview mit Dr. Eike Dazert zum Data-Anonymization-Projekt AVATAR „Anonyme Datensätze unterliegen nicht mehr der DSGVO“

Das Gespräch führte Natalie Ziebolz 6 min Lesedauer

Anbieter zum Thema

„Anonymisierung ist cleverer Datenschutz“: diesen Leitsatz hat sich das Forschungsnetzwerk Anonymisierung auf die Fahnen oder vielmehr auf die Website geschrieben. Eine der 17 Initiativen für eine Privatsphäre-freundliche und sichere Datennutzung ist das Projekt „AVATAR“. Was sich dahinter verbirgt, hat Healthcare-Digital mit der Verbundkoordinatorin Dr. Eike Dazert erörtert.

Ziel des AVATAR-Projekts ist die prototypische Erarbeitung eines kompletten Workflows zur Gewinnung, Anonymisierung und Weitergabe der anonymisierten Daten.(©  terovesalainen - stock.adobe.com)
Ziel des AVATAR-Projekts ist die prototypische Erarbeitung eines kompletten Workflows zur Gewinnung, Anonymisierung und Weitergabe der anonymisierten Daten.
(© terovesalainen - stock.adobe.com)

Im Projekt AVATAR werden patientenbezogene Datensätze anonymisiert und in sogenannten Avataren zusammengeführt. Können Sie uns erklären, wie genau die Anonymisierung funktioniert und was man unter einem Avatar in diesem Kontext versteht?

Dr. Eike Dazert: „Momentan stellen die enormen regulatorischen Anforderungen ein großes Innovationshindernis im Gesundheitsbereich dar.“(Bild:  medways e.V.)
Dr. Eike Dazert: „Momentan stellen die enormen regulatorischen Anforderungen ein großes Innovationshindernis im Gesundheitsbereich dar.“
(Bild: medways e.V.)

Dr. Dazert: Der Prozess sieht vor, gesammelte Daten entsprechend den vorliegenden Anfragen zum Zweck der Anonymisierung aus verschiedenen Datenquellen zusammenzuführen. Dabei entstehen größere Datenmengen, die dann entsprechend der Fragestellung, den vorhandenen Formaten und den vorhandenen Datensätzen mit verschiedenen Verfahren anonymisiert werden – hier wären beispielsweise Aggregation, Klassenbildung, Permutation, Differential Privacy, k-Anonymität und Erzeugung synthetischer Datensätze zu nennen.

Die anonymen Datensätze können für Auswertungen genutzt werden und lassen keine Rückschlüsse mehr auf die ursprünglichen Datengeber zu. In diesem Sinne ist ein Avatar ein anonymisierter und/oder synthetisierter Datensatz, der neben den eigentlichen Informationen noch zusätzliche Metainformationen enthält. Das könnte beispielsweise eine Datenqualitätsbewertung sein oder auch detailliertere Informationen zur Synthetisierung und Anonymisierung, zur Datenquelle oder zum verwendeten Algorithmus.

Gerade das Erzeugen synthetischer Datensätze mittels generativer KI ermöglicht die Nutzung von Daten, die sonst nicht DSGVO-konform verwendbar wären – wie beispielsweise Irisbilder –, da sie immer die Identifikation des „Spenders“ erlauben. Die im Projekt entwickelten Methoden lassen erstmals eine praktikable Sekundärnutzung der umfangreich vorhandenen Gesundheitsdaten zu, ob sie nun aus der Routineversorgung, aus klinischen Studien oder auch Patientenregistern stammen.

Welche Technologien und Methoden kommen bei der Anonymisierung und Erstellung der Avatare zum Einsatz?

Dazert: Inhalt des Projektes ist die prototypische Erarbeitung eines kompletten Workflows zur Gewinnung, Anonymisierung und Weitergabe der anonymen Daten. Architektonisch wird diese Aufgabe durch den Aufbau eines verteilten, dynamischen modularen Systems umgesetzt. Es entsteht eine Oberfläche für die Datenanfrage basierend auf HL7 FHIR und eine Gaia-X-Anbindung mittels EDC. Weiterhin werden ein Consent Management, Konnektoren und ein Matching-Tool entwickelt, um verschiedene Datenquellen anzubinden und die Daten abzufragen und in eine einheitliche Struktur zu überführen.

Die Daten werden einem Datentreuhänder in pseudonymisierter Form zur Verfügung gestellt und dort mittels verschiedener Verfahren anonymisiert. Nach jedem Anonymisierungsschritt wird evaluiert, ob eine Re-Identifikation nicht mehr möglich ist. Erst wenn dieser Test erfolgreich durchlaufen wurde, werden die nun anonymen Datensätze mittels Paketierungstool entsprechend der Anfrage aufbereitet und an den Betreiber der Plattform zurückgegeben, der sie dann an den Anfragenden ausreicht. Eine Speicherung der Daten beim Datentreuhänder oder Betreiber erfolgt nicht.

Welche konkreten Vorteile erwarten Sie von der Nutzung der Avatare für die medizinische Forschung und die Patientenversorgung?

Dazert: Das Projekt bewegt sich im frühen Prototypenstadium. Wir erarbeiten Konzepte, aber auch praxisrelevante Workflows und Lösungsmöglichkeiten für ausgewählte Anwendungsfälle, an die wir nach dem Projekt mit konkreten Umsetzungsideen anknüpfen können. Unsere Vision ist es, im ersten Schritt Daten verschiedener Datenquellen aus der stationären und ambulanten Gesundheitsversorgung, aus klinischen Studien oder auch aus Registern verfügbar zu machen, und diese bei Vorliegen einer Anfrage bei einem „Datentreuhänder“ zusammenzuführen.

Durch die so erhaltenen großen Datenmengen können Ano­nymi­sierungs­ver­fahren zum Einsatz kommen, die bei kleineren Datenmengen teilweise nicht zum gewünschten Ergebnis führen. Die so erzeugten anonymen Datensätze unterliegen nicht mehr der DSGVO und lassen sich daher für alle denkbaren Fragestellungen aus Wissenschaft und Forschung verwenden. Dies setzt große Innovationspotenziale frei, führt zu schnelleren und bedarfsgetriebenen Produktentwicklungen und ermöglicht so eine bessere Patientenversorgung.

Weiterhin werden sekundäre Gesundheitsdaten immer wichtiger bei der Einhaltung regulatorischer Anforderungen während der Zulassung neuer Medizinprodukte, Diagnostika und Therapeutika und auch zur Aufrechterhaltung der Zertifikate schon zugelassener Produkte. Momentan stellen die enormen regulatorischen Anforderungen ein großes Innovationshindernis im Gesundheitsbereich dar. Mit der DSGVO-konformen Nutzung anonymisierter Gesundheitsdaten lässt sich der Widerspruch zwischen hohen regulatorischen Hürden und dem Bedarf an kurzen Innovationszyklen auflösen.

Jetzt Newsletter abonnieren

Wöchentlich die wichtigsten Infos zur Digitalisierung im Gesundheitswesen

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Welche Herausforderungen und Schwierigkeiten gibt es bei der Umsetzung des Projekts AVATAR?

Dazert: Die großen Herausforderungen liegen sowohl auf technischer als auch auf organisatorisch und rechtlicher Seite. Technisch ist die IT-Infrastruktur gerade im Gesundheitsbereich sehr heterogen. Es existieren keine einheitlichen Standards und Datenformate. Viele Datensätze liegen nicht digital und/oder nicht strukturiert vor und sind daher nicht oder nur eingeschränkt nutzbar.

Forschungsansätze und -projekte gibt es zuhauf, aber für die Praxis sind nur wenige relevant. Weiterhin müssen viele verschiedene Komponenten zu einem Gesamtsystem zusammengeführt werden, wobei es gilt, die Expertisen verschiedenster Partner aus Wissenschaft, Kliniken, Industrie, IT und Gesundheitswirtschaft zu berücksichtigen.

Rechtlich existieren sehr unterschiedliche Ansichten, wie die bestehenden Gesetze und Verordnungen anzuwenden sind. Zu den meisten Fragen existiert noch keine etablierte Rechtsprechung, auf der eigene Konzepte aufgebaut werden können. Weiterhin verabschieden die EU und Deutschland gegenwärtig zahlreiche neue Regelungen, die rechtlich für das Projekt relevant sind.

Grundsätzliche, noch nicht beantwortete Fragen sind beispielsweise: Wann sind Daten tatsächlich anonym? Ist Anonymisierung tatsächlich eine Datenverarbeitung im Sinne der DSGVO? Darf eine Organisation gleichzeitig Datentreuhänder und Betreiber einer digitalen Plattform sein? Welche Risiken entstehen durch die Möglichkeit der Re-Identifizierung derzeit als anonym bewerteter Daten in der Zukunft? Welche rechtlichen Fragen ergeben sich bei der Erzeugung synthetischer Datenpopulationen aus realen Gesundheitsdaten und sind diese zum Beispiel für die Simulation klinischer Studien nutzbar?

Warum ist die Anonymisierung patientenbezogener Daten von so großer Bedeutung?

Dazert: Wir sprechen hier über hochsensible Gesundheitsdaten, mit denen im höchsten Maße verantwortungsvoll umgegangen werden muss. Sind die Personen hinter diesen Daten identifizierbar, bedeutet das ein hohes Gefährdungspotenzial für die identifizierten Personen in allen Bereichen des Lebens. So gewonnene Kenntnisse können Betroffene stigmatisieren, für kriminelle Aktivitäten genutzt, aber auch arbeits- und versicherungsrechtlich relevant sein. Die zu Grunde liegenden Daten sind daher absolut schützenswert. Aus diesem Grund ist der Umgang mit diesen Daten in Europa durch die DSGVO so streng reguliert.

Auf der anderen Seite erschwert diese Regulation aber auch die Nutzung vorhandener Daten, da für jeden Nutzungszweck eine Einwilligung der jeweiligen Person vorliegen muss. Das führt dazu, dass für jede Fragestellung Daten neu erhoben werden müssen, statt auf vorhandene Versorgungsdaten zurückgreifen zu können. Damit werden Innovationen sehr teuer, verlangsamt oder in Gänze verhindert, können nicht für eine gute Patientenversorgung genutzt werden und letztlich entsteht ein gesamtgesellschaftlicher Schaden.

Das Projekt umfasst 18 Partner. Wie wird die Zusammenarbeit zwischen den verschiedenen Partnern koordiniert und sichergestellt, dass alle auf dem gleichen Stand sind?

Dazert: Die Zusammenarbeit zwischen den Partnern funktioniert sehr gut. Das Projekt ist unterteilt in 7 inhaltliche Teilprojekte: Grundlegende Konzepte, Datengewinnung, Datenspende, Datenpool und -governance, Erzeugung digitaler Avatare, Reallabor und Open Science Lab. Darin arbeiten jeweils einige der 18 Partner zusammen.

Jedes Teilprojekt hat einen Teilprojektleiter und dieser beruft in der Regel vierzehntägig ein Treffen der jeweils beteiligten Projektpartner ein. Diese Termine sind allen Partnern des Gesamtkonsortiums bekannt und jeder Partner kann bei Interesse teilnehmen, auch wenn er nicht zur fest etablierten Arbeitsgruppe gehört.

Zusätzlich finden an jedem ersten Freitag im Monat zwei Videokonferenzen für alle Partner des Konsortiums statt. Hierbei handelt es sich zum ersten um eine rechtliche Sprechstunde, die von der Anwaltskanzlei Liebenstein Law geleitet wird und in der alle rechtlichen Fragen gestellt und diskutiert werden. Die zweite Videokonferenz dient der Darstellung aller aktuellen Projektstände aller Partner und der Abstimmung zwischen den Teilprojekten.

Weiterhin treffen wir uns einmal im Quartal als Gesamtkonsortium einen ganzen Tag lang persönlich, um die Projektstände zu diskutieren und uns zwischen den Partnern abzustimmen. Diese Treffen werden ergänzt durch anlassbezogene virtuelle oder persönliche Treffen, um zum Beispiel Use Cases oder offene Punkte in kleineren Kreisen zu diskutieren.

Wie geht es nun weiter, wo kommen die entwickelten Technologien zur Anwendung?

Dazert: Wir wollen zum Abschluss des Projektes den Prototyp eines Workflows anhand ausgewählter Use Cases demonstrieren können. Einzelne Lösungen können direkt nach dem Projekt zu Dienstleistungen oder Produkten (Software) weiterentwickelt werden. Zusätzlich werden wir Anschlussprojekte nutzen, um weitere Datenquellen anzubinden bzw. einzelne Komponenten weiterzuentwickeln und für Geschäftsmodelle nutzbar zu machen (z.B. Consent Management). Die Etablierung des Gesamtsystems als digitale Plattform ist nicht zuletzt stark von der Entwicklung der rechtlichen Rahmenbedingungen abhängig.

(ID:50110577)