Definition Was sind Synthetische Daten (Synthetic data)?
Anbieter zum Thema
Bei Synthetischen Daten (Synthetic data) handelt es sich um künstlich erzeugten Daten. Diese Informationen stammen nicht aus realen Quellen, sondern wurden anhand von Algorithmen generiert. Daher enthalten sie keinerlei kritische Informationen.

Künstliche Intelligenz (KI) gilt als eine der wichtigsten Schlüsseltechnologien. Sie ist in der Lage, Informationen aus Daten zu extrahieren, die ein Mensch aufgrund deren Komplexität niemals erfassen könnte. Liegen nicht genügend Daten vor, können Synthetische Daten (Synthetik data) diese Lücke schließen. Sie ahmen die Eigenschaften der aus realen Situationen gewonnenen Informationen nach, bilden deren Struktur und statistische Eigenschaften ab.
Ein vollständig synthetisch erzeugter Datensatz verzichtet komplett auf Originaldaten. Während des Generierungsprozesses greifen Datenschutzmechanismen. So ist eine Re-Identifizierung der Informationen ausgeschlossen. Verstöße gegen Europäische Datenschutz-Grundverordnung (BMWK) werden vermieden, daraus resultierende finanzielle Risiken minimiert. Vorratsdatenspeicherung und externe Weitergabe der Synthetischen Daten sind gefahrlos möglich. Aus dem Datenschutz resultierende Probleme gehören damit der Vergangenheit an.
Künstliche Intelligenz benötigt enorme Datenmengen
Damit der Einsatz Künstlicher Intelligenz die gewünschten Ergebnisse liefert, sind große Mengen an validen Trainingsdaten erforderlich. Reale Daten können den Bedarf nicht decken. Rechtliche wie ethische Gründe erschweren deren Verwendung. Synthetische Daten bieten gegenüber Realdaten viele Vorteile. Sie lassen sich schnell und kostengünstig generieren und sind hinsichtlich des Datenschutzes unbedenklich.
Die Digitalisierung im Gesundheitswesen (eHealth) verspricht mehr Effizienz und einen schnelleren Zugang zu relevanten Daten. KI-Modelle können nicht bedenkenlos mit realen Patientendaten trainieren. Der Schutz der Privatsphäre hat Priorität. Virtuelle medizinische Szenarien lassen sich jedoch mit Hilfe Synthetischer Daten simulieren. Sie verfügen inzwischen über jene Validität, die für die detaillierte Abbildung der realen Welt unabdingbar ist.
Digitale Zukunft ohne Synthetische Daten undenkbar
Statistische Erhebungen werden zunehmend abgelöst durch Synthetische Daten. Politik und Wirtschaft nutzen sie, um evidenzbasiert und effektiv handeln zu können. Synthetische Daten tragen dem Trend zu Open Data Rechnung. Da sie schutzbedürftige Informationen ausklammern, können sie bedenkenlos gespeichert und weitergegeben werden.
Die im Gesundheitswesen gewonnenen Patientendaten gelten als besonders sensibel. Eine Alternative zu anonymisierten Originaldaten stellen Synthetische Daten dar. Die medizinische Forschung ist dringend auf diese Informationen angewiesen. Mit Hilfe Künstlicher Intelligenz entwickelt sie optimale Therapieverfahren, bewertet Risikofaktoren und prognostiziert Krankheitsverläufe.
Angesichts drastisch gestiegener Kosten im Gesundheitswesen und in der Pflege konzentriert sich das Augenmerkt der Entscheider auf die Digitalisierung. Die unter der Federführung des Bundesministeriums für Gesundheit erarbeiteten Strategien setzen dabei verstärkt auf Künstliche Intelligenz. Die Nutzung von Gesundheits- und Pflegedaten unterliegt jedoch einer strengen Reglementierung. Synthetische Daten tragen dem Patientenschutz Rechnung und gewinnen damit stetig an Bedeutung.
(ID:49792810)