Best Practice: Graphtechnologie Betrugsaufdeckung bei Corona-Soforthilfen

Ein Gastbeitrag von Stefan Kolmar Lesedauer: 6 min |

Anbieter zum Thema

Rund 130 Milliarden Euro an Wirtschaftshilfen zahlte der Staat in den Corona-Jahren aus. Das hat auch Betrüger auf den Plan gerufen. Für die nachträgliche Überprüfung der Anträge auf Soforthilfen entwickelte das Beratungsunternehmen Deloitte einen Proof-of-Concept auf Basis der Graphdatenbank Neo4j.

Rund 130 Milliarden Euro an Wirtschaftshilfen zahlte der Staat in den Corona-Jahren aus
Rund 130 Milliarden Euro an Wirtschaftshilfen zahlte der Staat in den Corona-Jahren aus
(© m.mphoto - stock.adobe.com)

Schnell musste es gehen. Um von der Corona-Pandemie betroffene Unternehmen, Beschäftigten und Selbstständige zu helfen und die finanziellen Konsequenzen von Lockdowns und Kurzarbeit abzufedern, wurden Anträge möglichst rasch bewilligt und ausgezahlt. Eine gründliche Überprüfung erfolgte oft erst im zweiten Schritt. Betrüger erschlichen sich auf diesem Weg Gelder in dreistelliger Millionenhöhe. Nach Recherchen des Handelsblatts liefen letztes Jahr deutschlandweit mehr als 26.800 Verfahren gegen Verdächtige.

Spur verliert sich in Excel-Sheets

Die anfangs hohe Erfolgsquote der Betrüger hatte jedoch mehrere Gründe. Die Prüfung der Anträge auf Corona-Soforthilfen wurde zum Großteil auf die Landesförderbanken übertragen, die in kürzester Zeit neue Arbeitsabläufe definieren mussten. Wurden die Anträge anfangs noch isoliert voneinander betrachtet, galt es schon bald, verschiedene Datenquellen zentral zusammenzuführen, um übergreifende Auffälligkeiten zu erkennen. Dazu gehörten beispielsweise mehrere Anträge von einer Person oder auch Anträge mit einer identischen Adresse.

Häufig war für die Sachbearbeiter in den Behörden nicht ersichtlich, weshalb ein Antrag auf Corona-Soforthilfen als verdächtiger Fall eingestuft wurde. Es fehlte schlichtweg der Kontext. Die Bearbeitung und Weitergabe der Daten via Excel Spreadsheets erlaubte nur den Blick auf einen Teilausschnitt aller Informationen. Da die Listen über Windows SharePoint bereitgestellt wurden, konnten die Ermittler die Anträge zudem nicht simultan bearbeiten, ohne dass es zu Problemen kam. Der Zeitaufwand war enorm, die Trefferquote zunächst niedrig.

Graphtechnologie: Im Kontext der Daten ermitteln

Um hier zukünftig effektiver und schneller Anträge prüfen zu können, entwickelte das Beratungsunternehmen Deloitte einen Proof-of-Concept (PoC) für eine smarte Lösung zur Betrugsaufdeckung. Wichtiges Kriterium war es, die Daten ganzheitlich abzufragen und anschaulich zu visualisieren, um verdächtige Auffälligkeiten und Muster möglichst schnell und einfach zu identifizieren. Deloitte entschied sich aufgrund seiner bisherigen positiven Erfahrungen für den Einsatz von Graphtechnologie und nutzte im PoC die Graphdatenbank von Neo4j als Kern seiner Lösung.

Graphdatenbanken bestehen aus sogenannten „Knoten“ und „Kanten“: Knoten repräsentieren bestimmte Instanzen und stellen im Rahmen der Betrugsaufdeckung beispielsweise Personen, Unternehmen, aber auch Anträge, IBAN-Sperrliste, Betrugskriterien oder Prüfung dar. Als Kanten werden die Beziehungen zwischen diesen Datenpunkten bezeichnet (z. B. „gestellt von“, „ausgezahlt an“). Den einzelnen Knoten und Relationen lassen sich zudem Eigenschaften („Properties“) zuordnen, um Metadaten wie Antrags-ID oder Zeitpunkt hinzuzufügen. So entsteht ein umfassender Kontext für Ermittler, um Anträge und Verdachtsfälle zu prüfen.

Beispiel eines Datenmodells aus Knoten und Kanten
Beispiel eines Datenmodells aus Knoten und Kanten
(© Neo4j)

Dieser Kontext ist entscheidend. Denn nur so lassen sich mehrere Anträge zueinander in Beziehung setzen und versteckte Zusammenhänge aufdecken. Hat eine natürliche Person beispielsweise Corona-Subventionen mehrfach beantragt, wird dies im Graphen sofort sichtbar. Gleichzeitig kann das System automatisch und mit Hilfe von Graph-Algorithmen einen „Betrugs-Wert“ ermitteln, der bestimmte Kriterien nach ihrer Relevanz gewichtet und die Wahrscheinlichkeit eines Betrugs berechnet. Das hält die False-Positive-Rate niedrig und beschleunigt das Arbeiten. Das Auftreten eines weichen Kriteriums allein reicht zum Beispiel nicht aus, um eine umfassende Betrugsprüfung auszulösen – dafür müssen mehrere weiche Kriterien vorhanden sein. Bei harten Kriterien hingegen ist die Betrugsprüfung zwingend und das System schlägt Alarm.

Der Datenflut gewachsen

Bei den Corona-Soforthilfen stieg die Zahl der Förderanträge und damit die Anzahl der neu generierten Datensätze täglich. In relationalen Datenbanken kann eine solche Datenflut schnell die Performance von Abfragen beeinträchtigen und Systeme ins Stocken bringen. Graphen verfügen jedoch mit ihrem Knoten-Kanten-Prinzip über ein hohes Maß an Flexibilität: Neue Informationen lassen sich in einem sogenannten Knowledge Graphen problemlos hinzufügen – ohne das System an sich ändern zu müssen. Die Abfragegeschwindigkeit beträgt dabei wenige Millisekunden und erlaubt so auch Echtzeit-Analysen.

Auf der nächsten Seite: Datenbearbeitung, Visualisierung, Einsatz in Bund & Land.

Jetzt Newsletter abonnieren

Wöchentlich die wichtigsten Infos zur Digitalisierung im Gesundheitswesen

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:49232748)