Die Versicherungsindustrie sieht sich mit einer erheblichen Datenmenge konfrontiert. Eva van Viegen, Data Scientist bei FRISS, analysiert diese Daten, um eine bessere Einsicht in Bezug auf Betrug, Risiken und den Wert von Portfolios zu erhalten. Wie zuverlässig sind all diese Informationen und wie können sie (noch) zuverlässiger gestaltet werden?
Datenverlässlichkeit
Als Data Scientist beschäftigt man sich normalerweise mit einer Fülle von Informationen. Bei FRISS beziehen sich diese Informationen auf Daten, die von Kunden zur Verfügung gestellt wurden, Daten von externen Quellen und natürlich interne Daten. Im Falle von Versicherungen helfen die gesammelten Daten über die versicherten Personen, Gegenstände, Forderungen und festgestellten Betrugsfälle, begründete Urteile über Risiken, Trends und den Wert der Versicherungen und Portfolios zu erstellen.
In meinen Träumen wird die ideale Welt komplett von Zahlen und Datenfeldern erfasst. Aber wie zuverlässig sind all diese Daten? Es gibt wesentliche Fallstricke zwischen meiner Traumwelt und der Realität: sowohl was die Systeme als auch uns Menschen betrifft. Kulturunterschiede und die Datengenauigkeit und -beständigkeit erschweren einen Vergleich der Verwaltungssysteme. Außerdem kann der menschliche Faktor sowohl einen positiven als auch einen negativen Einfluss auf die Datenqualität haben.
Es besteht reichlich Platz und Gelegenheit zur Verbesserung. Nachfolgend ist eine Liste mit den 3 größten Fallstricken aufgeführt. Anschließend beschreibe ich meine ideale Welt und erläutere die 3 Schritte, die uns dabei helfen, dieser etwas näher zu kommen.
Fallstricke
1. Der Mangel an internationaler Uniformität zur Datenerfassung
In den Niederlanden wird ein Fahrzeug anhand seines Kennzeichens identifiziert. In Belgien erfolgt dies über die Fahrgestellnummer. Versicherungsgesellschaften registrieren in diesen beiden Ländern somit unterschiedliche Daten, was es wiederum erschwert zu bestimmen, ob die spezifischen Daten ein und dasselbe Fahrzeug betreffen. Anschriften, Geburtsdaten und Familiennamen sind ebenfalls eine permanente Quelle für potentielle Verwirrungen und Missverständnisse zwischen unterschiedlichen Ländern.
2. Änderung der Art und Weise, wie die Registrierungssysteme genutzt werden.
Nach einiger Zeit wurde vielleicht entschieden, bestimmte Informationen auf eine spezifischere Art festzuhalten. Zum Beispiel: zunächst wurde vielleicht eine Kategorie ‘Diebstahl’ festgehalten und zu einem späteren Zeitpunkt wurde ‘Autodiebstahl’ hinzugefügt. Oder das Feld ‘Projektnummer’ wurde zur Eingabe von Nummernschildern verwendet. Oft ist innerhalb eines Unternehmens noch bekannt, welche Änderungen durchgeführt wurden und weshalb, aber normalerweise wird diesbezüglich nur wenig aufgezeichnet und dokumentiert. Für Außenstehende ist über den Hintergrund bestimmter Daten wenig bekannt. Dies führt zu Ergebnissen, die schwer zu erklären sind.
3. Der Einfluss von Voreingenommenheit oder Vorurteilen
Die Daten in Bezug auf überprüfte Schadensmeldungen, die wir erhalten, basieren häufig auf Untersuchungen, die nicht stichprobenweise ausgeführt wurden. Es gab einen Grund, ein Gefühl, einen Hinweis, warum bestimmte Meldungen untersucht wurden. Dieses Gefühl könnte berechtigt sein, aber es besteht die Gefahr, dass man nach einer Rechtfertigung für gewisse Vorurteile sucht. Wenn man alle schicken Autos mit jungen Fahrern untersuchen würde, ließen sich zweifelsohne Unregelmäßigkeiten erkennen. Aber wer sagt denn, dass eine Untersuchung nach allen weißen Fahrzeugen nicht zu dem gleichen Ergebnis führt?! Wenn solche Daten in Modelle integriert werden, besteht die Gefahr, dass Vorurteile verstärkt werden.
Die ideale Welt
In der idealen Welt der Datenanalyse würden wir alle mit einheitlichen Daten arbeiten, sowohl national als auch international. Wir würden alle dieselben Definitionen verwenden und es würde keine sprachlichen oder kulturellen Unterschiede geben. Wir würden alle die gleichen Datenbanken mit den gleichen Kategorien verwenden und die Daten auf die gleiche Weise eintragen. In dieser idealen Welt kann ich eine unabhängige und stichprobenartige Analyse für einen Teil der Schadensmeldungen durchführen. Auf diese Weise sind wir in der Lage zu testen, inwiefern unsere Vorurteile unsere Wissensregeln beeinflussen.
Glücklicherweise werden immer mehr Techniken entwickelt, die diese unerwünschten Vorurteile in den Daten ermitteln. Dass diese gänzlich verschwinden, ist jedoch eine Idealvorstellung. Die folgenden Schritte könnten uns jedoch ein bisschen näher an meine ideale Welt heranbringen. Diese Schritte werden die Arbeit eines Data Scientists nicht nur erleichtern, sondern auch die Qualität von Analysen verbessern und sich somit positiv auf die unternehmerischen Entscheidungen auswirken, die darauf basieren.
Drei Schritte in die richtige Richtung
Was können wir verbessern?
1. Softwaresysteme auf lange Sicht wählen
Und einen Lieferanten auswählen, der sich mit der Versicherungsbranche auskennt und vorzugsweise jemand ist, der wahrscheinlich auch in zwanzig Jahren noch auf dem Markt sein wird. Richten Sie ein System in aller Ruhe ein und nutzen Sie es ausschließlich für den Zweck für das es vorgesehen ist. Dokumentieren Sie Änderungen präzise. Verändern Sie Systeme nicht zu schnell. Sollten Änderungen erforderlich sein, planen Sie ausreichend Zeit und Energie für die Übertragung der Daten ein. Vermeiden Sie jederzeit, zwei Systeme in Betrieb zu haben: lieber ein System mit nicht ganz perfekten Daten als zwei Systeme mit perfekten, aber inkosistenten Daten.
2. Investieren Sie national, aber vorzugsweise auch international in eine stärkere Uniformität der Daten
Betrügernetzwerke richten erheblichen Schaden für Versicherer an, weil sie nationale Grenzen und Unterschiede bei der Registrierung ignorieren. Fakt ist: Betrüger profitieren von solchen Grenzen. Diese könnte man effektiv bekämpfen, wenn man standardmäßig Fahrgestellnummern und Sozialversicherungsnummern registrieren würde, um die Identifikation von Personen und Fahrzeugen zu verbessern. Zurzeit sehen nationale Vorschriften und Rechtsvorschriften solche Standards jedoch nicht immer vor. Bereits kleine Schritte können zu Verbesserungen führen. Jedes nationale Betrügernetzwerk, das direkt stillgelegt wird, führt zu großen Einsparungen bei der Auszahlung von Forderungen.
3. Datenübertragung, z.B. Konvertierung von Daten in ein Standardsystem für Analysen.
Bei FRISS übertragen wir die Daten, die wir erhalten, in ein Standard-Datenformat. Dies ist der ideale Zeitpunkt für uns Experten mit dem Kunden über die folgenden Punkte zu sprechen: wie funktioniert das aktuelle System? Wie hat es sich in der Vergangenheit bewährt? Was sind die Kundenfelder und wie sollten bestimmte Informationen interpretiert werden? Es scheint als würden wir nur mit konkreten Zahlen und Definitionen arbeiten, aber es gibt viele potentielle Missverständnisse und Kulturunterschiede.
Das menschliche Auge
Neben der Datenqualität ist ein kritisches menschliches Auge unverzichtbar, wenn wir uns mit Analysen und ihren Ergebnissen beschäftigen. Unerwartete Ergebnisse sind interessant, können aber unterschiedliche Ursachen haben. Es liegt an uns, die Voreingenommenheit, die Störstellen und Missverständnisse zu filtern und zuverlässige sowie klare Analyen und Schlussfolgerungen zu erstellen. Versicherungsunternehmen können diese wiederum nutzen, um die Produkte zu verbessern und die Kundenzufriedenheit und das Betriebsmanagement zu stärken. Auf diese Weise halten wir die Industrie gesund.