Avant de nous plonger dans toutes sortes de définitions et d’explications, laissez-moi vous dire un petit secret : je peux vraiment être geek quand il s’agit de musique. D’où le titre de ce blog inspiré par le fameux album de Guns and Roses « Appetite for Destruction », sorti en 1987. Au départ, l’album n’a que peu attiré l’attention de l’industrie musicale et ce n’est que plus tard que cette dernière a reconnu qu’il contenait de grands titres. Et cela rejoint bien l’argument que je suis sur le point de faire valoir : pourquoi il est important pour les assureurs de lier précision (souvent appelée taux de réussite) à leur appétence pour le risque. S’ils ne le font pas, ils risquent de passer à côté d’informations importantes. Autrement dit, cela pourrait s’avérer autodestructeur.
Préparer le terrain pour une précision optimale
Commençons par quelques mots que nous utilisons pour qualifier correctement la fraude :
Précision : le nombre de sinistres correctement classifiés divisé par le nombre total de prédictions
Rappel : le nombre de sinistres correctement classifiés divisé par le nombre total de fraudes dans un ensemble de données historiques
F1 : deux fois la précision fois le rappel divisé par la somme de la précision et du rappel
Notre étude récente montre que les professionnels de l’assurance pensent que 18 % des sinistres contiennent un élément de fraude. Si vous observez un ensemble de 200 000 sinistres, il y aura certainement des cas de fraude. Si vous classifiez un seul cas à l’aide d’un modèle de détection de fraude, il se peut que vous ne trouviez que le plus évident. Du point de vue de la science des données, nous disons que si la probabilité est de 99,9 %, il s’agit d’un cas de fraude. La précision (ou taux de réussite) serait dans ce cas de 100 %. C’est un taux de réussite que tout expert en sinistres aimerait rapporter à son responsable.
Garder un œil sur le client honnête
Pourquoi ne pas le vouloir ?
Dans l’exemple ci-dessus, la majorité des fraudeurs passeraient entre les mailles du filet. Parce que même si la précision est de 100 % et que nous pensons que la plupart des fraudes sont classifiées, en réalité, seul un sinistre sur 200 000 a été signalé par le système.
Si vous voulez attraper tous les cas de fraude, vous devez classifier l’ensemble des 200 000 sinistres. Cela permettrait une stratégie de tolérance zéro, mais l’équipe d’investigation serait alors débordée par les faux positifs. Étant donné que la grande majorité des clients sont de bons clients, ils méritent un paiement rapide sans retards inutiles de la part du service d’investigation.
Afin de faire une bonne sélection pour des enquêtes ultérieures, vous devez être plus sélectif dans la classification des cas frauduleux.
Trouver le bon équilibre
C’est pourquoi nous croyons qu’il est essentiel de travailler avec nos clients pour trouver un équilibre entre précision et appétence pour le risque. Nos puissantes techniques d’IA comme les modèles prédictifs, l’analyse de réseau et l’exploration de texte, combinées à plus de 600 indicateurs de risque et de fraude prêts à l’emploi, peuvent automatiquement signaler tout type de fraude potentielle.
Si la capacité de l’équipe d’investigation est limitée, nous ajustons le système avec une précision plus élevée afin que seuls les cas les plus risqués soient signalés pour une enquête plus approfondie. Si la capacité est suffisante et que des processus suffisants sont en place pour le suivi des alertes, la précision peut être moindre et le rappel plus important.
Enquêter sur davantage de sinistres signifie également que nos modèles reçoivent davantage de retours du service d’investigation. Ces retours optimisent les modèles grâce à de l’auto-apprentissage ce qui conduit en fin de compte à une meilleure précision. Il s’agit d’une spirale positive de retours qui bénéficie grandement au taux de détection de fraude de nos clients. Trouver l’équilibre entre précision et rappel est ce qui est le plus précieux pour nos clients.
C’est le défi que nos experts en données doivent relever quotidiennement lorsqu’ils mettent en œuvre la solution FRISS, et je tire personnellement une grande satisfaction à faire les choses correctement. En plus de bombarder mes collègues de blagues musicales assez terribles…
À propos de l’auteur
Daan Bakker est expert en données chez FRISS et sa carrière professionnelle s’articule autour de la détection de la fraude. Daan et ses collègues spécialistes de la science des données améliorent quotidiennement les produits et algorithmes FRISS, dans le seul but de garantir une assurance honnête pour tous.