La CAF utilise un algorithme pour contrôler les allocataires et lutter contre la fraude aux allocations familiales.
Combattre la fraude aux allocations familiales est une nécessité pour la CAF. L’organisme social peut compter sur son algorithme pour détecter les profils qui doivent être contrôlés.
Fraude aux allocations familiales : la CAF prend les choses en main
En 2022, les différentes CAF ont détecté plus de 48 000 cas de fraudes sociales. Le RSA et la prime d’activité sont d’ailleurs les deux prestations les plus fraudées.
Les cas de fraudes aux allocations familiales sont assez nombreux. Comment la CAF fait-elle face à cela ?
Il faut savoir que l’organisme social a mis en place de nombreux contrôles pour limiter les fraudes. Selon, la Quadrature du Net, la CAF utilise un algorithme pour détecter les allocataires qu’il faut contrôler.
Deux versions antérieures de cet algorithme confirment que cet outil cible les personnes les plus précaires. Cependant, la CAF se défend en expliquant qu’elle l’utilise pour viser les personnes dont les revenus fluctuent. Ce qui peut donc représenter un risque de fraude.
Cela montre donc que les contrôles de la CAF ne se font pas de manière aléatoire. En effet, c’est l’algorithme qui décide quel allocataire d’aides sociales subira un contrôle.
Après une longue bataille juridique, la CAF a accepté de partager deux codes sources de ses algorithmes de notation. L’un de 2010, l’autre de 2014. Publiés par la Quadrature du Net ce 27 novembre, ils ont permis de voir les variables utilisées.
De son côté, l’association de défense des droits a voulu levé le voile sur le mystère qui entourait ces fameux algorithmes. Bien que ce ne soit pas le code source de l’algorithme actuel, cela permet de connaitre les variables qui sanctionnent les personnes les plus précaires.
La Quadrature du Net dénonce alors la mise en place d’un « système de surveillance de masse particulièrement pernicieux ». Mais comment ça marche ?
Comment ça marche ?
Pour lutter contre la fraude, la CAF utilise un algorithme bien ficelé. Malgré la révélation des codes sources de 2010 et 2014, le flou reste entier.
« Quand on leur demandait s’ils ciblaient vraiment les plus en difficulté, ils répondaient : non, il n’y a pas de ciblage dans l’algorithme parce que c’est quelque chose qui est purement statistique, construit par des experts » explique le chargé de campagne de la Quadrature du Net.
Il faut savoir que l’algorithme suit 32 variables. Elles comprennent des éléments comme le nombre de mois d’activité professionnelle. Ou encore la présence d’enfants dans le foyer et si la personne touche l’AHH. Il y a aussi le nombre de fois à laquelle l’allocataire se connecte à son espace web.
Plus ces variables peuvent entrainer une précarité, plus la note de l’allocataire se rapproche du 1. Ce qui veut dire qu’il est plus à risque de se faire contrôler.
« On sait que l’algorithme de la CNAF devait, à l’origine, être conçu pour lutter contre la fraude« explique le membre de la Quadrature du Net. « Mais il est en fait très difficile de caractériser algorithmiquement la fraude, donc d’avoir un score de prédiction de la fraude, parce que la fraude nécessite un caractère intentionnel » ajoute-t-il.
Mesurer l’intention à la fraude n’est tout simplement pas possible via un algorithme. « On s’attend à ce que la CNAF supprime les variables trop sensibles politiquement, comme l’AAH, l’allocation aux adultes handicapés. Tout en continuant à cibler les mêmes populations avec des variables qui seront bien plus compliquées à comprendre, pour le grand public. » conclut-il.
« Plus qu’un ciblage sur des “risques présumés”, la pratique du datamining contraint à désigner des populations à risque et, ce faisant, conduit à instiller l’idée selon laquelle certaines catégories d’usagers seraient plus enclines à frauder. » alerte alors le défenseur des droits.