Le data-mining, l’arme fatale contre les fraudeurs

23 octobre 2012
By

Depuis un an, pour traquer la fraude aux prestations sociales, la Sécurité sociale a mis en place une technique informatique de “profilage”, le data-mining. Une méthode dont l’opacité soulève quelques questions.

Le 17 septembre 2010, le tribunal correctionnel de Paris a condamné madame A. à quatre mois de prison avec sursis et à 11 508 euros de dommages et intérêts. L’accusée a été reconnue coupable de fraude aux prestations sociales, après avoir fourni de fausses déclarations en vue de percevoir l’allocation aux adultes handicapés.

Au cours de cette même année, la Caisse Nationale des Allocations Familiales (Cnaf) a recensé 13 114 cas de fraudes, correspondant à un montant de 90,15 millions d’euros de manque à gagner. Pour lutter contre le phénomène, la Cnaf avait jusqu’à présent comme seule arme les 629 contrôleurs présents sur l’ensemble du territoire qui devaient étudier de plus grand nombre de dossiers possible pour déceler les fraudes.

La Cnaf a alors décider de recenser un certain nombre de critères communs aux fraudeurs. En recoupant les informations, Daniel Buchet, responsable du département maîtrise des risques et lutte contre la fraude de la Cnaf, espérait mettre à jour un profil type de l’ “allocataire à risque” permettant de cibler des dossiers potentiellement frauduleux. Cette technique de collecte de données s’appelle le “data-mining”.

Le terme “data-mining”, signifie “exploration de données”. C’est en fait une méthode de recherche d’information automatisée, basée sur l’étude d’un très grand nombre de données. Autrement dit, c’est un moyen de trouver un élément précis, déterminé par avance, dans une masse de documents, à l’aide d’un logiciel configuré.

Cette methode qui a été développé par des statisticiens depuis l’apparition des premiers ordinateurs, a d’abord été utilisé à des fins médicales. Il permet de déterminer à partir de nombreux critères les individus les plus susceptibles de développé telle ou telle pathologie.

Mais rapidement, c’est le secteur privé qui s’empare de cette technique. Elle est beaucoup utilisée par les entreprises qui souhaitent analyser le profil des consommateurs, dégager des similarités et ainsi adapter l’offre à l’acheteur potentiel.

Le logiciel cible les dossiers suspects

Constatant l’efficacité du procédé, la Cnaf a donc décidé en 2005, de le reprendre à son compte pour lutter de manière plus efficiente contre la fraude. Un logiciel analyse à la place des contrôleurs une grande quantité de dossiers et cible ceux qui sont suspects, à partir de critères prédéfinis. Par exemple, le logiciel va signaler toutes les personnes touchant l’Aide au parent isolé (API) nettement plus agées, que la moyenne des allocataires de cette aide.

Si la Commission nationale de l’informatique et des libertés (Cnil) a donné son accord en janvier 2011 pour la mise en place du data-mining, le système soulève néanmoins certaines questions. Quels critères sont retenus pour déterminer des profils types de fraudeur ?

Le point est sensible, et Laurent Carloix, conseiller technique en charge de la lutte contre la fraude à la Cnaf, refuse de détailler les ressorts de la programmation du logiciel : “c’est un logiciel de statistiques et je ne suis pas statisticien. Je ne maîtrise pas les rouages et les algorithmes du système. Je sais simplement qu’il détermine des pourcentages de risques de fraude selon certains critères, mais ceux-ci ne peuvent être rendus publics “.

Aucune précision non plus concernant l’efficacité du système, mis en place depuis un an seulement : “On constate une baisse de la fraude. Les recoupements informatiques permettent un gain de temps considérable, mais aucun chiffre n’est disponible pour le moment.”

Enfin, du côté de la Cnil, les commentaires sont prudents sur une méthode encore assez opaque : “nous n’avons pas d’information sur les critères choisis, mais aucun débordement n’est à signaler jusqu’à présent.”

J.SP, F.B et I.M

 

Tags: , , , ,