Le Big Data, un cauchemar pour la fraude bancaire

Un vol de carte bancaire, un achat frauduleux sur internet ou un email de phising type « s’il te plait j’ai besoin d’argent »… nous avons tous été un jour victime d’une tentative, réussie ou non, de fraude bancaire.

Ces fraudes sont en croissance et la France a le titre peu glorieux de championne d’Europe (étude euromonitor): le montant total des fraude à la CB est monté de 4% pour atteindre 469 millions d’euros en 2013. Par ailleurs les escroqueries visant les entreprises, via des virements internationaux, sont tellement à la mode que la FBF (Fédération Bancaire Française) a publié en urgence une vidéo préventive, je parle par exemple de l’escroquerie dit « Au président », à la fois géniale et terrible (cf article et vidéo des Echos).

PAS DE PANIQUE, le Big Data est là! Ou depuis le 22 août devrais-je dire « mégadonnées » d’après la nouvelle dénomination officielle – sauf que « mégadonnéesfrance » n’est pas terrible comme nom de blog donc pour l’instant je reste sur Big Data…

Par nature le Big Data rassemble d’énormes quantités de données et les analyse dans une optique prédictive. La lutte contre la fraude en tout genre en est ainsi un usage tout naturel :  fiscale (notamment la TVA très à la mode en ce moment avec les succès rencontrés en Belgique), fraude à l’assurance, fraude à la sécurité sociale etc… L’article de cette semaine détaille un grand classique du sujet : le combat entre Big Data et fraude bancaire (CB et virements).

 

La fraude à la carte bancaire trahie par des transactions « atypiques »

Debit%20card

Ce type de fraude peut intervenir de 3 manières:

  • vol de la carte bancaire
  • piratage à distance du numéro de carte, de la date d’expiration et du cryptogramme (par exemple lors d’un paiement sur un site pas assez sécurisé)
  • récupération, chez un commerçant, des informations concernant votre CB. Ceci peut être effectué via un appareil modifié ou simplement en notant discrètement le cryptogramme et la date d’expiration (le numéro de CB étant intégralement inscrit sur les facturettes commerçants)

Dans tous les cas les achats frauduleux à distance donnent lieu à des données transactionnelles qui peuvent être identifiées comme « anormales » par des modèles intelligents. Un précuseur sur ce sujet fut le groupe américain Zions Bancorporation qui a décidé, en 2011, de transférer toutes ses données dans une structure type Big Data (Zettaset – Hadoop en l’occurrence) pour les croiser et traiter en temps réel afin de détecter les transactions à suspectes (cf article financial security). La société Visa aussi a lancé une approche Big Data en 2011  avec une capacité d’analyse sans commune mesure avec le passé: ils étudient 500 critères sur 100% des transactions avec 16 modèles quand, il y a quelques années, ils analysaient 40 critères sur un échantillon de 2% des transactions avec 1 modèle (cf article Visa)…

La concrétisation de cette théorie est bien illustrée par l’expérience personnelle d’un bloggeur américain (cf « Power of Analytics« ). Il raconte avoir reçu un appel de Capital One (sa banque) pour lui demander, après des vérifications d’usage sur son identité, s’il avait effectué un achat iTunes de 0.99$ quelques minutes auparavant; répondant par la négative le conseiller bancaire lui indique qu’il a été victime de fraude et que sa carte va être mise en opposition… Lui, curieux, insiste et finit par apprendre que:

  • les escrocs testent souvent les CB sur des petits montants (type iTunes) pour vérifier qu’elles sont toujours actives
  • la banque Capital One avait détecté que plusieurs personnes ayant dîné dans le restaurant X près de Las Vegas avaient effectué des achats à 0.99$ entre 12h et 24h après
  • l’algorithme anti-fraude avait considéré ces événements comme suspects car totalement improbables

Sans surprise il conclut son article par « Analytics are a beautiful thing » car les clients de ce restaurant ont tous été contactés (ainsi que la police de Las Vegas) évitant ainsi une fraude généralisée.

Le fait que les banques surveillent les transactions et préviennent certains abus n’est pas nouveau, ils le font plus ou moins efficacement depuis longtemps. Par exemple, même sans Big Data, si vous avez réalisé des achats à Paris et à Hong-Kong à 1 heure d’intervalle la plupart des banques françaises vont vous contacter en suspectant une escroquerie. Cependant le Big Data permet une triple rupture par rapport à l’existant pour gagner en efficacité:

  • La quantité de données traitées est beaucoup plus grande et elle peut avoir lieu en temps réel (meilleure réactivité)
  • Les modèles statistiques (type machine learning) détectent des comportements anormaux sans qu’ils aient été imaginés au préalable. Jusqu’à présent les vérifications informatiques étaient déterminées à l’avance: « si 2 achats dans 2 pays différents avec moins de 2 heures d’écart alors alerte », avec le Big Data l’algorithme s’auto alimente comme dans l’exemple de Capital One où personne n’avait demandé au modèle de croiser les achats iTunes avec les clients du restaurant X de Las Vegas…
  • A cela peut s’ajouter l’intégration de données d’un nouveau genre: les réseaux sociaux peuvent indiquer si vous êtes en vacances à Hong-Kong ou non (et si oui l’alerte à la CB sera relativisée), la géolocalisation de votre mobile pourra aussi aider si quelqu’un retire de l’argent à quelques arrêts de métro de là où vous êtes etc…

Ces nouveaux moyens de lutte anti-fraude (proposés par tous les grands, cf exemple du Smarter Counter Fraud d’IBM) seront un vrai cauchemar pour les escrocs car non seulement ces derniers seront trahis par les données mais en plus les modèles s’adapteront automatiquement aux comportements, difficile alors de les contourner…

 

Les virements douteux sont bloqués avant même d’être réalisés

western-union

Si pour l’instant la fraude aux entreprises, évoquée en introduction, est prise très au sérieux il n’y pas encore de cas concret d’utilisation du Big Data pour y faire face car l’intensification du sujet est assez nouvelle. L’angle d’attaque est plutôt la communication et la prévention (nouvelles règles internes aux entreprises etc.).
Pour autant le Big Data a déjà fait ses preuves dans la lutte contre les virements abusifs. Dans la liste des exemples souvent cités reviennent ceux de Moneygram et Western Union, sociétés qui transfèrent de l’argent en cash ou sur des comptes. Pour ces 2 sociétés la fraude a toujours été un véritable fléau, objet d’un combat acharné. L’arrivée des données de masse a changé la donne:

  • 2 défis à relever: pouvoir récolter toutes les informations (capacité de stockage) et les traiter en temps réel (performance limitée)
  • pour atteindre un objectif simple: avoir enfin un outil de détection efficace qui bloque les transferts d’argent AVANT qu’ils ne soient effectifs

Western Union explique que l’infrastructure Big Data permet de voir, avant qu’il ne soit trop tard, si le transfert d’argent est dans un autre pays, vers une personne inhabituelle, d’un montant étrange, et si tel est le cas si par hasard vous connaissez cette personne sur les réseaux sociaux, et enfin à partir de l’adresse email du bénéficiaire s’il y a un risque d’usurpation d’identité… Bref, une étude au microscope du transfert demandé, qui peut être bloqué jusqu’à ce que vous le re confirmiez (après vérification).

IBM utilise aussi l’exemple de Moneygram pour faire la promotion de son produit « InfoSphere ». Une grand-mère centenaire qui aurait transféré 2500$ pour payer la caution de son petit-fils, « soit disant arrêté », Moneygram a détecté une fraude de manière certaine et a bloqué le transfert en prévenant la dite grand-mère. Sauf que cette dernière, de peur de laisser son petit-fils en prison, a fait un scandale et ne voulait pas entendre parler d’arnaque. C’est finalement 3 jours après (via d’autres membres de la famille) qu’elle a compris que Moneygram lui avait évité une perte de 2500$, elle les a chaleureusement remercié.

Ces systèmes sont efficaces et Moneygram estime avoir fait baisser de 40% le montant total des transferts frauduleux en 1 an. Enfin, et c’est peut-être là l’essentiel, les plaintes pour cause de fraude ont baissé de 72% boostant ainsi la satisfaction globale des clients!

 

 

En conclusion on peut noter que si le digital a apporté de nouveaux outils pour les escrocs et ouvert des brèches technologiques il y a aujourd’hui un rééquilibrage du combat avec la capacité des services financiers à exploiter les données de masse. Le Big Data permet, en temps réel, d’identifier des comportements atypiques ou anormaux pour ainsi prévenir les utilisations frauduleuses des cartes bancaires ou des virements. Ces pratiques ne sont pas encore totalement généralisées (notamment en Europe) mais il ne fait aucun doute que ce sera le cas dans les années à venir.