Tu seras Data Scientist ma fille!

Le 20 novembre dernier s’est tenu Data Job, « Plus grand salon de rencontre des métiers de la Data ». Ce salon fut l’occasion d’observer les profils des étudiants et des recruteurs mais aussi de vérifier que la pénurie annoncée de Data Scientist se concrétisait.

Sans surprise les recruteurs principaux étaient des consommateurs historiques de données, je parle notamment les 4 sponsors: Axa (qui recrute pour son Data Lab), EY (aussi pour son Data Lab), Deloitte (audit et conseil) et enfin Quantmetry (conseil en statistiques et Big Data). Les profils des étudiants étaient pour partie issus de l’informatique  mais surtout très majoritairement du monde de la statistique/mathématique (ENSIMAG, UMPC, ENSAE, Ecole des Ponts, ENSAI, ENSTA, ISUP etc…).

Par ailleurs les différentes conférences qui se sont tenues en parallèle du salon ont montré que le secteur recrutait, et qu’il y avait de grandes difficultés à pourvoir tous les postes (Safran, Voyages SNCF, Crédit Mutuel Arkea).

Alors, comme le présente la Harvard Business Review, les Data Scientist ont ils le job le plus sexy du 21ème siècle (data scientist, the sexiest job of the 21st century)?

Personnellement « sexy » je n’en sais rien mais « d’avenir » c’est certain, en effet tous les secteurs et tous les domaines de compétences axent de plus en plus leur activité « en connaissance des données », je veux dire par là que tous ont besoin d’experts capables de manipuler et interpréter les données. Ceci est vrai en marketing pour connaître les clients et le marché, vrai en ressources humaines (recrutement et gestion de carrière), vrai sur les métiers coeurs de la banque (finance), de l’assurance (actuariat) etc…

Donc oui à titre très personnel je pense que si ma fille souhaitait devenir Data Scientist ça ne serait pas forcément un mauvais plan! La question restant « mais qu’est-ce qu’un Data Scientist et comment le devient-on? ».

Nota Bene: au départ je souhaitais appeler cet article « Tu seras Data Scientist mon fils », mais d’une part je ne voulais pas plagier l’article du même nom (article myrhline), d’autre part les femmes représentent moins de 10% des membres des comité de direction (cf article lexpress) – absurdité révoltante dans une société soit disant paritaire…

Le Data Scientist, une utopie?

datascience

La nature du Big Data est pluridisciplinaire: stocker et exploiter les données (informatique) pour les analyser ou modéliser (statistique) afin de les restituer et éclairer les décisions (business analyst). C’est ainsi que le mythe du Data Scientist qui sait tout faire est né.

Soyons clair, celle (ou celui) qui est capable faire tout cela avec un niveau expert sera effectivement un profil rare, recherché (et donc cher) correspondant à la définition complète du Data Scientist. Ces profils auront vocation à se multiplier, mais peut-on raisonnablement croire que tous auront la compétence et surtout l’envie d’être autant multi expertise? Il y aura (comme il en existe déjà) des experts complets de haut niveau qui pourront assumer une telle palette de compétences, par contre autour d’eux c’est probablement toute une structure complète qui sera mise en place avec des profils experts mais moins complets. Je pense par exemple à Axa qui affichait (lors de DataJob) des recrutements complémentaires pour son Data Lab: Data Scientist, Architectes SI, Business Projects Managers.

Les Data Scientist complets seront donc la clé de voute des activités Data des entreprises, alors peut-être même encore plus recherchés que ce que l’on pense.

Quels profils et formations pour devenir Data Scientist?

FormationDataScience

Une question fréquente, et structurante pour la formation, est de savoir de quel univers vont principalement venir les Data Scientist: plutôt informatique, statistique ou généraliste?

Cette question ne peut donner lieu à une réponse catégorique, il semble toutefois se dessiner une filière privilégiée bien que non exclusive: les statistiques et notamment les statistiques appliquées (Datamining, Business Intelligence etc…). Pour ce type de profil devenir Data Scientist signifie ajouter la compétence informatique d’extraction et manipulation de la donnée ainsi que l’algorithmie moins traditionnelle (machine learning). Les recruteurs et formateurs (notamment des responsables de Master Spécialisés Big Data) confirment ce point en expliquant qu’aujourd’hui la plupart des formations en informatique n’abordent que trop peu les mathématiques théoriques, la marche purement académique à franchir est donc souvent trop grande.

Il est possible de répartir les formations selon 3 familles:

  • celles qui créent une filière Data Science, écoles d’ingénieurs ou universités en systèmes d’information ou statistiques; cela peut passer par un ajustement du cursus (ENSAE, Telecom Nancy, UMPC) ou par des formations de spécialisation Bac+6 (ENSIMAG/EMSI, ENSAI) – sauf erreur de ma part toutes ces formations ont été annoncées, au plus tôt, fin 2013 pour démarrage en 2014, ces nouveaux profils ne sont pas encore sur le marché de l’emploi (ou alors en stage)
  • celles, étalées sur 12 à 24 mois, qui s’adressent à des publics soit en fin d’étude soit déjà en poste; par exemple sous forme de Master Spécialisé (Telecom Paris – précurseur du sujet dont c’est déjà la 2ème rentrée – EM Grenoble ou encore ENSAE) ou alors sous forme de certificat (Actuariat Big Data de l’Institut des Actuaires ou Certificat analyse données massives du CNAM – les 2 démarrent tout juste)
  • et enfin celles de quelques jours ou quelques semaines pour impulser la culture Big Data au sein des entreprises: l’institut CEPE (10 jours assez techniques), l’institut Cap Gemini (sur 2 jours) ou data-business.fr qui propose une formation de 2 semaines sur le sujet

Cet univers étant en plein expansion la liste n’est sûrement pas exhaustive, vos commentaires sont les bienvenus pour l’enrichir.

Voici les liens des formations citées: Filière Data Science ENSAE, Filière Data Science Telecom Nancy, Filière Data Science UMPC, Bac+6 ENSIMAG, Bac+6 ENSAI, MS Telecom Paris, MS EM Grenoble, MS ENSAEFormation Actuariat Data Science, Certificat Big Data CNAM, Formation continue CEPE, Formation continue Cap Gemini, Formation continue Data-Business.

Un métier de passionnés avant tout

kaggle

Quel que soit le profil d’origine où la formation suivie les bons Data Scientist auront tous un point commun: la passion de la donnée, curieux de tout savoir sur son cycle de vie: d’où elle vient? comment elle est générée? avec quelle qualité? comment la traiter? comment l’utiliser? comment en interpréter l’analyse? comment la restituer de manière efficace?

Répondre à ces questions demandent une forte curiosité et un haut niveau d’ouverture sur les outils, méthodes et règles métiers; nous sommes donc loin du cliché du statisticien/informaticien scotché derrière son PC.

J’ajouterais aussi qu’aujourd’hui pour se distinguer les plus motivés participent aux concours sur Kaggle.com ou DataScience.net; concours où des entreprises mettent des données en ligne (anonymes bien sûr) et lancent des challenges pour trouver les meilleurs modèles prédisant tels ou tels évènements, les vainqueurs peuvent toucher quelques milliers d’euros. Participer à de tels concours n’est pas anodin, cela demande des jours d’investissement et l’envie de tester de nombreuses méthodes innovantes, illustration parfaite de la curiosité et de l’implication nécessaire pour être un Data Scientist complet.

 

En conclusion je dirais que ce métier, comme souvent évoqué dans la littérature, a un très bel avenir devant lui. Par contre les équipes de Data Science seront plutôt composées de multiples profils SI, Stat et Chef de Projets avec, en leur sein, des piliers rares aux compétences transverses: les Data Scientists. Concernant les formations elles vont continuer à se multiplier dans les années à venir; le véritable enjeu n’étant finalement pas de former de nouveaux diplômés (le démarrage est réel bien que tardif) mais de transformer les entreprises pour qu’elles puissent les accueillir avec des structures et des profils plus séniors prêts à les encadrer.

Quelques liens intéressants: article formations e-orientation, article formations campus.lemonde, article formations data-business.frblog Uman Partners sur les problématiques RH

7 commentaires sur “Tu seras Data Scientist ma fille!

  1. Je vais prêcher pour ma paroisse, mais je vous encourage aussi à jeter un coup d’œil au programme rénové du DUT STID (Bac+2), qui couvre, bien qu’en niveau « débutant » (en même temps, un Bac+2 est destiné à s’intégrer dans une équipe existante, pas à monter des projets data-science de A à Z), une grande partie des thématiques abordées, notamment toute la chaîne de traitement des données, de la collecte à la restitution en passant par l’analyse et le stockage.

    DUT STID – Programme rénové 2013

    Cliquer pour accéder à PPN_STID_255235.pdf

    Cordialement.

    J’aime

    • Bonjour,
      Merci pour les informations et le lien; la formation couvre largement les sujets statistiques et informatiques classiques mais aussi l’exploitation des données de masse!
      Je me permets l’ajout du lien pour le STID de Niort (de belles entreprises là bas ;-)) qui parle du sujet du Big Data :http://www.dut-stid-niort.fr/
      Bonne journée

      J’aime

  2. Bonjour,

    Je vais également prêcher pour ma paroisse, mais je tenais à vous présenter Data ScienceTech Institute, une école supérieure d’application du Big Data et de la Data Science.

    Pure player de l’enseignement BD et DS, nous proposons des programmes intensifs, de 1600h de formation et projets, pour les futurs concepteurs de la Data Science (MSc Data Scientist Designer https://www.datasciencetech.institute/fr/master-msc-data-scientist-designer/ ) et les analystes Big Data (MSc Executive Big Data Analyst https://www.datasciencetech.institute/fr/master-msc-executive-big-data-analyst/), en alternance à Paris et temps plein à Nice Sophia-Antipolis.

    Venez nous rendre visite ici: https://www.datasciencetech.institute/fr/

    Bien cordialement.
    Sébastien Corniglion
    DG Pédagogie et Recherche
    DSTI

    J’aime

Laisser un commentaire