Retrouvez-nous le 14 mai au Google Cloud Summit à l'Accor Arena - Paris !

logo saagie red

Les nouveaux métiers de la data

Data scientist, data wrangler, dataOps, big data engineer… Si l’on commence à chercher sur internet, la liste des métiers relatifs à la data science est longue, très longue. D’autant plus qu’il s’agit là de fonctions qui n’existaient pas il y a une dizaine d’années. Et pour ne rien simplifier, on y retrouve quantité d’anglicismes !

Essayons donc d’y voir un peu plus clair. C’est justement l’objectif de cet article, car en même temps que le secteur de la data a explosé, le marché de l’emploi dans ce domaine s’est structuré pour répondre à la demande croissante de profils spécialisés.

Il est facile de trouver sur internet des définitions pour ces différents métiers. Cependant, il ne s’agit pas ici de faire un énième dictionnaire des professions du secteur de la data en essayant d’être le plus exhaustif possible, puisque comme ils sont récents, il n’y a pas vraiment de consensus sur les terminologies et leurs définitions.

Cet article propose des familles de métiers relatifs à la data en fonction des compétences requises et des responsabilités au sein d’un projet data. Pour cela, nous allons lister six catégories de métiers en essayant de les relier avec les terminologies que l’on croise couramment en ligne.

Les métiers relatifs à la sécurité et à la gestion des données

Avant même de pouvoir exploiter des données, il faut déjà qu’elles soient stockées, ceci en s’assurant :

Pour cela, il faut mettre en place une infrastructure informatique répondant au besoin de l’organisation en question. Il peut s’agir d’une simple base de données SQL ou bien d’un cluster de plusieurs serveurs orchestrés par des outils tels que ElasticSearch.

Plus important encore, il faut s’assurer de la cohérence des outils utilisés avec la nature et le volume de données. 

Globalement, tous les acteurs devront interagir avec cette infrastructure et devront donc idéalement être familiers avec les technologies utilisées.

Métiers concernés : 

  • le (big) data architect est la personne chargée de la conception de cette infrastructure
  • le data engineer désigne plus généralement celui qui s’occupe de la gestion et de la mise en œuvre des évolutions de cette infrastructure
  • l’expert cybersécurité ou Data Protection Officer s’assure de la sécurité de l’infrastructure et des données
  • le database administrator – terme peu courant – est chargé de gérer les accès aux bases de données
  • Le data stewardcoordinateur de données et l’administrateur de votre lac de données.

Les métiers relatifs à l’extraction

La première étape de beaucoup de projets datas commence ici : il s’agit de récupérer les données requises pour le projet. 

Il est courant que les données accessibles ne soient pas de très bonne qualité ou ne soient pas dans le bon format pour la suite des opérations. Avant de commencer l’analyse, il faut donc les nettoyer, les transformer en un format exploitable et auditer leur qualité finale.

Un autre point important est la mise en place de « pipeline » permettant d’automatiser toutes les opérations liées à l’extraction et au pré-traitement des données, de la source jusqu’à la base de données dans laquelle les personnes chargées de l’analyse viendront piocher.

Métiers concernés :

  • le data miner, comme son nom l’indique, est en première ligne pour identifier et exploiter les sources de données
  • le data wrangler – terme moins courant – désigne la personne chargée d’interpréter et de transformer les données
  • le data engineer est généralement impliqué dans la mise en place et la gestion des pipelines de données
  • parfois, le data scientist/analyst s’occupe du nettoyage et de l’audit des données

Les métiers relatifs à l’analyse et à l’exploitation des données

On rentre ici dans le cœur du problème. En fonction du projet, il peut s’agir de mener des analyses simplement descriptives ou bien de développer des modèles de deep learning.

Pour résumer, il faut combiner des outils mathématiques parfois complexes avec une approche scientifique permettant d’infirmer ou de confirmer des hypothèses pour ensuite concevoir des algorithmes exploitant les données collectées.

Les algorithmes développés peuvent être de nature très variée : moteur de recommandation, outil de pricing, évaluation de performance, maintenance prédictive…

Métiers concernés :

  • le data scientist, profil généraliste, maîtrise une bonne partie des techniques de machine learning, statistiques…, nécessaires pour l’analyse ainsi que la conception d’algorithmes
  • le data analyst a un rôle relativement proche du data scientist, cependant, on le retrouve plutôt dans les tâches exploratoires et descriptives
  • le statisticien – sûrement l’un des seuls non-anglicismes de cet article – utilise des techniques statistiques plus traditionnelles (mais loin d’être obsolètes !)
  • le machine learning engineer est un profil plus spécialisé dans les techniques de machine learning

Les métiers liés à la mise en production

Entre un algorithme fraîchement conçu et peaufiné par un data scientist et la mise en production de cet algorithme (c’est-à-dire sa mise en œuvre concrète), il y a un monde.

La mise en production d’un modèle peut poser beaucoup de problèmes et ne doit pas être sous-estimée ! Les problématiques en jeu dépendent des projets, mais souvent, cela fait intervenir des compétences variées et requiert la collaboration de plusieurs personnes.

Métiers concernés :

  • le data ops – version data du devops – est la personne faisant le lien entre les différents acteurs et qui est responsable de la mise en production
  • cette étape étant charnière, on y retrouvera souvent des data engineers, des développeurs, ainsi que des administrateurs systèmes.

Les métiers relatifs au business

Étant donné que la plupart des projets data sont réalisés en entreprise, ils sont censés servir une vision business. Or, la complexité et les compétences requises pour avoir une bonne compréhension de ces projets peuvent être limitantes pour un chef de projet n’ayant pas de bagage technique. 

C’est pourquoi il peut être nécessaire d’avoir des profils ayant une bonne compréhension des problématiques data business. Ces personnes font le lien entre les équipes data et les autres départements d’une entreprise.

En particulier, elles doivent être capables de communiquer clairement et sans ambiguïté des résultats d’analyses de données complexes.

Métiers concernés :

  • le business analyst : à l’image du data analyst, il a une approche exploratoire et descriptive, mais dans ce cas précis, il s’intéresse directement aux données relatives au fonctionnement de l’entreprise et à son marché
  • le product analyst et le data product owner sont chargés d’analyser l’impact des décisions business sur les produits de l’entreprise avec une approche data
  • le data visualisation specialist, comme son nom l’indique, est chargé de concevoir des visualisations, il a donc un rôle important dans la communication des résultats d’analyses
  • le data consultant, plus spécifique au conseil, est un consultant intervenant principalement sur des problématiques liées à la data

Les métiers relatifs au management

Tout cela représente pas mal de monde ! Par conséquent, il existe aussi des personnes chargées du management des projets et des équipes data.

Elles doivent avoir des connaissances dans les différentes compétences évoquées précédemment pour pouvoir faire collaborer les différents acteurs d’un projet data. 

Métiers concernés :

  • le lead data scientist : en plus d’être responsable du bon déroulement des analyses et de l’exploitation des données, il doit aussi avoir une bonne vision pour guider les efforts d’analyse et de recherche et ainsi créer un maximum de valeur
  • le chief data officer : on le retrouve dans les entreprises où l’exploitation des données revêt une dimension stratégique, il est chargé de la stratégie data de l’entreprise
  • suivant la structure de l’entreprise, d’autres métiers peuvent avoir une dimension managériale, comme le data architect par exemple.