Retrouvez-nous le 14 mai au Google Cloud Summit à l'Accor Arena - Paris !

logo saagie red
illustration blog demission data scientist

Comment Faire Face aux Démissions des Data Scientists ?

C’est tout le problème avec le Big Data ou l’Intelligence Artificielle, ces concepts encore nouveaux amènent avec eux promesses et attentes et parfois, le reste ne suit pas. Dans “Why so many Data Scientists are leaving their jobs”, Jonny Brooks livre, selon lui, les principales raisons qui poussent les Data Scientists (dont il fait partie) à la démission. C’est donc le moment pour nous de faire le débrief !

Le Big Data c’est comme faire l’amour pour les adolescents : tout le monde en parle, personne ne sait vraiment comment s’y prendre, tout le monde pense que les autres le font, donc tout le monde dit le faire…

Les attentes ne correspondent pas à la réalité

Selon l’auteur, tout part d’un constat : les jeunes Data Scientists ont voulu faire de la Data Science pour résoudre des problèmes en utilisant les nouveaux algorithmes de Machine Learning à la mode, en pensant que leur travail allait faire une grande différence pour l’entreprise. En arrivant dans le monde du travail, ils sont donc généralement déçus, et cela pour deux raisons majeures :

  • Beaucoup d’entreprises engagent des Data Scientists sans pouvoir suivre en terme d’infrastructure technologique.
  • Lorsqu’un Data Scientist intègre une entreprise, il voudrait de suite écrire des algorithmes de Machine Learning innovants. Or, il doit souvent se contenter, au moins dans un premier temps, de démêler et trier les données de l’entreprise. Il est ensuite souvent cantonné à de petites missions peu stimulantes comme mettre en place des rapports quotidiens.

Pour éviter de tomber dans ce travers, il faut être en capacité de fournir une large palette d’outils aux Data Scientists pour qu’ils puissent rapidement explorer les données de l’entreprise et expérimenter des algorithmes de Machine Learning. Il faut aussi s’assurer que l’infrastructure mise à disposition sera suffisamment robuste et répondra aux critères de sécurité et de production du département IT, afin d’assurer une certaine scalabilité à leurs travaux.

Pour ce faire, nous avons développé notre Plateforme DataOps: une plateforme certifiée et complètement sécurisée, intégrant le meilleur des technologies open-source et propriétaires du marché, pour concevoir de bout-en-bout des applications métier intelligentes, et les déployer en un temps record. Les Data Scientists vont y trouver un environnement idéal pour explorer et expérimenter, contribuant ainsi à leur épanouissement. La DSI va disposer d’une infrastructure Big Data clé en main, infogérée et conforme aux critères IT. La Data Fabric va ainsi faciliter l’exploration pour ensuite accélérer le développement d’applications intelligentes.

La suprématie de la politique

“En réalité, vous avez tout intérêt à ce que les gens les plus influents de l’entreprise aient une bonne opinion de vous”. Cet aspect, pointé du doigt par l’auteur, est valable dans de nombreuses entreprises et touche presque tous les secteurs. Il explique ainsi que le fait de connaître un grand nombre d’algorithmes ne fait pas forcément la différence, mais que la politique quant à elle, peut tout changer.

Selon l’auteur, une bataille se joue alors pour devenir le “chouchou”. Il faut alors jouer le jeu et cela signifie parfois simplement chercher, trouver et apporter des données à la bonne personne, au bon moment. D’autres fois, il s’agira de petites tâches à faire rapidement. Cela peut donc être frustrant pour le salarié qui n’a pas suffisamment de stimulations. A cela s’ajoute aussi le manque de reconnaissance du salarié qui a du mal à se sentir estimé ou utile.

Pour éviter de tomber dans ce jeu politique, il faut dès le début d’une initiative Big Data / IA aligner les métiers, le Data Lab (incluant les Data Scientists) et l’IT sur un objectif commun. Cet objectif, c’est de savoir accélérer la mise en production de cas d’usage pour démontrer rapidement de la valeur, et réduire ainsi le temps passé à faire du lobbying. Une fois le/les cas d’usage définis, il sera plus aisé pour le Data Scientist de faire son travail, et de démontrer de la valeur. Dans ce contexte, notre Data Fabric apparaît comme une solution idéale. En effet, elle s’inspire des pratiques devops pour les appliquer à la Data Science, réduisant ainsi les temps de développement et de déploiement des projets. Le travail des équipes de data Scientists est donc rapidement mis en avant, avec des résultats tangibles.

Travailler au sein d’une équipe isolée

Le développement d’une application intelligente implique différents profils, des Data Scientists, Data engineers, développeurs jusqu’à l’IT, qui doivent collaborer afin d’assurer la réussite du projet. Les équipes de Data Science, quand elles travaillent de façon isolée, ont plus de mal à être réellement impliquées et donc à générer toute la valeur qu’elles sont pourtant capables de générer. C’est en tout cas l’analyse de l’auteur.

Malgré tout, encore beaucoup d’entreprises forment des équipes de Data Science isolées qui sont à l’initiative de projets, codent et aident à résoudre des problèmes. Et cela suffit dans le cas de création d’un tableau de résultats mis à disposition chaque trimestre. En revanche, ce n’est pas souvent le cas pour les missions plus complexes comme proposer des suggestions intelligentes sur un site web pour l’achat d’un produit. C’est pourquoi l’auteur rappelle qu’il ne faut pas en attendre trop d’une équipe de Data Scientists, qui ne pourra pas développer une solution web sur mesure de toute pièce, les compétences nécessaires n’étant pas celles attendues d’un Data Scientist. Attention donc aux entreprises qui voudraient créer un projet de 0 et qui reposerait entièrement sur une équipe de Data Science, qui devra alors composer avec la pression, la frustration et souvent l’échec qui s’en suit.

Pour ne pas sombrer dans le syndrome de l’isolation, il faut être en capacité d’amener les équipes composant le Data Lab (Data Scientists, Data Engineers, Data AnalystsData Stewards, etc) à collaborer entre elles et partager leur travaux. Sans collaboration, les projets sont voués à l’échec, générant de la frustration dans tout le Data Lab. Pour faire tomber les barrières, Saagie propose au sein de sa Data Fabric un environnement collaboratif où chaque membre du Data Lab va pouvoir apporter et suivre ses contributions. Saagie se positionne ainsi comme le moteur des Data Labs, réduisant l’isolement, renforçant l’entraide et l’échange pour mieux capitaliser sur l’expérience et les compétences de chacun.

Si de nombreuses raisons poussent les Data Scientists à la démission, nous essayons chez Saagie de leur apporter un environnement qui leur garantit de bonnes conditions. Néanmoins et comme le rappelle l’article une chose est sûre et n’est pas seulement valable dans le monde de la Data Science, si les objectifs de l’entreprise ne sont pas alignés avec ceux du salarié, alors leur relation a déjà une date d’expiration.