5 erreurs qui empêchent les projets du Data Lab de passer en production

Cover Data Lab erreurs

5 erreurs qui empêchent les projets du Data Lab de passer en production

Share on twitter
Share on linkedin
Share on pinterest
Share on reddit
Share on pocket
Share on email

Toujours pour vous accompagner dans la réussite de votre projet Big Data / IA, voici notre quatrième article sur le sujet. Si vous suivez depuis le début, vous savez désormais monter un Data Lab, vous connaissez tout des pièges du POC, et comprenez l’importance de mettre la vision métier au coeur de son projet. Il est donc temps de s’intéresser aux erreurs qui empêchent les projets du Data Lab de passer en production.

Schema Data Lab

Erreur #1 - Vouloir tout faire soi-même

Uber, afin notamment de pouvoir lancer Uber Eats, a mis près de 18 mois à développer sa plateforme Data & Analytics. Cela montre que, même pour un géant américain de la Silicon Valley, concevoir sa propre plateforme pour gérer ses projets de bout-en-bout reste long et complexe. Les technologies nécessaires sont difficiles à assembler car disparates, et tout autant compliquées à maintenir. Le risque majeur pour une petite structure est donc d’avoir un ROI très tardivement (en effet, on ne peut adresser un cas d’usage tant qu’elle n’est pas en place), ce qui peut mettre en péril le projet.

Erreur #2 - Fonctionner en mode Shadow IT

C’est l’un des problèmes les plus récurrents. Ce que l’on appelle « shadow IT », c’est le fait de monter un projet Big Data / IA sans consulter au préalable le département informatique. L’IT n’est donc ni informé, ni impliqué, et finit souvent par bloquer la mise en production. En effet, les solutions choisies ne correspondent pas toujours aux critères de l’IT en termes d’infrastructure ou de sécurité, et s’arrêtent donc au pied de la mise en production. Il faut ainsi repartir de 0.

Erreur #3 - "Bunkeriser" son Data Lake

Avec les nouvelles réglementations comme celle du RGPD, les entreprises sont maintenant très prudentes lorsqu’il s’agit de données, ce qui est rassurant pour les consommateurs, mais peut être un frein à un projet. Les lacs de données, de plus en plus fermés (restriction des accès, contraintes liées à la protection des données personnelles…) pour toujours assurer une meilleure sécurité, ne laissent plus passer grand chose. Moins de données entrantes, moins de données sortantes et donc moins de cas d’usage. Et évidemment, aucune initiative autour de la donnée n’est envisageable sans tout cela.

Erreur #4 - Manquer de collaboration

Comme évoqué précédemment avec le cas précis du « shadow IT », il n’est pas rare que les équipes manquent de coordination. Cela se constate régulièrement entre l’IT et le Data Lab. Il faut se rendre compte que les profils engagés viennent de cultures différentes, ne travaillent pas sur les mêmes outils et pas de la même manière. En effet, leurs approches sont même opposées : l’équipe de Data Science va favoriser l’approche agile et le test & learn, quand l’IT se base sur des standards et processus plus stricts pour des questions, notamment, de sécurité. Dans certains cas, cela peut même amener des développeurs à réécrire complètement le code de Data Scientists, ce qui, à nouveau, constitue une énorme perte de temps.

Erreur #5 - Suivre des approches artisanales

De l’expérimentation à la véritable mise en production, les outils diffèrent. On distingue ainsi les technologies dites de Data Science, et les technologies largement utilisées lors de la mise en production. Par exemple, en langage Python, il existe des librairies de modélisation très avancées (scikit learn) que l’on ne retrouve pas dans une technologie comme Java. Ainsi, cela complique :

  • le passage à l’échelle
  • la reproductibilité des travaux pour le reste de l’entreprise

Voici cinq des principales erreurs dans la mise en place d’un Data Lab, qui font que la majorité des initiatives Big Data / IA n’atteignent pas la mise en production. 

Découvrez le DataOps résumé en 5 points !

Si vous voulez découvrir comment nos clients ont pu éviter ces différents pièges avec notre plateforme DataOps, n’hésitez pas à demander une démo de notre solution.

Demo
Demandez votre
démo de Saagie !