La mise à jour trimestrielle de Saagie est prête !

Nous sommes ravis de vous annoncer la sortie de la version 2023.02 de notre plateforme DataOps ! Nous améliorons constamment Saagie. Grâce entre autres à vos retours et vos contributions. Vous étiez nombreux à demander plus de capacités de monitoring et plus d’intelligence dans les pipelines. Cette release est une version majeure focalisée sur l’observabilité […]
Analyse de données : Enjeux et bonnes pratiques

L’analyse de données est devenue un élément clé dans la prise de décisions stratégiques pour les entreprises et les organisations de toutes tailles et de tous secteurs. Avec la montée en puissance du Big Data, il est désormais possible de collecter et de stocker des quantités massives de données, provenant de sources diverses telles que […]
Projets « DataOps » : le guide ultime – méthode, process et techno

Sommaire Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion collaborative des données. Il est axé sur l’amélioration de la communication entre les équipes, l’intégration et l’automatisation des flux de données entre les métiers de données et les consommateurs de données. 1. Le DataOps est avant tout une méthode […]
Comment amener un projet data en production ?

Les chiffres parlent d’eux-mêmes : selon une étude de Forrester Consulting, plus de 60 % des projets de transformation numérique en entreprise échouent. La notion de risque est inhérente aux projets data. Pour réduire ce risque, optez pour une approche orientée production. Pour cela, retenez un seul mot : le DataOps. Les défis sont multiples en big data (le POC, le […]
Qu’est-ce que le DataOps ? Découvrez comment l’adopter !

« Le DataOps est une méthodologie collaborative de gestion des données dont l’objectif est d’améliorer la communication, l’intégration et l’automatisation des flux de données entre les gestionnaires et consommateurs de données au sein d’une organisation. » Source : Gartner Quels sont les défis auxquels répond le DataOps ? Le DataOps est né en réponse aux trois défis […]
Comment déployer un modèle de machine learning avec Python ?

Comment travailler avec des modèles de machine learning ? Quelles sont les principales étapes du cycle de vie des modèles de machine learning ? Comment le langage Python s’intègre-t-il dans un modèle de machine learning ? Nous montrerons aussi un exemple d’architecture de traitement de data basée sur Docker et hébergée dans le cloud pour déployer votre modèle […]
Comment créer un pipeline de détection de sentiments sur Saagie avec Python, Bash, AWS Glue, VSCode, MLflow et Dash

Pour accompagner nos nouveaux utilisateurs dans leurs premiers pas sur Saagie, nos équipes ont développé un projet complet de détection de sentiments exprimés au sein de critiques de films. Celui-ci repose sur une interaction forte entre des jobs en Python, Bash, AWS Glue et des applications Docker comme VSCode, MLflow et Dash pour démontrer comment […]
Pourquoi nos data engineers plébiscitent dbt

Chaque année, le nombre d’articles vantant dbt et ses capacités innovantes de transformation de données se multiplient. Depuis sa première version en 2016, sa communauté n’a cessé de croître jusqu’à atteindre le statut de référence parmi les data analysts et engineers. À notre tour d’en parler ! L’apparition de la Modern Data Stack Il est […]
5 erreurs qui empêchent les projets du Data Lab de passer en production

Toujours pour vous accompagner dans la réussite de votre projet Big Data/Intelligence artificielle, voici notre quatrième article sur le sujet. Si vous nous suivez depuis le début, vous savez désormais monter un Data Lab, parfois orthographié Datalab, vous connaissez tout des pièges du POC, et comprenez l’importance de mettre la vision métier au cœur de […]
Les enjeux du Big Data : sécurité et RGPD

Le Big Data se développe de plus en plus avec la multiplication du volume d’objets connectés, le traitement et l’utilisation de ces données par les entreprises. Quels sont actuellement les enjeux du Big Data ? Vous avez sans doute entendu parler du RGPD, qui vise à garantir la protection des données personnelles, mais comment le mettre en place […]
Comprendre les différences entre le rôle des ingénieurs SysOps et DevOps dans l’infrastructure système

Avec l’émergence des approches DevOps en informatique, notamment avec le cloud grand public comme les plateformes AWS et Azure, le rôle des ingénieurs SysOps et DevOps est devenu plus crucial que jamais pour les entreprises. Mais qu’y a-t-il derrière les mots « SysOps » et « DevOps » ? Quelles sont les différences entre les rôles et responsabilités imposés aux […]
Mise en place et coût d’un Data Warehouse : un mode de stockage des données hébergé sur le cloud

Votre entreprise fait face à un double constat : une croissance massive des données produites et un besoin impératif d’en tirer des informations pertinentes, impliquant tous vos services. Autrement dit, vous souhaitez acquérir un avantage concurrentiel pour votre activité en prenant des décisions éclairées, transverses et judicieuses. Il est temps d’envisager l’utilisation d’un entrepôt de […]