Écrire du code de qualité est essentiel en data

Data science et développement informatique sont deux domaines très proches l’un de l’autre. En particulier, la data emprunte beaucoup au développement, qu’il est utile de maîtriser pour être un spécialiste data accompli. En effet, plusieurs logiciels permettant de faire de l’analyse de données via une interface graphique existent et se sont développés ces dernières années […]
Saagie annonce de nouvelles fonctionnalités stratégiques pour sa plateforme DataOps : pipelines conditionnels

Saagie, éditeur de logiciel leader du DataOps, poursuit sa mission, celle d’accélérer la mise en œuvre de projets data en annonçant des nouveautés produits. Après avoir levé 25 millions d’euros en juin 2020 et intégré Gwendal Vaz Nunes en tant que Chief Product Officer, la start-up annonce de fortes innovations produits avec notamment l’intégration de […]
ETL et ELT, de quoi s’agit-il ? Quelle est la différence ?

Alors que les entreprises font de plus en plus appel à l’analyse de données, les besoins pour des processus efficaces de traitement des données vont crescendo. Les ETL et ELT sont justement deux outils répondant à ces besoins. ETL est l’acronyme de « Extract Transform Load », tandis que ELT signifie « Extract Load Transform ». Bien qu’ils aient […]
La méthode Agile, un fondement du DataOps

Vous avez entendu parler de la méthode Agile et du DataOps, mais vous voulez en savoir plus sur ces méthodes de gestion de projets ? Nous vous expliquons tout dans cet article. 1. La méthode Agile A. La méthode Agile : historique et définition Dans les années 1990, on assiste à une crise de développement d’applications, […]
Stockez vos données non structurées avec l’object storage

L’une des problématiques majeures du big data est le stockage des données, car il s’agit de volumes de données considérables qu’il faut pouvoir stocker et gérer le plus facilement possible. Une solution de stockage très utilisée à cette fin aujourd’hui est l’« object storage » (ou « stockage d’objets » en français, l’appellation reste cependant récente et on croise […]
Data Science : quel outil d’intégration continue choisir ?

L’organisation d’une équipe de Data Science est très complexe. En plus du facteur humain, il faut prendre en compte l’organisation technique. Pour coordonner ce type d’équipe, le paradigme DevOps propose un ensemble d’outils d’intégration continue essentiels ainsi qu’une chaîne de traitement pour réunir dans une seule équipe plusieurs profils qui étaient isolés auparavant. Ceci dit, […]
DataOps et autorisations : pourquoi est-il important de contrôler l’accès aux données ?

Vous avez entendu parler du DataOps, mais vous voulez en savoir plus sur le contrôle d’accès aux données ? Nous vous expliquons tout dans cet article. Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion des données collaborative. Il est basé sur trois axes principaux : le développement Agile pour une […]
Dash : l’outil idéal pour développer une web App avec Python

Lorsque vous analysez des données, il est courant de devoir présenter vos résultats à vos collègues ou à vos clients, notamment via des visualisations. Cependant, si vous souhaitez présenter un algorithme ou rendre vos visualisations interactives, un diaporama ne sera pas suffisant… Alors, une option courante est de créer une application web (web App) intégrant […]
DataOps : les spécificités du code en machine learning

Le domaine de l’analyse des données est devenu un eldorado et une opportunité de développement pour beaucoup d’entreprises. En particulier, la data a apporté des solutions techniques à des problèmes jusqu’ici insolubles sans une forte intervention manuelle (et donc souvent coûteuse). Il existe des cas d’applications dans de nombreux secteurs : financier, assurance, imagerie satellite, recherche […]
Le DataOps, ou la recherche d’une approche idéale pour mener à bien un projet data

Vous avez entendu parler du DataOps, mais vous voulez en savoir plus sur son application pour vos projets data ? Nous vous expliquons tout dans cet article. Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion des données collaborative. Il est basé sur trois axes principaux : le développement Agile pour […]
Conteneuriser une API en DataOps : un guide pour démarrer

La conteneurisation (containerisation en anglais) consiste à regrouper dans une même entité tous les éléments nécessaires au fonctionnement d’une application : le code, les fichiers de configuration, l’environnement d’exécution… Ainsi, cette entité est l’élément unique et nécessaire pour déployer une application. C’est donc un concept clé en dataops, en particulier pour mettre en œuvre le principe […]
Découvrez Talend, l’outil idéal pour connecter, intégrer et superviser différentes sources de données

Les données sont la matière première de tout projet data. La qualité des données va donc engendrer la réussite ou l’échec du projet. L’extraction et le nettoyage des données représentent une part importante du temps de travail des data scientists. Il est donc important de porter une attention particulière aux données utilisées et de diversifier […]