Écrire du code de qualité est essentiel en data

illustration blog ecrire code qualité

Data science et développement informatique sont deux domaines très proches l’un de l’autre. En particulier, la data emprunte beaucoup au développement, qu’il est utile de maîtriser pour être un spécialiste data accompli. En effet, plusieurs logiciels permettant de faire de l’analyse de données via une interface graphique existent et se sont développés ces dernières années […]

ETL et ELT, de quoi s’agit-il ? Quelle est la différence ?

Alors que les entreprises font de plus en plus appel à l’analyse de données, les besoins pour des processus efficaces de traitement des données vont crescendo.  Les ETL et ELT sont justement deux outils répondant à ces besoins. ETL est l’acronyme de « Extract Transform Load », tandis que ELT signifie « Extract Load Transform ».  Bien qu’ils aient […]

La méthode Agile, un fondement du DataOps

Vous avez entendu parler de la méthode Agile et du DataOps, mais vous voulez en savoir plus sur ces méthodes de gestion de projets ? Nous vous expliquons tout dans cet article. 1. La méthode Agile A. La méthode Agile : historique et définition Dans les années 1990, on assiste à une crise de développement d’applications, […]

Stockez vos données non structurées avec l’object storage

L’une des problématiques majeures du big data est le stockage des données, car il s’agit de volumes de données considérables qu’il faut pouvoir stocker et gérer le plus facilement possible. Une solution de stockage très utilisée à cette fin aujourd’hui est l’« object storage » (ou « stockage d’objets » en français, l’appellation reste cependant récente et on croise […]

Data Science : quel outil d’intégration continue choisir ?

L’organisation d’une équipe de Data Science est très complexe. En plus du facteur humain, il faut prendre en compte l’organisation technique. Pour coordonner ce type d’équipe, le paradigme DevOps propose un ensemble d’outils d’intégration continue essentiels ainsi qu’une chaîne de traitement pour réunir dans une seule équipe plusieurs profils qui étaient isolés auparavant. Ceci dit, […]

DataOps et autorisations : pourquoi est-il important de contrôler l’accès aux données ?

Vous avez entendu parler du DataOps, mais vous voulez en savoir plus sur le contrôle d’accès aux données ? Nous vous expliquons tout dans cet article. Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion des données collaborative. Il est basé sur trois axes principaux :  le développement Agile pour une […]

Dash : l’outil idéal pour développer une web App avec Python

Lorsque vous analysez des données, il est courant de devoir présenter vos résultats à vos collègues ou à vos clients, notamment via des visualisations. Cependant, si vous souhaitez présenter un algorithme ou rendre vos visualisations interactives, un diaporama ne sera pas suffisant… Alors, une option courante est de créer une application web (web App) intégrant […]

DataOps : les spécificités du code en machine learning

Le domaine de l’analyse des données est devenu un eldorado et une opportunité de développement pour beaucoup d’entreprises. En particulier, la data a apporté des solutions techniques à des problèmes jusqu’ici insolubles sans une forte intervention manuelle (et donc souvent coûteuse). Il existe des cas d’applications dans de nombreux secteurs : financier, assurance, imagerie satellite, recherche […]

Le DataOps, ou la recherche d’une approche idéale pour mener à bien un projet data

Vous avez entendu parler du DataOps, mais vous voulez en savoir plus sur son application pour vos projets data ? Nous vous expliquons tout dans cet article. Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion des données collaborative. Il est basé sur trois axes principaux :  le développement Agile pour […]

Conteneuriser une API en DataOps : un guide pour démarrer

La conteneurisation (containerisation en anglais) consiste à regrouper dans une même entité tous les éléments nécessaires au fonctionnement d’une application : le code, les fichiers de configuration, l’environnement d’exécution… Ainsi, cette entité est l’élément unique et nécessaire pour déployer une application. C’est donc un concept clé en dataops, en particulier pour mettre en œuvre le principe […]