À quoi sert un data hub dans la mise en place d’un projet data?

La gestion efficace des données est devenue un enjeu crucial pour les entreprises de tous les secteurs. Cependant, en big data, elle peut être complexe et nécessite souvent l’intervention de plusieurs équipes et de différents systèmes informatiques. C’est là que le data hub entre en jeu. 1. Qu’est-ce qu’un data hub ? A. Définition d’un […]

Le data cleaning, comment obtenir un traitement de qualité des données

Le nettoyage des données d’une entreprise (data cleaning) n’est peut-être pas la partie la plus appréciée de la data science, mais c’est certainement l’une des plus importantes : sans données propres, il est impossible d’entreprendre quoi que ce soit. En effet, si les données en entrée d’un modèle ou d’une analyse ne sont pas de bonne […]

Comment analyser et modéliser des données Big Data avec Power Pivot ?

En Data Science ou en Big Data, on est amené à définir un modèle de données complexe, à créer des tableaux croisés dynamiques, des graphiques croisés dynamiques, et à effectuer des requêtes pour l’analyse des données. L’objectif est de filtrer et d’analyser les données en fonction du besoin business. Pour cela, on utilise des outils, […]

Saagie nommé par Gartner comme éditeur de logiciel représentatif du DataOps

Saagie a été nommé par Gartner dans son rapport “Market Guide for DataOps Tools” de 2022. Saagie y est reconnu pour les capacités de sa plateforme DataOps. Selon l’étude, les outils DataOps fournissent une plus grande automatisation et agilité dans la gestion du cycle de vie de bout en bout des pipelines de données afin […]

Saagie lance sa plateforme DataOps sur Google Cloud

Pour accroître toujours plus l’efficacité des équipes data, Saagie, éditeur de logiciel leader du DataOps en France, complète et améliore son offre SaaS en l’hébergeant sur Google Cloud Platform (GCP) .  Fruit d’une coopération renforcée avec les équipes Google Cloud, Saagie met à disposition une plateforme infogérée, idéale pour les opérations Big Data et l’apprentissage […]

Loi normale Python ou loi de Gauss, comment modélisez-vous vos données?

En Data Science et en probabilités, on est amené à modéliser un grand nombre de données ou un échantillon de valeurs, aléatoires (random en anglais) ou non. Pour cela, plusieurs études sont possibles : le calcul de la moyenne (mean en anglais), de la médiane (median en anglais), de la variance ou de l’écart-type, en […]

Comment intégrer un ingénieur data science au sein de son entreprise ?

Ces dernières années, les entreprises ont compris l’importance d’analyser les données pour en tirer des bénéfices en matière de choix stratégiques, d’accompagnement client et de positionnement vis-à-vis de la concurrence. Pour cela, elles ont créé un pôle data qui regroupe notamment des ingénieurs data science, ou data scientists, pour travailler sur le sujet. 1. Qui […]

Saagie nommé par Gartner® comme éditeur de logiciel représentatif du DataOps dans la catégorie Orchestration

Saagie a été nommé par Gartner au sein de l’écosystème DataOps dans son rapport “Data and Analytics Essentials: DataOps” de 2022. Saagie y est reconnu pour les capacités d’orchestration de sa plateforme. Selon l’étude, la première question à laquelle doivent répondre les organisations souhaitant investir dans un outillage DataOps relève de leur capacité à gérer […]

Qui est le Data Architect et que fait-il dans votre entreprise ?

Avec l’émergence du Big Data, l’augmentation croissante des volumes de données collectées par les entreprises et les organisations, de plus en plus de métiers autour de la Data voient le jour.  En effet, les données permettent aujourd’hui aux entreprises de mieux comprendre les besoins des clients, de les aider dans leur prise de décision et […]

Le CI/CD en DataOps : le développement continu et la mise en place de pipeline

Les données sont de plus en plus présentes dans les entreprises et on voit émerger les projets Big Data. D’autre part, on observe une diminution du temps de développement. La livraison en production et le déploiement doivent être réalisés rapidement et fréquemment par les équipes de développement et les équipes data pour faire face aux besoins.  […]

Stockage des données : quelles sont les solutions disponibles ?

Avec le développement du Big Data et l’augmentation croissante du volume des données, il devient important de bien choisir son système de stockage des données, qu’il soit sur disque SSD, sur clé USB, sur carte mémoire, sur un réseau (NAS) ou sur un cloud privé.  Particuliers comme entreprises doivent réfléchir à leur mode de gestion […]

La conteneurisation, le standard en DevOps et en DataOps

La mise en place de conteneurs dans le développement des applications, notamment avec l’utilisation d’outils comme Docker et Kubernetes, est aujourd’hui un standard en DevOps et en DataOps.  La conteneurisation informatique permet de s’affranchir de la virtualisation du système d’exploitation que l’on trouve dans les machines virtuelles, en utilisant par exemple Linux Container LXC, ce […]