Stockage des données : quelles sont les solutions disponibles ?

Avec le développement du Big Data et l’augmentation croissante du volume des données, il devient important de bien choisir son système de stockage des données, qu’il soit sur disque SSD, sur clé USB, sur carte mémoire, sur un réseau (NAS) ou sur un cloud privé.  Particuliers comme entreprises doivent réfléchir à leur mode de gestion […]

Analyse de données : quelles sont les problématiques liées au calcul distribué ?

Depuis une dizaine d’années, le big data s’invite dans tous les domaines pour faire l’analyse des données afin d’obtenir des résultats pour les décisions et la stratégie d’une entreprise.  Les décideurs ont souvent besoin d’un rapport, d’un tableau statistique, d’indicateurs ou d’un graphique pour analyser les informations de l’entreprise ou les besoins des clients. 1. Analyse […]

S3, l’interface d’object storage la plus répandue

La technologie « object storage » est une technologie de stockage de données très répandue, en particulier dans le monde de l’analyse de données. Par conséquent, beaucoup d’entreprises cloud proposent leurs solutions d’objects storage, notamment les fournisseurs principaux (AWS, Microsoft et Google), mais aussi des acteurs niches ou régionaux (DigitalOcean ou OVH). Parmi toutes ces solutions, la […]

Quelles seront les nouvelles problématiques data en 2022 ?

Longtemps cantonnée au domaine de l’IT, la data révolutionne aujourd’hui les entreprises en devenant une ressource exploitable grâce à l’émergence du big data et à l’augmentation de la variété source de data et des importants volumes de données disponibles. L’exploitation des données permet de réaliser des études approfondies pour de meilleures prises de décisions et […]

IaaS, SaaS… le cloud est incontournable en DataOps

La gestion des données prend une place de plus en plus importante dans notre société et dans la stratégie informatique des entreprises. Le développement du cloud a été l’un des principaux vecteurs de cette transformation numérique. Sans surprise, le DataOps s’appuie donc fortement sur ces technologies. Pour rappel, le DataOps est un ensemble de processus, […]

Stockez vos données non structurées avec l’object storage

L’une des problématiques majeures du big data est le stockage des données, car il s’agit de volumes de données considérables qu’il faut pouvoir stocker et gérer le plus facilement possible. Une solution de stockage très utilisée à cette fin aujourd’hui est l’« object storage » (ou « stockage d’objets » en français, l’appellation reste cependant récente et on croise […]

Data Science : quel outil d’intégration continue choisir ?

L’organisation d’une équipe de Data Science est très complexe. En plus du facteur humain, il faut prendre en compte l’organisation technique. Pour coordonner ce type d’équipe, le paradigme DevOps propose un ensemble d’outils d’intégration continue essentiels ainsi qu’une chaîne de traitement pour réunir dans une seule équipe plusieurs profils qui étaient isolés auparavant. Ceci dit, […]

SQL, MongoDB, ElasticSearch… Présentation des différentes technologies de stockage

Les données sont l’élément central de la data science. La réussite (comme l’échec) d’un projet data dépend grandement des données informatiques dont on dispose. Par conséquent, le stockage de données est un défi technique crucial. Beaucoup de technologies de stockage existent, avec leurs avantages et leurs inconvénients respectifs. L’objectif de cet article est de faire […]

SQL et NoSQL : Quelle est la différence et lequel choisir ?

Vous connaissez un peu le SQL, mais avez entendu parler du NoSQL et vous ne savez pas lequel choisir pour vos projets ?  L’une des bonnes pratiques à adopter dans un projet data science est de bien choisir ces technologies dès le début du projet pour qu’il n’y ait pas de frein à celui-ci. Nous […]

DataOps : comment gérer différents environnements au sein du même projet ?

Quel data scientist ne s’est jamais mordu les doigts lorsqu’un algorithme, qui marchait parfaitement bien dans son environnement local, ne fonctionne plus après son déploiement dans le cloud ? C’est une situation qui peut facilement arriver et qui démontre bien que l’environnement dans lequel un logiciel ou une application s’exécute est un paramètre essentiel à […]

#DATARETENIR- Épisode 2 : La machine de Turing ou les prémices de l’informatique

Bienvenue à tous pour ce nouvel épisode de #DATARETENIR! 🎉 Une série explicative retraçant l’histoire de la Data. Alors voyagez avec nous dans le temps pour en apprendre plus sur les inventions tech et numériques qui ont fait le monde de l’internet, la data ou encore l’IA, tel que nous le connaissons ! Aujourd’hui, #DATARETENIR s’attaque […]

R en data science, un langage aux nombreux avantages

Dans le secteur de la data science, il existe des classements, selon le niveau de popularité des langages en informatique. Notamment, deux classements mensuels sont régulièrement cités : il s’agit du « Tiobe Index » (Tiobe est le nom de l’entreprise ayant créé cet index) et du « PYPL » (PopularitY of Programming Language index).  Pour un langage donné : ⦁ […]