Comment développer l’API idéale pour vos projets data ?

Après des mois de travail passés sur un projet data (tel un algorithme de machine learning, par exemple), vous arrivez à obtenir des résultats intéressants. Vous et votre hiérarchie souhaitez donc passer à la phase déploiement. Pour ce faire, une approche très classique est de développer une API dédiée intégrant le travail que vous avez […]
Machine learning : comment évaluer vos modèles ? Analyses et métriques

Vous utilisez ou souhaitez utiliser le machine learning, mais vous voulez évaluer vos modèles ? Comment les évaluer ? Nous vous expliquons les analyses et métriques dans cet article. 1. Qu’est-ce que le machine learning ? A. Machine learning : définition Selon Talend, le machine learning est une technique de programmation informatique qui utilise des probabilités statistiques […]
Sqoop, l’outil big data idéal pour combiner SQL et Hadoop

En big data, Hadoop est le framework le plus utilisé pour gérer et analyser des données. Cependant, il n’est pas fait pour se connecter directement à des données stockées dans des bases SQL. En effet, Hadoop a été conçu pour utiliser d’autres technologies de stockage, telles que HDFS ou Hive. Or, la base SQL reste […]
SQL, MongoDB, ElasticSearch… Présentation des différentes technologies de stockage

Les données sont l’élément central de la data science. La réussite (comme l’échec) d’un projet data dépend grandement des données informatiques dont on dispose. Par conséquent, le stockage de données est un défi technique crucial. Beaucoup de technologies de stockage existent, avec leurs avantages et leurs inconvénients respectifs. L’objectif de cet article est de faire […]
R, le langage roi en statistiques

R est un langage informatique lancé en 1993 et niché dans la modélisation et l’analyse statistique des données. Il est souvent utilisé avec R Studio, qui est un IDE (environnement de développement) dédié à ce langage, bien qu’il soit tout à fait possible d’utiliser d’autre IDE avec R, notamment Jupyter. R a connu un boost […]
Gouvernance des données : comment choisir entre centralisation et initiatives ?

Qu’est-ce que la gouvernance des données ? Quels choix faire entre centralisation et initiatives en fonction de la structure de l’entreprise ? La donnée connaît un essor important depuis une dizaine d’années. Elle est maintenant présente partout et collectée de manière importante, notamment avec le développement des objets connectés. Les entreprises utilisent de plus en plus l’analyse […]
La programmation fonctionnelle : un exemple concret pour comprendre comment ça marche

La programmation fonctionnelle est un paradigme de programmation peu répandu, bien qu’ancien, qui tire ses racines du lambda calculus. Ce paradigme a gagné en popularité lors de la dernière décennie, avec l’avènement du Big Data. Un paradigme de programmation est une approche, une méthode pour écrire des programmes informatiques indépendamment du langage utilisé. Un paradigme […]
10 librairies Python qui vous simplifieront la vie pour l’analyse de données

On peut, sans trop prendre de risque, affirmer que le langage Python est le numéro 1 en data science aujourd’hui et plus généralement l’un des outils les plus utilisés dans ce domaine. Ce langage de programmation, apparu au début des années 1990, fait presque figure de dinosaure dans un univers de la tech habitué au changement. Cependant, […]
Java : 5 bonnes raisons de l’adopter dans vos projets data

Vous commencez un nouveau projet data et vous réfléchissez aux technologies à utiliser ? C’est un très bon début, car nous avons vu que le choix des technologies est l’une des clés pour lancer un projet data. Aujourd’hui, nous vous expliquons pour quelles raisons Java peut être une très bonne solution pour vos projets data. Java […]
Comment l’équipe data s’intègre-t-elle au sein d’une organisation existante ?

De plus en plus d’entreprises décident d’utiliser l’analyse des données pour gagner en productivité. Cela passe par le recrutement de talents data et la création d’une équipe data. Il faut donc réfléchir à l’intégration de l’équipe data dans l’organisation de l’entreprise. Monter une équipe data performante au sein de votre organisation Une équipe data est […]
Tests unitaires, tests d’intégration… comment tester votre code ?

Vous développez, mais vous testez peu votre code ? Pourquoi et comment réaliser les vérifications de votre code ? Faire des tests en amont, c’est vérifier qu’une partie de son logiciel fonctionne comme attendu. Un processus de test permet de vérifier que le logiciel répond au besoin, est bien défini et ne fait pas d’erreur même dans […]
Culture d’entreprise : pourquoi et comment promouvoir la data ?

Depuis une dizaine d’années, les entreprises utilisent de plus en plus la data et l’analyse des données pour gagner en productivité. Cela consiste à mener à bien des projets data par l’équipe dédiée. Cependant, la data ne fait pas encore partie de la culture d’entreprise dans toutes les organisations. Nous allons donc voir pourquoi et […]