Saagie lève 5 millions d'euros pour devenir le champion français du Big Data ! En savoir plus

Technologies supportées

La plateforme Saagie vous fournira le meilleur de la technologie Big Data.

Toutes ces technologies sont pré-configurées, personnalisées et prêtes à l’emploi. Il n’y a pas que des technologies Big Data, mais aussi des frameworks classiques.

Demandez une Démo

Saagie technologies supportées
Apache Hadoop File System

Apache Hadoop - HDFS

HDFS est un framework extensible et portable développé par la fondation Apache Software Foundation.

Vous pourrez stocker des téraoctets de données simplement en ajoutant des serveurs. Il gère aussi les pannes serveurs avec de la réplication sur au moins trois niveaux.

Apache Impala

Impala est un outil de gestion de données analytiques libre de droits, qui fonctionne dans l’environnement Apache Hadoop.

Nous aimons Impala car c’est le moteur de requête le plus rapide. Vous pouvez maintenant traiter des terabytes de données avec un minimum de bagages SQL.

Apache Impala
Apache Hive

Apache Hive

Hive est une infrastructure de stockage de données intégrée à Hadoop permettant l’analyse de grandes quantités de données.

Hive est le plus stable des outils de requête SQL.

Apache Drill

Prêt pour explorer vos données ? Drill vous permet d’instancier des sources de données hétérogènes en utilisant une seule requête SQL. Des requêtes depuis HDFS, Mongo, Hive ou encore Elastic Search.

Apache Drill
Apache Spark

Apache Spark

Spark est un framework open source développé par UC Berkeley AMPLab, la fondation Apache et Databrick’s qui vous permet de traiter de grands volumes de données.

Spark est le meilleur outil pour distribuer des algorithmes de machine learning sur des réseaux de serveurs. D’autre part l’avantage de Spark est qu’il couvre l’ensemble de la chaîne de traitement des données avec une seule technologie. Notre plateforme supporte toutes les versions de Spark depuis la 1.5.

Apache Sqoop

Sqoop est une interface de commande en ligne, développée par la Fondation Apache, permettant le transfert entre des bases relationnelles et Hadoop.

Si vous avez besoin d’importer des bases de données SQL depuis Oracle, SQL Server, MySQL ou encore PostgreSQL utilisez simplement Sqoop et vos données seront exportées dans votre lac de données.

Apache Sqoop
R

Talend

Talend est un logiciel libre de droit, servant à l’extraction et l'intégration des données.

N’oubliez pas que le Big Data reste simplement de la donnée. Si vous êtes un consultant Big Data, Talend sera votre meilleur ami pour ingérer de la donnée ou pour agréger de la donnée.

Java/Scala

Les jobs Java et Scala donnent la possibilité d’exécuter du contenu dans la JVM.

N’oubliez pas que le Big Data reste simplement de la donnée. Si vous êtes développeur, vous pouvez intégrer et agréger de la donnée en Java ou Scala. Java 7 et 8 sont supportées.

Java/Scala
R

R

R est un langage de programmation et un environnement d’analyse de données statistiques.

Utilisez R pour lancer vos algorithmes et vos calculs statistiques sur mesure. R est le successeur et remplaçant de SAS dans de nombreuses entreprises et connaît un fort développement sur les trois dernières années.

Python

Python est un langage de programmation vous permettant de travailler plus rapidement grâce à une intégration efficiente sur vos systèmes.

Python a longtemps été utilisé dans les laboratoires universitaires. Python vous fournira les librairies les plus complètes et stables en matière de Data Science.

Python
Notebooks

Notebooks

Jupyter est une application web vous permettant de créer et partager du code et est compatible avec de nombreux langages (Python, R, Scala, Spark, Ruby, Haskell & Julia).

Un notebook vous permet de tester vos processus et vos algorithmes de machine learning sur les données du data lake. Vous pouvez partager vos fichiers notebook (incluant les graphiques et plans) avec vos collaborateurs et ainsi avoir leurs retours.

Docker

Docker vous permettra de déployer des applications pour la visualisation de vos données ou le déploiement de vos APIs. Vous pouvez aussi déployer des processus spécifiques (Fortran, C++, Golang, Rust) ou tous types de documents tels que notebook ou d’autres applications plus spécifiques.

Deux principaux avantages :

  • Nous assurons la maintenance de votre Docker, donc vous pouvez vous concentrer sur votre code.
  • Vous pouvez tester tout ce qui fonctionne sur Docker sur la plateforme Saagie.

Docker
MongoDB

MongoDB

Mongo DB est une base de données multiplateforme orientée document.

Nous aimons utiliser MongoDB comme Datamart pour sa flexibilité et sa facilité d'utilisation pour les développeurs.

MySQL

MySQL est la plus populaire des bases de données libres de droit.

Parfois vous avez simplement besoin d’une bonne vieille base SQL pour stocker vos résultats ;)

MySQL
Découvrez votre prochaine plateforme Big Data !
Demandez votre démo
Pouvons-nous utiliser des cookies ?

Nous utilisons sur notre site des cookies. Vous pourrez trouver des explications ci-dessous. Afin d'être conforme avec la nouvelle réglementation en vigueur dans le cadre de la RGPD, merci de cliquer sur "Accepter". Après avoir cliqué, vous ne verrez plus ce message.

En savoir plus sur les traceurs En savoir plus sur la GDPR Demander la suppression de vos données personnelles