Orchestrez des technologies et exécutez des pipelines

Tirez parti du meilleur des technologies commerciales, open source et public cloud. Notre Plateforme DataOps les intègre et les orchestre grâce à Kubernetes pour vous en faciliter l’utilisation. Optimisez vos coûts sans perdre en agilité en choisissant vos technologies préférées, leurs version et les librairies qui les accompagnent.

Sélectionnez vos technologies

Lancez vous sans plus attendre en profitant d’une orchestration simplifiée de frameworks pré-packagés open source, propriétaires et cloud et évitez-vous de nombreux mois de configuration et de débats en meetings d’architecture.

La plateforme DataOps de Saagie offre de nombreux contextes de choix de technologies, de leurs différentes versions et de librairies pour vous permettre d’adapter vos choix tout au long du projet.

technologies
Devops

Rendez vos travaux reproductibles

Ne vous arrêtez plus au stade du POC. En simplifiant l’implémentation de pratiques DevOps dans les projets data, Saagie vous permet de passer vos travaux en production.

La plateforme DataOps permet aux équipes data d’explorer et d’expérimenter en leur assurant que leurs traitements s’exécuteront de la même manière en Lab’ qu’en Prod’ par la promotion de jobs entre environnements.

Chacun des jobs créés au sein de Saagie est reproductible peu importe l’environnement et vous évite de perdre du temps à configurer des environnements Python.

Lancez vos jobs en pipelines

Après avoir choisi vos technologies et créé vos jobs, il vous suffit de construire vos pipelines afin de gérer le cycle complet de la donnée, de la préparation à la visualisation.

Le large choix de technologies et leur orchestration permet à vos data engineers et data scientists de collaborer sur un seul et même projet, le tout dans un environnement sécurisé. Toute instance et exécution de jobs est sauvegardée afin que l’ensemble du projet soit supervisable et traçable.

Orchestration

Les technologies supportées

Débutez maintenant en choisissant parmi notre sélection de technologies sur étagère. Orchestrez des ETL (Extract, Transform, Load), des technologies de préparation et de traitement.

python

Python

Catégorie:
Data Engineering, Machine Learning

Utilisation:
KPI et Machine Learning sur de petits datasets

Versions supportées:
2.7, 3.5, 3.6, 3.7
bash

Bash

Catégorie:
Data Engineering

Utilisation:
Extraction, Intégration

Versions supportées:
Debian 9, CLI AWS, CLI Azure, CLI GKE
R

R

Catégorie:
Data Engineering, Machine Learning

Utilisation:
Statistiques

Versions supportées:
3.4.4, 3.5.3, 3.6.3
spark

Spark

Catégorie:
Data Engineering, Machine Learning
Utilisation:
KPI et Machine Learning sur de grands datasets, Streaming
Versions supportées:
2.4.5 (Java: 8,11 - Python: 2.7, 3.5, 3.7)
Talend

Talend

Catégorie:
Data Engineering

Utilisation:
Batch

Versions supportées:
8.121, 8.131
Java

Java

Catégorie:
Data Engineering

Utilisation:
Streaming

Versions supportées:
7, 8, 11
docker

Docker

Catégorie:
Data Engineering, Machine Learning

Utilisation:
App containerization
sqoop

Sqoop

Catégorie:
Data Engineering

Utilisation:
Extraction

Versions supportées:
1.4.6

Notre catalogue d’applications

Profitez aussi d’images Docker pré-configurées afin d’intégrer facilement des applications et leurs librairies. 

r studio

R Studio

Catégorie:
Data Engineering, Machine Learning

Versions supportées:
3.4.4, 3.6.2
Nifi

Nifi

Catégorie:
Data Engineering

Versions supportées:
1.9.2
jupyter

Jupyter

Catégorie:
Data Engineering, Machine Learning

Versions supportées:
5.2.1
Grafana

Grafana

Catégorie:
Data Visualization

Versions supportées:
6.6.2
zeppelin

Zeppelin

Catégorie:
Data Engineering, Machine Learning

Versions supportées:
0.7.3
Kibana

Kibana

Catégorie:
Data Visualization

Versions supportées:
5.6.3, 5.6.16, 6.4.1, 6.4.3, 6.8.1, 6.8.4, 7.4.0, 7.4.1, 7.5.1, 7.6.2
Demo
Demandez votre démo de Saagie !