Apache Spark est un système de traitement des données rapide et puissant qui permet aux utilisateurs de traiter et d’analyser des volumes massifs de données de manière distribuée. Il offre une plateforme unifiée pour le traitement de données en batch, en temps réel, par flux et l’apprentissage automatique.
Catégorie
Utilisations
Versionning
2.4 Java/Scala 11
Stable
2.4 Python 3.7
Stable
3.0 Java/Scala 11
Stable
3.0 Python 3.7
Stable
3.1 Python 3.7
Stable
3.1 Python 3.8
Stable
3.1 Python 3.9
Stable
3.1 AWS Java/Scal 11
Stable
3.1 AWS Python 3.7
Stable
3.1 AWS Python 3.8
Stable
3.1 AWS Python 3.9
Stable