Connecteurs
Connecteur MongoDB pour Apache Spark
Accès immédiat aux informations
À l’ère du « Big Data », ce ne sont pas tant les données elles-mêmes qui sont précieuses, mais les informations qu’elles recèlent. La rapidité avec laquelle une entreprise peut extraire et exploiter ces informations est devenue un enjeu de compétitivité capital. La collecte de données dans les systèmes opérationnels et les processus ETL (Extract, Transform, Load) nocturnes pour mettre à jour l’entrepôt de données ne sont plus suffisants.
Exploitez tout le potentiel d’Apache Spark
Le connecteur MongoDB pour Apache Spark expose toutes les bibliothèques Spark, notamment Scala, Java, Python et R. Les données MongoDB sont matérialisées sous forme de dataframes et d’ensembles de données pour l'analyse à l’aide du machine learning, de graphiques, de traitement par flux et d’API SQL.
Exploitez toute la puissance de MongoDB
Le Connecteur MongoDB pour Apache Spark peut tirer parti du pipeline d’agrégation et de la richesse des index secondaires de MongoDB pour extraire, filtrer et traiter uniquement les données dont il a besoin, par exemple, en analysant tous les clients situés dans une zone géographique spécifique. Les datastores NoSQL traditionnels n’offrent pas d’index secondaires ni d’agrégations dans la base de données. Dans ce cas, Spark doit extraire toutes les données basées sur une simple clé primaire, même si un seul sous-ensemble de ces données est nécessaire pour le processus Spark. Le Connecteur MongoDB pour Apache Spark colocalise les ensembles de données distribués résilients (Resilient Distributed Datasets, RDD) avec le nœud MongoDB source afin de minimiser le mouvement des données dans le cluster et réduire la latence.MongoDB et Apache Spark au service de vos data scientists
China Eastern Airlines
Qumram
Stratio
Stratio a implémenté sa plateforme Big Data Pure Spark, combinant MongoDB avec Apache Spark, Zeppelin et Kafka, afin de créer un data lake opérationnel pour Mutua Madrileña, l’une des plus grandes compagnies d’assurance d’Espagne. Les modèles de machine learning sont conçus pour personnaliser l’expérience client à partir des données d’analyse des campagnes marketing pour mesurer l’impact et améliorer la performance.
Compagnie aérienne mondiale
Une compagnie aérienne mondiale a regroupé les données clients dispersées sur plus de 100 systèmes dans une vue unique stockée dans MongoDB. Les processus Spark s’exécutent sur les données opérationnelles en direct dans MongoDB pour mettre à jour les classifications clients et personnaliser les offres en temps réel, au moment même où le client est connecté au site ou échange avec un opérateur du centre d’appels.