Conectores
MongoDB Connector for Apache Spark
Acceda a la información ahora
Vivimos en un mundo de “big data”. Pero no solo los datos en sí son valiosos, sino la información que pueden generar. La rapidez con la que una organización puede desbloquear esa información y actuar al respecto se ha convertido en una fuente importante de ventaja competitiva. Ya no basta con recopilar datos en los sistemas operativos y confiar en los procesos nocturnos de extracción, transformación y carga (ETL) por lotes para actualizar el almacén de datos empresariales (EDW).
Desbloquee el poder de Apache Spark
El MongoDB Connector for Apache Spark expone todas las bibliotecas de Spark, incluidas Scala, Java, Python y R. Los datos de MongoDB se materializan como DataFrames y Datasets para su análisis con aprendizaje automático, gráficos, secuencias y API de SQL.
Aproveche el poder de MongoDB
El MongoDB Connector for Apache Spark puede aprovechar el aggregation pipeline de MongoDB y los índices secundarios enriquecidos para extraer, filtrar y procesar solo los datos que necesita, por ejemplo, analizar todos los clientes ubicados en una geografía específica. Los almacenes de datos NoSQL tradicionales no ofrecen índices secundarios ni agregaciones en la base de datos. En estos casos, Spark tendría que extraer todos los datos en función de una clave principal simple, incluso si solo se requiere un subconjunto de esos datos para el proceso de Spark. El MongoDB Connector for Apache Spark ubica conjuntos de datos distribuidos resistentes (RDD) con el nodo de MongoDB de origen para minimizar el movimiento de datos en el clúster y reducir la latencia.MongoDB y Apache Spark: trabajar para equipos de ciencia de datos hoy
China Eastern Airlines
Qumram
Stratio
Stratio implementó su plataforma de big data Pure Spark, que combina MongoDB con Apache Spark, Zeppelin y Kafka, para crear un lago de datos operativo para Mutua Madrileña, una de las compañías de seguros más grandes de España. Los modelos de aprendizaje automático están diseñados para personalizar la experiencia del cliente, con el análisis de los datos de las campañas de marketing para medir el impacto y mejorar el rendimiento.
Aerolínea mundial
Una aerolínea mundial ha consolidado los datos dispersos de los clientes en más de 100 sistemas en una sola vista almacenada en MongoDB. Los procesos de Spark se ejecutan con los datos operativos en vivo de MongoDB para actualizar las clasificaciones de los clientes y personalizar las ofertas en tiempo real, mientras el cliente está en vivo en la web o hablando con el centro de llamadas.