Conectores
Conector do MongoDB para o Apache Spark
Acesse as informações agora mesmo
Vivemos em um mundo de "big data". Mas não são apenas os dados em si que são valiosos, mas as informações que eles podem gerar. A rapidez com que uma organização pode desbloquear e agir com base nessas informações tornou-se uma fonte importante de vantagem competitiva. A coleta de dados nos sistemas operacionais e a dependência dos processos de extração noturnos, transformação e carregamento de processos (ETL) para atualizar o armazenamento de dados corporativos (EDW) não é mais suficiente.
Libere o poder do Apache Spark
O Conector do MongoDB para o Apache Spark expõe todas as bibliotecas do Spark, incluindo Scala, Java, Python e R. Os dados do MongoDB são materializados como DataFrames e conjunto de dados para análise com aprendizado de máquina, gráficos, streaming e APIs de SQL.
Aproveite o poder do MongoDB
O Conector do MongoDB para o Apache Spark pode aproveitar o pipeline de agregação e os índices secundários avançados do MongoDB para extrair, filtrar e processar somente os dados necessários — por exemplo, analisar todos os clientes localizados em um local específico. Os armazenamentos de dados NoSQL tradicionais não oferecem índices secundários ou agregações no banco de dados. Nesses casos, o Spark precisaria extrair todos os dados com base em uma chave primária simples, mesmo que apenas um subconjunto desses dados seja necessário para o processo do Spark. O Conector do MongoDB para o Apache Spark colocaliza o Resilient Distributed Datasets (RDDs) com o nó do MongoDB de origem para minimizar a movimentação de dados no cluster e reduzir a latência.MongoDB e Apache Spark: trabalhando para equipes de ciência de dados
China Eastern Airlines
Qumram
Stratio
A Stratio implementou sua plataforma de big data Pure Spark, combinando o MongoDB, Apache Spark, Zeppelin e Kafka, para criar um data lake operacional para a Mutua Madrileña, uma das maiores seguradoras da Espanha. Os modelos de aprendizado de máquina são criados para personalizar a experiência do cliente com análise dos dados da campanha de marketing para medir o impacto e melhorar o desempenho.
Companhia aérea global
Uma companhia aérea global consolidou os dados de clientes espalhados por mais de 100 sistemas em uma única exibição armazenada no MongoDB. Os processos do Spark são executados com base nos dados operacionais em tempo real no MongoDB para atualizar as classificações dos clientes e personalizar as ofertas, tudo em tempo real, à medida que o cliente está no site ou falando com a central de atendimento.