Conectores

Conector do MongoDB para o Apache Spark

Crie novas classes de real-time analytics sofisticadas ao combinar o Apache Spark, o principal mecanismo de processamento de dados do setor, com o MongoDB, o banco de dados de crescimento mais rápido do setor. O Conector do MongoDB para o Apache Spark está disponível, certificado e atualmente tem suporte para uso em produção.

Acesse as informações agora mesmo

Vivemos em um mundo de "big data". Mas não são apenas os dados em si que são valiosos, mas as informações que eles podem gerar. A rapidez com que uma organização pode desbloquear e agir com base nessas informações tornou-se uma fonte importante de vantagem competitiva. A coleta de dados nos sistemas operacionais e a dependência dos processos de extração noturnos, transformação e carregamento de processos (ETL) para atualizar o armazenamento de dados corporativos (EDW) não é mais suficiente.

Uma ilustração de um gráfico de barras crescente e um foguete
Um diagrama que descreve a aplicação de análise facilitada pelo Conector para o Apache Spark

Libere o poder do Apache Spark

O Conector do MongoDB para o Apache Spark expõe todas as bibliotecas do Spark, incluindo Scala, Java, Python e R. Os dados do MongoDB são materializados como DataFrames e conjunto de dados para análise com aprendizado de máquina, gráficos, streaming e APIs de SQL.

Aproveite o poder do MongoDB

O Conector do MongoDB para o Apache Spark pode aproveitar o pipeline de agregação e os índices secundários avançados do MongoDB para extrair, filtrar e processar somente os dados necessários — por exemplo, analisar todos os clientes localizados em um local específico. Os armazenamentos de dados NoSQL tradicionais não oferecem índices secundários ou agregações no banco de dados. Nesses casos, o Spark precisaria extrair todos os dados com base em uma chave primária simples, mesmo que apenas um subconjunto desses dados seja necessário para o processo do Spark. O Conector do MongoDB para o Apache Spark colocaliza o Resilient Distributed Datasets (RDDs) com o nó do MongoDB de origem para minimizar a movimentação de dados no cluster e reduzir a latência.
Uma ilustração de um pipeline de agregação com fluxo de dados

MongoDB e Apache Spark: trabalhando para equipes de ciência de dados

Embora o MongoDB ofereça recursos nativos avançados do Real-Time Analytics, há casos de uso em que a integração do mecanismo do Apache Spark pode ampliar o processamento dos dados operacionais gerenciados pelo MongoDB. Isso permite que os usuários operacionalizem os resultados gerados pelo Spark nos processos de negócios em tempo real com suporte do MongoDB.
industry_airline_app

China Eastern Airlines

Como uma das maiores companhias aéreas do mundo, a China Eastern explora constantemente as tecnologias emergentes para identificar novas maneiras de melhorar a experiência do cliente e reduzir custos. A China Eastern Airlines usa o Conector do MongoDB para o Apache Spark em seu novo mecanismo de cálculo de tarifas, atendendo a 1,6 bilhão de consultas por dia.
Saiba mais
industry_finance

Qumram

A Qumram expõe os dados da sessão do usuário armazenados no MongoDB aos processos de aprendizagem de máquina do Spark para ajudar as instituições financeiras globais a detectar fraudes por meio de análise comportamental e aplicar técnicas de aprendizagem profunda para a análise de sentimentos com o Processamento de Linguagem Natural.
Saiba mais
cloud_iot

Stratio

A Stratio implementou sua plataforma de big data Pure Spark, combinando o MongoDB, Apache Spark, Zeppelin e Kafka, para criar um data lake operacional para a Mutua Madrileña, uma das maiores seguradoras da Espanha. Os modelos de aprendizado de máquina são criados para personalizar a experiência do cliente com análise dos dados da campanha de marketing para medir o impacto e melhorar o desempenho.

Saiba mais
industry_airline_app

Companhia aérea global

Uma companhia aérea global consolidou os dados de clientes espalhados por mais de 100 sistemas em uma única exibição armazenada no MongoDB. Os processos do Spark são executados com base nos dados operacionais em tempo real no MongoDB para atualizar as classificações dos clientes e personalizar as ofertas, tudo em tempo real, à medida que o cliente está no site ou falando com a central de atendimento.

Próximos passos

general_action_download

Download

O Conector do MongoDB para o Spark está disponível para download no Github.

Baixar agora
general_content_learn

Saiba mais

Leia nosso novo whitepaper: Transformando a análise em ação em tempo real com Apache Spark e MongoDB.

Saiba mais
general_action_audit

Navegar

Navegue pela documentação do Conector do MongoDB para o Spark na nossa biblioteca de documentos.

Exibir documentos

Pronto para começar?

Obtenha o Conector do MongoDB para o Apache Spark.
Database illustration