Menu Docs
Página inicial do Docs

MongoDB Connector para Spark

O conector do MongoDB para Spark fornece integração entre MongoDB e Apache Spark.

Observação

10A versão.x do MongoDB Spark Connector conector do para totalmente novo com base na mais recente do Spark API. Instale e migre para a versão 10.x para aproveitar os novos recursos, como integração mais estreita com o Spark Structured Streaming.

A versão 10.x utiliza o novo namespace com.mongodb.spark.sql.connector.MongoTableProvider. Com isso é possível usar versões antigas do conector (versões 3.x e anteriores) em paralelo com a versão 10.x.

Para saber mais sobre o novo conector e suas vantagens, consulte o o anúncio do MongoDB no blog.

Com o conector, você tem acesso a todas as bibliotecas do Spark para uso com conjuntos de dados do MongoDB: Dataset para análise com SQL (beneficiando-se da inferência automática de esquemas), transmissão, machine learning e APIs de gráficos. Você também pode usar o conector com o Spark Shell.

O conector Spark do MongoDB é compatível com as seguintes versões do Apache Spark e MongoDB:

MongoDB Connector para Spark
Versão do Spark
Versão do MongoDB
10.4.0
3.1 a 3.5
4.0 ou posterior

Próximo

Primeiros passos com o Spark Connector