Explore o novo chatbot do Developer Center! O MongoDB AI chatbot pode ser acessado na parte superior da sua navegação para responder a todas as suas perguntas sobre o MongoDB .

Junte-se a nós no Amazon Web Services re:Invent 2024! Saiba como usar o MongoDB para casos de uso de AI .
Desenvolvedor do MongoDB
Central de desenvolvedor do MongoDBchevron-right
Produtoschevron-right
Atlaschevron-right

Dados do MongoDB ELT usando o Airbyte

Robert Walters2 min read • Published Nov 16, 2022 • Updated Nov 16, 2022
Atlas
Ícone do FacebookÍcone do Twitterícone do linkedin
Airbyte e MongoDB
Avalie esse Tutorial
star-empty
star-empty
star-empty
star-empty
star-empty
O Airbyte é uma plataforma de integração de dados de código aberto que oferece uma maneira fácil e rápida de ELT (Extrair, Carregar e Transformar) seus dados entre uma variedade de fontes de dados. O AirByte pode ser usado como parte de uma solução de orquestração de fluxo de trabalho como o Apache Airflow para lidar com a movimentação de dados. Neste post, instalaremos o Airbyte e replicaremos o banco de dados de amostra, "sample_restaurants, " encontrado no MongoDB Atlas em um arquivo CSV.

Começar

O Airbyte está disponível como um serviço de nuvem ou pode ser instalado de formaauto-hospedada usando contêineres Docker. Neste post, implantaremos o Airbyte localmente usando o Docker.
1git clone https://github.com/airbytehq/airbyte.git
2cd airbyte
3docker-compose up
Quando os containers estiverem prontos, você verá o logo impresso nos logs compostos da seguinte maneira:
texto do shell da linha de comando mostrando o logotipo da airbyte
Navegue até http://localhost:8000 para iniciar o portal da Airbyte. Observe que o nome de usuário padrão é "admin " e a senha é "password. "

Criando uma conexão

Para criar um connector de origem, clique no item de menu Fontes no lado esquerdo do portal e, em seguida, no botão "Connect to your first source". Isso iniciará a página Nova fonte da seguinte maneira:
Caixa de diálogo Nova fonte mostrando MongoDB como uma opção para o tipo de fonte
Digite "mongodb " e selecione "MongoDb. "
O MongoDB Connector pode ser usado com clusters auto-hospedados e MongoDB Atlas.
Nova caixa de diálogo Fonte mostrando as opções de tipo de instância do MongoDB
Selecione o tipo de instância MongoDB apropriado e preencha o restante das informações de configuração. Neste post, usaremos o MongoDB Atlas e definimos nossa configuração da seguinte forma:
Tipo de instância do MongoDBMongoDB Atlas
Cluster URLdemo.ikyil.mongodb.net
Nome do Banco de Dadossample_restaurants
Nome de usuárioab_user
Senha**********
Fonte de autenticaçãoadmin
Observação: Se você estiver usando o MongoDB Atlas, certifique-se de criar o usuário e permitir o acesso à rede. Por padrão, o MongoDB Atlas não acessa conexões remotas.
Clique em “Setup source” e o Airbyte testará a conexão. Se for bem-sucedido, você será enviado para a página Adicionar destino. Clique no botão “Add destination” e selecione “Local CSV” no menu suspenso.
Em seguida, forneça um nome de destino, "restaurant-samples, " e um caminho de destino, "/local. ". O portal da Airbyte fornece um guia de configuração para o connector CSV local no lado direito da página. Isso é útil para uma referência rápida sobre a configuração do connector.
Nova caixa de diálogo de destino mostrando o Guia de configuração da conexão CSV local
Clique em “Set up destination” e a Airbyte testará a conexão com o destino. Após o sucesso, você será redirecionado para uma página na qual poderá definir os detalhes do stream que deseja sincronizar.
Configurando uma conexão
O Airbyte oferece uma variedade de opções de sincronização, incluindo atualização completa e incremental.
Source sync options dialog
Selecione “Full Refresh | Overwrite” e clique em “Set up sync.”
O Airbyte iniciará o processo de sincronização e, se for bem-sucedido, você verá a mensagem Sincronização bem-sucedida.
Caixa de diálogo Sincronização bem-sucedida

Explorando os dados

Vamos dar uma olhada nos arquivos CSV criados. O connector CSV grava no suporte Docker /local no servidor airbyte. Por padrão, essa montagem é definida como /tmp/airbyte_local e pode ser alterada definindo a variável de ambiente Docker LOCAL_ROOT.
Para visualizar os arquivos CSV, inicie o bash a partir do comando docker exec da seguinte maneira:
docker exec -it airbyte-server bash
Depois de conectado, navegue até a pasta /local e visualize os arquivos CSV:
bash-4.2# cd /tmp/airbyte_local/ bash-4.2 #ls _airbyte_raw_neighborhoods.csv _airbyte_raw_restaurants.csv

Resumo

No mundo rico em dados de hoje, a criação de pipelines de dados para coletar e transformar dados heterogêneos é uma parte essencial de muitos processos de negócios. Se o objetivo é obter insights de negócios por meio de análises ou criar uma visão única do cliente, a Airbyte facilita a movimentação de dados entre o MongoDB e muitas outras fontes de dados.

Ícone do FacebookÍcone do Twitterícone do linkedin
Avalie esse Tutorial
star-empty
star-empty
star-empty
star-empty
star-empty
Relacionado
Tutorial

Simplificando o desenvolvimento nativo da nuvem com o Gitpod e o MongoDB Atlas


Apr 02, 2024 | 5 min read
Tutorial

Integre os registros do Atlas Application Services no Datadog na AWS


Sep 09, 2024 | 2 min read
Tutorial

Simplifique a pesquisa semântica do Atlas com LangChain e MongoDB


Oct 28, 2024 | 4 min read
Tutorial

Impulsionando a IA: construa um chatbot sobre seus dados com o MongoDB Atlas Vector Search e os modelos LangChain usando o padrão RAG


Sep 18, 2024 | 7 min read
Sumário
  • Começar