Este tutorial demonstra como implementar a geração aumentada de recuperação (RAG) localmente, sem a necessidade de chaves ou créditos de API. Para saber mais sobre RAG, consulte Geração Aumentada de Recuperação (RAG) com MongoDB.
Especificamente, você executa as seguintes ações:
Crie um sistema do Atlas local.
Configure o ambiente.
Use um modelo de incorporação local para gerar incorporação de vetores.
Crie um índice do MongoDB Vector Search em seus dados.
Use um LLM local para responder a perguntas sobre seus dados.
Neste tutorial, você cria uma implantação local do Atlas usando a Atlas CLI. A Atlas CLI é a interface da linha de comando do MongoDB Atlas, e você pode usar a Atlas CLI para interagir com o Atlas a partir do terminal para várias tarefas, incluindo a criação de implantações locais do Atlas. Para saber mais, veja Gerenciar implantações locais e de nuvem a partir do Atlas CLI.
Você também pode usar um cluster do MongoDB Community ou Enterprise com pesquisa e pesquisa vetorial instalados.
Observação
As implantações locais do Atlas são destinadas apenas para testes. Para ambientes de produção, implante um cluster.
Pré-requisitos
Além dos pré-requisitos comuns, este tutorial requer o seguinte:
Crie uma implantação local.
Nesta seção, você cria uma implantação local do Atlas carregada com o conjunto de dados de listagens de amostra do AirBnB para usar como banco de dados vetorial.
Observação
Se você já tiver uma implantação local existente ou um cluster MongoDB Community ou Enterprise com pesquisa e pesquisa vetorial instalados, com os dados de amostra do sample_airbnb.listingsAndReviews carregados, você pode pular esta etapa.
Criar uma implantação local usando o Atlas CLI.
Execute atlas deployments setup e siga as solicitações para criar uma implantação local.
Para obter instruções detalhadas, consulte Criar uma implementação local do Atlas.
Carregue os dados de amostra na sua implantação.
Execute o seguinte comando no seu terminal para baixar os dados de amostra:
curl https://atlas-education.s3.amazonaws.com/sampledata.archive -o sampledata.archive Execute o seguinte comando para carregar os dados em sua implantação, substituindo
<port-number>pela porta em que você está hospedando a implantação:mongorestore --archive=sampledata.archive --port=<port-number> Observação
Você deve instalar MongoDB Database Tools da linha de comando para acessar o comando
mongorestore.
Configurar o ambiente
Gerar incorporações com um modelo local
Nesta seção, você carrega um modelo de incorporação localmente e gera incorporações vetoriais usando dados do banco de dados sample_airbnb, que contém uma coleção chamada listingsAndReviews.
Esse código pode levar alguns minutos para ser executado. Depois de concluído, você poderá visualizar suas incorporações vetoriais conectando-se ao sistema local a partir do mongosh ou ao seu aplicação usando a string de conexão do sistema. Em seguida, você pode executar operações de leitura na sample_airbnb.listingsAndReviews coleção.
Dica
Você pode converter as incorporações nos dados de amostra em vetores BSON para armazenar e ingerir vetores no Atlas com eficiência. Para saber mais, consulte como converter incorporações nativas em vetores BSON.
Crie o índice de Vector Search do MongoDB
Para habilitar a pesquisa vetorial na collection sample_airbnb.listingsAndReviews, crie um índice do MongoDB Vector Search .