Aplicar linguagem natural em consultas do MongoDB com o Google Gemini
Venkatesh Shanbhag, Yemi Falokun7 min read • Published Apr 09, 2024 • Updated Apr 23, 2024
Avalie esse Artigo
Na era digital, aproveitar a linguagem natural para consultas de banco de dados representa um salto em direção a um gerenciamento de dados mais intuitivo. As Vertex AI Extensions, atualmente em visualização privada, ajudam na interação com o MongoDB usando linguagem natural. Este tutorial apresenta uma abordagem que combina o processamento avançado de linguagem naturaldo Google Gemini com o MongoDB, facilitado pelas extensões de AI da Vertex. Essas extensões abordam as principais limitações dos modelos de linguagem grandes (LLMs), permitindo a consulta e modificação de dados em tempo real, o que os LLMs não podem fazer devido à sua base de conhecimento estática após o treinamento. Ao integrar o MongoDB Atlas com as extensões de AI da Vertex, oferecemos uma solução que melhora a acessibilidade e a usabilidade do banco de dados.
O esquema dinâmico, a escalabilidade e os recursos abrangentes de query do MongoDB o tornam um exemplo para aplicativos de IA generativa. Ele é hábil em lidar com a natureza versátil e imprevisível dos dados que esses aplicativos geram e usam. Da geração de conteúdo personalizada, em que os dados do usuário moldam o conteúdo em tempo real, aos sistemas de recomendações sofisticados e orientados por IA, aproveitando dados atualizados ao minuto para sugestões personalizadas, o MongoDB se destaca. Além disso, ele se destaca na análise complexa de dados, permitindo que as ferramentas de AI interajam com conjuntos de dados vastos e variados para extrair insights significativos, mostrando seu papel fundamental no aprimoramento da eficiência e eficácia dos aplicativos de AI generativa.
A consulta de linguagem natural representa uma mudança de paradigma na interação de dados, permitindo que os usuários recuperem informações sem a necessidade de linguagens de consulta personalizadas. Ao integrar o MongoDB com um sistema capaz de entender e processar linguagem natural, simplificamos as operações de banco de dados, tornando-as mais acessíveis a usuários não técnicos.
A solução envolve uma sinergia de vários componentes, incluindo MongoDB, Google Vertex AI SDK, Google Secrets Manager e OpenAPI 3 especificações. Juntos, esses elementos criam uma estrutura robusta que traduz consultas de linguagem natural em chamadas do MongoDB Atlas Data API. Nesta solução, exploramos as operações básicas de CRUD com extensões de Vertex AI. Estamos trabalhando em estreita colaboração com o Google para permitir agregações de pesquisa vetorial em um futuro próximo.
- MongoDB: Um banco de dados versátil e orientado a documentos que armazena dados em formatos semelhantes ao JSON, tornando-o altamente adaptável a vários tipos de dados e estruturas
- SDK de AI do Google Vertex: facilita a criação e o gerenciamento de modelos de AI e aprendizado de máquina, incluindo a extensão personalizada para a AI do Google Vertex
- Extensões Vertex AI: aprimore os LLMs, permitindo que eles interajam com sistemas externos em tempo real, estendendo seus recursos além do conhecimento estático
- Google Secrets Manager: Armazena com segurança informações confidenciais, como chaves de API do MongoDB, garantindo a segurança e a integridade da solução
- OpenAPI 3 Especificação para o Atlas Data API: Define uma interface padrão e independente de linguagem para o MongoDB que permite uma integração fácil e uma documentação clara dos recursos da API.
A solução opera convertendo queries de linguagem natural em parâmetros que a MongoDB Atlas Data API pode entender. Essa conversão é facilitada por uma extensão personalizada desenvolvida usando o SDK de extensão Google Vertex AI, que é então integrada ao Gemini 1.0 Pro. A extensão aproveita as especificações OpenAPI 3 para interagir com o MongoDB, recuperando dados com base na entrada de linguagem natural do usuário. O Google Secrets Manager desempenhou um papel fundamental no gerenciamento seguro das chaves de API necessárias para o acesso ao MongoDB, garantindo a segurança da solução.
Antes de começar, certifique-se de ter o seguinte:
- Se você é novo no MongoDB Atlas, pode se inscrever no MongoDB por meio do GCP Marketplace ou com a Atlas página de registro do .
- As extensões Vertex AI não estão disponíveis publicamente. Inscreva-se no Programa Extensions Trusted Tester.
Antes de começarmos, certifique-se também de:
Habilitar MongoDB Data API: para habilitar o Atlas Data API a partir da página de destino do Atlas, abra a seçãoAtlas Data API no painel lateral, habilite o Atlas Data API e copie o URL conforme mostrado abaixo.
Para criar uma chave de API, clique em Usuários e, em seguida, clique em Criar chave de API.
Crie um segredo para sua API: Para proteger a API de dados do MongoDB, armazene-a no GCP [Gerenciador de segredos](https://cloud.google.com/secret-manager/docs/createting-and-accessing-secrets# :~:text=Vá para a página do Secret Manager no console do GCP.&text=Na página do Secret Manager,exemplo%2C my-secret )). Para criar um novo segredo no Console do GCP, navegue até Secrets Manager e clique em CREATE SECRET. Cole o segredo criado pelo MongoDB no campo de valor secreto e clique em Criar.
Desenvolver especificação de API: definiremos as interações entre o Google Vertex AI e sua MongoDB Atlas Data API usando OpenAPI 3. especificações do 0 . Você pode baixar as especificações do Github. Esta especificação descreve como as queries de linguagem natural serão convertidas em operações do MongoDB.
Este tutorial usa o conjunto de dados padrão MongoDB do banco de dados sample_mflix, filmescollection. Executaremos todo o código abaixo no Notebook Enterprise Colib.
- O Vertex AI Extensions é uma plataforma para criar e gerenciar extensões que conectam grandes modelos de linguagem a sistemas externos por meio de APIs. Esses sistemas externos podem fornecer dados em tempo real aos LLMs e executar ações de processamento de dados em seu nome.
- Instale as dependências necessárias do Python.
- Após a instalação das dependências, reinicie o kernel.
- Inicialize as variáveis de ambiente.
- Baixe a especificação Open API do GitHub e envie o arquivo YAML para o bucket do Google Cloud Storage.
- Para criar a extensão Vertex AI, execute o script abaixo. O manifesto aqui é um objeto JSON estruturado que contém vários componentes principais:
- Valide a extensão criada e imprima o esquema de operação e os parâmetros.
Depois que a extensão for criada, navegue até Vertex AI UI e, em seguida, Vertex UI Extension no painel esquerdo.
Todas as extensões criadas estarão disponíveis para seleção. Selecione o intérprete da API do MongoDB Vertex. Para este tutorial, consideraremos duas viagens de usuário.
Recupere dados por meio das extensões Vertex AI: Imagine precisar descobrir rapidamente quando um filme clássico foi lançado sem navegar manualmente pelo banco de dados. Ao perguntar à Vertex AI, " Encontre o ano de lançamento do filme 'A Corner in Wheat' no cluster VertexAI-POC, sample_mflix, movies, ", você obtém o ano de lançamento específico, pois o sistemaexecuta uma operação findOne () para recuperar esse detalhe.
Além de usar a UI, também podemos usar o Notebook para consultar o MongoDB usando o processamento de linguagem natural. Estamos usando o Gemini para converter a linguagem natural no esquema de operação real para chamar a extensão Vertex AI. Atualize a variável de ambiente e execute o script abaixo.
No esquema convertido, consulte a extensão.
Recuperar dados por meio de extensões da Vertex AI: um analista do cinema deseja uma lista de todos os filmes lançados em um ano específico — por exemplo, 1924 — para aprender as tendências do cinema da época. Eles poderiam perguntar: "Mostre-me filmes lançados no ano 1924 do VertexAI-POC cluster, sample_mflix, filmes," e o sistema usaria o método find() para listar todos os filmes do 1924, fornecendo um instantâneo abrangente dos a produção cinematográfica daquele ano.
Além de usar a UI, também podemos usar o Notebook para consultar o MongoDB usando o processamento de linguagem natural.
Aqui está a integração do Gemini para conversão de linguagem natural em esquema de extensão:
Execute a extensão para obter a resposta.
Concluindo, a integração do MongoDB com recursos de query de linguagem natural revolve a interação de dados, melhorando a acessibilidade e a intuitividade das queries de banco de dados. Aproveitar o Google Gemini Foundation Model junto com uma extensão personalizada do Vertex AI não apenas enriquece a experiência de recuperação de dados, mas também mantém a segurança e a integridade dos dados. Estamos trabalhando de perto com a equipe do Google Cloud para adicionar ainda mais padrões de query às extensões da Vertex AI. Fique atento para mais neste espaço.
- Comece a usar o MongoDB Atlas no Google Cloud.
Principais comentários nos fóruns
Ainda não há comentários sobre este artigo.