Fireworks AI e MongoDB: os aplicativos de IA mais rápidos com os melhores modelos, alimentados por seus dados

Mat Keep and Angela Lee

Temos o prazer de anunciar que o Fireworks AI e o MongoDB estão se unindo para tornar a inovação com IA generativa mais rápida, eficiente e segura. O Fireworks AI foi fundado no final de 2022 por veteranos do setor e integrantes da equipe PyTorch da Meta que se concentraram na otimização do desempenho, na melhoria da experiência do desenvolvedor e na execução de aplicativos de IA em grande escala.

É essa experiência que o Fireworks AI traz para sua plataforma de IA de produção, selecionando e otimizando os principais modelos abertos do setor. O benchmarking da empresa mostra que os modelos de IA generativa executados no Fireworks AI operam com velocidades de inferência até 4 vezes mais rápidas do que as plataformas alternativas, com taxa de transferência e escala até 8 vezes maiores.

Os modelos são uma parte da pilha de aplicação. No entanto, para que os desenvolvedores possam desbloquear o poder da IA generativa, eles também precisam trazer dados corporativos para esses modelos. É por isso que o Fireworks AI fez uma parceria com o MongoDB, abordando um dos desafios mais difíceis para a adoção da IA. Com o MongoDB Atlas, os desenvolvedores podem unificar com segurança dados operacionais, dados não estruturados e incorporações vetoriais para criar com segurança aplicações e experiências de IA consistentes, corretas e diferenciadas.

Juntos, o Fireworks AI e o MongoDB oferecem uma solução para desenvolvedores que desejam aproveitar modelos de código aberto altamente selecionados e otimizados e combiná-los com os dados proprietários da própria organização – e fazer tudo isso com velocidade e segurança incomparáveis.

Modelos ultrarrápidos do Fireworks AI: permitindo velocidade, eficiência e valor

Com plataforma de inferência ultrarrápida, o Fireworks AI seleciona, otimiza e implanta mais de 40 modelos diferentes de IA. Essas otimizações podem resultar simultaneamente em economia significativa de custos, latência reduzida e taxa de transferência aprimorada. A plataforma oferece isso por meio de:

  • Modelos prontos para uso, modelos otimizados e complementos: o Fireworks AI fornece uma coleção de modelos de base de texto, incorporação e imagem de alta qualidade. Os desenvolvedores podem aproveitar esses modelos ou ajustar e implantar os seus próprios, combinando-os com seus dados proprietários por meio do MongoDB Atlas.

  • Recursos de ajuste fino: para melhorar ainda mais a precisão e a velocidade do modelo, o Fireworks AI também oferece um serviço de ajuste fino usando sua CLI para ingerir objetos formatados em JSON de bancos de dados como o MongoDB Atlas.

  • Interfaces e API simples para desenvolvimento e produção: o playground do Fireworks AI permite que desenvolvedores interajam com modelos diretamente no navegador. Ele também pode ser acessado de forma programática por meio de uma REST API conveniente. Isso é compatível com a API OpenAI e, portanto, interopera com o ecossistema LLM mais amplo.

  • Livro de receitas: um livro de receitas simples e fácil de usar que fornece um conjunto amplo de receitas prontas para uso que podem ser adaptadas para vários casos de uso, incluindo ajuste fino, geração e avaliação.

Fireworks AI e MongoDB: definindo o padrão para IA com modelos selecionados, otimizados e rápidos

Com o Fireworks AI e o MongoDB Atlas, os aplicativos são executados em ambientes isolados, garantindo tempo de atividade e privacidade, protegidos por controles de segurança sofisticados que atendem aos padrões regulatórios mais rígidos:

  • Como um dos principais fornecedores de API de modelo de código aberto, o Fireworks AI fornece 66 bilhões de tokens por dia (e esse número só cresce).

  • Com o Atlas, você executa seus aplicativos em uma plataforma comprovada que atende a dezenas de milhares de clientes, desde startups de alto crescimento até as maiores empresas e governos.

Juntas, a solução conjunta do Fireworks AI e do MongoDB permite:

  • RAG ou perguntas e respostas a partir de um vasto conjunto de documentos: ingerir inúmeros documentos para produzir resumos e dados estruturados que podem alimentar a IA conversacional.

  • Classificação por meio de pesquisa semântica/similaridade: classifique e analise conceitos e emoções de chamadas de vendas, videoconferências e muito mais para garantir inteligência e estratégias melhores. Ou organize e classifique um catálogo de produtos usando imagens e texto do produto.

  • Imagens para extração de dados estruturados: extraia o significado das imagens para produzir dados estruturados que possam ser processados e pesquisados em uma variedade de aplicativos de visão – de fotos de banco de imagens à moda, detecção de objetos e diagnósticos médicos.

  • Inteligência de alerta: processe grandes quantidades de dados em tempo real para detectar e alertar automaticamente sobre casos de fraude, ameaças à segurança cibernética e muito mais.

Figura 1: o tutorial do Fireworks mostra como trazer seus próprios dados para LLMs com o RAG e o MongoDB Atlas

Introdução ao Fireworks AI e ao MongoDB Atlas

Para ajudar você a começar, analise o tutorial Otimizando o RAG com o MongoDB Atlas e o Fireworks AI, que mostra como criar um aplicativo de recomendação de filmes e envolve

  • Banco de dados MongoDB Atlas que indexa filmes usando incorporações. (Vector Store)

  • Um sistema para geração de incorporação de documentos. Usaremos a API de incorporação do Fireworks para criar incorporações a partir de dados de texto. (Vetorização)

  • O MongoDB Atlas Vector Search responde às consultas do usuário convertendo a consulta em uma incorporação, buscando os filmes correspondentes. (Mecanismo de recuperação)

  • O modelo Mixtral usa a API de inferência do Fireworks para gerar as recomendações. Você também pode usar o Llama, o Gemma e outros modelos OSS excelentes, se desejar. (LLM)

  • Carregando o conjunto de dados Mflix de amostra do MongoDB Atlas para gerar incorporações (conjunto de dados)

Também podemos ajudar você a projetar a melhor arquitetura de acordo com necessidades da sua organização. Sinta-se à vontade para entrar em contato com a equipe responsável pela sua conta ou entre em contato com a gente por aqui para agendar uma sessão colaborativa e explorar como o Fireworks AI e o MongoDB podem otimizar seu processo de desenvolvimento de IA.