Reimaginando o caminho para a aprovação regulatória
Um Relatório de Estudos Clínicos (CSR) desempenha uma função crucial no processo de desenvolvimento de qualquer novo medicamento. Ele serve como um documento abrangente que captura a metodologia, a execução, os resultados e as análises de um estudo clínico. O objetivo primário do relatório é fornecer um relato detalhado do ensaio clínico, garantindo que as autoridades reguladoras, os profissionais de saúde e outras partes interessadas, como pesquisadores e equipes jurídicas, possam avaliar a eficácia e a segurança de um novo produto farmacêutico.
Explicando o tempo e o esforço necessários para produzir um relatório de estudo clínico, Skov diz: "Um CSR geralmente leva cerca de 12 semanas para ser compilado, envolvendo uma equipe multidisciplinar de estatísticos, cientistas e autores técnicos. Cada dia de atraso significa que os pacientes não recebem os tratamentos de que precisam e a empresa não pode começar a recuperar seus custos de P&D.
O processo inicia com a análise estatística dos dados de ensaios clínicos coletados no campo, gerando saídas como tabelas e figuras. Os autores técnicos então extraem e mesclam esses dados com modelos de relatórios utilizados na submissão regulatória. São necessários processos extensivos de garantia de qualidade (QA) para assegurar que todos os dados do relatório de mais de 100 páginas sejam consistentes, abrangentes e em conformidade com os padrões regulatórios.
Com a chegada da IA generativa, a equipe de Skov na Novo Nordisk identificou a oportunidade de impulsionar eficiências significativas na produção de CSRs. E assim nasceu o NovoScribe.
NovoScribe: Criado sobre uma base sólida do Amazon Bedrock, LangChain e MongoDB Atlas Vector Search
Iniciando o projeto em meados de 2023, a equipe de Skov reimaginou seu fluxo de trabalho com o NovoScribe. Eles experimentaram a compilação dinâmica do CSR, aproveitando a RAG para acionar LLMs de última geração, usando tanto os resultados estatísticos dos ensaios clínicos quanto as incorporações de vetores dos modelos de relatórios.
Em poucas semanas, os experimentos se mostraram bem-sucedidos. O NovoScribe produziu CSRs mais rapidamente e com maior precisão, exigindo menos recursos do que os métodos manuais anteriores. O NovoScribe estava pronto para o horário nobre.
Tobias Kröpelin, líder técnico da NovoScribe e especialista em programação estatística na Novo Nordisk, explica a pilha de IA generativa que alimenta o NovoScribe. Cada modelo de base tem seus próprios pontos fortes e fracos, então normalmente experimentamos uma variedade de modelos de incorporação e geração para cada relatório que compilamos.
A NovoScribe usa os modelos de fundação Claude 3 e Titan hospedados pelo Amazon Bedrock, juntamente com a instância privada da própria empresa do ChatGPT. Com o framework de desenvolvimento e orquestração LangChain, a equipe pode alternar entre modelos de forma rápida e fácil, sem precisar alterar nenhum código do aplicativo. Usando RAG, os modelos são servidos com dados de relatório e incorporações vetoriais gerenciadas pelo MongoDB Atlas Vector Search.
NovoScribe gera texto validado com base em regras de conteúdo definidas e resultados estatísticos. O Atlas Vector Search calcula a similaridade de cada trecho de texto com as estatísticas relevantes. Isso, combinado com a saída do LLM, esboça o CSR. Ao utilizar o Atlas Vector Search, o texto relevante é selecionado com um alto grau de precisão e exatidão. A linhagem completa de todas as fontes é apresentada, permitindo que os autores verifiquem a precisão, eliminando semanas de escrita e revisão.
“O que é ótimo no MongoDB Atlas é que podemos armazenar incorporações vetoriais nativas do relatório junto com todos os trechos de texto e metadados associados”, diz Kröpelin "Isso significa que podemos executar queries realmente poderosas e complexas rapidamente" Para cada incorporação de vetor, podemos aplicar um filtro de qual documento de origem ela vem, quem a gravou e quando.