AnnoncePrésentation de MongoDB 8.0, la plus rapide des MongoDB ! En savoir plus >

AnnonceVoyage AI rejoint MongoDB pour développer des applications d'IA plus précises et plus fiables sur Atlas. En savoir plus >

De 12 semaines à 10 minutes : comment Novo Nordisk accélère le délai de rentabilisation avec GenAI et MongoDB

Secteur

Pharmaceutique

Produit

MongoDB Atlas

Atlas Vector Search

Cas d'usage

IA Générative

Client depuis

2021

Fondé en 1923 au Danemark, le groupe Novo Nordisk est aujourd’hui l’un des leaders mondiaux dans le domaine de la santé. S’appuyant sur son héritage dans le traitement du diabète, l’entreprise s’est donné pour mission d’impulser le changement pour vaincre les maladies chroniques graves. Pour ce faire, elle réalise des percées scientifiques, élargit l’accès à ses médicaments et s’efforce de prévenir et, à terme, de guérir les maladies.

Novo Nordisk emploie plus de 64 000 personnes dans 80 pays. Ses produits sont commercialisés dans 170 pays, générant des revenus établis à 232 milliards de couronnes danoises (33,5 milliards de dollars) pour son exercice 2023.

« Nos traitements aujourd’hui bénéficient à des millions de personnes vivant avec le diabète, l’obésité et des maladies rares du sang et du système endocrinien », explique Louise Lind Skov, responsable de la numérisation des contenus chez Novo Nordisk. « Nous produisons 50 % de l’insuline mondiale, avons fabriqué plus de 600 millions de stylos à insuline, et plus de 36 millions de personnes utilisent nos produits de traitement du diabète. De nos laboratoires à nos usines, nous découvrons et développons des médicaments biologiques innovants et les rendons accessibles aux patients du monde entier. »

En exploitant l’IA générative avec Amazon Bedrock et MongoDB Atlas, Novo Nordisk accélère considérablement les délais d’approbation de nouveaux médicaments et leur livraison aux patients.

Comment Novo Nordisk accélère le délai de rentabilisation avec GenAI et MongoDB — Découvrez comment Novo Nordisk a repensé le parcours d’approbation réglementaire en réduisant le temps nécessaire pour produire un rapport d’étude clinique (CSR) de 12 semaines à 10 minutes avec l’IA générative et MongoDB, accélérant ainsi le délai de rentabilisation.

« Avec NovoScribe, nous sommes les premiers du secteur à générer un rapport d’étude clinique complet en quelques minutes au lieu de plusieurs semaines. Nous le faisons à grande échelle, et avec une fraction des ressources dont nous avions besoin auparavant. C’est une révolution pour le secteur dans le monde entier. »

Louise Lind Skov
Novo Nordisk

Réimaginer le chemin vers l'approbation réglementaire

Un rapport d’étude clinique (CSR) joue un rôle crucial dans le processus de développement de tout nouveau médicament. Il s’agit d’un document exhaustif qui présente la méthodologie, l’exécution, les résultats et les analyses d’un essai clinique. L’objectif principal du rapport est de fournir un compte rendu détaillé de l’essai clinique, qui permet aux autorités réglementaires, aux professionnels de santé et aux autres parties prenantes, telles que les chercheurs et les équipes juridiques, d’évaluer l’efficacité et la sécurité d’un nouveau produit pharmaceutique.

Décrivant les efforts et le temps nécessaires à la production d’un rapport d’étude clinique, Louise Lind Skov déclare : « La production d’un rapport d’étude clinique (CSR) prend généralement environ 12 semaines, impliquant une équipe multidisciplinaire de statisticiens, de scientifiques et de rédacteurs techniques. Chaque jour de retard signifie que les patients ne reçoivent pas les traitements dont ils ont besoin et que l’entreprise ne peut pas commencer à récupérer ses coûts de R&D. »

Le processus débute par l’analyse statistique des données d’essais cliniques recueillies sur le terrain, produisant des résultats tels que des tableaux et des graphiques. Les rédacteurs techniques extraient puis fusionnent ces données avec les modèles de rapport utilisés dans la soumission réglementaire. Des processus d’assurance qualité approfondis sont nécessaires pour garantir que toutes les données du rapport de plus de 100 pages sont cohérentes, complètes et conformes aux normes réglementaires.

L’arrivée de l’IA générative a offert à l’équipe de Mme Skov de Novo Nordisk l’opportunité de réaliser des gains d’efficacité significatifs dans la production de CSR. C’est ainsi qu’est né NovoScribe.

NovoScribe : construit sur une base solide d'Amazon Bedrock, de LangChain et de MongoDB Atlas Vector Search

Dans le cadre du lancement du projet NovoScribe à la mi-2023 l’équipe de Louise Lind Skov a dû entièrement repenser son workflow. Tirant parti de la génération augmentée par récupération pour expérimenter la compilation dynamique du CSR, l’équipe a mis au point des grands modèles de langage (LLM) de pointe exploitant à la fois les résultats statistiques des essais cliniques et les embeddings vectoriels des modèles de rapport.

Les expériences se sont révélées fructueuses en quelques semaines. NovoScribe a produit des CSR plus rapidement et avec plus de précision, nécessitant moins de ressources que les méthodes manuelles précédentes. NovoScribe était prêt pour une utilisation en masse.

Tobias Kröpelin, responsable technique de NovoScribe et spécialiste de la programmation statistique chez Novo Nordisk, explique la pile d'IA générative qui alimente NovoScribe. « Chaque modèle de base a ses propres forces et faiblesses, c'est pourquoi nous expérimentons généralement avec une variété de modèles d'intégration et de génération pour chaque rapport que nous compilons. »

NovoScribe utilise les modèles de fondation Claude 3 et Titan hébergés par Amazon Bedrock, ainsi que sa propre instance privée de ChatGPT. Grâce au framework de développement et d’orchestration LangChain, l’équipe peut passer d’un modèle à l’autre rapidement et facilement, sans avoir à modifier le code de l’application. Grâce à la RAG, les modèles sont alimentés par des données de rapport et des embeddings vectoriels gérés par MongoDB Atlas Vector Search.

NovoScribe génère des textes validés selon des règles de contenu définies et des résultats statistiques, tandis qu’Atlas Vector Search calcule la similarité de chaque extrait de texte avec les statistiques correspondantes. Le tout, combiné à la sortie préliminaire du CSR, constitue le LLM. L’utilisation d’Atlas Vector Search assure une sélection du texte pertinent de manière extrêmement précise. La lignée complète de toutes les sources est présentée, permettant aux auteurs de vérifier l’exactitude et d’éviter des semaines de rédaction et de révisions.

« Ce qui est formidable avec MongoDB Atlas, c’est que nous pouvons stocker des embeddings vectoriels natifs du rapport directement avec tous leurs extraits de texte et métadonnées associés », déclare M. Kröpelin. « Nous pouvons ainsi exécuter des requêtes très puissantes et complexes rapidement. Pour chaque embedding vectoriel, nous pouvons filtrer en fonction du document source dont il provient, qui l’a rédigé et quand. »

« Cela est important car la qualité des rapports est cruciale — nous devons bien faire les choses car la sécurité des patients exige que nous ne fassions pas d'erreurs. »

Tobias Kröpelin
Novo Nordisk

IA Générative + MongoDB Atlas : Démarrage et dimensionnement rapide dans le cloud en toute sécurité

Au début du projet NovoScribe, M. Kröpelin et l’équipe Statistiques de Novo Nordisk ont commencé par les bases de données relationnelles qu’ils utilisaient habituellement dans leur travail quotidien. Mais il est rapidement devenu évident que le data model nécessaire pour alimenter à la fois les sorties statistiques et le texte du rapport dans les LLM était extrêmement complexe et trop peu flexible pour suivre le rythme de développement rapide des fonctionnalités de NovoScribe.

Comme l’explique M. Kröpelin, « Avec le modèle tabulaire de notre base de données relationnelle traditionnelle, nous aurions eu des dizaines de tables distinctes, chacune comportant seulement quelques colonnes. Celles-ci ne ressemblaient en rien aux dictionnaires Python que mon équipe utilisait dans le code, ce qui ralentissait notre vitesse de développement. Nous ne pouvions pas non plus apporter de modifications à notre application sans effectuer des migrations complexes de schémas dans la base de données, ce qui nous entravait également. De plus, joindre toutes ces tables au moment de la requête pour instruire les LLM affectait les performances des applications et l’expérience utilisateur. »

Au-delà des bases de données relationnelles, l’équipe de M. Kröpelin avait également une bonne connaissance de MongoDB et a rapidement reconnu que son modèle de données documentaire offrirait la facilité d’utilisation, la flexibilité et la rapidité exigées par NovoScribe. Un seul appel depuis le pilote MongoDB Python permet de récupérer l’intégralité de l’objet, y compris les extraits de texte source, son embedding vectoriel et ses métadonnées, sans les frais liés à la jointure des données.

Outre l’accès par programmation, MongoDB Compass est disponible pour les membres de l’équipe non développeurs qui peuvent consulter et filtrer les données stockées dans MongoDB via une interface graphique, leur permettant de vérifier l’exhaustivité de l’ensemble de données avant de le transmettre aux LLM.

En utilisant le service MongoDB Atlas entièrement géré, Novo Nordisk obtient les assurances essentielles dont le groupe a besoin pour exécuter des applications hautement réglementées. Comme le déclare Waheed Jowiya, responsable de la stratégie de numérisation chez Novo Nordisk, « la sécurité et la reprise après sinistre ne sont pas négociables. Nous avons un accès VPC grâce au support de MongoDB Atlas pour Amazon Privatelink. De plus, les contrôles d’accès précis, les audits, le chiffrement des données de bout en bout et les sauvegardes sont des fonctionnalités standard d’Atlas, qui se configurent par de simples appels d’API.

« Comme nous avons une petite équipe, l’automatisation opérationnelle fournie par MongoDB Atlas est précieuse », poursuit W. Jowiya. « Cela nous offre aussi des alternatives. NovoScribe fonctionne aujourd’hui sur AWS, mais en tant qu’entreprise, nous travaillons également avec Azure. Grâce au support multicloud de MongoDB Atlas, nous pouvons l’exécuter entre les deux plateformes hyperscale en toute liberté et sans verrouillage. »

IA générative : débloquer des gains de productivité incroyables et se tourner vers l'avenir

Aujourd’hui, NovoScribe compile environ 30 % de tous les CSR pour Novo Nordisk, et ce travail devrait augmenter pour dépasser 90 % d’ici la fin de l’année. Les résultats obtenus démontrent pourquoi NovoScribe est adopté si rapidement au sein de l’entreprise.

« Nous avons réduit le temps nécessaire à la création des rapports d’études cliniques de 12 semaines à 10 minutes, avec des résultats de meilleure qualité et une équipe allégée. En termes de valeur, chaque jour gagné dans la mise sur le marché d’un médicament rapporte environ 15 millions de dollars à l’entreprise.

Waheed Jowiya
Responsable de la stratégie de digitalisation chez Novo Nordisk

M. Jowiya ajoute que les LLM ne prennent que quelques minutes pour générer le CSR à partir des données récupérées de MongoDB Atlas pour produire le résultat final. Le reste du temps est consacré à l’assurance qualité. Les membres hautement qualifiés de l’équipe ne perdent plus de temps à rassembler les données ni à s’assurer de copier-coller les bonnes statistiques dans la section appropriée du rapport. Les modèles d’IA générative automatisent désormais le processus, leur permettant de se consacrer à la recherche et au développement de molécules plus innovantes.

Pour Novo Nordisk, NovoScribe n’est que le début. Au-delà des CSR, l’entreprise explore de nombreuses possibilités nouvelles d’appliquer l’IA générative à tous les segments de son activité, avec MongoDB Atlas au cœur de ses efforts.

« Tout est nouveau dans l'IA générative : vous ne pouvez pas simplement aller sur GitHub et réutiliser un code écrit par d'autres. Seul MongoDB Atlas nous offre la flexibilité et l'évolutivité nécessaires au niveau de la plateforme de données pour expérimenter comment exploiter l'une des plus grandes avancées techniques que le secteur ait jamais connues. »

Louise Lind Skov
Responsable de la numérisation du contenu chez Novo Nordisk

Pour aller plus loin

Découvrez comment d’autres clients de MongoDB innovent avec l’IA. Vous pouvez également vous inscrire à MongoDB Atlas pour accéder au guide de démarrage rapide d’Atlas Vector Search et commencer à créer des recherches plus intelligentes ou à intégrer l’IA générative dans votre prochain projet.

Passer à l'étape suivante

Accédez à tous les outils et ressources nécessaires pour commencer à créer quelque chose de formidable en vous inscrivant dès aujourd’hui.

DémarrerDiscuter avec un expert