公告MongoDB 8.0 隆重推出,这是有史以来最快的MongoDB!了解详情 >
公告Voyage AI 与 MongoDB 携手合作,致力于在 Atlas 上提供更准确和更值得信赖的 AI 应用。了解更多 >

从 12 周到 10 分钟:Novo Nordisk 如何利用生成式 AI 和 MongoDB 加速价值实现时间

Novo Nordisk 与 MongoDB
mdb_backup

行业

制药

mdb_backup

产品

MongoDB Atlas

mdb_backup

使用案例

生成式人工智能

industry_enterprise

Industry

Pharmaceutical

atlas_product_family

Product

MongoDB Atlas

Atlas Vector Search

atlas_for_edge

Use Case

Gen AI

Novo Nordisk 于 1923 年在丹麦成立,如今是全球领先的医疗保健公司之一。传承其在糖尿病治疗领域的深厚积淀,该公司的使命是推动变革以攻克严重的慢性病。为此,它以科学突破为先导,以普惠医疗为根本,努力预防并最终治愈疾病。

Novo Nordisk 在 80 个国家/地区拥有 64,000 多名员工。其产品销往 170 个国家/地区,在 2023 财年实现 2320 亿丹麦克朗(33.5 亿美元)的营收。

Novo Nordisk 内容数字化主管 Louise Lind Skov 解释称:“我们的药物如今惠及数百万糖尿病、肥胖症以及罕见血液和内分泌疾病的患者。”我们生产了全球 50% 的胰岛素,制造了逾 6 亿支胰岛素笔,有超过 3,600 万人在使用我们的糖尿病治疗产品。从实验室到生产车间,我们不断探索开发创新生物药物,致力于让全球患者都能使用。

通过利用 Amazon Bedrock 和 MongoDB Atlas 的生成式 AI,Novo Nordisk 正在显著加快新药获批并交付给患者的速度。

 

Novo Nordisk 如何通过生成式 AI 和 MongoDB 加速实现价值创造
了解 Novo Nordisk 如何通过生成式 AI 和 MongoDB 将生成临床研究报告 (CSR) 的时间从 12 周缩短至 10 分钟,从而重新规划监管审批路径,加速实现价值创造。
Novo Nordisk
“有了 NovoScribe,我们在业内率先实现了在几分钟而非几周内生成完整的临床研究报告。”这一突破性技术不仅获得规模化应用,而且所需资源仅为过去的一小部分。这将是颠覆全球行业的革命性突破。”
Louise Lind Skov
Novo Nordisk

重新构想通往监管批准的路径

临床研究报告(CSR)在任何新药研发进程中都起着举足轻重的作用。这份综合性文档记录了临床试验的方法、实施情况、研究成果和分析结论。报告的主要目的是说明医学试验的详细情况,确保监管机构、医务人员和其他利益相关者(如研究人员和法律团队)能够评估新药的有效性和安全性。

 

在解释编写临床研究报告所需的时间和精力时,Skov 说道:“一份 CSR 的编写通常需要大约 12 周的时间,需要由统计学家、科研人员和技术作者组成的多学科团队共同完成。每延迟一天,就意味着患者无法得到所需的治疗,公司也无法开始收回其研发成本。”

该流程的第一步是对在字段中收集的临床试验数据进行统计分析,创建表格和图形等输出文档。然后,技术作者将这些数据提取出来,并与监管报批文件中使用的报告模板进行整合。为确保这份长达 100 多页的报告中所有数据的一致性、完整性且符合监管标准,必须实施全面的质量保证 (QA) 流程。

随着生成式人工智能的到来,Novo Nordisk 的 Skov 团队看到了在撰写 CSR 报告方面显著提高效率的机会。因此,NovoScribe 诞生了。

NovoScribe:基于 Amazon Bedrock、LangChain 和 MongoDB Atlas Vector Search 的坚实基础构建

Skov 的团队在 2023 年年中启动了该项目,并使用 NovoScribe 重新设计了其工作流程。他们尝试利用 RAG 动态编译 CSR,以使用临床试验的统计输出结果和报告模板的向量嵌入来驱动最先进的大型语言模型 (LLM)。

短短数周内,实验即取得成功。NovoScribe 生成 CSR 的速度更快,准确度更高,而且所需资源较传统人工方法更少。NovoScribe 已经具备了商业化应用的条件。

NovoScribe 技术主管兼统计编程专家 Tobias Kröpelin 解释了为 NovoScribe 提供技术支持的生成式人工智能堆栈。“每个基础模型都有其优缺点,因此我们通常会针对编写的每份报告尝试各种不同的嵌入和生成模型。”

NovoScribe 使用由 Amazon Bedrock 托管的 Claude 3 和 Titan 基础模型,以及该公司自己的 ChatGPT 私有实例。借助 LangChain 开发及编排框架,该团队可以快速轻松地在模型之间切换,而无需更改任何应用程序代码。基于 RAG,模型所获取的数据源包括 MongoDB Atlas Vector Search 管理的报告数据和向量嵌入。

NovoScribe 根据定义的内容规则及统计输出结果生成已验证文本,而 Atlas Vector Search 计算每个文本代码片段与相关统计数据的相似度。这与 LLM 的输出结果相结合,产生了 CSR 草稿。借助 Atlas Vector Search,系统能够以高精度和准确度筛选相关文本。所有数据来源的完整谱系都已呈现,使报告作者能够验证准确性,从而节省数周的撰写与审校时间。

Kröpelin 表示:“MongoDB Atlas 的最大优势在于,我们可以将报告的原生向量嵌入与所有相关文本代码片段和元数据一起存储。”“这使得我们可以快速运行功能强大且复杂的查询。对于每个向量嵌入,我们可以筛选其来源的源文档、撰写人员及时间。”

Novo Nordisk
“这很重要,因为报告质量至关重要——我们必须做好这一点,因为患者安全要求我们不能出错。”
Tobias Kröpelin
Novo Nordisk

 

生成式人工智能 + MongoDB Atlas:快速启动并在云端安全扩展

在 NovoScribe 项目启动阶段,Kröpelin 和 Novo Nordisk 统计团队最初沿用日常工作中常用的关系数据库。但很快发现,要为大型语言模型同时提供统计输出结果和报告文本所需的数据模型极其复杂,原有系统的灵活性远不足以支持 NovoScribe 快速迭代的功能开发需求。

Kröpelin 表示:“如果使用我们传统的关系型数据库的表格模型,我们最终会获得几十份独立表格,每个表只有几列。这些与我的团队在代码中使用的 Python 字典截然不同,拖慢了我们的开发进度。同样影响进度的是,对应用程序进行的任何更改都要进行复杂的数据库架构迁移。然后,在查询时连接所有这些表以提示大型语言模型,更是导致应用性能和用户体验双双受损。”

除了关系数据库,Kröpelin 的团队对 MongoDB 也很熟悉,并很快意识到其文档数据模型可为 NovoScribe 提供所需的易用性、灵活性和速度。只需从 MongoDB Python 驱动程序调用一次,即可检索整个对象,包括源文本代码片段、其向量嵌入和元数据,彻底省去数据关联操作。

除了编程访问权限外,MongoDB Compass 还为非开发者团队成员提供了通过图形化界面查看并筛选存储在 MongoDB 中的数据的功能,使他们能够在将数据集提供给大型语言模型之前检查数据集的完整性。

通过使用全托管 MongoDB Atlas 服务,Novo Nordisk 获得了运行严苛监管类应用所需的关键任务保证。正如 Novo Nordisk 数字化战略主管 Waheed Jowiya 所言:“安全和灾难恢复是不可妥协的底线。我们通过 Atlas 对 Amazon PrivateLink 的支持实现了 VPC 接入。此外,细粒度访问权限控制、审核、端到端数据加密和备份都是 Atlas 的标准功能,只需通过简单的 API 调用进行配置。”

Jowiya 继续说道:“我们有一支小团队,因此 MongoDB Atlas 提供的操作自动化非常宝贵。这也给了我们选择的余地。NovoScribe 目前在 AWS 上运行,但作为一家公司,我们也与 Azure 开展合作。通过其多云支持,我们可以在两个超大规模平台之间运行 Atlas,完全自由无锁定。”

生成式人工智能:释放惊人的生产力提升并展望未来

目前,NovoScribe 为 Novo Nordisk 编制了约 30% 的所有 CSR,预计到今年年底,这项工作将增加到超过 90%。所取得的结果证明了 NovoScribe 为何能在全公司如此迅速地获得采用势头。

Novo Nordisk
“我们将创建临床研究报告所需的时间从 12 周缩短到了 10 分钟,同时产出质量更高,所需团队人员也大幅减少。在价值方面,药物每早一天上市,就可以为公司增加约 1500 万美元的收入。
Waheed Jowiya
Novo Nordisk 数字化战略负责人

Jowiya 接着表示,大型语言模型只需几分钟,就能使用从 MongoDB Atlas 检索的数据生成 CSR,并产生最终输出文档。其余的时间都用在 QA 上。高水平的团队成员无需再花时间汇总数据,或反复核对是否将正确的统计数据剪切并粘贴到报告的相应章节。如今,生成式人工智能模型使这一流程实现了自动化,使他们能够专注于推动更多具突破性的研发工作。

对于 Novo Nordisk 而言,NovoScribe 仅仅是个开始。除 CSR 外,该公司不断探索众多新契机,将生成式人工智能应用于其业务的各个方面,并以 MongoDB Atlas 为其人工智能升级的核心。

Novo Nordisk
“生成式人工智能中的一切内容都是新的,您不能直接去 GitHub 并重新利用其他人编写的代码。只有 MongoDB Atlas 为我们提供了数据平台层的灵活性和扩展,让我们可以尝试利用行业有史以来最大的技术进步之一。”
Louise Lind Skov
Novo Nordisk 内容数字化主管

未来

详细了解其他 MongoDB 客户如何 利用 AI 进行创新。您还可以注册 MongoDB Atlas并浏览 Atlas Vector Search 快速入门指南,以开始构建更智能的搜索或在下一个项目中开始使用生成式人工智能。

Build AI that understands, not just matches

Go beyond keywords. Use native vector search to power semantic queries and generative AI applications right in MongoDB.
Learn More
Illustration of a magnifying glass and data points on a graph

Explore more success stories

View all stories
LG U+ logo

LG U+

Read about how LG U+ improves efficiency by 30% with MongoDB-powered AI tool

Read more
DevRev logo
With Video

DevRev

Learn how IT company DevRev boosted its CRM solution’s performance by 3-4x with MongoDB Atlas.

Read more
Lombard Odier logo
With Video

Lombard Odier

Learn more about how Lombard Odier modernizes legacy banking technology with gen AI

Read more

采取后续步骤

今天注册,获取您开始构建伟大项目所需的全部访问权限和资源。
开始使用与专家沟通
Illustration of a database.