Docs 菜单
Docs 主页
/
MongoDB Atlas
/

Atlas Vector Search 快速入门

在此页面上

  • 目标
  • 先决条件
  • 索引向量嵌入
  • 运行向量搜索查询

本快速入门介绍了如何在 Atlas 集群上对数据中的向量嵌入进行索引,并运行查询以搜索向量嵌入以查找相似数据。

向量是按一维或多维排列的值数组。双向编码器模型(如 OpenAI text-embedding-ada-002 )生成的向量嵌入可以表示单词、短语和句子。您可以对向量嵌入进行索引并搜索在含义或上下文中相关的项目。要了解更多信息,请参阅Atlas Vector Search 概述。

在本快速入门中,您将执行以下步骤:

  1. sample_mflix.embedded_movies集合创建索引定义,将plot_embedding字段索引为vector类型。 plot_embedding字段包含使用 OpenAI 的text-embedding-ada-002嵌入模型创建的嵌入。索引定义指定了1536向量维度,并使用cosine来衡量相似性。

  2. 运行 Atlas Vector Search 查询来搜索样本sample_mflix.embedded_movies集合。该查询使用$vectorSearch阶段搜索plot_embedding字段,其中包含使用 OpenAI 的text-embedding-ada-002嵌入模型创建的嵌入。该查询使用向量嵌入在plot_embedding字段中搜索字符串time trip 。它最多考虑150个最近邻,并在结果中返回10个文档。

要完成此快速入门,您必须满足以下先决条件。

您必须具有以下集群配置:

  • MongoDB 版本6的 Atlas 集群。 0 。 11或 v 7 。 0 。 2或更高版本(包括 RC )。

  • 示例数据已加载到您的 Atlas 集群中。

您必须安装以下应用程序之一才能在 Atlas 集群上运行查询:

  • mongosh

  • C#

  • Java

  • MongoDB 节点驱动程序

  • pymongo

您还可以将 Atlas Vector Search 与通过 Atlas CLI 创建的本地 Atlas 部署结合使用。要了解更多信息,请参阅创建本地 Atlas 部署。

要创建 Atlas Vector Search 索引,您必须对项目具有Project Data Access Admin或更高访问权限。

使用以下示例对 Atlas 集群上数据中的向量嵌入进行索引。

1
  1. 如果尚未显示,请从导航栏的 Organizations 菜单中选择包含所需项目的组织。

  2. 如果尚未显示该页,请从导航栏的 Projects(项目)菜单中选择所需的项目。

  3. 如果 Clusters(数据库部署)页面尚未出现,请单击侧边栏中的 Database(数据库)。

2
  1. 单击集群的名称。

  2. 单击 Atlas Search 标签页。

3
  1. 单击 Create Search Index(连接)。

  2. Atlas Vector Search 部分,选择 JSON Editor

  3. 单击 Next(连接)。

4
  1. Database and Collection(数据库和集合)部分中找到 sample_mflix 数据库,然后选择 embedded_movies 集合。

  2. Index Name 字段中指定 vector_index

5

sample_mflix.embedded_movies集合的以下示例索引定义将plot_embedding字段索引为vector类型。 plot_embedding字段包含使用 OpenAI 的text-embedding-ada-002嵌入模型创建的嵌入。索引定义指定了1536向量维度,并使用cosine来衡量相似性。

1{
2 "fields": [{
3 "type": "vector",
4 "path": "plot_embedding",
5 "numDimensions": 1536,
6 "similarity": "cosine"
7 }]
8}

要了解详情,请参阅如何为向量搜索建立字段索引

6

查看索引定义并单击Create Search Index

模式窗口会指示您的索引正在构建。

7

单击Close关闭You're All Set!模式窗口,并等待索引完成构建。

构建索引大约需要一分钟时间。在构建时, Status列显示为Initial Sync 。构建完成后, Status列显示为Active

使用以下示例运行搜索向量嵌入的查询。


➤ 使用选择语言下拉菜单选择要用于运行本节中示例查询的客户端。


← Atlas Vector Search 概述