特色集成
Atlas 作为矢量数据库的多功能性
不同于使用独立或附加的矢量数据库,我们平台的多功能性使用户能够将其操作数据、元数据和矢量嵌入存储在 Atlas 上,并无缝使用 Atlas Vector Search 进行索引、检索和构建高性能的生成式人工智能应用程序。
强健的 AI 集成生态系统
常见问题解答
什么是语义搜索?
语义搜索是根据数据的含义而不是数据本身进行搜索的做法。
什么是向量?
向量是数据和关联上下文的数字表示,可以使用高级算法进行高效搜索。
Atlas Vector Search 与 Atlas Search 有何不同?
Atlas Vector Search 支持根据向量中捕获的语义来搜索数据,而 Atlas Search 则支持关键字搜索(即基于实际文本和任何定义的同义词映射)。
我可以使用 MongoDB Atlas 代替独立的矢量数据库吗?
可以,MongoDB Atlas 是一个矢量数据库。Atlas 是一个完全托管的多云开发者数据平台,具有丰富的功能,包括文本或词汇和矢量搜索。不同于使用独立或附加的矢量数据库,我们平台的多功能性使用户能够将其操作数据、元数据和矢量嵌入存储在 Atlas 上,并无缝使用 Atlas Vector Search 进行索引、检索和构建高性能的生成式人工智能应用程序。
K-最近邻搜索 (KNN)、近似最近邻搜索 (ANN) 和精确最近邻搜索 (ENN) 之间有什么区别?
KNN,或 K 最近邻,是一种常用于查找相邻向量的算法。
ANN,或近似最近邻,是一种寻找相似向量的途径,以牺牲准确性为代价来提升性能。这是用于支持 Atlas Vector Search 的核心算法之一。我们的近似最近邻搜索算法使用分层可导航小世界 (HNSW) 图来有效地索引和查询数百万个向量。
ENN(精确最近邻)是一种查找相似向量的方法,以牺牲一些性能来换取准确性。此方法返回与查询向量最接近的向量,向量数量由变量限制指定。精确向量搜索查询执行可以为最多 10,000 个文档的未筛选查询保持亚秒级延迟。它还可以为高度选择性的过滤器提供低延迟响应,将大量文档限制为 10,000 个或更少,并按向量相关性排序。
什么是 $vectorSearch?它与 $search 中的 knnBeta 操作符有何不同?
什么是搜索节点?
Atlas Vector Search 支持哪些向量嵌入?是否支持向量量化?
Atlas Vector Search 支持来自在服务的 4096 维限制内的任何提供程序的嵌入。目前,我们支持对您所选择的提供商提供的标量量化向量嵌入进行摄取、索引和查询。我们即将在 Atlas 中添加对二进制量化向量摄取以及自动标量和二进制量化的支持,并在不影响准确性的情况下实现成本和存储效率。
向量搜索是否适用于图像、媒体文件和其他类型的数据?
适用,Atlas Vector Search 可以查询任何可以转化为嵌入的数据。文档模型的好处之一是您可以将嵌入与丰富的数据一起存储在文档中。