词汇表
- 分层可导航小世界 图
- 在多维空间中执行高效最近邻搜索的算法。 Atlas Vector Search使用 Hierarchical Navigable Small Worlds 执行 ANN搜索。
- 警报
当数据库操作或服务器使用率达到影响集群性能的阈值时, Atlas发送的通知。 要学习;了解可以设立哪些条件来trigger警报,请参阅 查看警报条件。
- 分析节点
- 专用的只读节点,可用于隔离您不希望影响操作工作负载的查询。 分析节点 可用于处理分析数据,例如由 BI 工具执行的报告查询。 您可以在专用地理区域托管分析节点, 优化读取性能并减少延迟。
- API
促进客户端与 MongoDB Atlas 之间交互的通信协议。 您可以使用 Administration API, 自动执行 Atlas UI 中的许多任务。
- 近似最近邻 (ANN)搜索
- 用于快速查找数据集中与给定查询点接近的点的计算技术。 Atlas Vector SearchAtlas Vector Search使用 ANN搜索在数据中查找与Atlas VectorAtlas Vector Search Search查询中的向量嵌入最接近的向量嵌入,而无需扫描每个向量。
- Atlas Search
细粒度文本索引,支持对数据进行高级文本搜索,而无需任何额外管理。 Atlas Search 提供多种文本分析器选项、基于分数的结果排名以及丰富的查询语言。
- Atlas 用户
用于访问 Atlas 应用程序的帐户。您可以授予 Atlas 用户访问 Atlas 组织、项目或两者的访问权限,某些权限由用户角色定义。Atlas 用户与数据库用户不同。Atlas 用户不能访问任何 MongoDB 数据库。
- Atlas user role
- Atlas Vector Search
- Atlas中的一项功能,允许您通过将查询向量与索引向量进行比较以找到最接近的匹配项,从而对向量嵌入执行语义搜索。
- 自动伸缩 (Auto-Scaling)
可配置选项, 使集群根据集群使用情况自动增加或减少集群层、存储容量, 或两者兼而有之。
- 备份
用于封装集群在特定时间状态的数据副本。 备份可在发生数据丢失事件时提供安全措施。
Atlas 提供以下完全托管的备份方法:
- 云备份
Atlas 支持在以下集群上的云备份:
- 集群
- 包含 MongoDB 部署的节点集。在 Atlas 中,集群可以是副本集或分片部署。
- 集群类
可针对 Amazon Web Services 上托管的 M40+ 集群进行配置。
集群的存储类。您所选择的类会影响 集群存储性能和集群成本。您可以选择以下类之一:
Low CPU
General
Local NVMe SSD
- 集群层
规定集群中每个数据承载服务器的内存、存储、vCPU 和 IOPS 规格。集群存储大小和总体性能随着集群层的增加而增加。
- 余弦相似度
- 使用两个向量之间的角度来确定这些向量之间的相似度的指标。 余弦相似度对向量方向敏感。 在为Atlas Vector Search的向量嵌入创建索引时,可以使用余弦相似度函数。 如果向量已标准化为单位长度,请改用点积相似度函数。
- 自定义角色
您可以保存并分配给数据库用户的 MongoDB 权限操作和 MongoDB 角色的自定义集。当 Atlas 的内置角色不能描述所需的权限集时,创建自定义角色。
- 数据资源管理器
在 Atlas 中用于查看集群数据并与之交互的工具。 您还可以使用数据浏览器来管理索引,运行聚合管道来处理数据。
- Data Federation
MongoDB 的解决方案,用于使用MongoDB查询语言查询存储在低成本 S 3存储桶、 Atlas集群和HTTP端点中的数据。 分析应用程序可以使用Atlas Data Federation来利用存档数据,满足数据处理需求。
- 数据摄取管道
- 使用 RAG 组织和转换数据并将其存储在矢量数据库(例如Atlas)中的工作流。
- 数据库用户
用于验证客户端访问权限MongoDB 集群的凭证。 您可以为数据库用户分配特权,以确定该用户对集群的访问权限级别。 数据库用户与Atlas用户不同。 数据库用户可以访问权限MongoDB部署,但不能访问Atlas应用程序。
- 数据库用户权限
- 死信队列(DLQ)
- 死信队列是 Atlas 数据库中的一个集合, 用于存储在接收过程中抛出错误的文档。
- 专用集群
包含
M10
及更高层级集群的集群类别。层级推荐环境M10
和M20
开发中
低流量生产
M30
以及更大的生产- 密集向量
- 大部分或所有维度都包含非零值的数据的数字表示形式。 Atlas Vector Search使用包含更多数据的密集向量来捕获更复杂的关系。
- 部署
- 一群组包含您的数据的MongoDB服务器。 Atlas 托管的集群是集群(副本集或分片的集群)。
- 维度
- 构成多维空间中数据的特征或属性的组件或元素的数量。 Atlas Vector Search在索引时和查询时最多支持
4096
个维度。 - 点积相似度
- 衡量多维空间中两个向量之间的相似度,并返回一个标量值。当向量点大致相同的方向时,该标量值为正;当向量点相反的方向时,该标量值为负;当向量没有相似性时,该标量值为零。 Atlas Vector Search支持在搜索最近邻时使用
dotproduct
相似度函数。如果向量标准化为单位长度,则建议使用此相似度函数而不是余弦相似度。 - 可选举节点
- 有资格成为副本集主节点的节点。在选举期间,Atlas 会就主节点资格对最高优先级区域的节点进行优先级排序。为确保选举的可靠性,整个区域的可选举节点总数必须为 3、5 或 7。
- 内嵌
- 用数字大量表示文本、图像、音频、视频等数据,可以将其解释为多维空间中的坐标。 Atlas支持在Atlas 集群中存储嵌入, Atlas Vector Search支持对最多
4096
维度的向量嵌入进行索引和查询。 - 加密密钥
专门为加密和解密数据而生成的随机位串。
除了Atlas提供的默认
Project Owners
静态加密 之外, Atlas 还可以为其数据配置额外的加密层。项目所有者可以将其与 Atlas 兼容的客户密钥管理提供商与MongoDB加密存储引擎结合使用。在配置静态加密时,Atlas 支持以下客户密钥管理提供程序:
- 欧几里得相似度
- 使用多维空间中两个向量之间的距离计算相似度的公式。 欧几里得距离对向量的大小敏感。 Atlas Vector Search支持使用
euclidean
相似度函数来索引向量和搜索最近邻。 - 免费层
免费使用的集群层,可提供小规模开发环境以托管数据。免费集群永不过期,并提供对部分 Atlas 特性和功能的访问。 免费集群也可以通过其实例大小
M0
来表示。- Atlas 全球集群
具有已定义地理区域的集群,可支持全球分布式应用程序实例和客户端的位置感知读写操作。您可以在
M30
层及更高层级的集群上启用全局分片。- 全局写入区域
代表全球集群分布子集的地理区域。每个全局集群最多支持 9 个不同的全局写入区域。每个区域由一个最高优先级区域和一个或多个可选区域、只读区域或分析区域组成。
可用的地理区域取决于所选的云服务提供商。
- GROUP
- 请参阅项目。
- groupId
- 请参阅项目 ID。
- 最高优先级区域
- 混合搜索
- 结合不同搜索方法(例如全文搜索和语义搜索)以发挥各自优势的方法。 使用倒数排名融合 (RRF) 等技术组合结果。
- 影响
Performance Advisor 建议索引的预计性能改进。
- 接口端点
AWS 具有私有 IP 地址的VPC端点,通过Amazon Web Services PrivateLink 将流量发送到 Atlas 私有端点服务。
- IP 访问列表
可访问 Atlas 项目 内集群的 IP 地址和 CIDR 块列表。对于通过公共互联网的客户端连接,Atlas 仅允许从相应项目的 IP 访问列表中的条目连接到集群。 访问列表最多可包含200个条目。
Atlas还支持通过非公共网络进行客户端连接,例如网络对等互连或私有端点。 无论IP访问列表如何,这些类型的连接都会正常工作。 要学习;了解更多信息,请参阅设置网络对等互连互连和了解Atlas中的私有端点。
- K 最近邻搜索
- 给定具有定义的相似度函数 S 的点设立P ,对于查询点q ,查找 P 中具有最佳 S*(*p , q ) 值的 k 个点的设立。Atlas Vector Search ENN搜索返回精确的前 k 个点,ANN搜索返回与 q 相似的 k 个点,但不一定是与 q 最相似的 k 个点。
- LDAP
验证用户身份并授权用户访问集群数据的跨平台协议。您可以使用 Atlas,通过 TLS 使用自己的 LDAP 服务器管理来自所有 MongoDB 客户端的用户身份验证和授权。一个 LDAPS 配置适用于 Atlas 项目中的所有集群。
- 旧版备份
Atlas 对集群进行的增量备份,确保备份时间通常仅比操作系统晚几秒。您可以将集群恢复到过去 24 小时内所选时间点的状态。
重要
传统备份已弃用
- 链接令牌(Link-Token)
字符串其中包含在从 Cloud Manager 或 Ops Manager 部署 实时迁移到 Atlas 中的集群期间从 Cloud Manager 或 Ops Manager 连接到 Atlas 所需的信息。
当准备好从 Cloud Manager 或 Ops Manager 部署实时迁移数据时,您可以在 Atlas 中生成链接令牌, 然后将其输入到 Cloud Manager 或 Ops Manager 组织的设置中。您使用相同的链接令牌, 按顺序逐个迁移 Cloud Manager 或 Ops Manager 组织中的每个部署。 您可以在 Atlas 中生成多个链接令牌。 为每个 Cloud Manager 或 Ops Manager 组织使用一个唯一的链接令牌。
- 实时迁移
将现有源副本集或分片集群无缝移动到 Atlas 的进程。 在实时迁移进程中, Atlas 使目标集群与远程源保持同步, 直到您将应用程序切换到 Atlas 集群。 Atlas 提供两种实时迁移模式:
推送实时迁移,在 Atlas 用户界面中称为 Live Migration from Ops Manager or Cloud Manager,即 Atlas 将部署从 Cloud Manager 或 Ops Manager 推送到 Atlas。
拉取实时迁移,在 Atlas 用户界面中称为 General Live Migration(一般实时迁移),即 Atlas 将部署从云或本地部署拉取到 Atlas。
- 维护窗口
Atlas应开始对集群进行每周维护的日期和时间。 您可以在“项目设置”中设立维护窗口。
重要
维护窗口注意事项
- 紧急维护活动
- 诸如安全补丁之类的紧急维护活动无法等待 您选择的窗口。Atlas 将在需要时启动这些维护活动。
- 持续维护操作
- 一旦为群集安排了维护, 在当前维护工作完成之前,您就无法更改维护窗口。
- 维护需要副本集选举
- Atlas 的维护方式与 MongoDB 手册所述的维护过程相同。此过程要求每个副本集在维护窗口期间至少进行一次副本集选举。
- 维护尽量靠近整点开始
- 维护总是尽可能接近预定时间开始, 但正在进行的集群更新或意外的系统问题可能会延迟开始时间。
- MongoDB Charts
Atlas 数据的可视化工具。您可以从 Atlas 集群中 启动 MongoDB Charts,并使用 MongoDB Charts 应用程序 查看数据,开始将数据可视化。
- 多区域集群
跨多个地理区域的 Atlas 集群。多区域集群可将应用程序查询路由到最合适的地理区域,从而提高可用性和性能。
多区域集群必须包含可选举节点。
- namespace
- 格式为
database.collection
的数据库名称和集合名称的组合。 - 命名空间见解
用于监控集合级查询延迟的 Atlas 工具。 您可以查看某些主机和操作类型的查询延迟指标和统计信息。 管理固定的命名空间,并选择最多五个命名空间以显示在相应的查询延迟Atlas Charts中。
- 网络对等连接
两个互联网络连接并交换流量的进程。您可以直接将自己的 VPC 与为 MongoDB 集群创建的 Atlas VPC 对等互连。使用网络对等互连,您的应用程序服务器可以直接连接到 Atlas,同时与公共网络保持隔离。
- NVMe 存储
可用于 AWS 上托管的 M40+ 集群
对于需要低延迟和高吞吐量 IO 的 AWS 托管应用程序,您可以使用 NVMe 集群类。NVMe 集群类利用独特的数据协议,显著提高了数据访问速度。
NVMe 集群使用一个隐藏的从节点,该节点由一个具有高吞吐量和 IOPS 的预配卷组成,以方便备份。
- 操作节点
- Atlas 集群中的任何可选举节点或只读节点。
- 组织
Atlas 项目的逻辑群组。您可以利用组织来管理其中所包含项目的账单、用户和安全设置。
计费在组织层面进行,同时保持对每个项目使用情况的可见性。
您可以查看组织内的所有项目。
您可以使用团队将组织用户批量分配给组织内的项目。
- 组织 ID
- 24string用于标识Atlas 组织 的唯一 位十六进制 。返回所有组织端点返回执行API调用的经过身份验证的用户可以访问的所有组织的 ID。
- 性能顾问
Atlas 工具,用于监控集群上执行的慢查询,并建议使用索引来提高查询性能。Performance Advisor 建议的每个索引都包含一个影响分数,指示此索引可能带来的潜在性能改进。
- 主节点
- 在副本集中,主节点是接收所有写入操作的节点。在多区域集群中,Atlas 在选举期间会优先考虑最高优先级区域中的节点有无主节点资格。
- 项目
对群组进行逻辑分组。一个项目中可以有多个集群,一个组织中可以有多个项目。
注意
项目是组的同义词。
- 项目 ID
24string用于标识Atlas 项目 的唯一 位十六进制 。获取所有项目API端点返回执行 API 调用的经过身份验证的用户可以访问的所有项目的 ID。
注意
项目 ID 与群组 ID同义。
- 量化
- 将向量中各个维度的值压缩到较小范围以减少资源消耗并提高速度的方法。 Atlas Vector Search支持对量化向量进行索引和查询。
- Query Profiler
用于诊断和监控集群性能问题的 Atlas 工具。 查询分析器可以显示长期运行的查询 及其性能统计信息。您可以过滤 查询分析器返回的数据,专注于特定的命名空间和操作类型。
- 只读节点
- 专用地理区域中的副本集,用于补充可选举节点区域。您可以使用只读节点将数据副本存储在最常被读取的位置,以提高性能。
- 实时性能面板
Atlas 监控服务,可显示当前网络流量、集群上的数据库操作以及有关主机的硬件统计信息。使用 RTPP,直观地评估查询执行时间,监控网络活动,并发现副本集辅助成员潜在的复制延迟。
- 召回
- 测量 ANN搜索返回的真正最近邻的比例。该指标反映了算法与新奥搜索结果的接近程度。符号 Recall@k 是指衡量Atlas Vector Search返回的前 k 个结果中存在多少真正的最近邻。
- 复制集
维护相同数据集的 MongoDB 服务器群组。 副本集提供冗余和高可用性,是所有生产部署的基础。
- 滚动重启
- 按顺序重启集群中所有节点的进程。为了保持集群可用性,Atlas 从从节点开始,每次重启一个节点。Atlas 始终保持一个主节点,直到滚动重启完成。
- 语义搜索
- 搜索与查询具有相似含义的值。 即使没有词汇重叠,语义搜索也能捕捉单词或短语之间的自然关系。 语义搜索和向量搜索通常互换使用。 Atlas Vector Search支持对Atlas集群中存储的矢量数据进行语义搜索。
- 分片集群
- 共享集群
包含
M0
(免费套餐)、M2
和M5
层集群的集群类别。共享集群通常用于开发和小规模生产工作负载。- 相似度函数
- 衡量两个向量之间的相似度。 Atlas Vector Search支持
euclidean
、cosine
和dotProduct
相似度函数。 - snapshot
- 团队
同一组织中的 Atlas 用户群组。您可以使用团队,为跨越多个项目的同一组 Atlas 用户授予访问权限。团队中的所有用户享用相同的项目访问权限。
注意
Atlas 用户可归属于多支团队。
- 拓扑结构
MongoDB 实例部署的状态,其包括以下详细信息:
- 向量数据库
- 系统,用于存储向量嵌入和相关元数据,并启用对存储的向量嵌入的最近邻搜索。 您可以使用Atlas作为向量数据库,并使用Atlas Vector Search对存储的向量嵌入执行向量搜索。 您可以使用向量数据库来实现RAG 。
- 向量索引
- 可有效处理最近邻搜索查询的数据结构。 Atlas Vector Search支持创建类型为
vector
$vectorSearch
的索引,以便为运行 查询的字段编制索引。 - Vector Search
- 对存储在向量索引中的向量设立执行 k 最近邻搜索的方法。Atlas Vector Search支持针对 k 个最近邻的 ANN 和 ENN搜索。