Docs 菜单
Docs 主页
/
MongoDB Atlas
/ /

与 Datadog 集成

在此页面上

  • 必需的访问权限
  • 先决条件
  • 步骤
  • 适用于 Datadog 的性能指标
  • 适用于 Datadog 的标签

您可以将 Atlas 配置为将有关项目的指标数据发送到 Datadog 仪表盘。

注意

如果您将 Atlas 项目配置为向 Datadog 发送警报和事件,则无需遵循此过程。Atlas 通过用于发送 警报和事件的相同集成将项目指标发送到 Datadog。

您还可以将 Datadog 配置为接收 Atlas 警报。要了解更多信息,请参阅通知选项。

要将 Atlas 与 Datadog 集成,您必须拥有项目的 Project Owner(项目所有者)访问权限。拥有 Organization Owner(组织所有者)访问权限的用户必须将自己作为 Project Owner(项目所有者)添加到项目中。

数据狗集成仅适用于 M10+ 集群。

注意

Datadog 集成不支持标签。如果您与 Datadog 集成,请继续使用标签。要定义标签,请使用修改一个集群 API 端点中的 labels 参数。

要将 Atlas 与 Datadog 集成,您必须拥有 Datadog 帐户和 Datadog API 密钥。当您首次创建 Datadog 帐户时,Datadog 会向您授予 API 密钥。

如果您还没有 Datadog 帐户,可以通过以下链接注册:https://app.datadoghq.com/signup

要使用 Atlas CLI 创建或更新 Datadog 集成,请运行以下命令:

atlas integrations create DATADOG [options]

要了解有关命令语法和参数的更多信息,请参阅 Atlas CLI 文档中的 Atlas 集成创建 DATADOG。

要使用 Atlas 用户界面配置 Atlas 与Datadog 的集成,请执行以下操作:

1
  1. 如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。

  2. 如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。

  3. Projects(项目)菜单旁边,展开 Options(选项)菜单,然后单击 Integrations(项目设置)。

    显示“项目集成”页面。

2
  1. 单击 Datadog 集成卡的 Configure

  2. 在输入框中输入您的 Datadog API 密钥。

  3. 选择您的 API 区域。

    在 Atlas 用户界面中,Atlas 支持以下 Datadog 地区:

    • US1

    • US3

    • US5

    • EU1

    • AP1

    Datadog 默认使用 US1

    如要了解有关 Datadog 区域的更多信息,请参阅 Datadog 站点

  4. 单击 Save(连接)。

Datadog 跟踪您的 Atlas 集群的以下指标数据。括号中的指标名称是 Datadog 用户界面中使用的名称。

指标名称
指标类型
说明
CONNECTIONS
(mongodb.atlas.connections.current)

处理

集群上当前打开的连接数。

DB_STORAGE_TOTAL
(mongodb.atlas.stats.totalstoragesize)
DB_DATA_SIZE_TOTAL
(mongodb.atlas.stats.totaldatasize)
DB_INDEX_SIZE_TOTAL
(mongodb.atlas.stats.totalindexsize)

处理

集群上的总数据库存储空间大小、数据大小和索引大小(以字节为单位)。

DISK_LATENCY_READS
(mongodb.atlas.system.disk.latency.reads)
DISK_LATENCY_WRITES
(mongodb.atlas.system.disk.latency.writes)

Disk

读取请求和写入请求的延迟测量(以毫秒为单位)。

DISK_MAX_LATENCY_READS
(mongodb.atlas.system.disk.max.latency.reads)
DISK_MAX_LATENCY_WRITES
(mongodb.atlas.system.disk.max.latency.writes)

Disk

读取请求和写入请求的最大延迟时间(以毫秒为单位)。

DISK_QUEUE_DEPTH
(mongodb.atlas.system.disk.queuedepth)

Disk

在指标粒度指定的时间段内向 MongoDB 使用的磁盘分区发出请求队列的平均长度。

MAX_DISK_QUEUE_DEPTH
(mongodb.atlas.system.disk.max.queuedepth)

Disk

向 MongoDB 使用的磁盘分区发出的请求队列的平均长度的指标粒度指定的时间段内的最大值。

DOCUMENT_METRICS_RETURNED
(mongodb.atlas.metrics.document.returned)
DOCUMENT_METRICS_INSERTED
(mongodb.atlas.metrics.document.inserted)
DOCUMENT_METRICS_UPDATED
(mongodb.atlas.metrics.document.updated)
DOCUMENT_METRICS_DELETED
(mongodb.atlas.metrics.document.deleted)

处理

每秒读取或写入的文档数。

NETWORK_BYTES_IN
(mongodb.atlas.network.bytes.in)

处理

每秒发送到数据库服务器的物理字节的平均速率(经过任何传输压缩后)。

NETWORK_BYTES_OUT
(mongodb.atlas.network.bytes.out)

处理

每秒从数据库服务器发送的物理字节的平均速率(经过任何传输压缩后)。

NETWORK_NUM_REQUESTS
(mongodb.atlas.network.num.requests)

处理

每秒发送到数据库服务器的平均请求速率。

OPCOUNTER_CMD
(mongodb.atlas.opcounters.command)
OPCOUNTER_QUERY
(mongodb.atlas.opcounters.query)
OPCOUNTER_UPDATE
(mongodb.atlas.opcounters.update)
OPCOUNTER_DELETE
(mongodb.atlas.opcounters.delete)
OPCOUNTER_GETMORE
(mongodb.atlas.opcounters.getmore)
OPCOUNTER_INSERT
(mongodb.atlas.opcounters.insert)

处理

每秒操作数,按操作类型分隔。

OP_EXECUTION_TIME_READS
(mongodb.atlas.oplatencies.reads.avg)
OP_EXECUTION_TIME_WRITES
(mongodb.atlas.oplatencies.writes.avg)
OP_EXECUTION_TIME_COMMANDS
(mongodb.atlas.oplatencies.commands.avg)

处理

平均操作时间(毫秒),按操作类型分隔。

QUERY_TARGETING_SCANNED_OBJECTS_PER_RETURNED
(mongodb.atlas.metrics.queryexecutor.scannedobjectsperreturned)

处理

衡量扫描对象数量与返回对象数量的比值。值越低表示查询效率越高。

QUERY_SPILL_TO_DISK_DURING_SORT
(mongodb.atlas.metrics.query.sort.spillToDisk)

处理

$sort阶段引起的磁盘写入总数。

REPLICATION_LAG
(mongodb.atlas.replset.replicationlag)

处理

更新到主节点后再更新到从节点的延迟时间长度(以秒为单位)。

REPLICATION_OPLOG_WINDOW
(mongodb.atlas.replset.oplogWindow)

处理

主节点副本 oplog 中可用数据库操作的估计平均次数(以秒为单位)。该指标基于 oplog 的流失。如果从节点上的复制延迟超过复制 oplog 窗口,且复制空间达到零,则需要完全重新同步

REPLICATION_STATUS_HEALTH
(mongodb.atlas.replstatus.health)

处理

指示副本集成员健康状况的数字。值为 1 表示副本集成员已启动/正在运行。值为 0 表示副本集成员已关闭/未运行。

在以下情况下,您看到的健康状态可能不准确:

  • 如果您有网络分区并且 MongoDB 助手位于副本集中的隔离节点上,则只有来自该隔离节点的网络探测到达 Datadog。该隔离节点和 Atlas 用户界面将其他节点报告为关闭。

  • 如果您有网络分区并且 MongoDB 助手处于受影响节点之外,则所有节点的网络探测都会到达 Datadog,但会报告不同的状态。

  • 如果所有节点均无响应或其状态为挂起,则不会有新的 ping 进入。Atlas UI 报告这些节点已关闭,但 Datadog 报告它们是正常的且状态变旧。

  • 如果 Datadog 在导入指标时出现故障或中断,该指标可能会报告错误并产生误报。

重要提示:如果健康状态为 1,但 Datadog 中没有出现其他指标,则副本集可能已关闭。

REPLICATION_STATUS_STATE
(mongodb.atlas.replstatus.state)

处理

介于 010 之间的整数,表示副本集成员的副本状态。

SYSTEM_MEMORY_USED
(mongodb.atlas.system.memory.used)
SYSTEM_MEMORY_AVAILABLE
(mongodb.atlas.system.memory.available)

记录

指示已使用的物理内存(以字节为单位)的计量表。

MAX_SYSTEM_MEMORY_USED
(mongodb.atlas.system.memory.max.used)
MAX_SYSTEM_MEMORY_AVAILABLE
(mongodb.atlas.system.memory.max.available)

记录

指示已使用的最大物理内存(以字节为单位)的计量表。

SYSTEM_NORMALIZED_CPU_USER
(mongodb.atlas.system.cpu.norm.user)
SYSTEM_NORMALIZED_CPU_KERNEL
(mongodb.atlas.system.cpu.norm.kernel)
SYSTEM_NORMALIZED_CPU_NICE
(mongodb.atlas.system.cpu.norm.nice)
SYSTEM_NORMALIZED_CPU_IOWAIT
(mongodb.atlas.system.cpu.norm.iowait)
SYSTEM_NORMALIZED_CPU_IRQ
(mongodb.atlas.system.cpu.norm.irq)
SYSTEM_NORMALIZED_CPU_SOFTIRQ
(mongodb.atlas.system.cpu.norm.softirq)
SYSTEM_NORMALIZED_CPU_GUEST
(mongodb.atlas.system.cpu.norm.guest)
SYSTEM_NORMALIZED_CPU_STEAL
(mongodb.atlas.system.cpu.norm.steal)

记录

逻辑 CPU 在服务器各种进程中所占的时间百分比。这些值根据逻辑 CPU 核心的数量进行标准化。

MAX_SYSTEM_NORMALIZED_CPU_USER
(mongodb.atlas.system.cpu.max.norm.user)
MAX_SYSTEM_NORMALIZED_CPU_KERNEL
(mongodb.atlas.system.cpu.max.norm.kernel)
MAX_SYSTEM_NORMALIZED_CPU_NICE
(mongodb.atlas.system.cpu.max.norm.nice)
MAX_SYSTEM_NORMALIZED_CPU_IOWAIT
(mongodb.atlas.system.cpu.max.norm.iowait)
MAX_SYSTEM_NORMALIZED_CPU_IRQ
(mongodb.atlas.system.cpu.max.norm.irq)
MAX_SYSTEM_NORMALIZED_CPU_SOFTIRQ
(mongodb.atlas.system.cpu.max.norm.softirq)
MAX_SYSTEM_NORMALIZED_CPU_GUEST
(mongodb.atlas.system.cpu.max.norm.guest)
MAX_SYSTEM_NORMALIZED_CPU_STEAL
(mongodb.atlas.system.cpu.max.norm.steal)

记录

在指标粒度指定的时间段内,服务器中各个进程使用的逻辑 CPU 的时间百分比的最大值。这些值根据逻辑 CPU 核心的数量进行标准化。

PROCESS_NORMALIZED_CPU_USER
(mongodb.atlas.system.cpu.mongoprocess.norm.user)
PROCESS_NORMALIZED_CPU_KERNEL
(mongodb.atlas.system.cpu.mongoprocess.norm.kernel)
PROCESS_NORMALIZED_CPU_CHILDREN_USER
(mongodb.atlas.system.cpu.mongoprocess.norm.childrenuser)
PROCESS_NORMALIZED_CPU_CHILDREN_KERNEL
(mongodb.atlas.system.cpu.mongoprocess.norm.childrenkernel)

处理

逻辑 CPU 在服务器特定于 MongoDB 进程的各个进程中使用的时间百分比。这些值根据逻辑 CPU 核心的数量进行标准化处理。

MAX_PROCESS_NORMALIZED_CPU_USER
(mongodb.atlas.system.cpu.mongoprocess.max.norm.user)
MAX_PROCESS_NORMALIZED_CPU_KERNEL
(mongodb.atlas.system.cpu.mongoprocess.max.norm.kernel)
MAX_PROCESS_NORMALIZED_CPU_CHILDREN_USER
(mongodb.atlas.system.cpu.mongoprocess.max.norm.childrenuser)
MAX_PROCESS_NORMALIZED_CPU_CHILDREN_KERNEL
(mongodb.atlas.system.cpu.mongoprocess.max.norm.childrenkernel)

处理

由指标粒度指定的时间段内,服务器中特定于 MongoDB 进程的各个进程使用的逻辑 CPU 的时间百分比的最大值。这些值根据逻辑 CPU 核心的数量进行标准化处理。

MEMORY_RESIDENT
(mongodb.atlas.mem.resident)
MEMORY_VIRTUAL
(mongodb.atlas.mem.virtual)

处理

服务器上 MongoDB 进程占用的内存(单位:MB),按内存类型分隔。

OPCOUNTER_REPL_CMD
(mongodb.atlas.opcountersrepl.command)
OPCOUNTER_REPL_UPDATE
(mongodb.atlas.opcountersrepl.update)
OPCOUNTER_REPL_DELETE
(mongodb.atlas.opcountersrepl.delete)
OPCOUNTER_REPL_INSERT
(mongodb.atlas.opcountersrepl.insert)

处理

测量针对 MongoDB 从节点的数据库操作速率,而这些操作会从 MongoDB serverStatus 命令的 opcountersRepl 文档中进行收集。

您可以在Opcounters - Repl 图表上查看这些指标,可通过集群指标进行访问。

OPLOG_RATE_GB_PER_HOUR
(mongodb.atlas.replset.oplograte)

处理

主服务器每小时生成 oplog 的平均速率(以千兆字节为单位)。

TOTAL_NUMBER_OF_GETMORE_COMMANDS
(mongodb.atlas.search.index.stats.commands.getmore)

Atlas Search

在所有 Atlas Search 查询中运行的 getmore 命令总数。

TOTAL_NUMBER_OF_DELETES
(mongodb.atlas.search.index.stats.deletes)

Atlas Search

删除的文档或字段(索引定义指定)总数。

TOTAL_NUMBER_OF_INDEX_FIELD
(mongodb.atlas.search.index.stats.index.fields)

Atlas Search

Atlas Search 索引存在的唯一字段总数。

TOTAL_INDEX_SIZE_ON_DISK
(mongodb.atlas.search.index.stats.index.size)

Atlas Search

磁盘上所有索引的总大小。

TOTAL_NUMBER_OF_INSERTS_SERIES
(mongodb.atlas.search.index.stats.inserts)

Atlas Search

Atlas Search 建立索引的文档或字段总数(索引定义指定)。

MAX_REPLICATION_LAG
(mongodb.atlas.search.index.stats.max.replication.lag)

Atlas Search

Atlas Search 在复制 mongodoplog 中的更改时大约落后的毫秒数。

TOTAL_NUMBER_OF_UPDATES
(mongodb.atlas.search.index.stats.updates)

Atlas Search

Atlas Search 更新的文档或字段(在索引定义中指定)的总数。

TOTAL_NUMBER_OF_ERROR_QUERIES
(mongodb.atlas.search.index.stats.queries.error)

Atlas Search

Atlas Search 无法返回响应的查询总数。

TOTAL_NUMBER_OF_SUCCESS_QUERIES
(mongodb.atlas.search.index.stats.queries.success)

Atlas Search

Atlas Search 成功返回响应的查询总数。

TOTAL_NUMBER_OF_TOTAL_QUERIES
(mongodb.atlas.search.index.stats.queries.total)

Atlas Search

提交给 Atlas Search 的查询总数。

JVM_CURRENT_MEMORY
(mongodb.atlas.search.jvm.current.memory)

Atlas Search

JVM 堆当前使用的内存量。

JVM_MAX_MEMORY
(mongodb.atlas.search.jvm.max.memory)

Atlas Search

JVM 堆中的可用内存总量。

DISK_PARTITION_SPACE_FREE
(mongodb.atlas.system.disk.space.free)
DISK_PARTITION_SPACE_USED
(mongodb.atlas.system.disk.space.used)
DISK_PARTITION_SPACE_PERCENT_FREE
(mongodb.atlas.system.disk.space.percentfree)
DISK_PARTITION_SPACE_PERCENT_USED
(mongodb.atlas.system.disk.space.percentused)

Disk

测量 MongoDB 使用的磁盘分区上的可用磁盘空间和已用磁盘空间(以字节为单位)。

MAX_DISK_PARTITION_SPACE_FREE
(mongodb.atlas.system.disk.max.space.free)
MAX_DISK_PARTITION_SPACE_USED
(mongodb.atlas.system.disk.max.space.used)
MAX_DISK_PARTITION_SPACE_PERCENT_FREE
(mongodb.atlas.system.disk.max.space.percentfree)
MAX_DISK_PARTITION_SPACE_PERCENT_USED
(mongodb.atlas.system.disk.max.space.percentused)

Disk

MongoDB 使用的磁盘分区上的可用磁盘空间和已用磁盘空间(以字节为单位)的指标颗粒度指定的时间段内的最大值。

DISK_PARTITION_IOPS_READ
(mongodb.atlas.system.disk.iops.reads)
DISK_PARTITION_IOPS_WRITE
(mongodb.atlas.system.disk.iops.writes)
DISK_PARTITION_IOPS_TOTAL
(mongodb.atlas.system.disk.iops.total)
DISK_PARTITION_IOPS_PERCENTUTILIZATION
(mongodb.atlas.system.disk.iops.percentutilization)

Disk

测量 MongoDB 所用磁盘分区的 IOPS 吞吐量。

MAX_DISK_PARTITION_IOPS_READ
(mongodb.atlas.system.disk.max.iops.reads)
MAX_DISK_PARTITION_IOPS_WRITE
(mongodb.atlas.system.disk.max.iops.writes)
MAX_DISK_PARTITION_IOPS_TOTAL
(mongodb.atlas.system.disk.max.iops.total)

Disk

MongoDB 占用的磁盘分区的 IOPS 吞吐量在指标粒度指定的时间段内的最大值。

SYSTEM_NETWORK_BYTES_IN
(mongodb.atlas.system.network.bytes.in)

记录

每秒接收物理字节的平均速率。

SYSTEM_NETWORK_BYTES_OUT
(mongodb.atlas.system.network.bytes.out)

记录

平均传输速率,即每秒传输的物理字节数。

MAX_SYSTEM_NETWORK_IN
(mongodb.atlas.system.network.max.bytes.in)

记录

由每秒接收的物理字节平均速率的指标颗粒度指定的时间段内的最大值。

MAX_SYSTEM_NETWORK_OUT
(mongodb.atlas.system.network.max.bytes.out)

记录

由每秒传输的物理字节平均速率的指标粒度指定的时间段内的最大值。

CACHE_BYTES_READ_INTO
(mongodb.atlas.wiredtiger.cache.bytes_read_into_cache)
CACHE_BYTES_WRITTEN_FROM
(mongodb.atlas.wiredtiger.cache.bytes_written_from_cache)

处理

测量 WiredTiger 缓存中读取和写入字节的平均速率。

CACHE_USED_BYTES
(mongodb.atlas.wiredtiger.cache.bytes_currently_in_cache)
CACHE_DIRTY_BYTES
(mongodb.atlas.wiredtiger.cache.tracked_dirty_bytes_in_cache)

处理

测量 WiredTiger 缓存中的数据字节数和脏数据的字节数。

PAGES_READ_INTO_CACHE
(mongodb.atlas.wiredtiger.cache.pages_read_into_cache)
PAGES_REQUESTED_FROM_CACHE
(mongodb.atlas.wiredtiger.cache.pages_requested_from_the_cache)

处理

读入缓存的页数以及从缓存请求的页数。

TICKETS_AVAILABLE_READS
(mongodb.atlas.wiredtiger.concurrenttransactions.read.available)
TICKETS_AVAILABLE_WRITES
(mongodb.atlas.wiredtiger.concurrenttransactions.write.available)

处理

测量存储引擎中的读写操作数量。

GLOBAL_LOCK_CURRENT_QUEUE_READERS
(mongodb.atlas.global.lock.current.queue.readers)
GLOBAL_LOCK_CURRENT_QUEUE_WRITERS
(mongodb.atlas.global.lock.current.queue.writers)
GLOBAL_LOCK_CURRENT_QUEUE_TOTAL
(mongodb.atlas.global.lock.current.queue.total)

全局

仪表盘指示由于 Atlas 在读取、写入或读写组合时持有的而导致当前排队的操作数量。

AVG_OBJECT_SIZE
(dbstats.avg.object.size)

仪表盘

每个文档的平均大小(以字节为单位)。即 dataSize 除以文档数量。缩放参数不会影响 avgObjSize 值。

COLLECTIONS
(mongodb.atlas.dbstats.collections)

仪表盘

数据库中的集合数量。

DATA_SIZE
(mongodb.atlas.dbstats.data.size)

仪表盘

数据库中保存的未压缩数据的总大小。

FILE_SIZE
(mongodb.atlas.dbstats.file.size)

仪表盘

MongoDB 存储数据的文件系统中使用的所有磁盘空间的总大小。

INDEX_SIZE
(mongodb.atlas.dbstats.index.size)

仪表盘

分配给数据库中所有索引的磁盘空间总和,包括可用索引空间。

INDEXES
(mongodb.atlas.dbstats.indexes)

仪表盘

数据库中所有集合的索引总数。

NUM_EXTENTS
(mongodb.atlas.dbstats.num.extents)

仪表盘

包含数据库中所有集合的扩展数量。

OBJECTS
(mongodb.atlas.dbstats.objects)

仪表盘

数据库中所有集合的对象(特别是文档)的数量。

STORAGE_SIZE
(mongodb.atlas.dbstats.storage.size)

仪表盘

分配给数据库中用于存储文档的所有集合的磁盘空间总和,包括可用空间。

VIEWS
(mongodb.atlas.dbstats.views)

仪表盘

数据库中视图的数量。

COLLECTION_READ_LATENCY
(mongodb.atlas.latencyStats.read.sum)
COLLECTION_WRITE_LATENCY
(mongodb.atlas.latencyStats.write.sum)
COLLECTION_COMMANDS_LATENCY
(mongodb.atlas.latencyStats.write.sum)
COLLECTION_TOTAL_LATENCY
(mongodb.atlas.latencyStats.total.sum)

计数器

64 位整数,以微秒为单位表示读取、写入、命令和总请求的延迟。

COLLECTION_READ_OPS
(mongodb.atlas.latencyStats.read.count)
COLLECTION_WRITE_OPS
(mongodb.atlas.latencyStats.write.count)
COLLECTION_COMMANDS_OPS
(mongodb.atlas.latencyStats.write.count)
COLLECTION_TOTAL_OPS
(mongodb.atlas.latencyStats.total.count)

计数器

64 位整数,提供自启动以来对集合执行的读取、写入、命令和总请求数的操作数。

READ_HISTOGRAM_P50
(mongodb.atlas.latencyStats.read.p50)
WRITE_HISTOGRAM_P50
(mongodb.atlas.latencyStats.write.p50)
COMMANDS_HISTOGRAM_P50
(mongodb.atlas.latencyStats.commands.p50)
TOTAL_HISTOGRAM_P50
(mongodb.atlas.latencyStats.total.p50)

计数器

读取、写入、命令和总请求的延迟直方图中第 50 个百分位数的操作数。

READ_HISTOGRAM_P95
(mongodb.atlas.latencyStats.read.p95)
WRITE_HISTOGRAM_P95
(mongodb.atlas.latencyStats.write.p95)
COMMANDS_HISTOGRAM_P95
(mongodb.atlas.latencyStats.commands.p95)
TOTAL_HISTOGRAM_P95
(mongodb.atlas.latencyStats.total.p95)

计数器

读取、写入、命令和总请求的延迟直方图中第 95 个百分位数的操作数。

READ_HISTOGRAM_P99
(mongodb.atlas.latencyStats.read.p99)
WRITE_HISTOGRAM_P99
(mongodb.atlas.latencyStats.write.p99)
COMMANDS_HISTOGRAM_P99
(mongodb.atlas.latencyStats.commands.p99)
TOTAL_HISTOGRAM_P99
(mongodb.atlas.latencyStats.total.p99)

计数器

读取、写入、命令和总请求的延迟直方图中第 99 个百分位数的操作数。

除了任何集群标签外,Datadog 还会将以下标签作为某些指标的标签发送:

Datadog Tags
说明

organizationname

与指标相关的 Atlas 组织。

projectname

与指标关联的 Atlas 项目。

clustername

与指标相关的 Atlas 集群。

replicasetname

与指标相关的副本集。

shardedclustername

与指标相关的分片集群。

databasename

与指标相关的数据库。

collectionname

与指标相关的集合。

hostnameport

与 Atlas 主机名关联的端口号。

hostnamestate

您的 Atlas 主机名的状态(主进程、从进程或单个进程)。在查询分片集群或副本集时,您可以使用此标签来过滤集合级延迟指标。

后退

第三方服务