DigitalOcean监测术语和指标术语表

DigitalOcean Monitoring通过详细的图表和可配置的警报策略为管理员提供有关其基础架构运行状况的信息。在本指南中,我们将讨论跟踪的指标以及监视和使用的一些术语。

介绍

DigitalOcean Monitoring通过详细的图表和可配置的警报策略为管理员提供有关其基础架构运行状况的信息。 在本指南中,我们将讨论跟踪的指标以及监视和警报中使用的一些术语。

指标

DigitalOcean Monitoring使用各种指标来跟踪系统运行状况。 我们将通过不同的资源,用于测量的单位,以及DigitalOcean监控的方式。 如果您不熟悉常规监控词汇,或者您遇到不了解的术语,请跳到页面底部的术语部分

CPU利用率

CPU利用率衡量在给定时间使用的处理器的数量。 CPU利用率以百分比表示。

在DigitalOcean上,所有处理器的总使用量由100%表示。 这与某些CPU使用工具不同,每个CPU或内核报告为100%。 例如,其他工具可能会在具有两个CPU的机器上表示200%的度量,或者对于四核处理器,可能会表示400%的度量。

在Droplet图中,CPU使用率按照Linux对系统和用户时间的概念进行细分。 系统时间是执行内核级指令的时间,而用户时间是执行“用户空间”指令所花费的时间,这是由内核以外的任何内容定义的。

DigitalOcean CPU图

警报策略不区分用户和系统时间。

记忆

内存利用率是对服务器上正在使用的内存的测量。 这表示为总可用物理内存的百分比:

DigitalOcean记忆图

DigitalOcean通过评估/proc/meminfo暴露的内存信息来计算内存消耗。 通过从总内存量中减去可用内存和用于缓存的内存来计算内存使用量。

磁盘I / O

磁盘I / O或输入/输出是衡量服务器磁盘所经历的读写活动的程度。 这以MB / s或兆字节每秒表示。

DigitalOcean将磁盘I / O分解为单独处理的读写操作。 Droplet图将其显示为磁盘I / O图中的两条独立的行:

DigitalOcean磁盘I / O图

可以创建单独的警报策略来监视磁盘读取操作和磁盘写入操作。

磁盘使用情况

磁盘使用量是当前使用的磁盘空间的量度。 这表示为服务器上可用总磁盘空间的百分比。

该值考虑了Droplet的根存储和任何附加的附加块存储设备。 每个存储设备的值被汇总为表示服务器总存储空间的单个值:

DigitalOcean磁盘使用图

警报策略也将根据总磁盘空间进行解释。

带宽

带宽是测量通过Droplet网络接口的入站或出站流量。 这表示为MBps或每秒兆字节。

在Droplet图中,公共和私人流量之间的带宽被分解。 公共带宽是通过连接到互联网的公共接口的带宽。 传入流量由一行表示,另一行代表流量。

DigitalOcean公共带宽图

专用带宽是允许在数据中心内通信的专用接口上的流量的量度。 仅当启用了专用网络并且接口经历了流量时,才会显示此图。 再次,有一些单独的线路用于传入和传出流量。

DigitalOcean私人带宽图

在警报策略中,公共和私有接口之间没有区别,但仍保留入站和出站流量的分离。 警报策略可以跟踪传入流量或传出流量。 警报策略也按MBps进行定义。

顶级流程

DigitalOcean还将CPU和内存的最高消费者作为Droplet图中的图表报告。 这些进程首先使用所选资源的最高消费者进行排序。 每个过程都伴随着总可用资源的使用百分比。

最高的CPU用户:

DigitalOcean顶级CPU图表

最高记忆体用户:

DigitalOcean顶级内存图表

这些图表对警报政策没有太大的影响,尽管他们可能能够深入了解哪些进程可能导致触发警报。

术语

在使用监控技术时,熟悉常用术语通常是有帮助的。 下面我们将介绍一些与DigitalOcean监控相关的最常用的概念:

  • 资源 :在计算中,资源是可用性有限的基本组件。 资源包括CPU,内存,磁盘空间或可用带宽。
  • 度量 :在计算中,度量是衡量计算机资源的标准。 指标可以指向要测量的资源和单位,或者是关于该资源收集的数据。
  • 单位 :单位是比较价值的标准方法。
  • 百分比单位 :百分比单位指定与总可用数量关系的值,通常设置为100%。 百分比对于具有已知限制的数量(如磁盘空间)很有用。
  • 费率单位 :费率单位指定与另一项措施相关的价值(最常见的时间)。 费率单位通常会告诉你在一段时间内发生的频率,以便您可以比较大小。 当没有易于理解的上边界指示总使用或更有助于检查使用情况(如输入带宽)时,速率单位很有用。
  • 数据点 :数据点或数值是表示单次测量的数字和单位。
  • 数据集 :数据集是相关数据点的集合。
  • 时间序列数据 :时间序列数据是按照时间顺序收集的数据,按时间顺序排列,以便检查随时间的变化。
  • 趋势 :趋势表明数据集中的一般趋势。 趋势对于识别变化和预测未来行为很有用。
  • 监测 :在计算中,监测是收集和可视化数据的过程,以提高对系统健康的认识,并在使用超出预期水平时尽可能减少响应时间。
  • 系统使用监控 :系统使用情况监控是一种监控系统,涉及跟踪系统资源。
  • 警报 :在计算机监控系统中的警报功能是在某些指标超出预期范围时发送通知的能力。
  • 阈值 :在警报中,阈值是定义正常和异常使用之间边界的值。
  • 警报间隔 :警报间隔是在触发警报之前平均使用量超过阈值的时间段。

结论

DigitalOcean监控的重点是提高您的基础架构资源消耗的意识。 通过在Droplet图中可视化使用数据,用户可以深入了解历史性能,相关模式和资源消耗的新趋势。 当资源使用量超出可接受的范围时,警报策略会及时提供通知。

要了解有关DigitalOcean监控的更多信息,请查看以下链接: