Google SRE 定义了四个需要监控的关键指标。延迟(Latency),流量(Traffic),错误(Errors)和饱和度(Saturation)。

正如google sre 所讨论的,如果您只能衡量服务的四个指标,请关注这四个指标。

延迟 Latency

延迟是服务处理传入请求和发送响应所用时间的度量。测量服务延迟有助于及早发现服务的缓慢。

流量 Traffic

流量可以更好地理解服务需求。通常称为服务 QPS(每秒查询数),流量是服务请求量的度量。此信号可帮助您决定何时需要扩大服务规模以应对不断增长的客户需求,或缩小服务规模以提高成本效益。

错误 Errors

错误是对客户端请求失败的度量。这些故障可以根据响应代码(HTTP 5XX 错误)轻松识别。

在某些情况下,由于错误的结果数据或违反了约定,响应被认为是错误的。例如,您可能会收到HTTP 200 响应,但返回的数据不完整,或者响应时间超出了约定的 SLA。因此,除了响应码之外,可能还需要其他机制(代码逻辑)来捕获错误。

饱和度 Saturation

饱和度是服务器资源利用率的度量。这个信号告诉你服务资源的状态以及它们有多“满”。

这些资源包括内存、cpu、网络 I/O 等。在资源利用率达到 100% 之前,服务性能也会缓慢下降。因此,有一个利用率目标很重要。延迟的增加是饱和度的一个很好的指标;测量延迟99线 有助于及早发现饱和度。

系统监控的四个黄金指标相关推荐

  1. 自动驾驶 Apollo 源码分析系列,系统监控篇(四):Monitor模块如何监控进程 Process 的存活状态?

    本篇文章分析 Apollo 中监控模块中监控进程状态的相关代码. 1. ProcessMonitor ProcessMonitor 是一个普通的定时器组件,内部函数也只是常规的 RunOnce 和 U ...

  2. 用于监控分布式系统的四个黄金信号

    为客户提供高质量的应用程序或服务取决于幕后的高可用性基础架构.当您的服务不可用,速度慢或损坏时,客户可能会感到沮丧,减少支出或完全停止使用您的服务.您的运营团队需要快速地了解问题,以防止服务质量降低并 ...

  3. 转:运维监控系统-监控项及指标的梳理

    转自: 运维监控系统-监控项及指标的梳理_程序员杂谈-CSDN博客_运维监控指标综合监控功能工具 综合监控工具完成对被管对象的集中监控.集中维护和集中管理,被管对象包括网络设备.服务器.PC设备.数据 ...

  4. 五十四、Linux性能优化实战学习笔记|套路篇:系统监控的综合思路

    目录 指标监控 日志监控 小结 上一节,我带你学习了,如何使用 USE 法来监控系统的性能,先简单回顾一下. 系统监控的核心是资源的使用情况,这既包括 CPU.内存.磁盘.文件系统.网络等硬件资源,也 ...

  5. 生活质量衡量系统_「电力闲聊」电能质量中的电压质量,有四个衡量指标

    今天我们要聊的话题是电能质量. 说到这里,你可能想问了,电还需要有质量么?当然了,电就是商品,质量过关才能拿出来卖.在我国,主要采用的是交流供电系统.交流电能的质量指标主要包括电压.频率和波形,我们今 ...

  6. 大厂竟然都是这么做系统监控的,我们的方式太原始了~

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源 | http://www.xuyasong.com ...

  7. 调研字节码插桩技术,用于系统监控设计和实现

    作者:小傅哥 博客:https://bugstack.cn ❝ 沉淀.分享.成长,让自己和他人都能有所收获!???? ❞ 目录 一.来自深夜的电话! 二.准备工作 三.使用 AOP 做个切面监控 1. ...

  8. linux 系统监控 php,Linux系统资源监控命令简介

    Linux 系统由若干主要物理组件组成,如CPU.内存.网卡和存储设备.要有效地管理Linux 环境,您应该能够以合理的精度测量这些资源的 各种指标-每个组件处理多少资源.是否存在瓶颈等.下面我们介绍 ...

  9. linux系统监控命令汇总

    零.Linux系统监控命令速查手册 命令 功能应用 用法举例     free 查看内存使用情况,包括物理内存和虚拟内存 free -h或free -m     vmstat 对系统的整体情况进行统计 ...

最新文章

  1. Spring Boot 2.x基础教程:使用@Scheduled实现定时任务
  2. MongoDB:详细解释mongodb的高级操作,聚合和游标
  3. js变量后面加问号是什么_js没那么简单(1)-- 执行上下文
  4. 信息系统项目管理师算职称吗
  5. [Head First Java] - 线程共享数据问题
  6. 记录用户转成超级用户的文件名字_一分钟了解Linux用户
  7. 7个理由,给你推荐这款“秒杀Excel”的分析神器!
  8. Linux RT(1)-硬实时Linux(RT-Preempt Patch)在PC上的编译、使用和测试
  9. Swift 5 从Model, Struct或Class转Dictionary
  10. Windows11 + Linux子系统(ubuntu)体验(篇一)
  11. Docker中部署.NET CORE应用(控制台应用程序篇)
  12. netty实战-概述
  13. python自由落体_Javascript摸拟自由落体与上抛运动原理与实现方法详解
  14. 统计小写英文字母的个数 c语言,输入一行字符,统计英文字母,空格,和其他字符的个数...
  15. 电脑状态栏中,声音图标不见了怎么办?三招帮你找回!
  16. 开源协议(GPL,LGPL,BSD,MIT,Apache)
  17. php后台腾讯地图显示折线图
  18. springcloud + oauth2
  19. 实例分析!如何快速搭建OA办公系统
  20. syncthing搭建自己的同步云

热门文章

  1. TensorFlow 2.9的零零碎碎(一)-tf.keras里的兜兜转转
  2. 时间管理-系统管理员
  3. java音乐播放器视频_java 实现音乐播放器的简单实例
  4. 电脑打字技巧:微软输入法的U模式和V模式,快速打日期和时间。
  5. EOS基础全家桶(九)官方测试网的使用
  6. 微型计算机的外储存器是指什么,微型计算机的外储存器是指
  7. 首个AI公园探秘:身高体重一秒被曝,大爷大妈坐无人车玩疯了
  8. Unity3D 2D射击小游戏瞄准线的实现
  9. 用51单片机实现抽水水泵
  10. 达梦数据库管理工具使用