如今,如何保证互联网平台服务的可靠性和稳定性成为整个互联网行业面临的难题。谷歌提出的SRE(网站可靠性,本意是软件可靠性工程)方法被业界奉为解决这一难题的经典。

SRE理念是近年来运维领域最重要的变革,影响广泛而深远。从SRE的核心理念出发,运维都是围绕可靠性(Reliability)展开的。“质量、成本、效率、安全”是运维不可或缺的4个要素,其中质量尤为重要,而质量的核心就是可用性,可用性的核心依赖就是可靠性,真所谓殊途同归。

Google最早在2003年就提出了SRE这个概念,历经了近20年的发展,SRE作为保障信息系统平稳运行的重要措施,已逐步在大型互联网公司落地,众多国民级应用背后都有SRE的身影。现有的中文SRE著作几乎都是引进自国外的译著,鲜有中国工程师结合自己的最佳实践来指导大家如何构建SRE工程。

今天推荐一本《SRE原理与实践:构建高可靠性互联网应用》,作者是虎牙科技的SRE架构师张观石,他基于20余年的架构、研发和运维经验,用4年时间反复打磨,代表中国的工程师总结了中国互联网企业的SRE方法和经验。书籍得到了中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价并一致推荐。

主要内容

本书尝试系统性地讨论如何建立互联网软件可靠性工程体系。

  • 首先,本书参考传统可靠性工程及软件可靠性工程体系,把传统可靠性工程中的“六性”(可靠性、维修性、测试性、保障性、安全性、环境适应性)转化为互联网软件可靠性工程中的六种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)。

  • 然后,本书通过这六种能力把可靠性相关的工作组织起来,比较清晰地描绘出互联网软件可靠性工程的体系全貌,并将六种能力对应到六个工作方向上。

  • 最后,本书深入探讨了各种能力如何建设、如何度量、如何改进等。本书也较为系统地总结了互联网软件可靠性工程的发展过程,参考了可靠性工程方法来讨论当前行业面临的突出问题,初步分析、总结了各种故障的规律,并提出了“可靠性是和故障作斗争”的观点。

【主要特点】

本书具有以下几个特点。

  • 整体性。本书较完整地介绍了互联网软件可靠性工程体系,并结合互联网平台软件的技术特点、业务特点,把互联网SRE相关工作总结为六种能力,帮助工程师快速理解SRE体系全貌。

  • 重视度量。书中对各种能力都进行了定性与定量的评估。度量才能真正了解现状,才能推动改进,才能见到改进的效果。

  • 从原理出发。本书较为全面地总结了互联网平台软件的故障特点和故障规律。研究规律是我们学习SRE相关工作的必经之路。通过研究规律,我们不仅可以积累经验,而且能更深刻地了解故障的本质。

  • 本书在写作时引用了大量虎牙直播的实践案例,这些案例对一些中小型平台建设应该有一定的参考价值。

【读者对象】

  • 互联网行业运维工程师、研发工程师、架构师

  • 关注软件系统可靠性的管理者

  • 关注软件可靠性的研究者、计算机专业师生等

好了,本次继续送书3本。

留言区留言,点赞前三分别赠送一本,截止时间:本周五下午6点。

如何保证互联网平台服务的可靠性和稳定性?相关推荐

  1. 【工业互联网】项天成:实体经济需要智能服务;王洪添:浪潮M81工业互联网平台

    传化智联副总裁项天成,以"实体经济需要智能服务"为主题,在2018工业互联峰会"工业互联网发展对话"环节,从传化智联对工业互联网的理解出发,阐述工业互联网不仅仅 ...

  2. 以数据智能为核心,寄云发布新一代工业互联网平台NeuSeer 3.0

    9月8日,作为工业数智化转型的探索者.实践者,寄云科技在北京圆满召开"数聚力量 智见未来"寄云NeuSeer全新工业互联网产品发布会,重磅发布了新一代工业互联网平台产品-NeuSe ...

  3. 工业互联网平台:将为“补链”“优链”“强链”提供有力保障

    2020年,工业互联网创新发展取得显著成效,平台体系建设不断走深走实,"平台+技术""平台+行业""平台+区域""平台+双链&qu ...

  4. 工业互联网平台赋能制造业数字化转型分析

    工业互联网是新一代信息通信技术与工业经济深度融合的新型基础设施.应用模式和工业生态,通过对人.机.物.系统等的全面连接,构建起覆盖全要素.全产业链.全价值链的全新制造服务体系,为工业乃至产业数字化.网 ...

  5. 工业互联网平台大盘点

    据e-works粗略统计,能提供工业互联网平台服务的国内外厂商超过100家,像GE.西门子.PTC.树根互联.航天云网.海尔COSMO.美云智数等这些耳熟能详且能直接说出名字的工业互联网厂商至少50家 ...

  6. 医药/医疗/互联网医疗服务平台/问诊/挂号/开药/处方/医生/医院/问诊订单管理/移动端问诊医疗系统/医生端处方开药系统/web端医药服务平台管理/axure原型/rp源文件/健康咨询/视频问诊/统计

    医药/医疗/互联网医疗服务平台/问诊/挂号/开药/处方/医生/医院/问诊订单管理/移动端问诊医疗系统/医生端处方开药系统/web端医药服务平台管理/处方管理/axure原型/rp源文件/健康咨询/视频 ...

  7. 服务创新产品“在线智能问诊”——互联网平台建设...

    本文所讲内容包括是服务还是保险.美国恒康保险之变.众安步步保.智能问诊与电话问诊服务.对保险公司的启示五部分. 思考三个问题: 1.何为保险?保险的第一性原理是什么? 2.用户需要的是保险或保单?还是 ...

  8. 创新型服务“智能推荐”——互联网平台建设

    所谓智能分发,即利用人工智能进行个性化推荐的技术,也称之为智能推荐,推荐系统. 思考三个问题: 1.国内外推荐系统最好的产品是什么? 2.什么是用户画像?什么是服务.内容.产品画像? 3.怎么利用机器 ...

  9. 创新型服务“智能推荐”——互联网平台建设 1

    所谓智能分发,即利用人工智能进行个性化推荐的技术,也称之为智能推荐,推荐系统. 思考三个问题: 1.国内外推荐系统最好的产品是什么? 2.什么是用户画像?什么是服务.内容.产品画像? 3.怎么利用机器 ...

最新文章

  1. 从“如何学会做一只机械表”讲如何创新,如何做好产品
  2. Spring+SpringMVC+Mybatics配置文件解析
  3. mysql ibdata作用_mysql data文件夹下ibdata1 文件作用
  4. Linux下编译一个静态链接的程序的注意点
  5. [转载]matlab中控制mesh或者surf的颜色
  6. Android调用相册、相机(兼容6.0、7.0、8.0)
  7. Android:Touch和Click的区别
  8. H3C大规模路由综合实验
  9. 机器学习高质量数据集大合辑
  10. 在idea或eclipse软件下配置Tomcat
  11. Lwip协议详解(基于Lwip 2.1.0)TCP协议 (未完待续)
  12. win7打不开桌面计算机,win7电脑中梦幻桌面打不开如何解决
  13. VTK笔记-vtkProbeFilter探针类
  14. 解决Mac谷歌浏览器问题
  15. win7系统音响没有声音的解决设置方法
  16. 360公司 2020秋招 技术综合E卷 在线考试 编程题 第一题 表面积(web前端)
  17. C#使用公共语言拓展(CLE)调用Python3(使用TensorFlow训练的模型)
  18. Lammps模拟剪切作用下的位错滑移
  19. 学会这三款软件,可以轻松完成录音转文字操作
  20. Java-设计模式之单例模式

热门文章

  1. java.强引用软引用,java 强引用、软引用、弱引用、虚引用-Go语言中文社区
  2. Java多线程写文件
  3. rmd文件变成HTML,从Rmd通过RStudio呈现HTML文档时出现问题文字斜体
  4. 计算机软件职称论文,计算机软件技术中级职称论文(2)
  5. 把 Mac 触控板点按查词的默认词典改成欧路词典
  6. 创客工具 - 芯片模拟器 , 原型
  7. 正在做 ESP32 , STM32 , 树莓派 RaspberryPi 的创客工具
  8. linux centos 安装rar文件,在centos下安装rar解压.rar压缩包
  9. 【转载自amobbs IDzhcj66】FATFS读取数据问题
  10. Python+FFmpeg/CMD根据m3u8合并ts文件