背景

最近和小伙伴们吐槽,发现在产品故障review,尤其是涉及到运维的故障review的时候有两个经常背锅的兄弟——“流程”和“监控”。

一般伴随着 发布流程有问题,变更流程不规范,工单流程错误等。

监控呢?基本上就是监控未覆盖,监控报警阈值不合理。

监控问题是运维的重心,这部分内容有机会展开,这几天主要思考了一下流程的问题就一些形而上的务虚的内容掰扯掰扯。

流程的四项基本论断

(本来是想写四项基本原则的怕被喝茶算了)

1 流程需要兼顾效率。

2 没有工具和平台支持的流程终将废弃。

3 流程/工具/平台 最终落实在人的身上。

4 闭环、闭环、闭环

论断1  流程需要兼顾效率

增加流程必须要评估带来的成本和降低的效率,成本提升\效率下降是增加/修改流程必然会带来的负面作用,而且是经常被忽视的。

必须要时刻提醒领导,增加流程会带来成本的增加和效率的降低,怎么说?

以增加审批流程为例,增加一道审批就增加了审批人的工作、并且降低了整体工作的完成效率。对于单个任务也许不明显但是对于量大的日常工单这部分的损耗不可忽略。

完善流程的动力——稳定性可靠性 这是老生常谈的话题,但是稳定性是需要和成本效率做衡量取舍的。

《SRE: Google运维解密》这本书里面明确指出了,不应该盲目的追求高可用性,从99.9% -->99.99%的也不付出的成本是巨大的。

但是也正如DEVOPS里面的墙理论,OPS考虑的是稳定性、DEV考虑的是效率,那么出现了这个流程问题,OPS倾向于增加流程,但是增加流程势必影响DEV的效率?

DEVOPS的实践理论是要推到这堵墙。

综上,当出现了故障,需要谈到增加和修改流程的时候,运维领导必须要考虑到由此带来的成本和降低的效率比较带来的稳定性提升到底是否划算。但是这个问题引发另外两个提问?

问题1: 如何评估上升的成本和降低的效率

问题2;如何评估业务稳定性提升了多少

无法量化无法比较,那无法决策,这个是个难题,这其实是运维的一大课题,如何量化日常运维的成本以及效率?(这得后期展开说了)

但是首先请在故障review的时候得谨慎回应完善流程。

论断2  没有工具和平台支持的流程终将废弃

有了流程,流程在哪?

有人说流程在wiki上,有人说流程在心里。我说流程应该内化在平台上。

信息论里面熵的定义都不陌生,熵让我理解了一件事,如果不施加外力影响,事物永远向着更混乱的状态发展,落在wiki和人心上面的流程也是一样。

流程的确立规范标准化需要人力维持,一旦人员变更,事有松懈,那么在wiki上面的流程区域混乱。

发布的流程、变更的流程需要工具和平台将流程内化在自动化平台内。

这是运维自动化、平台化的内涵,把一切流程内化涵盖,这也是论断1效率的要求。

论断3 流程/工具/平台 最终落实在人的身上

所有的问题都是人的问题,完善的流程、自动化的平台也挡不住低级错误不断的人的失误。

流程工具平台之外,对于运维人员素质培养意识提升是至关重要的。

哲学上看这部分属于主观能动性了,素质高的人员在小米加步枪的情况下也能取得胜利。

论断4 闭环、闭环、闭环

闭环啥意思?

强调三遍的意思在于,任何一个流程要能形成一个正反馈的闭环,流程自身有不断修正反馈问题的机制。

哪些环节的不断修正?

效率(流程的各个环境的效率统计)

成功率(流程各环节流转的成功率,比如发布成功,变更失败统计)

审批(审批时效等)

等等

以上其实涉及到了运维数据运营的范畴。

一个流程结束之后必然要能体现什么,反馈什么。

应用运维的价值体现

1 协助应用产品方设计使用合理的流程,合理体现在需要在稳定性与成本效率之间做好平衡,这个平衡也只有应用运维才好去把控。

2 推动产品相关流程的自动化平台化服务化,运维开发本身需要应用运维去确定流程,并且不同产品之间也需要组合不通的流程,平台化建设需要应用运维推动。

3 人的价值就是指应用运维的价值,在平台流程趋向完善之前,应用运维是稳定性和成本效率的摆渡人。(我在瞎扯请忽略)

4 闭环本身就是数据运营本身是应用运维的另一个价值点。

广告时间依旧:

网易运维与账号中心正在招聘包含了应用运维、系统运维、数据库运维、运维开发相关岗位:

有兴趣加入的伙伴请简历 hzluyang@corp.netease.com

转载于:https://www.cnblogs.com/hzluyang/p/9220532.html

什么,又是流程有问题?相关推荐

  1. MySql轻功-存储过程

    存储过程 一.存储过程概述 二.存储过程的参数 1.in 2.out 3.inout 三.存储过程中的变量 1.局部变量 2.用户变量 3.系统变量 四.存储过程的条件定义和处理 1.条件处理 2.条 ...

  2. 首席工程师揭秘:LinkedIn大数据后台是如何运作的

          原文转自:http://kb.cnblogs.com/page/518558/       摘要:Jay Kreps是来自LinkedIn的首席工程师,他表示日志几乎在计算机产生的时候就存 ...

  3. 每个软件工程师都应该知道的有关实时数据的统一概念

    转自:炼数成金 每个软件工程师都应该知道的有关实时数据的统一概念 我在六年前的一个令人兴奋的时刻加入到LinkedIn公司.从那个时候开始我们就破解单一的.集中式数据库的限制,并且启动到特殊的分布式系 ...

  4. 次世代游戏建模该如何开始学习呢?低模到高模角色模型的具体流程又是怎样的?

    首先,如果你想学习游戏建模,那么我建议你从3Dmax开始学起,熟悉软件后做做简单的道具,大概一到两个,武器什么的都是可以的. 然后开始场景,这个考虑的就比较多了,所以放在后面.大概自己练习两三个就行. ...

  5. 做一个PMC需要懂得哪些知识?PMC的流程又是什么?工作重点内容是什么?

    PMC代表Product Material Control的缩写形式,意思为生产及物料控制.通常它分为两个部分----PC&MC PC:生产控制或生产管制(台.日资公司俗称生管).主要职能是生 ...

  6. 武汉市小型微型企业创业创新示范基地申报条件是什么?申报流程以及材料又是什么?

    今天我给大家带来的是关于武汉市小型微型企业创业创新示范基地申报工作的讲解,内容包含示范基地的申报条件.申报材料.申报流程等相关内容,想要申报的可以来了解一下,同时对以下内容有疑惑的可以随时来提问: 一 ...

  7. 奢侈品典当价格以及流程又是如何的?现今哪些品牌的奢侈品押呗可以典当!

    现今可以典当物品包括很多,特别是奢侈品之类的,不过也不是所有的奢侈品品牌都可以典当,哪那些奢侈品品牌嫩典当呢?接下来为大家一一说明一下吧. 首先,我们先来了解一下能典当的手表品牌吧.一般像劳力士.百达 ...

  8. Rocksdb 写流程,读流程,WAL文件,MANIFEST文件,ColumnFamily,Memtable,SST文件原理详解

    文章目录 前言 Rocksdb写流程图 WAL 原理分析 概述 文件格式 查看WAL的工具 创建WAL 清理WAL MANIFEST原理分析 概述 查看MANIFEST的工具 创建 及 清除 MANI ...

  9. 2016cocoapods安装流程及使用

    一:参考安装流程:http://blog.csdn.NET/showhilllee/article/details/38398119/. 二:我的安装步骤. 1:安装cocoapods需要ruby,先 ...

  10. 一文搞定深度学习建模预测全流程(Python)

    作者 | 泳鱼 来源 | 算法进阶 本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Pyt ...

最新文章

  1. 消息队列优缺点和选型
  2. 找不到python2018解释器_python解释器安装教程的方法步骤
  3. 【TensorFlow】占位符:tf.placeholder,与feed_dict
  4. 高级cmd攻击命令_一步一步学习DVWA渗透测试(Command Injection命令行注入)-第七次课...
  5. 病毒及攻击防御手册之八
  6. VS2013创建opencv-2.4.10静态链接库
  7. VB Environ系统环境变量函数大全
  8. java高并发编程艺术_[高并发]Java高并发编程系列开山篇--线程实现
  9. spring --(16)AOP前置通知与后置通知
  10. asp.net网页版斗地主 已提供下载(开源) 测试版
  11. 虚拟化管理软件比较(Eucalyptus, OpenNebula, OpenStack, OpenQRM, XenServer, Oracle VM, CloudStack, ConVirt)
  12. C# 中取绝对值的函数
  13. 解决Word2013光标乱跳的问题
  14. 基于ROS的机器人模型建立及3D仿真【物理/机械意义】
  15. 极海单片机串口调试记录
  16. 开课通知 | 2021FPGA寒假班/就业班开课啦!
  17. 华为模拟器配置S5700交换机OSPF案例
  18. 雷锋网专访布丁CEO徐磊
  19. Janky frames 是如何计算出来的
  20. .crx文件怎么解压

热门文章

  1. 在类库中使用Session
  2. 【今日所得】1.29。。。
  3. 猎豹浏览器_金山猎豹浏览器_官方正式版下载_首款双核安全浏览器
  4. HAPPY 2010
  5. 【DL】一文读懂深度学习中的N种卷积
  6. PyTorch学习—15.PyTorch中TensorBoard的使用
  7. 《Effective Python 2nd》 读书笔记——函数
  8. 自然语言处理——词性标注实战
  9. 李宏毅机器学习——梯度下降
  10. 所以,我们依然要读书