互联网,讲究快速迭代,快速上线,敏捷开发。

有些固定上线时间的项目,可能因为技术方案变化,导致测试时间压缩,最终上线出了问题,有些锅,却由有苦说不出的运维来背了。

运维苦,今天,运维有很多心里话想和研发哥哥与测试姐姐说一说:

(1)“敏捷开发,频繁交付”的KPI,真不是增加运维人手就能解决的,需要自动化回归的支持,需要自动化上线的支持;

(2)“上线失败,快速回滚”的KPI,真不是增加运维人手就能解决的,需要回滚方案的支持,而回滚方案真的测试过么;

(3)“快速扩容,快速响应”的KPI,真不是增加运维人手就能解决的,需要架构设计的支持(很多系统无法水平扩展,来了机器,无法扩容),需要快速部署的支持,需要服务发现的支持(所有上游修改配置重启肯定是不行的),需要压力测试和容量评估的支持;

(4)“系统高可用”的KPI,真不是增加运维人手就能解决的,需要优雅降级的支持,需要架构设计的支持,如何评判系统是否高可用?这个简单,关掉线上任何一台机器试试,看用户服务是否受影响,如果受影响,研发哥哥们拜托了;

(5)“快速故障报警”的KPI,真不是增加运维人手就能解决的,需要监控系统的支持(操作系统和运维层面的监控,我们可以实施,但错误日志、接口、业务的监控呢?),另外报警短信能少一点么,过度报警会让人变得“麻木不仁”的;

(6)“快速故障定位”的KPI,真不是增加运维人手就能解决的,需要数据量化健康信息的支持,需要快速诊断的支持;

画外音:到家集团的守望者平台,以及调用链跟踪系统,还是很好用的。

(7)“快速故障恢复”的KPI,真不是增加运维人手就能解决的,需要故障转移的支持,相信我们,故障发生时,如果运维人员不知道怎么抉择,且又必须做出抉择,这时的抉择往往是错的(我们能做的,是重启),我们也不想凌晨打给你们,但希望你们能实现自动化方案;

(8)“内审合规”的KPI,真不是增加运维人手就能解决的,在资源允许的情况下,请不要手动删除任何资源,数据是很重要的资源。访问控制和权限申请的流程,真的不是限制大家,相反,哪一次数据的误删除,不是我们加班来恢复的?宝宝心里苦呀;

我们的KPI都掌握在大家的手里,自己人不为难自己人,希望研发哥哥与测试姐姐理解。

技术本一家,既然相爱,何必相杀。

架构师之路-分享技术思路

相关文章:

《究竟啥才是互联网架构“高可用”》

《多机房多活,多机房平滑迁移架构方案》

《同一个SQL语句,为啥性能差异咋这么大呢?》

研发哥哥对测试姐姐说,我刚才在线上关停了一台机器试了一下,运维晕倒了,我们的架构果然不是高可用的。呵呵。

运维真心苦,这次我要和大家说说心底话了相关推荐

  1. 别人7天乐,运维还苦逼值班?

    你被点名值班了吗?或者你的朋友.隔壁七大姑八大姨的侄子被点名值班了吗? 国庆将至,大家都开始研究各种度假攻略了,国内游.国外游.地球游.外星游...然而总有一票人,默默地职守着 -- tIT 公司运营 ...

  2. 老王亲述:我的运维心路历程

    本文根据高效运维专家群友文章整理并发布.欢迎关注"高效运维"公众号,以抢先赏阅诚意满满的各种原创文章. 嘉宾简介 王津银 他,曾经从业腾讯.YY.UC等知名互联网公司 他,维护的微 ...

  3. 一个运维老将的自我修养

    作者:huashionxu,腾讯 TEG 业务运维专家 运维同学作为站在研发团队背后的男人们,一直在担任着举重若轻的角色,而这两年盛行的 Devops.研效变革也直接影响到运维同学岗位职责的变化, 腾 ...

  4. 腾讯运维专家的自我修养

    运维同学作为站在研发团队背后的男人们,一直在担任着举重若轻的角色,而这两年盛行的 Devops.研效变革也直接影响到运维同学岗位职责的变化, 云架平技术运维副总监 huashionxu(徐欢) 近十年 ...

  5. 腾讯十年运维专家谈运维的自我修养

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 作者:huashionxu,腾讯 TEG 业务运维专家 技术运维作为站在研发团队背后的男人们,一直在担任着举重若轻 ...

  6. python职业发展方向_59秒看懂IT运维的发展方向及职业规划

    59秒知料 2018-02-12 14:25:56 IT运维很苦?其实可以很牛! 就在前几天,小编的一个从事IT运维的朋友准备离职,离职的原因一方面是觉得自己学东西遇到了瓶颈,没有办法再有一个好的提升 ...

  7. 网易校招,网络运维工程师——满满的干货点

    本文关键字:网易,面试 出自公众号:工程师江湖 一.交待背景 在朋友的鼓动下,决定转战,加入校招大军,目标互联网企业,岗位网易的网络运维工程师. 这次经历将会成为我大学生涯,最重要的记忆之一. 原来, ...

  8. 腾讯游戏运维服务体系演变史

    在面临高速发展的移动互联网游戏行业,对运维能力的要求变得越来越高,传统运维已经无法适应当下的节奏,如何随着时代演变而进步,如何能在危机中给自己创造机会,抓住要领才能坦然面对万变. 1 运维服务定义 谈 ...

  9. 锐捷先见先行,运维“乐享”其成

    锐捷运维大杀器来,运维人员有福了. 运维该"减负"了 运维苦.运维累.运维随时要奔溃. 前两天知乎上有一个热榜是一个企业要招一个运维,开始出价3500,后来涨到了5000,还有各种 ...

最新文章

  1. 干掉SQL中的like,我用es后运营小姐姐们都说好快!
  2. 步步为营-68-asp.net简单练习(get set)
  3. nsga2多目标优化之核心知识点(快速非支配排序、拥挤距离、精英选择策略)详解(python实现)
  4. maven工程错误汇总
  5. 第三次学JAVA再学不好就吃翔(part80)--List三个子类的特点
  6. Github常用搜索指令(毕设资料搜索必备)
  7. matlab函数用法积累
  8. python 拟合圆心_OpenCV:将单个圆拟合到图像(在Python中)
  9. 深度学习——ReLU在x=0的时候是条线,为什么什么是非线性函数?
  10. Thinkphp新增字段无法插入到数据库问题
  11. struts2登陆拦截器
  12. 如何建立个人商业画布
  13. Zipf齐夫分布及Java实现
  14. 安洵信息渗透工程师面试经验分享
  15. idea 内存溢出问题
  16. “互联网协作如何改变商业未来”文字实录
  17. node 脚手架项目,快速删除 node_modules 包的 rimraf 命令
  18. 盘点:视频监控行业的潜在商机
  19. 产品的理解:TOC、TOB、TOG
  20. BIO基本介绍以及使用

热门文章

  1. SXD_Decompile_1
  2. 使用小学数学解决的算法题
  3. 关于想哭(WannaCry)勒索病毒的9个真相
  4. Java swing酒店管理系统
  5. 驾校计算机管理制度,驾校工作人员管理制度
  6. 传奇脚本显示服务器开区时间代码,传奇时间拓展之定时器脚本命令解释与使用...
  7. Ebee无人机地面站航线规划方法
  8. windows安装nacos步骤,还有那些坑
  9. 一键安装DTCloud
  10. onlyoffice设置跟踪变化trackChanges默认为对自己启动