那些年我们在一线背锅的日子- 运维经理手记
文章目录
- 前言
- 自动化,可视化运维
- 主动维护
- 1. 定期巡检
- 2. 系统日常优化
- 3. 专项优化
- 建立维护标准规程
- 运维经理是个什么角色
前言
一个项目可能在你交付给甲方的时候就结束了,但对于运维来说,战斗才刚刚开始。
一套生产系统,只要甲方没有破产,又没有被其他系统所替代,也没有被竞争对手干掉,就要无休止的运行下去。
而你作为运维就需要手机24小时开机,每月初,月底通宵执行出账,节假日别人去了泰国,阿拉斯加,印度尼西亚,你也要在现场值守。
手机收到告警,第一时间处理;半夜出了故障,第一时间处理;甚至地震了你也要第一时间赶赴现场把信控停机程序停下来,等等。
运维的技术含量本身一点都不比开发低,而且技术在牛逼的大牛,比如微软研究院,谷歌,IBM大中华区或者全世界技术研发中心那些大牛们,专家们,设计出来的程序,在国内看来也是跟Linux和MySQL一样,千疮百孔,漏洞百出。
自动化,可视化运维
系统的运行维护不能只能人来盯着,老虎也有打盹的时候,所以运维方向开发出来的核心系统的保障系统,用来监控运行程序主机的CPU,内存,IO,日志文件,以及网络交换,中间件,各类进程的状态,设置相应的阈值告警。
其次是对业务指标的稽核和平衡性校验,在后来发展到自动检测,仿真检测,自动化日志分析,端到端的流量监控等技术。
目前市场上出现的,各种中台,日志监控,故障辅助检测告警,比比皆是。
将一套生产系统,用可视化的设备实时,直观的展示出来,能够准确的定位任何一个故障点,甚至能够自动处理。
运维经理的首要任务就是推动类似系统的建设与发展,尽量避免使用人工去干。
现阶段喊得最火的是AIOPS,我们把一些需要面对大量用户,大量同质化,简单化的问题,进行积累,形成智能问答,系统根据关键字索引自动推荐相似的答案,一旦用户采纳,就做好标记。 标记最多的答案排在自动回复的前位。
智能机器人的后台是企业版的知识库,降低操作人员的入职门槛。
主动维护
运维经理的任务之二是不要把系统全部寄托在自动化运维上
1. 定期巡检
包括晨检,日检,月检,每季度的巡检优化
2. 系统日常优化
每日抓取效率低下的SQL语句top10,增加完善网管的监控点,数据模型的生命周期管理,对部署,配置参数的不断调整,对平台软件,中间件的打补丁,升级。
3. 专项优化
每日的系统巡检数据,比如连续的故障,系统长期反应慢等,根据这些数据进行相应的专项优化。
建立维护标准规程
标准规程分为两类,一类是管理规程,一类是技术操作规程。
管理规程主要用来约束生产操作的纪律,工作处理的流程。 比如规定短信告警的处理时限,出现重大故障后的处理方法,报告顺序,生产系统的安全管理规范等。
技术操作规程主要是把各种生产操作的方法固化下来,形成规范,工序,标准。
运维经理是个什么角色
有人说运维经理是这样的:写的了PPT,看得懂招标书,上的了千人大堂,下得了小营业厅;懂得全局策略,细节毫不放松;各种业务门清儿,技术里外贯通; 研究过组织行为,治得了地痞流氓。
运维经理是个综合性的职业,需要你懂技术,懂业务,懂管理,三懂人才。
所以如果你想做个运维经理,前期一定要先把技术练好,把公司业务搞透,如此才有机会。
那些年我们在一线背锅的日子- 运维经理手记相关推荐
- 运维经理的运维经验总结
1. 域名 从买域名开始,要买多个域名,50个甚至100个.分为主域名和推广域名(给推广链接用的).要从godaddy上买域名,因为这里的域名稳定,不会出现被***等事情.同时还要买域名保护,这样互联 ...
- [Oracle运维工程师手记] 如何从trace 文件,判断是否执行了并行
[Oracle运维工程师手记系列]如何从trace 文件,判断是否执行了并行 客户说,明明指定了并行的hint,OEM 却报说没有并行,并且提供了画面. 客户的SQL文长这样: INSERT/*+ p ...
- “拯救网站运维经理赵明”有奖方案征集启事
[51CTO.com独家策划]做网站运维的人都或多或少有过感慨,平时各种故障就很让人抓狂了.更别说遇上***了!不过兵来将挡,水来土掩.有攻就有防.网站怎么做防护?大家需要什么样的技术和产品?咱们不妨 ...
- 从零起步到Linux运维经理,你必须管好的23个细节
2019独角兽企业重金招聘Python工程师标准>>> 从零起步到Linux运维经理,你必须管好的23个细节 双面人发表于热爱IT订阅 63 不想成为将军的士兵,不是好士兵-拿破仑 ...
- “拯救网站运维经理赵明”已近尾声
做网站运维的人都或多或少有过感慨,平时各种故障就很让人抓狂了.更别说遇上***了!不过兵来将挡,水来土掩.有攻就有防.网站怎么做防护?大家需要什么样的技术和产品?咱们不妨来看看51CTO独家视频策划& ...
- 网络运维经理新选择:不再做时间的奴隶
我们大部分上班族的特点之一就是"按部就班",早上准时出门搭乘公交,或是驾车,然后在车里吃早餐(非常不好的习惯,但我们都是这样做).无论您的日常安排是怎样的,您都会按照自己的方式进行 ...
- 运维经理应具备的能力
一个优秀的运维经理,应该具备以下七大能力: 1.系统架构的设计和规划能力 做为一个技术工程师,你关注更多的是具体的技术和问题分析.故障处理等细节,而做为一名运维经理,则需要你站在全局 ...
- 视频教程-网管转行linux运维并做到运维经理经验分享-Linux
网管转行linux运维并做到运维经理经验分享 Linux运维经理,高级运维经理,长期从事商城等知名企业的千万级.亿万级PV门户网站维护工作. 专注于Linux服务器架构运维近8年,擅长系统高并发.超多 ...
- 网管转行到运维经理经验分享
本人自学linux 到现在运维经理,几年时间从初级运维到运维经理,很感谢我的师傅,培养我 辅导到, 让我从一个网管做到运维经理 总结一下无非就是 天天实战 天天写文档 ,跟着老师指引学习,让我少走大量 ...
最新文章
- 如何让自己在云服务器上部署的项目一直运行
- 关于web前端的学习路线
- MDK中利用宏定义__DATE__和__TIME__设置产品的代码固件版本
- 剑指Offer - 面试题47. 礼物的最大价值(动态规划)
- Linux shell脚本全面学习
- 樱花漫地集于我心,蝶舞纷飞祈愿相随---总结 适者:survival of the fittest 适者:survival of the fittest...
- 深度学习 --- BP算法详解(误差反向传播算法)
- (MathType)LaTeX风格公式样式
- 室内智能照明控制系统电路设计
- 离散求边缘密度_密度梯度理论简介——半导体器件仿真
- C# Word脚注和交叉引用功能
- LeetCode114--词典中最长的单词、最短补全词、宝石与石头
- 码蹄集第23周赛(买礼物,召唤神龙,大促销,轨道探测)
- Xposed FrameWork v89 安装
- 用Python选取神股(简单、粗暴)
- 2013硕士毕业生薪资待遇
- android应用中为按键添加声音
- C# 2.0 泛型编程 选择自 shoutor 的 Blog
- php短信炸弹,php发送短信炸弹 - rookier的个人页面 - OSCHINA - 中文开源技术交流社区...
- 各省统计指标面板数据(1994-2019年)
热门文章
- java程序将汉字转成拼音的两种方法
- 大话互联网行业发展史
- android equalizer,全球最佳十大安卓均衡器
- 宝贝成长记事(97)
- 裸辞不是说走就走的旅行
- mysql无法安装 server 2008 r2_【运维】windows server 2008 R2 Standard中如何安装 mysql8.0
- android怎么调出虚拟手机,如何在android手机上打开虚拟光驱
- 课表网页完整的php代码,练手Lab课程表小程序源码v1.0.0 Thinkphp 前后端分离
- j-link “the connected j-link is defective“问题的解决
- 跟着大神学习,超写实高级影视肖像,《傲慢女爵》教程