文章目录

  • 前言
  • 自动化,可视化运维
  • 主动维护
    • 1. 定期巡检
    • 2. 系统日常优化
    • 3. 专项优化
  • 建立维护标准规程
  • 运维经理是个什么角色

前言

一个项目可能在你交付给甲方的时候就结束了,但对于运维来说,战斗才刚刚开始。
一套生产系统,只要甲方没有破产,又没有被其他系统所替代,也没有被竞争对手干掉,就要无休止的运行下去。
而你作为运维就需要手机24小时开机,每月初,月底通宵执行出账,节假日别人去了泰国,阿拉斯加,印度尼西亚,你也要在现场值守。

手机收到告警,第一时间处理;半夜出了故障,第一时间处理;甚至地震了你也要第一时间赶赴现场把信控停机程序停下来,等等。

运维的技术含量本身一点都不比开发低,而且技术在牛逼的大牛,比如微软研究院,谷歌,IBM大中华区或者全世界技术研发中心那些大牛们,专家们,设计出来的程序,在国内看来也是跟Linux和MySQL一样,千疮百孔,漏洞百出。

自动化,可视化运维

系统的运行维护不能只能人来盯着,老虎也有打盹的时候,所以运维方向开发出来的核心系统的保障系统,用来监控运行程序主机的CPU,内存,IO,日志文件,以及网络交换,中间件,各类进程的状态,设置相应的阈值告警。

其次是对业务指标的稽核和平衡性校验,在后来发展到自动检测,仿真检测,自动化日志分析,端到端的流量监控等技术。

目前市场上出现的,各种中台,日志监控,故障辅助检测告警,比比皆是。

将一套生产系统,用可视化的设备实时,直观的展示出来,能够准确的定位任何一个故障点,甚至能够自动处理。

运维经理的首要任务就是推动类似系统的建设与发展,尽量避免使用人工去干。

现阶段喊得最火的是AIOPS,我们把一些需要面对大量用户,大量同质化,简单化的问题,进行积累,形成智能问答,系统根据关键字索引自动推荐相似的答案,一旦用户采纳,就做好标记。 标记最多的答案排在自动回复的前位。

智能机器人的后台是企业版的知识库,降低操作人员的入职门槛。

主动维护

运维经理的任务之二是不要把系统全部寄托在自动化运维上

1. 定期巡检

包括晨检,日检,月检,每季度的巡检优化

2. 系统日常优化

每日抓取效率低下的SQL语句top10,增加完善网管的监控点,数据模型的生命周期管理,对部署,配置参数的不断调整,对平台软件,中间件的打补丁,升级。

3. 专项优化

每日的系统巡检数据,比如连续的故障,系统长期反应慢等,根据这些数据进行相应的专项优化。

建立维护标准规程

标准规程分为两类,一类是管理规程,一类是技术操作规程。

管理规程主要用来约束生产操作的纪律,工作处理的流程。 比如规定短信告警的处理时限,出现重大故障后的处理方法,报告顺序,生产系统的安全管理规范等。

技术操作规程主要是把各种生产操作的方法固化下来,形成规范,工序,标准。

运维经理是个什么角色

有人说运维经理是这样的:写的了PPT,看得懂招标书,上的了千人大堂,下得了小营业厅;懂得全局策略,细节毫不放松;各种业务门清儿,技术里外贯通; 研究过组织行为,治得了地痞流氓。

运维经理是个综合性的职业,需要你懂技术,懂业务,懂管理,三懂人才。

所以如果你想做个运维经理,前期一定要先把技术练好,把公司业务搞透,如此才有机会。

那些年我们在一线背锅的日子- 运维经理手记相关推荐

  1. 运维经理的运维经验总结

    1. 域名 从买域名开始,要买多个域名,50个甚至100个.分为主域名和推广域名(给推广链接用的).要从godaddy上买域名,因为这里的域名稳定,不会出现被***等事情.同时还要买域名保护,这样互联 ...

  2. [Oracle运维工程师手记] 如何从trace 文件,判断是否执行了并行

    [Oracle运维工程师手记系列]如何从trace 文件,判断是否执行了并行 客户说,明明指定了并行的hint,OEM 却报说没有并行,并且提供了画面. 客户的SQL文长这样: INSERT/*+ p ...

  3. “拯救网站运维经理赵明”有奖方案征集启事

    [51CTO.com独家策划]做网站运维的人都或多或少有过感慨,平时各种故障就很让人抓狂了.更别说遇上***了!不过兵来将挡,水来土掩.有攻就有防.网站怎么做防护?大家需要什么样的技术和产品?咱们不妨 ...

  4. 从零起步到Linux运维经理,你必须管好的23个细节

    2019独角兽企业重金招聘Python工程师标准>>> 从零起步到Linux运维经理,你必须管好的23个细节 双面人发表于热爱IT订阅 63 不想成为将军的士兵,不是好士兵-拿破仑 ...

  5. “拯救网站运维经理赵明”已近尾声

    做网站运维的人都或多或少有过感慨,平时各种故障就很让人抓狂了.更别说遇上***了!不过兵来将挡,水来土掩.有攻就有防.网站怎么做防护?大家需要什么样的技术和产品?咱们不妨来看看51CTO独家视频策划& ...

  6. 网络运维经理新选择:不再做时间的奴隶

    我们大部分上班族的特点之一就是"按部就班",早上准时出门搭乘公交,或是驾车,然后在车里吃早餐(非常不好的习惯,但我们都是这样做).无论您的日常安排是怎样的,您都会按照自己的方式进行 ...

  7. 运维经理应具备的能力

    一个优秀的运维经理,应该具备以下七大能力:   1.系统架构的设计和规划能力        做为一个技术工程师,你关注更多的是具体的技术和问题分析.故障处理等细节,而做为一名运维经理,则需要你站在全局 ...

  8. 视频教程-网管转行linux运维并做到运维经理经验分享-Linux

    网管转行linux运维并做到运维经理经验分享 Linux运维经理,高级运维经理,长期从事商城等知名企业的千万级.亿万级PV门户网站维护工作. 专注于Linux服务器架构运维近8年,擅长系统高并发.超多 ...

  9. 网管转行到运维经理经验分享

    本人自学linux 到现在运维经理,几年时间从初级运维到运维经理,很感谢我的师傅,培养我 辅导到, 让我从一个网管做到运维经理 总结一下无非就是 天天实战 天天写文档 ,跟着老师指引学习,让我少走大量 ...

最新文章

  1. 如何让自己在云服务器上部署的项目一直运行
  2. 关于web前端的学习路线
  3. MDK中利用宏定义__DATE__和__TIME__设置产品的代码固件版本
  4. 剑指Offer - 面试题47. 礼物的最大价值(动态规划)
  5. Linux shell脚本全面学习
  6. 樱花漫地集于我心,蝶舞纷飞祈愿相随---总结 适者:survival of the fittest 适者:survival of the fittest...
  7. 深度学习 --- BP算法详解(误差反向传播算法)
  8. (MathType)LaTeX风格公式样式
  9. 室内智能照明控制系统电路设计
  10. 离散求边缘密度_密度梯度理论简介——半导体器件仿真
  11. C# Word脚注和交叉引用功能
  12. LeetCode114--词典中最长的单词、最短补全词、宝石与石头
  13. 码蹄集第23周赛(买礼物,召唤神龙,大促销,轨道探测)
  14. Xposed FrameWork v89 安装
  15. 用Python选取神股(简单、粗暴)
  16. 2013硕士毕业生薪资待遇
  17. android应用中为按键添加声音
  18. C# 2.0 泛型编程 选择自 shoutor 的 Blog
  19. php短信炸弹,php发送短信炸弹 - rookier的个人页面 - OSCHINA - 中文开源技术交流社区...
  20. 各省统计指标面板数据(1994-2019年)

热门文章

  1. java程序将汉字转成拼音的两种方法
  2. 大话互联网行业发展史
  3. android equalizer,全球最佳十大安卓均衡器
  4. 宝贝成长记事(97)
  5. 裸辞不是说走就走的旅行
  6. mysql无法安装 server 2008 r2_【运维】windows server 2008 R2 Standard中如何安装 mysql8.0
  7. android怎么调出虚拟手机,如何在android手机上打开虚拟光驱
  8. 课表网页完整的php代码,练手Lab课程表小程序源码v1.0.0 Thinkphp 前后端分离
  9. j-link “the connected j-link is defective“问题的解决
  10. 跟着大神学习,超写实高级影视肖像,《傲慢女爵》教程