原文链接:https://segmentfault.com/a/1190000017094981

前言:
最近部门变动,负责接手电商业务的运维工作,但是电商原来运维人员6人,我只有1人,因此这个交接工作还是挺有难度和压力的,已经交接完毕,我想这些经验对于新工作、新环境、新业务都有所帮助,也是自己的运维足迹,记录一二

跟产品运营了解业务

由于以前没有接触过电商的运维,因此首先了解电商业务,梳理为以下

  • 电商产品详情
  • 电商功能模块
  • 电商节假日活动
  • 用户登录、浏览、下单、支付流程
  • 是否有抢购秒杀类业务
  • 优惠券红包积分等业务
  • 会员业务

以上业务最好跟产品、运营去了解,他们是比较清楚的,对这些清楚了之后才能开展之后的运维工作

跟研发了解系统架构

跟开发聊聊业务架构,了解所使用的技术,为什么使用,以及好处。最好让其准备PPT能演讲下,如果不行让其发发文档看看也是好的,梳理以下几点

  • 了解各项目业务架构设计,及拓扑图
  • 大流量场景业务
  • 目前存在的业务瓶颈
  • 有无历史遗留落后设计
  • 有无应用最新技术及为什么这样选择

在这里只是了解,运维跟研发是会一直合作的,因此后面可以带着问题再找到相关负责人

运维相关

这里就涉及到我们的主要工作了,了解运维的方式,技术栈等等,列了如下

  • 了解阅读运维文档,一般有wiki,因此可以先看看大致了解,但不是所有wiki都有章有法,多数还是很乱
  • 了解当前运维资产,服务器、网络、数据库等相关运维资源情况
  • 了解当前运维方式,如人肉、脚本、自动化等等,看看当前处于哪个阶段
  • 了解当前运维技术栈,毕竟运维技术、工具更新快,且多又杂,不一定都接触过
  • 了解线下线上发布流程,是否自动化
  • 了解各业务部署的运维架构
  • 了解目前运维安全方面的防护
  • 了解和开发测试运营等合作方式

减少踩坑风险

相信很多人如果接手其他人的工作时,前面都是比较痛苦的,因为其他人的工作方式、理念等都跟自己或多或少都有出入,就运维而言,自己当前的技术能力如果与接手的运维工作阶段(如自动化程度较高)有出入,则很难快速着手,比如工作中没有一定的标准、规范会导致很混乱,或者即使有标准规范,但执行得不理想。又或者工作中都靠口头相传,没有很好的文档记录,因此想要快速,首先自身的技术需要有一定的基础,其次就是努力熟悉了,这里我主要是提出几点减少踩坑坑的方法

1.做好记录
如果跟人交接,则一定要做好记录,这点非常重要,因为人在短时间内接收一大堆东西是非常容易忘记的,俗话说的好,好记性不如烂笔头,最重要的是自己记录的过程也会形成一种记忆,可以回想当时为什么这样记录帮助回忆,另外很多wiki上找不到的考运维间口头相传的更要记录

2.标准与非标准
现在运维DEVOPS理念很火,但其实好些团队做得并不完全,有些地方做了标准化,有些地方又保留了老的,导致运维过程中,有些自动化了有些还是人肉,这些需要好好区分开来,否则很容易出故障,当然后续是一定优化这样的不良运维

3.熟悉各业务所在服务器
首先运维自己也要熟悉产品相关的业务,当我们业务出问题时,才能第一时间处理,比如某个页面打不开,那么是什么域名,什么业务,可能在哪些地方出故障,我们也要第一时间知道这些业务在哪些服务器上面,这样才能方面运维排查问题,所以要熟悉业务和服务器间的拓扑图

4.熟悉各个服务进程的启动停止方法
在运维里面流行一句话,没有什么是重启解决不了的,虽然不那么准确,但是运维工作中,的确有很多时候的故障是可以通过重启来快速恢复业务的,那么我们不同的服务进程如何重启一定要优先了解熟悉并记录,才能做到更快速的管理进程

5.熟悉各个服务的文件配置路径、日志路径
运维工作中总会有变动,故障等,当需要修改配置文件,以及查看日志时,如果我们不熟悉则会查询许久,因此在交接过程中这些也一定要记录下来,才能快速处理运维需求及故障

6.熟悉了解各个服务器的开机启动项
开机启动或者有哪些还没有加入开机启动的进程一定要注意,有时候服务器宕机了进程没有启动,就影响了业务,因此要去了解如chkconfig、/etc/rc.local里面的内容及未添加的

7.熟悉好发布流程
跟运维及其他部门了解代码发布平台、流程等,这是经常用到的,问问有无哪些需要运维经常配合的,还有一些历史遇到的一些问题

8.了解以往故障
对以前运维中发生的故障如果有记录那就最好去了解,看看当时的故障表现及处理方法,如果没有记录,也可以询问同事了解

9.对不熟悉的技术栈先浅尝
运维技术工具众多,我们一般不会每一种都了解,如果接手的刚好有较多自己不熟悉的,可以先了解,然后知道怎么重启管理进程以及查看日志排查问题即可,等有富余时间了再逐渐深入学习,这样才不会消耗大量的时间在一些不熟悉的事情上面

10.优先深入理解核心业务
要跟运维开发测试运营产品等了解哪些是非常核心的业务,是不可容忍停机停服的,这些是我们重点关注并且需要非常熟悉的,需要很仔细的对待交接,千万不能马虎

11.搞好关系
没错啦,无论是交接还是去了解学习,一定要跟同事们打好关系,可以适当的请客吃饭几次,这点非常重要,因为在交接的时候,有些坑如果对方不说,你不一定看得到。所谓害人之心不可有,防人之心不可无,大家相处融洽,其乐融融,相信在交接的时候也更愿意将经验之谈奉上,说不定还能多学习些运维知识,提升自己技术水平,还交个朋友,何乐而不为

总结

在防止踩坑哪里都基本总结了,在新工作新环境或者交接工作中一定要放稳心态,戒躁戒急,要自信些,有难度有挑战有压力才能看到自身的不足,遇事冷静则事半功倍,工作加油!!!

深入浅出-交接运维工作相关推荐

  1. 医院HIS系统运维工作见闻

    本文由markdown语法编辑器编辑完成. 1. 前言 近期由于公司项目调整,我和几名同事被外派到了北京的一家医院从事HIS系统的开发和运维工作.这也是我工作3年多以来,第一次长时间地在医院客户现场进 ...

  2. 医院HIS系统运维工作见闻——引用

    1. 前言 近期由于公司项目调整,我和几名同事被外派到了北京的一家医院从事HIS系统的开发和运维工作.这也是我工作3年多以来,第一次长时间地在医院客户现场进行开发和维护.在客户现场工作和在公司办公室进 ...

  3. 运维工作钱少、事多而且杂?年轻人,你这个思想很危险吶

    知乎上有个网友提出了这样的问题:"为什么感觉做运维是事累事杂还最不值钱的那一档?" 不少运维工作者都在这个问题下面发表了自己的看法. 初级运维工作者的工作内容包含很多基础.重复性的 ...

  4. Linux 运维工作中的经典应用ansible(批量管理)Docker容器技术(环境的快速搭建)...

    一 Ansible自动化运维工具 Python 在运维工作中的经典应用ansible(批量管理操作)1.安装ansible(需要bese epel 2种源) wget -O /etc/yum.repo ...

  5. 网络运维工作是什么的?

    互联网运维工作,以服务为中心,以稳定.安全.高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务. 运维人员对公司互联网业务所依赖的基础设施.基础服务.线上业务进行稳定性加 ...

  6. 我的一个学生在运维工作中写的自动日志清理脚本程序

    本文是我的一个学生在运维工作中写的自动日志清理脚本程序,我这里不评价该shell脚本写的好与坏,只是发出来,和大家做一个分享,如果能给大家带来一点点思路上的参考就够了. 自动日志清理脚本程序 #!/b ...

  7. 公用机房计算机主板选购,才知道,IDC机房运维工作居然可以如此简单!

    原标题:才知道,IDC机房运维工作居然可以如此简单! 机房运维事情比较多且繁琐,每一个细节都要做到标准.专业和完美!如何将繁琐的机房运维简化,就从这几点开始! 机房运维 关于电力 定期检测机房内市电及 ...

  8. 今晚直播丨用高效的Oracle性能诊断工具,让运维工作轻松起来!

    Oracle诊断性能问题时常用脚本工具 - 4月15日20:00 "工欲善其事,必先利其器",对于 Oracle 数据库性能诊断工作同样如此:在积累了一定数据库性能诊断经验的基础上 ...

  9. 运维部门工作总结_部门动态 | 主动出击 超前谋划 全面做好园区网络运维工作...

    随着冬季的到来 欢乐田园游客量相比客流高峰期 有所减少 公司各部门进入修整备战状态 ......... 为保障园区网络平稳良好运行 工程设备部提前部署.主动出击 狠抓网络运维保障工作 为来年迎接客流高 ...

最新文章

  1. WP8:Unity3D之间的值传递
  2. 艾伟_转载:.NET设计模式:观察者模式(Observer Pattern)
  3. npm 加入 TC39 委员会,参与定制 JavaScript 标准
  4. JAVA并发编程实战---第三章:对象的共享
  5. ACM POJ 2723 Get Luffy Out(2-SAT入门)
  6. ftp+nginx+lua_Nginx+GraphicsMagick来实现目录浏览、实时缩略图
  7. JPA mysql wildfly jboss 存储时乱码
  8. AjaxControlToolkit的使用
  9. 2017.3.29 lis 失败总结
  10. 中移M5311-NBIOT-低功耗OPENCPU开发-MQTT
  11. mongodb的安装和sql操作
  12. mysql的随机查询
  13. 网页上的内容无法复制和下载?一行代码教你解决
  14. 汉字转拼音接口 get请求 无需注册
  15. 题目:L2-029 特立独行的幸福 (25 分)
  16. HTML5游子吟网页的完整代码,《游子吟》教学案
  17. 摩托罗拉defy.apk+安装recovery和刷机的教程
  18. 小米笔记本Ruby默认开启fn键如何解决方法步骤
  19. 点击图片放大缩小功能
  20. 时艳强对话杨霞:智能合约的安全bug,有可能让你的资产瞬间归零

热门文章

  1. 软件开发中的王者荣耀理论
  2. Python入门笔记,代码练习——常用内置数据类型【持续更新】
  3. 树莓派3B Qt+dht11读取温湿度并写入数据库202005(8)
  4. python 曲线平滑处理——方法总结(Savitzky-Golay 滤波器、make_interp_spline插值法和convolve滑动平均滤波)
  5. 大部分有高学历的人比低学历的人强
  6. 基于惯性轮倒立摆原理的自行车
  7. Qgis教程4:文本数据的加载
  8. 找工作经验——EE Master 找CS工作总结
  9. truffle unbox react报错解决方案(linux)
  10. 骑士周游(dfs+greedy)