运维工作是项目工作的延续,是公司项目管理系统中的最后一环。接手运维工作也有一段时间了,遇见过各种各样的客户,处理过各种各样的问题。在解决问题的过程中,发现每类项目都会有相似的问题出现,比如安全漏洞问题、后续系统接入的协助问题、产品出现BUG等等,每一类问题都有它对应的解决方式和注意事项。

本文将对运维工作中常见的问题进行分类,并总结常用的解决办法和注意事项,同时为制定运维管理制度提供思路以及解决办法。

1运维工作理解

与一般工作相比,运维工作的特别在于突发性、时间不规律性和紧迫性

运维工作通常是出现问题后由客户反馈而来的,问题都是突然发生的且没有预兆,那么出现问题的时间就更是不确定不规律了,即便是运行了一段时间的系统,也可能突然触发一些未知的BUG,由于这些BUG会影响到生产环境,也就体现了运维工作的紧迫性。

由于是生产环境,每次升级替换都需要在客户使用频率低的时候进行调整,通常是周末或者半夜,因此熬夜加班也是运维工作必然要面临的挑战。

1.1工作目的

项目运维的目的要从两个层面来理解,一方面项目运维是项目实施的必要环节,开始于项目上线确认之后,截止于公司与甲方的合作终止,主要是为了延续项目价值,保障收款,积累产品经验等等;另一方面是保持与客户的沟通协作,为后续项目的持续开展提供基础,同时工作中的一些成果可以考虑作为人天抵扣到后续项目中。

1.2工作要求

对待客户要注意能够解决的事情要尽快解决,当下不能解决的事情要做好工作排期,对客户生产环境影响大的问题,要第一时间反馈给公司领导寻求资源,同时做好客户的安抚工作。

由于运维人员对于程序的把握未必是那么到位的,很多时候需要记录问题并寻求资源。运维工作需要的详细记录包括提报时间、问题类型、解决耗时及交互人等等,一些影响比较大的问题,要做情况说明,记录当时的事情经过,改动事项等等,这些都会为后续的运维以及产品改进提供思路。

2常见问题分类

在运维过程中,客户主要问题分为两类,咨询类的问题主要是客户在产品的基础使用以及特定业务场景的灵活使用上遇到的问题;产品BUG报修类的问题根据产生BUG的原因可分为操作问题、环境问题和产品问题等等。

2.1方案咨询类

此类问题在项目交付之初比较常见,以产品的基础使用为主,也有一些是新业务场景不知道如何适配。在这个阶段,客户通常只有对场景的描述或者是思路,需要我们据此给出具体的解决方案。

这个阶段对于公司的价值体现在扩展产品的业务适应性,记录下产品适用的主要业务场景以及各类业务场景的解决方案,在宣讲时可以作为问题提问宣讲人。

2.2项目协助类

由于公司承接的大多是集成类项目,因此很多时候是以运维作为中转的核心,因此当有新系统接入或者是第三方系统改造时,需要运维协助提供数据或技术支持

在这个阶段对于公司的价值主要是掌握、验证第三方对接的技术,提升水平

2.3产品BUG类

这类问题伴随项目运维的整个周期,产品BUG类问题与产品改造类问题非常相似,很多时候产品改造本质上就是对BUG进行处理,这里要注意的是,对于项目问题只做项目级调整,产品级调整要根据公司的战略来执行。

在这个阶段对于公司的价值主要是测试产品BUG,修复产品,提升性能

2.4产品改造类

产品改造类要区分于产品BUG类的是,产品改造类主要是客户针对实际场景,对于产品提出了新的需求。产品改造类问题的解决通常是在与客户需求确认过程中,提出替代性的解决方案,通过简单的开发来实现的。

在这个阶段对于公司的价值主要是扩展产品功能,提取集成需求,为后续产品升级迭代提供方向

3问题处理方法

虽然运维问题多种多样,但是每一类都有比较通用的处理方法和注意事项。整体的问题处理要把握一个原则,影响客户当前使用的一定要优先改。客户咨询的问题,给出的答复要需求扩大化;客户提出需要后续协助,能给方案的就先不要自己动手;产品改进类的问题,收集意见及时反馈,尽量不要做调整。

3.1方案咨询类

咨询类问题默认为高优先级,因为是即问即答的形式,解决的基本点是指导客户工作,而不是参与具体工作。

同时需要注意的是,项目运维阶段不是项目实施阶段,对客户的想法要适当予以婉拒。如果全盘接收,咨询类问题就很容易变为改造类问题,在运维阶段实施产品改造,如果没有后续项目落地,通常是难以收取费用的,因此要特别注意。

3.2项目协助类

协助类问题默认为中优先级,解决的基本点是客户要有明确的工作意向和思路,我方只是参与部分工作,即我方不是工作的主导部门。

项目协助类常见的问题有项目上线后第三方系统接入、部分项目资料的索取、第三方系统出现问题协助定位等。处理这类问题时要注意,有了结果要第一时间通知客户,以便客户可以继续推动后续工作的开展。

3.3产品BUG类

产品BUG类问题默认为中优先级,其中影响客户登录的问题,默认优先级是高。解决的基本点是先恢复后修复,一定要保证客户能够正常使用,哪怕是通过屏蔽功能的方式,也要先保证客户的使用,后续再进行调整。

对于产品BUG类问题的即时修复手段主要有屏蔽页面功能、调整数据库数据(修改人员状态)、集群改单机等等,后续要有跟进和落实,针对BUG要制定解决方案,审核通过后再进行修改,修改内容及方案要统一在SVN留存。

3.4产品改造类

产品改造类问题默认为低优先级,原则上已验收项目不做产品改造,如果有重大安全隐患或者客户比较重要,可以考虑进行产品改造。

产品改造一般是要有商务参与的,但是这部分工作不需要运维人员来考虑,唯一需要考虑的是,改造是项目级改造还是产品统一升级,相关的实施办法与BUG修改要一致。

4汇报交互机制

上述问题解决的过程中,一定要保持适当频度的汇报,汇报的对象主要是运维负责人和公司领导。具体包括日常汇报和重点汇报,日常汇报是定期对运维工作的汇报,重点汇报是对高优先级内容的汇报,以及涉及商务问题的请示。

4.1日常汇报

日常汇报分为日汇报和周汇报,日汇报有专人负责,每天统计运维情况,整理成EXCEL进行汇报,周汇报是对一周内运维情况的总结,针对运维中的重大事宜,要在会议穿透时进行汇报,包括当前的解决进度、解决方法、解决过程是否有突发情况等。

此外,计划定期对项目运维进行一次核定,初步计划是每季度一次,包括对项目运维等级的评定、项目运维情况统计、产品问题反馈等等,具体的汇报格式尚未确定。

4.2紧急汇报

紧急汇报是针对两种情况,一是影响客户使用的,没有替代方法且自己难以解决;二是对客户影响较大的,比如单点登录异常、系统无法登录等等。

紧急汇报主要是申请资源,请求协助解决问题,因此一定要快速、简洁、准确地反馈问题。在解决问题后,要向协助人员反馈问题已解决。对于解决问题的过程要有记录,记入重点汇报的工作中。

4.3重点汇报

重点汇报是对高优先级内容的汇报,必须及时通知到运维负责人及公司领导。例如客户门户登录异常、业务集成同步中断、客户有新的需求需要商务沟通等等。对于修复过程超过0.5天的重点问题,要给出书面记录,记录修复过程以及解决方案,上传至SVN作为备忘。

项目运维工作是项目实施不可或缺的步骤,想要做好运维工作就一定要做到有章可循,这就需要大量的工作积累。由于出现的问题大多在生产环境,要求运维人员快速、准确地定位问题,这就导致运维工作交接困难,新的运维人员往往需要一段时间才能适应。不断地总结、分类、梳理运维问题,可以使运维工作在交接的过程中非常顺利,也可以保证项目后续跟进时,实施人员对项目有充分的理解。

运维常见问题及解决策略相关推荐

  1. 运维常见问题及解决方法汇总(持续更新...)

    1.yum安装软件提示:another app is currently holding the yum.lock;waiting for it to exit. 原因:可能是系统自动升级正在运行,y ...

  2. 桌面终端运维常见问题

    桌面运维常见问题 1.C盘满了,如何进行清理(干货) ①关闭休眠,节省空间方法 ②Windows.edb是什么文件,怎么删除或者转移到其他盘? ③进行磁盘清理 ④转移数据文件 2.电脑本地没有声音 3 ...

  3. linux系统python截图不显示中文_Linux运维知识之解决linux系统下python中的matplotlib模块内的pyplot输出图片不能显示中文的问题...

    本文主要向大家介绍了Linux运维知识之解决linux系统下python中的matplotlib模块内的pyplot输出图片不能显示中文的问题,通过具体的内容向大家展现,希望对大家学习Linux运维知 ...

  4. linux crontab不运行,Linux运维知识之解决Linux中crontab不执行ntpdate问题

    本文主要向大家介绍了Linux运维知识之解决Linux中crontab不执行ntpdate问题,通过具体的内容向大家展现,希望对大家学习Linux运维知识有所帮助. 解决Linux中crontab尚未 ...

  5. linux sudo 命令无法使用,Linux运维知识之解决Linux下无法使用sudo命令问题

    本文主要向大家介绍了Linux运维知识之解决Linux下无法使用sudo命令问题,通过具体的内容向大家展现,希望对大家学习Linux运维知识有所帮助. 问题描述 使用普通用户登录后在终端中执行sudo ...

  6. 百度云曲显平:AIOps时代下如何用运维数据系统性地解决运维问题?

    百度云智能运维负责人 曲显平 本文是根据百度云智能运维负责人曲显平10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日<百度云智能运维实践>演讲中的分享内容整理而 ...

  7. 百度云曲显平:AIOps时代下如何用运维数据系统性地解决运维问题? 1

    本文是根据百度云智能运维负责人曲显平10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日<百度云智能运维实践>演讲中的分享内容整理而成. 内容简介:本文主要从百度 ...

  8. 大数据开发套件—调度运维常见问题

    我们在进行大数据开发过程中,会遇到各种问题,本文将定期收集整理一些在使用阿里云数加 大数据开发套件 时遇到的常见问题,供大家参考~ Q. 如果之前提交的任务修改后再次提交,是否会影响当天的任务调度? ...

  9. VMware vSphere 6.0 虚拟机运维常见问题排除

    戳蓝字"CSDN云计算"关注我们哦! 技术头条:干货.简洁.多维全面.更多云计算精华知识尽在眼前,get要点.solve难题,统统不在话下! 当您将VMware vSphere 6 ...

最新文章

  1. 艾欧币 不需繁琐存币不用学习使用钱包
  2. SAP CRM Fiori My Opportunity应用文件上传的技术实现
  3. php分页采集数据,php实现分页调取数据库记录
  4. [转]深入浅出Java设计模式之备忘录模式
  5. leetcode(一)刷题两数之和
  6. PP视频播放视频时如何关闭弹屏
  7. Android 系统(241)---IPv4 or IPv6 优先
  8. video 全屏显示
  9. 别让自己成为一名废弃的程序员
  10. 洛谷P4074 [WC2013]糖果公园(莫队)
  11. 只因一段代码全公司200多人被捕,爬虫敲响警钟!
  12. 制作自己的 Kindle 电子书
  13. 解决Vuser停在Gradual Exiting状态不动的问题
  14. [siggraph13]《命运》的实时渲染技术
  15. js中onsubmit用法
  16. Elasticsearch 中文IK分词器
  17. 火车售票系统 java_基于jsp的火车售票系统-JavaEE实现火车售票系统 - java项目源码...
  18. oracle绝对值求和,Oracle存储过程当中经常使用函数
  19. 如何给微信公众号做认证
  20. 固定电话呼叫转移设置方法

热门文章

  1. matlab阵风仿真,基于matlab风力发电系统的建模与仿真毕业设计论文
  2. 运用计算机思想分析和综合经济问题,【经济学论文】数量经济学学科素养分析(共6246字)...
  3. 使用zabbix对服务器进行性能监控
  4. 《安富莱嵌入式周报》第252期:2022.02.07--2022.02.13
  5. 天线接收功率计算公式_天线功率调整方法与流程
  6. 【拖延症】如何克服拖延症,提高工作效率
  7. TextView解决中英文混排自动换行
  8. AutoCAD2013 以上利用AccoreConsole+ c# NetApi Windows Froms 封装
  9. java 文件大小单位换算_获取文件大小Byte、KB、MB、GB、TB单位自动转换
  10. C#开发用于计算安全访问算法Key值的上位机