一个成熟的自动化运维系统至少应该包括三个子系统:
      机房设备数据系统 (EMDB)
      1.录入机房服务器和网络设备的各种信息,比如机器型号,硬盘大小,OS类型,所属应用,运行状态,机房名称,所在房间,机架,位置等等各种信息,这是一个最基础的数据库,最主要的目的是给每个机器从多个维度统一打上各种标签,方便其他系统的使用。

      2.提供各种查询API接口,并做好权限控制。目的是能够被上层的各种系统调用,一般是rest接口,xml接口。然后基于各种语言做相应的封装库。
      应用监控系统(Appmonitor) 

      1.一个统一的数据采集模块,用于采集设备运行信息,包括磁盘IO,网络流量,CPU利用率,网络设备的Session数,PPS。这个采集模块在网络设备上一般可以通过snmp来实现,在服务器上一般通过一个定制化的Agent来实现,这个Agent最基础的能力是采集服务器运行数据,最重要的是能执行各种脚本语言并通过脚本语言实现对服务器的各种操作(如更改配置,分析应用日志并输出结果)。

      2.监控数据存储与可视化,数据采集模块采集到各种数据会很多,但对事务性没啥要求,可以用各种NoSQL数据库如Hbase,Cassandra等来实现。数据的可视化是一个可以做的很深且偏应用层面的东西,一般在监控系统上只实现最基本的曲线图展示,提供按时段选择和对比的功能,其他复杂的可视化操作通过各种API来实现。
      3.监控项添加和报警通知,监控项是一种层次结构,而不是列表结构。上层节点的配置能够被下层节点的配置覆盖掉。对网络设备来说监控项就是一些不同的oid。借助于底层的数据采集模块,对服务器来说监控项基本上就是一个脚本。可以分为标准监控项和自定义监控项,标准监控项最大化的通用,实现cpu,内存,磁盘,网络等信息的监控。自定义监控项可以用多种系统管理脚本语言(shell,python,perl)等实现,脚本的输出符合一定规范即可,一般采用行结构或json串。每个监控项设定warn,crit报警阈值和若干报警联系人,阈值一般是数值型,特殊的可以是字符串。超过阈值的监控项会发送报警给联系人,报警可以通过短信,邮件,IM软件发出。报警发送要支持合并报警,频率控制,关闭报警。要不然可能一次小故障就能发出成千上万条报警,报警就失去效果了。
      4.监控Api接口,并做好权限控制。做法和目的与EMDB一样。开放监控数据获取,报警消息发送,配置推送的接口。主要目的是让监控系统里面的数据能够被外界利用,可以在这些数据基础上做更加绚丽复杂的数据可视化工作,或者做一些更加个性化的监控和报警。次要目的是支持对服务器的统一操作,比如公司所有机器统一升级系统软件的版本。建议统一操作的API接口仅对少数几个人开放,并且权限严格控制。
      发布和线上配置管理系统(ReleaseManager)
 
      1.应用发布和依赖库版本管理,应用发布是运维与开发对接的重要环节,一般发布系统会和svn系统紧密结合,svn系统里面会有线上应用的列表,EMDB里面会有各个机器所属的应用。发布系统会用到这些数据,将svn系统里面生成的应用包及其依赖包发布到线上,并且自身对这些应用包和依赖包进行版本管理和控制,在应用发布出现问题时可以回滚到上一个版本。

      2.线上配置管理,类似于linux下puppet的功能,主要用于应用服务器上关键配置文件的版本控制,分发,一致性维护工作。大应用一般是若干台服务器组成集群提供服务,要求这若干台服务器的应用配置是一致的,但有时候又存在应用的灰度发布操作,或者某人误更改配置。线上配置管理系统要求提供统一的配置修改入口,对灰度发布提供支持,同时对于误更改配置情况进行纠正。执行操作可以借助于Appmonitor的接口。
      
       以这三个系统为基础可以做更多的自动化工作,比如说财务人员可以用EMDB里面的数据准确的计算Capex&Opex,机房管理人员可以用EMDB通过OOB远程执行各种关机,重装系统,网络设备维护等工作,不在现场也能管理机器,现场工作可以外包完成。应用开发人员可以通过svn系统调用Releasemanager自主打包,发布,回滚应用。应用维护人员可以调用监控系统获取数据和报警信息,通过编写相关脚本,实现一些简单报警的自动化处理工作,提升效率。
 

转载于:https://www.cnblogs.com/muzinan110/p/5026663.html

自动化运维系统具备的功能相关推荐

  1. 自动化运维-----项目实战: 基于Ansible的云平台自动化运维系统

    文章目录 项目实战: 基于Ansible的云平台自动化运维系统 一.项目介绍 1.项目介绍 2.项目背景 二.项目环境搭建 1.项目目录的配置 2.远程服务器虚拟环境的配置 3.MySQL数据库配置 ...

  2. c语言自动登陆ssh,CheungSSH国产中文开源自动化运维系统Web界面(二)

    登录CheungSSH Web 温馨提示: 如果登录次数联系超过5次,那么系统会锁定登录IP一天时间. 首次登陆后修改密码,http://您的IP地址:端口/cheungssh/admin/ . 添加 ...

  3. 污水泵站远程自动化运维系统

    大量生活污水都需要进行处理,鉴于污水处理占地面积大.设备运维难等问题,需要建立成完善的自动化升级监控管理系统,远隔千里能实时监测到各泵站的运作情况,协同维护人员及时解决问题,令污水处理终端有效运转. ...

  4. python自动化运维——系统批量运维管理器pexpect详解

    pexpect可以理解成Linux下的expect的Python封装,通过pexpect可以实现对ssh.ftp.passwd.telnet等命令进行自动交互,来达到自动化的目的.比如可以模拟FTP登 ...

  5. 框架下cookie的使用_为什么自动化运维系统越来越多使用都RESTful API?

    Flask是轻量级.易于采用.文档化和流行的开发RESTful API的非常好的选择,也是笔者在工作中最常用的Flask Web框架之一.从根本上说,Flask是建立在可扩展性和简单性的基础之上的.F ...

  6. mysql 自动化运维工具_MySQL使用工具Inception实现自动化运维

    MySQL使用工具Inception实现自动化运维 发布时间:2020-05-27 17:11:14 来源:51CTO 阅读:180 作者:三月 下面一起来了解下MySQL使用工具Inception实 ...

  7. 一个颜值低但脾气超好的自动化运维实战入门教程

    注:本教程由廖高祥发布于实验楼,版权归原作者所有. 什么是自动化运维? 自动化运维是指将IT运维中日常的.大量的重复性工作自动化,把过去的手工执行转为自动化操作.自动化运维不单纯是一个维护过程,更是一 ...

  8. python自动化部署hadoop集群_大数据集群的自动化运维实现思路

    原标题:大数据集群的自动化运维实现思路 | 作者简介 王晓伟 知数堂<大数据实战就业>课程讲师 六年大数据相关工作经验 清华大学软件工程硕士 曾就职于网易.搜狗等互联网企业 从事大数据及数 ...

  9. 【自动化运维新手村】Web框架序篇

    [摘要] 首先我们需要先想清楚,为什么一定要学Web框架,有的朋友会觉得运维中最常用的应该是脚本,我只要脚本写的溜,能提高工作效率就好了.但如果有一天你的同事也遇到了相同的场景,那你的脚本要直接拷贝给 ...

最新文章

  1. 2022-2028年中国AKD施胶剂行业市场研究及前瞻分析报告
  2. 联想一体计算机排行,2019最具性价比一体机推荐 电脑一体机十大最新排名
  3. c语言windows api编程,windows API编程学习
  4. 大内高手—共享内存与线程局部存储
  5. wordpressQQ登陆php代码_WordPress实现前台登录功能
  6. 【韩顺平Servlet视频教程】下载
  7. Hibernate 延迟加载(一)
  8. 微信iOS 7.0.9版本更新:今天的朋友圈是一片欢乐的海洋!
  9. c++ 使用正则匹配url
  10. Python操作SQLAlchemy之连表操作
  11. 动态修改php的配置项
  12. Dlubal RFEM(有限元分析软件)官方中文版V5.25.01 | 结构设计软件下载 | 有限元分析软件有哪些
  13. android加音乐歌词代码,Android简易音乐播放器实现代码
  14. UG工程图自动标注工具 64位 版本无限制
  15. 对话镕铭微电子CEO朱照远:未来几年视频处理芯片将成为一个万亿级的市场
  16. 电脑通过网口共享网络(WIFI)给其他设备
  17. 世界银行公布各国1996-2018年GDP及GDP增长率
  18. 普通路由器改4g路由器_4G工业路由器将加速工业物联网发展进程
  19. P and V
  20. 怎么使用大疆无人机建模?

热门文章

  1. 这款新晋K歌神器-麦克风话筒音响,宅家就能释压随时随地嗨翻天
  2. 数学建模-MATLAB算法精讲系列文章目录介绍(持续补充ing)
  3. 基于单片机的消毒灯系统
  4. CAS单点登录的实现(二)
  5. 「高并发秒杀」微信抢红包实战案例
  6. 商院人物:印度IT之王顶级幸存术
  7. uniapp+Echarts微信小程序实现中国地图
  8. 【http方式操作es】springboot整合es,轻量级不需要引入任何依赖
  9. 私域流量社群电商运营sop工作步骤计划销售转化方案表格
  10. 【智能金融】BCG报告:智慧运营,银行业竞争的下一个决胜之地