监控是运维这个职业的根本。尤其是在现在DevOps这么火的时候,用监控数据给自己撑腰,这显得更加必要。

有人说运维是背锅侠,那么,有了监控,有了充足的数据,一切以数据说话,运维还需要背锅吗,所以作为一个运维工程师,如何构建一套监控系统是你的第一件工作。

现在运维监控工具非常多,哪个好,哪个不好,哪个适合你,哪个不适合你,其实只有你了解了他们的特性后,才知道。

1、Cacti

Cacti是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。

简单的说Cacti就是一个PHP程序。它通过使用SNMP协议获取远端网络设备和相关信息,(其实就是使用Net-SNMP 软件包的snmpget 和snmpwalk 命令获取)并通过RRDTOOL工具绘图,通过PHP程序展现出来。我们使用它可以展现出监控对象一段时间内的状态或者性能趋势图。

Cacti是很老的一款监控工具了,其实说它是一款流量监控工具更合适,对流量监控比较精准,但缺点很多,出图不好看,不支持分布式,也没有告警功能,所以使用的人会越来越少。

2、Nagios

Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios主要的特征是监控告警,最强大的就是告警功能,可支持多种告警方式,但缺点是没有强大的数据收集机制,并且数据出图也很简陋,当监控的主机越来越多时,添加主机也非常麻烦,配置文件都是基于文本配置的,不支持web方式管理和配置,这样很容易出错,不宜维护。

3、Zabbix

Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供强大的通知机制以让系统运维人员快速定位/解决存在的各种问题。

Zabbix由2部分构成,zabbix server与可选组件zabbix agent。zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平台上。

Zabbix解决了cacti没有告警的不足,也解决了nagios不能通过web配置的缺点,同时还支持分布式部署,这使得它迅速流行起来,zabbix也成为目前中小企业监控最流行的运维监控平台。

当然,Zabbix也有不足之处,它消耗的资源比较多,如果监控的主机非常多时,可能会出现监控超时、告警超时等现象,不过也有很多解决办法,比如提高硬件性能、改变zabbix监控模式等。

4、Ganglia

Ganglia是一款为HPC(高性能计算)集群而设计的可扩展的分布式监控系统,它可以监视和显示集群中的节点的各种状态信息,它由运行在各个节点上的gmond守护进程来采集CPU 、内存、硬盘利用率、I/O负载、网络流量情况等方面的数据,然后汇总到gmetad守护进程下,使用rrdtool存储数据,最后将历史数据以曲线方式通过PHP页面呈现。

Ganglia监控系统有三部分组成,分别是gmond、gmetad、webfrontend。gmond安装在需要收集数据的客户端,gmetad是服务端,webfrontend是一个php的web ui界面,ganglia通过gmond收集数据,然后在webfrontend进行展示。

Ganglia的主要特征是收集数据,并集中展示数据,这是ganglia的优势和特色,ganglia可以将所有数据汇总到一个界面集中展示,并且支持多种数据接口,可以很方面的扩展监控,同时,最为重要的是,ganglia收集数据非常轻量级,客户端的gmond程序基本不耗费系统资源,而这个特点刚好弥补了zabbix消耗性能的不足。

最后,Ganglia在对大数据平台的监控更为智能,只需要一个配置文件,即可开通Ganglia对hadoop、spark的监控,监控指标有近千个,完全满足了对大数据平台的监控需求。

5、Centreon

Centreon是一款功能强大的分布式IT监控系统,它通过第三方组件可以实现对网络、操作系统和应用程序的监控:首先,它是开源的,我们可以免费使用它;其次,它的底层采用类似nagios的监控引擎作为监控软件,同时监控引擎通过ndoutil模块将监控到的数据定时写入数据库中,而Centreon实时从数据库读取该数据并通过Web界面展现监控数据;最后,我们可以通过Centreon web一键管理和配置主机,或者说Centreon就是nagios的一个管理配置工具,通过Centreon提供的Web配置界面,可以轻松完成nagios需要手工配置主机和服务的不足。

Centreon的强项是一键配置和管理,并支持分布式监控,nagios能够完成的功能,通过centreon都能实现,同时,centreon还可以和ganglia进行集成,centreon将ganglia收集到的数据进行整合,可以实现主机自动加入监控以及自动告警的功能。

6、Prometheus

Prometheus是一套开源的系统监控报警框架,它既适用于面向服务器等硬件指标的监控,也适用于高动态的面向服务架构的监控。对于现在流行的微服务,Prometheus的多维度数据收集和数据筛选查询语言也是非常的强大。Prometheus是为服务的可靠性而设计的,当服务出现故障时,它可以使你快速定位和诊断问题。

7、猎报安全

作为一款国内开发的运营工具,猎豹安全依托传统态势感知平台通过收集大量日志,将安全事件与相关日志进行关联,发现威胁事件。通过引入全球先进的威胁情报数据,一方面威胁情报是经过验证的恶意攻击资产信息,可过滤大量误报,并对威胁事件赋予优先级,指导客户用有限资源应对关键问题;另一方面,通过威胁情报丰富的上下文信息深入分析了解威胁事件的本质、意图、技术和造成损害,增强深入分析能力,有效指导响应处置工作。

7个好用的运维监控工具,你在用哪个?相关推荐

  1. 运维监控工具之商用软件篇

    在运维监控工具方面来说,开源产品对比商用平台在服务和安全等方面必然是存在着很多短板,也正因为有这些问题,所以国内企业,特别是中大型行业企业往往因此而拒绝开源产品,选择服务更有保障,产品安全性.稳定性更 ...

  2. 运维人必须掌握的 5 种常用运维监控工具

    运维监控工具千千万,仅开源的解决方案就有流量监控(MRTG.Cacti.SmokePing.Graphite 等)和性能告警(Nagios.Zabbix.Zenoss Core.Ganglia.Ope ...

  3. 开源运维监控工具open falcon

    小米发布的运维监控工具:open falcon 项目地址:http://open-falcon.org/ Introduction 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时 ...

  4. 五款企业运维监控工具简单介绍-行云管家

    维监控其实分很多方面,如:服务器.虚拟机.网络设备.VMware监控以及CPU.内存.磁盘.网络.邮件报告等等,侧重点不一样功能也会有些许的差异.今天我们小编就对五款企业运维监控工具进行简单介绍,希望 ...

  5. 绝不能错过的10款最新OpenStack网络运维 监控工具

    摘要 今天我们要推荐给大家的是关于奥斯汀OpenStack Summit的OpenStack网络方面功能与工具相关的技术演讲. 希望可以帮助国内的开发者.架构师和用户更好地了解OpenStack在SD ...

  6. 运维监控工具排名(前10名介绍)

    Zabbix 官方网站:https://www.zabbix.com/ 推荐星级:★★★★★ Zabbix是一个基于WEB界面的提供分布式系统监控以及网络监控功能的企业级开源运维平台,也是目前国内互联 ...

  7. mysql运维监控工具排名_最全的监控工具盘点|无监控,不运维!

    原标题:最全的监控工具盘点|无监控,不运维! 随着互联网行业的不断发展,各种监控工具多得不可胜数.这里列出网上最全的监控工具.让你可以拥有超过80种方式来管理你的机器.在本文中,我们主要包括以下方面: ...

  8. GBase 8a 运维监控工具---“统一数据平台监控与运维系统”

    GBase 8a MPP Cluster 提供了海量数据的管理及分析功能和易于监管数据库集群的工具. 本篇文章主要介绍一款 便于数据库管理员监控数据库集群的图形化工具: "统一数据平台监控与 ...

  9. 开源运维监控工具WGCLOUD - 功能概述及架构介绍(理论篇)

    一.项目简介 开源运维监控系统WGCLOUD,基于springboot和golang开发,可以监控各种设备(物理机,云主机,虚拟机等都可以,安卓也可以). 二.实现功能 支持windows和redHa ...

最新文章

  1. Java 继承 执行顺序
  2. Phpcms V9当前栏目及所有二级栏目下内容调用标签
  3. java对话框背景图片插入_关于java编程窗体加背景图片的问题
  4. UGUI内核大探究(一)EventSystem
  5. 如何在log4j.properties文件中使用相对路径
  6. [Web 前端] 解决因inline-block元素导致的空白间距和元素下沉
  7. 3位格雷码的顺序编码_第3部分-计算机程序员(FPGA嵌入式应用)_3级_理论知识复习题...
  8. php之include的使用
  9. Oracle 11g R2 RAC上配置TAF和Load balance
  10. ECharts 实现地图功能
  11. html5游戏ztype源码,Ztype打字游戏!
  12. Linux下使用Netfilter框架编写内核模块(统计协议层ping特定地址丢包数)
  13. stm32 U盘升级 bootloader程序 基于stm32f407 将升级包下载到U盘中,插入到设备中,完成对主程序的升级
  14. 华为android9手机短信不提醒设置,华为手机微信不提醒怎么办 华为收不到微信提示信息多种解决方法...
  15. PostgreSQL:不支持 10 验证类型
  16. 通过Nginx访问静态页面
  17. echarts折线图实现滑动平移,横坐标过多时隐藏部分横坐标,通过滑动平移显示隐藏的部分
  18. wgt 增量包下载过程中断,重新下载安装显示 [-1202]manifist 文件不存在
  19. 硬盘分区丢失不能识别,文件系统损坏,不能读取第一个/第二个NTFS引导扇区的解决方法
  20. 什么是电子面单,电子面单的功能和应用场景

热门文章

  1. Centos7服务器测试网速Speedtest小工具
  2. 思科设备ACL与NAT技术
  3. Cert Manager 申请 SSL 证书流程及相关概念 - 一
  4. cv2如何使用有专利的shift算法
  5. 互联网产品设计进阶(7)还需要懂点UML
  6. 马云只持有阿里巴巴8.9%的股份,为什么却拥有绝对控制权?
  7. 银行 IT 架构到底要不要云化?
  8. Google翻译PDF文档
  9. 算法:深度优先遍历和广度优先遍历
  10. 关系型数据库选型MySQL、 Oracle、SQL server、DB2、PostgreSql