走进爆发中的AIOps
原创 李瑜 恒生LIGHT 2022-01-19 13:33

近几年我国证券市场不断演进,券商内部业务发展迅猛,与此同时中后台运营中业务操作也越来越复杂。新业务的开展不可避免地会引入新系统、新技术,大量重复性高、低价值的人工操作需求出现了,随之而来的是愈加频繁的人机交互流程。

现阶段金融机构IT部门业务运维的工作特点是业务操作规范、业务系统多、重复性事务多、时效性要求高,如数据库DBA需要快速定位并解决问题,降低对业务系统的影响。

智能运维平台主要把企业日常工作中耗时、枯燥的任务交给“人工智能”来完成,因为机器可以比人类更快、更准确地执行这些任务。同时,这种精简业务的战略也使员工可以腾出更多的时间处理高价值的工作,通过对工作流程的数智化升级提高企业效益。

AI如何赋能运维?

智能运维即AIOps,英文全称为“artificial intelligence for IT operations”,是人工智能应用于海量数据场景下的一个运维实践,以此来实现IT运维自动化和智能化。

AIOps一词,最早由著名研究机构Gartner在2016年提出。在《AIOps平台市场指南》这篇文章中,Gartner将AIOps平台描述为“结合大数据和人工智能(AI)或机器学习功能的软件系统,以增强并部分替代广泛的IT运维流程和任务,包括了可用性和性能监控,事件关联和分析,IT服务管理和自动化等功能。”

在传统运维模式下,IT运维人员需要关注的场景包括:交易清算、资金结算、登记清算、估值核算、外包托管、综合运营等,涉及的业务系统有柜台、PB、O32、法人清算、账户、基金TA、基金估值系统等。这些业务系统处理过程中存在数据导入、预处理、核对等基本操作,处理过程中还可能存在报错、警示等信息提醒,这需要人工对错误、警示信息进行分析、处理。

在各业务系统间的数据核对环节,需要通过各业务系统内导出的数据文件,人工对关键数据进行核对以确定结果无误。例如日间基金认购、日间申购交收处理、日中清算结果核对、日终开放式基金核对等业务。

引入基于人工智能的智能运维平台后,通过自动分析海量底层数据找到合适的模型,识别和追溯现有问题出现的根本原因来防范未然。同时在流程处理上,可以实现自动化采集、自动化操作、实时管控、精确核对和规范配置,并实时掌握底层存储、网络、服务器、数据库节点的运行状态,必要时基于人工智能的智能运维平台还可以提前介入,处理潜在风险。

“智”在何方?

根据Gartner定义,智能运维平台的核心功能是:数据源的无关性、实时分析源头数据、历史数据追溯分析、机器学习、问题溯源后能够自主进行修复。

智能运维平台能够分析存储的数据,并在采集点提供实时分析功能。

在2018年智能运维平台市场指南中,Gartner又指出,“智能运维平台增加了嵌入式的AIOps监控功能。”真正的AIOps平台是“能够结合大数据和机器学习功能,通过分布式的结构来收集和分析IT系统快速产生的多样性数据,从而支持运维工作的方方面面。”

智能运维的关键场景有大数据管理、性能分析、异常监测、事件关联与分析、IT服务管理。

性能分析场景中,智能运维平台使用人工智能和机器学习来快速收集和分析大量事件数据,以确定问题的根本原因。随着数据量和类型的增加,性能分析变得更加复杂,运维人员通过传统方式分析数据变得越来越困难,智能运维使用更复杂的人工智能技术,来分析海量数据集,从而解决了数据量和复杂性不断增加的问题。

IT系统中的异常检测也称为“离群值检测”,是对数据离群值的识别。比如数据库中突然增多的会话数量、日志切换频率以及等待事件,智能运维都会提示存在潜在问题,这些异常值被称为异常事件。

异常检测依赖于算法。趋势算法通过比较当前行为和过去行为来监视单个指标,如果分数异常增长算法就会发出警报。聚类算法通过查看一组行为相似的指标,并在一个或多个更改的行为时发出警报。

智能运维使异常检测更快、更有效。一旦识别出目标行为,智能运维平台就可以监控指标实际值与机器学习模型预测值之间的差异,并观察是否存在重大偏差。

事件关联和分析是通过多个相关警告的“事件风暴”发现事件的潜在原因,并确定如何将他们修复。传统运维工具不能提供问题的分析结论,只能提供问题发生时的一部分告警。

智能运维可以通过人工智能算法,根据事件的关联性自动对事件进行分组。这既减少了运维团队持续关注监控工具的负担,又减少了不必要的网络流量和噪音。智能运维使用人工智能技术对相关事件进行分组并执行基于规则的操作,如合并重复事件、抑制告警等。

传统的运维工具需要手动拼凑多个信息来源,再理解、排除故障并解决异常。智能运维平台可以自动收集和关联来自多个数据源的信息,极大地提高了运维效率和准确性。

智能运维平台具体的自动层面包括服务器、操作系统、网络、容器、云监控、虚拟化监控和存储监控。具体表现为自动化收集所有日志、指标、配置、消息和漏洞,跨多个服务器进行搜索、关联、告警和报告,并将其与其他基础设施数据关联起来,以提供更好的服务。

此外,在云监控能力、虚拟化监控、存储监控这几个层面上,智能运维平台可以自动获取云基础设施的性能、使用情况和可用性,以及自动化获取跨虚拟平台的可见性,实现更快的事件关联,并且可以全方面检索存储系统、应用程序的性能、服务器响应时间和虚拟化开销情况。

“海纳百川”、“大道至简”

智能运维,旨在将人工智能的效率和准确性,带入到日常的IT运维工作中。随着金融业务系统越来越复杂,IT 运营管理变得越来越具有挑战性。传统的运维工具,难以跟上复杂多样的业务变化,更难以适应底层数据的指数级增长。

为了应对这些挑战,智能运维充分发挥了自己的两个特点,“海纳百川”与“大道至简”。

“海纳百川”是指智能运维能够从环境中收集任何类型的数据,同时保持数据可信度,用以进行全面分析。传统的运维方法、工具和解决方案很难应对当今复杂且互联网化的IT环境,所产生的数据呈现出多样性、多源头的特点。传统运维通过整合和汇总数据,取得平均值,然而该平均值会直接影响数据的可信度,智能运维则通过全面盘活数据可有效避免此类问题。

“大道至简”则是指智能运维平台能够以不同的粒度和数量收集所有格式的数据,然后通过人工智能技术对收集的数据进行简化分析,查找现有问题的原因,并对未来即将发生的问题进行预测。

AIOps助力业务智能化升级

通过智能运维平台,使用人工智能的能力来增强系统的可维护性、可拓展性、易用性,从正面提高公司的硬实力,其随之附加的人员可更加专注于实现业务创新需求,还可从侧面提高公司的软实力。

图片

智能运维可以最大程度避免停机、提高客户满意度,并且将以前孤立的数据源组合在一起,进行更全面的分析。在时效性上,它可以做到第一时间响应需求、大幅提升服务交付。

对于运维人员来说,查找和修复错误是冗长而耗时的,智能运维平台就可以做些事情,从而让运维团队专注于高价值的分析和优化。通过人工智能技术,智能运维在提高异常追溯的分析和修复效率上卓有成效,大大节省了企业运维的时间、成本和资源。

于金融科技产业而言,智能运维平台对金融机构带来的改变是多面的。一方面可以防止日益复杂的安全漏洞和网络犯罪,保证数据安全和合规,另一方面通过深度融合人工智能技术可以分析历史客户数据输出更准确的研究报告,通过精准分析存量数据来推动市场营销的增长机会。

此外,与人工智能技术的融合应用还使得智能运维集成了多个大型数据集的框架,提高了用户访问速度和性能,满足消费者对移动和数字金融的期望。

图片

金融科技产业发展至今,数据毫无疑问目前是一个公司最核心的资产。数据产生的效应是巨大的,从疫情期间与我们出行密切相关的健康码,到河南洪涝灾害发生时一个小小的在线文档,无处不在的体现着数据技术的力量。

数智化将是金融科技产业的下一场革命,人工智能将引领这场变革走向高潮。

智能运维作为人工智能在数智化升级中的一个较为成熟的应用场景,为金融业务智能化作了一个示范。从提高安全性到精简运维工作,再到提高生产效率,智能运维将先前人工智能和大数据的“炒作”变为了现实。

可以说,智能运维是在金融机构数智化升级中已被验证的可落地场景,它可以帮助我们提高IT运维的效率以应对业务变化带来的挑战,并同时兼任金融机构业务智能化战略中“后方保障”和“推动者”双重角色。

走进爆发中的AIOps相关推荐

  1. 语文课上运用计算机,让多元智能教学走进语文课中 (人教版)

    一.创设有利于激发学生兴趣与潜能的多元智能环境 要想使学生真正参与教学,就要针对他们的智能等的差异设计课堂情境,使他们自信.欣赏自己,认识自己的强项,能够展示和分享自己的长处. 1.让多元智能教学走进 ...

  2. 从腾讯实时音视频发家史,看爆发中的 RTC 将何去何从

    作者 | 夕颜 头图 | 下载于视觉中国 出品 | AI 科技大本营(ID:rgznai100) 早在2015年左右,直播和短视频的兴起渗透进普通人的日常生活,人们信息消费的内容已经开始从文字向语音. ...

  3. 走进Java中的持有对象(容器类)之一 容器分类

    转载自 https://www.cnblogs.com/ACFLOOD/p/5555555.html Java容器可以说是增强程序员编程能力的基本工具,本系列将带您深入理解容器类. 容器的用途 如果对 ...

  4. python vector 初始化_一文带你走进Python中的数据类

    全文共2607字,预计学习时长14分钟 图源:unsplash 数据类适用于Python3.7或更高版本,它不仅可以用作数据容器,还可以编写样板代码,简化创建类的过程. 创建第一个数据类 创建一个数据 ...

  5. 走进游戏中的美术:游戏美术风格介绍

    本文首发网易游戏学院 如果把游戏比作一场舞蹈演出,游戏的核心玩法是舞蹈本身,那么游戏的美术风格则是舞蹈演员,一位优秀的舞蹈演员能更好的与舞蹈结合,传达舞蹈寓意,赋予舞蹈生命,展现舞蹈的灵魂,美术风格即 ...

  6. 走进语音识别中的WFST(三)

    下面这几章讲WFST中的优化操作,包括空转移去除(epsilon removal),确定化操作(determinization),权重推移(weight pushing)和最小化操作(minimiza ...

  7. 走进语音识别中的WFST(二)

    这几天生病了,很难受,更新的事情搁置了几天. 言归正传,之前建议大家看Mohri的paper因为那是Kaldi官网WFST那一章的作者推荐的,但是现在发现有一本更好的书推荐给大家,这本书深入浅出,讲的 ...

  8. 走进语音识别中的WFST(一)

    本人最近在研究语音识别的生成Graph和Lattice的模块,其中用到了WFST这个概念,惊叹于它的神奇也被它的复杂搞得晕头转向.于是决定静下心来仔细研读了Mohri大牛的Speech Recogni ...

  9. 走进语音识别中的WFST(四)

    前一章说了WFST的determinzation这个算法,本章继续说说WFST中的优化操作,包括权重推移(weight pushing)和最小化操作(minimization). 权重推移我们可以这么 ...

  10. java容器类_走进Java中的持有对象(容器类)之一 容器分类

    Java容器可以说是增强程序员编程能力的基本工具,本系列将带您深入理解容器类. 容器的用途 如果对象的数量与生命周期都是固定的,自然我们也就不需要很复杂的数据结构. 我们可以通过创建引用来持有对象,如 ...

最新文章

  1. java加减乘除运算代码_从“位运算”炫技到“操作符”,再到逐步理解“群论”...
  2. 北师大毕彦超:AI和人类感知的相同点和不同点
  3. 目标检测:NMS和计算mAP时的置信度阈值和IoU阈值
  4. DL之ANN/DNN: 人工神经网络ANN/DNN深度神经网络算法的简介、应用、经典案例之详细攻略
  5. 《R语言实战》第6章
  6. DotnetCharting
  7. 【C/C++】从技术学习和实际运用的角度来看,C/C++和Java到底区别在哪?C语言、C++学习路线?
  8. 大数据导论章节答案_托福100+需要准备多久?考生大数据给你答案
  9. 用PHP编写提供性别的发法,第6节 Laravel-通过模型处理性别
  10. html5模板 制作,优秀的H5作品是如何炼成的?模板制作详解!
  11. 科大讯飞 文字转语音
  12. 程序员需知的 58 个网站
  13. Python爬虫:数据提取
  14. st计算机编程语言,初学ST语言,有了这篇ST编程语言的相关知识就容易多了~
  15. Oracle-数据库的备份与恢复
  16. QQ互联官网使用跳坑
  17. 在线文档转换接口 word,excel,ppt等在线文件转pdf、png
  18. 三维GIS显示中,利用太阳高度角和方位角计算光照
  19. 美团8年经验之谈,测试工程师如何进阶(自动化、性能、测开)
  20. OpenCV图像特征SIFT

热门文章

  1. 传说中的“猴年马月”就要来了,感觉很多愿望都要实现啦!
  2. ArcGIS For Flex学习之Mapping---Add LODs for extra zooming
  3. centos6 下安装xfce+vnc
  4. JAVA开发常用类(六)
  5. mysql数据库操作语句整合
  6. pop和push等使用方法,every和some、join
  7. istringstream字符串流对象
  8. iOS利用代理实现界面跳转
  9. 全触摸模式,让你尽享ipad 开发出的精品
  10. State Machine Workflow 入门篇