近期,工业和信息化部印发了《‘十四五’软件和信息技术服务业发展规划 》,明确了软件是信息技术关键载体和产业融合关键纽带,其中软件系统稳定性是促进软件行业高质量发展的基石。《证券期货业科技发展“十四五”规划》中提到的四项原则也着重强调了系统稳定性:“稳字当头、稳中求进”。由此可见,系统稳定性已经成为支撑金融机构转型发展、保障产品和服务质量、提升客户满意度、控制金融风险的重要影响因子。在此背景下,越来越多的企业通过应用混沌工程技术来提高软件系统的稳定性,从而实现韧性架构。金融行业是拥抱、尝试新技术最为积极的行业之一,众多金融领域的客户对混沌工程技术在金融场景下的应用展现出了浓厚的兴趣。

12月7日,由中国信息通信研究院支持、混沌工程实验室主办的“混沌工程技术沙龙——金融行业精品专场”以“线下沙龙+线上直播”的形式成功召开。此次沙龙聚焦金融行业分布式系统稳定性痛点问题,邀请行业技术专家共同探讨混沌工程技术在金融行业内的实践经验及建设成效,为解决金融行业分布式系统的稳定性提供新思路。

作为实验室成员单位、灾备和业务连续性领域的领军企业,同创参加了此次活动。同创永益技术总监郑阳先生在,以“混沌工程助力金融行业业务连续性管理”为主题做了专题演讲,针对目前混沌工程的挑战与企业业务痛点做了陈述,也与各位老师共同探讨了更多混沌工程针对业务的场景,赢得了现场的广泛赞誉。

以下为CTO郑阳现场演讲部分内容:

我们认为引入了混沌工程之后就可以进行从容的一个应急,在事前的时候可以预测一些故障,也可以通过一些攻防演练的方式去主动发现问题,使得我们的系统更加健壮,在事中的时候也可以快速地定位和解决问题。事后是对故障的影响进行一个分析,还有重建的设计,然后进行一些复盘,还有改进我们整个的过程、流程等等,这是我们认为混沌工程带给BCP的。

其实在真实的故障场景中肯定不是这样的,因为真实的切换场景前面肯定还有很多的环节在,至少有两个环节,第一个是应急响应,另一个是应急处置这方面,包括我们说的指挥调度等等这些环节,其实环节越多的话,它的故障点越多,每个故障点我们的假设的都是90%以上的成功率,你把这些故障点这些成功率乘起来之后,就得到了我们最后的真实的一个成功率,其实成功率只有65%的到85%。

从事件的发生到应急处置,在灾备切换演练里其实是没有得到一个验证的。现阶段目前有一些银行客户在跟同创一起去研究怎么去做极限情况下的切换演练,其实也就是往混沌工程这个方向去思考了。如果是引入了混沌程之后,我们才计划会是什么样子,肯定是从通过混沌工程故障注入这种方式去模拟真实存在的一些故障。

同创业务连续性平台:数字化时代全方位为企业业务提供保驾护航

从软件的角度上考虑,这是同创软件的能力模型,首先是覆盖稳敏双态,第二个是叫平战结合,我们有两个原则覆盖双态和平战结合。覆盖双态的意思就是说我们的所有的能力模块,这些是我们的能力模块,这些能力模块在不同的层次上有不同的诉求,比如像监控告警的话,我们在iaas上就是传统监控,在paas层次上我们叫平台可观测, saas层次我们叫业务可观测,每一个模块其实都在纵向的文笔状态上有不同的诉求。

另外从横向上我们说平战结合平时的话叫防患于未然,战时的话叫然则有备,有备覆盖平时和战时。我们通过业态感知的我们的能力模块,去感知到我们整个的应用拓扑、物理拓扑,从而给我们的业务连续性管理提供一个依据,做BIA营业务影响分析和风险分析的依据。

然后根据我们的RA风险分析的一个结果,生成相应的预案体系,然后到我们的混沌工程平台出场,我们的混沌工程平台可以跟业务跟监控报警很好的一个结合,去一个看监控报警的策略做优化,另外的话是给系统的稳定性也是做了一个测试。另外就是跟我们的预案体系去结合,验证我们预案有效性,并且优化预案体系。这是平时做的事情,战时一旦发生了故障的时候,有辅助的决策去帮助我们的管理者快速地进行决策。然后决策完之后的话,到应急管理启动应急的指挥调度、处置流程等等,如果是涉及到本地自愈,我们就结合我们同创的自动化运维产品做本地自愈,如果是需要灾备切换的,就去应急管理去调用我们的灾备切换管理平台进行灾切,所以整个就构成了我们同创大的产品地图,就是践行了我们的业务连续性闭环。

借用一位国外的做业务连续性的一个同仁,他说的一句话结束我今天的分享:许多企业都以不让测试太难为目标进行自我测试,但真正的问题发生时不太可能那么体贴,混沌工程是业务韧性的未来,是找出系统是否可以真正恢复到一种现实的方法。谢谢大家。

混沌工程实验室丨同创助力金融行业业务连续性管理相关推荐

  1. 银行业灾备及业务连续性管理:从混沌走向清明

    <金融时报>记者 潘竑 2007-01-17     每每提及灾难备份与业务连续性管理,银行业总是被誉为行业中的"领头羊".这不仅是由于其起步早,上世纪90年代末,部分 ...

  2. 金融机构业务连续性管理

    目录 一.金融机构制定业务连续性计划的必要性 金融机构业务连续的意义 金融机构业务连续的目标 二.金融机构应该如何制定业务连续性计划 业务连续性管理框架 董事会.管理层责任以及审计要求 业务冲击分析和 ...

  3. 银行业“业务连续性”管理(上篇)

    近期,有些金融行业的客户咨询咨询"业务连续性"的相关问题,客户提问"信息科技部门的灾备管理是否就是业务连续性管理?如果不是,那么二者的区别是什么?"" ...

  4. SRE理论:企业业务连续性管理体系该如何建设?

    10月,由嘉为科技携手腾讯蓝鲸智云联合主办的智慧生长·研运未来暨2021年研运治理实践大会在北京成功召开 在下午进行的智能化运维分论坛上,来自嘉为蓝鲸的解决方案架构师李方园同与会嘉宾探讨了IT运维团队 ...

  5. 浅析商业银行“业务连续性管理体系”的构建

    当前世界所面临的风险有恐怖袭击.黑客. 网络侵袭.电脑病毒.自然灾害.大规模停电.罢工.环保.市场恶性竞争.企业倒闭等,近年来发生的"9.11"."SARS"事 ...

  6. 运维的进击“转型”:阿里业务连续性管理最佳实践

    公众号回复:干货,领取价值58元/套IT管理体系文档 公众号回复:ITIL教材,领取最新ITIL4中文教材 说明:本文根据付来文老师在 GOPS 全球运维大会 2021 · 深圳站的演讲速记整理而成. ...

  7. 毁灭还是生存?业务连续性管理考验公司基业常青-系统体系风险防范

    业务连续性管理(BusinessContinuityManagement,简称BCM),是一项综合管理流程,使企业认识到潜在的危机和相关影响,制订响应.业务和连续性的恢复计划,其总体目标在于提高企业的 ...

  8. 业务连续性管理体系建设

    GDS是国内较早提供灾难恢复和业务连续性服务的专业服务提供商.GDS根据多年的实践经验和理论基础,总结出了一套行之有效的BCM(业务连续性管理/Business Continuity Manageme ...

  9. 业务连续性管理峰会2007演讲记录

    业务连续性管理峰会2007演讲记录 2007-09-24 13:11 作者: 佚名 出处: 天极Yesky 责任编辑:黄惟冰 演讲一:从国际标准中看业务持续性管理的发展 申屠献忠 通标标准技术服务有限 ...

最新文章

  1. NVIDIA GPU的神经网络自动调度
  2. 2021年春季学期-信号与系统-第十二次作业参考答案-第三小题
  3. mybatis 无法初始化类_从零开始手写 mybatis(一)MVP 版本
  4. ES6之let和const
  5. 规定自己的Java编码规范
  6. Andorid之华为手机开发模式不打印日志
  7. 摇滚java游戏_java 集合类
  8. java飞机大战分数累加代码_JAVA 基础编程练习题39 【程序 39 分数累加】
  9. Java7并发编程指南——第七章:定制并发类
  10. pass 软件_以信息化为支撑,合理用药为保障,我院 PASS合理用药系统正式上线!...
  11. centos7创建asm磁盘_asm磁盘路径包含混合路径时的设置
  12. 《手把手教你》系列基础篇之3-python+ selenium自动化测试-驱动浏览器和元素定位大法(详细)
  13. bfc是什么_清除浮动和 BFC
  14. HTML+CSS制作旋转的loading效果
  15. 一文简介常见的机器学习算法
  16. 追佛信道不如追求真理。。
  17. 001 lambda的分析
  18. 早上运动和晚上运动,哪个更利于减肥?
  19. 蚂蚁算法蚁群算法-原理-思路-步骤-程序实现
  20. 镜头相关的基本参数总结

热门文章

  1. HRNet——个人学习记录
  2. c++11之STL容器
  3. scip 输出日志解析
  4. while读取文件 Shell中while循环的陷阱, 变量实效, 无法赋值变量
  5. 在ubuntu使用easyconnect
  6. 网线认证测试仪-FLUKE和AEM如何选?
  7. 湖北自考计算机一年考几次,湖北自考一年能考完吗 有几次报名机会
  8. 独家专访汪玉:不止是 DPU,深鉴要做 AI 解决方案提供商
  9. ORACLE PL/SQL编程之二:PL/SQL块结构和组成元素
  10. 生物信息学分析服务器搭建教程,Snakemake搭建生信分析流程-步骤