点击“开发者技术前线”,选择“星标????”

13:21 在看|星标|留言,  真爱

▌概述

很多互联网公司在发展过程中大多出现过多次机房网络故障的情形,如果发生故障,一般需要动用整个IT部门的人力进行流量切换和客诉处理。为了避免此类情形的发生,公司计划进行服务的高可用建设。会员部门持续跟进公司网络基础设施建设,和网络等基础服务部门一起,实现服务的高可用。目前已经实现了同一Region的互备,这里分享一下会员服务的高可用建设的实战和探索。

对于网络、机房、硬件服务器之类的故障,一般采取多备份和绕路回避的策略,将流量从出故障设施切换到正常的集群中,将故障服务下线,待服务恢复后再切换回来。总体来说,须要求多副本部署、实时故障检测和服务快速切换。目前会员已经实现从最上层的DNS服务到底层的数据库的自动切换。

▌高可用的方案

网络层

多区域,多出口,出口有互备和切换的能力

根据目前的CDN结构,将地域划分为北方,华中,华南,海外四个区域,每个区域支持主流运营商,保证流量均衡

应用层

多机房部署,相互独立

到少保证两个机房互备,实现基础架构两地三中心的战略规划

储存层

多实例,可以指定切换方向

Mysql/Redis都可以自动将故障的实例下线

消息层

统一使用RMQ

RMQ支持高可用,可能自动备切,将amq替换为rmq

监控层

监控DNS,应用,数据库等实例,进行数据修复

提供监控功能,监控结点覆盖数据库和网络层,异常时,报警和切换。提供数据处理工具。

▌升级网络架构

1.运营商出口的互备

系统网络部门研发了域名,LB的运维管理平台,支持故障监测,业务异常时切换到备用资源,变更配置时进行通知。会员在使用过程中,提出了很多优化需求,如展示IP的地域和运营商信息,提升用户体验,目前部署了三套独立的出口IP,相互之间可以在网络层隔离和自动切换。因为数据库的主库暂时无法多机房部署,所以订单、权益等核心服务和数据库保持同城部署。目前在同城机房部署了两套出口IP,可以进行互备和自动切换。

用户访问最近的机房总是最快的,会员将DNS区域划分出北方,华中,华南三个独立的区域进行部署,设置独立的出口IP,区域划分上也保证了流量的均衡。网络组提供自动化的运维设施,通过故障演练,已经可以在故障时进行流量的自动切换。

在人员方面,邀请网络部门专业人员对会员团队进行网络基础架构和网络保障方案等的讲解,对过往故障进行整体分析总结,并一起对业务灾备方案做出调整。通过大家的共同努力,近一年来将业务故障率降为零。

2.内网IDC机房的互备

各机房通过专线互连互通。应用的部署与上下游的服务保持在同一个机房最佳,不占用专线带宽,提升服务稳定性,减少网络抖动和晚高峰的影响。在统计了应用的上下游的流量分布之后,应用在部署上覆盖了主要的机房,将最早的自建机房定义为备用机房。当主机房故障时,DNS系统通过定时检测,发现异常后会自动切换到备用机房。内网服务间东西向流量是很大的,高峰时直接切换到另一个机房可能会引起机房不稳定,所以每个服务从Nginx层配置了应用级别的限流。极端情况下的流量监控和限流成为保障服务安全稳定的最后屏障。流量可以在机房间进行切换,如果流量超过机房承载能力,会触发限流和报警。

▌升级应用服务

1.改造单点的应用

部分应用如worker一般都存在单点的情况,将应用改造成可以部署在多个IDC中,形成多个互备的集群。Worker一般会执行定时任务,通过改造定时任务,并使用了开源项目xxl-job,开发出了异步任务框架和调度系统(vip-job),定时任务由调度系统触发,随机选择一台服务器进行任务调度,解决了单点问题。

2.核心应用多机房部署

核心服务(如会员影片播放链路上的应用)会覆盖尽量多的IDC,期望流量在同机房流转,保证服务质量,同时核心应用的DNS配置根据地域和运营商两个维度进行优化,给用户提供最优的服务体验。

3.升级数据库

公司的数据库部署架构为DNS+HA。通过实现Raft协议,开发了HA-Master/HA-Agent监控和切换软件。当数据库实例宕机时,agent会发送心跳检查,触发主备切换或是将宕机实例从DNS中下线,避免人工运维成本和宕机带来的数据丢失。

消息中间件和Redis的高可用

会员使用服务云提供的RocketMQ,申请支持跨机房互备。

将ActiveMQ和历史不支持HA的RocketMQ进行替换和升级以支持互备。

Redis使用Sentinal机制进行主备切换。两者都具备HA的能力,使用起来比较方便。

1.会员应用的部署架构

会员将目前的机房进行了抽象和划分,自建的核心机房可以承载所有的流量,部署了会员全套的应用。租赁机房存在扩容困难,机器折旧,流量单一,应用覆盖不全的问题。将租赁机房划分成一个整体,抽象成一个虚拟机房,从外部看,虚拟机房和自建机房一样,支持多运营商,容量大,应用覆盖全面,可以提供高质量的服务。目前会员实现的是自建机房与虚拟机房的互备。

2.运维平台

会员打通了从DNS到虚拟机的资源信息,开发了运维平台,建立了一系列的监控指标和运维工具。为机房之间业务切换和日常运维提供支撑服务和工具,架构如图所示:

▌砥砺前行与未来展望

会员服务的高可用方案随着公司的网络与计算设施部门的工作进展而不断优化升级,基础设施部门提供了更多的能力和服务,方案也更整洁和强大。未来的重点将放在提升资源利用率,优化会员服务,同时保证业务的故障恢复在用户无感知的情况下进行。

END

开发者技术前线 ,汇集技术前线快讯和关注行业趋势,大厂干货,是开发者经历和成长的优秀指南。

历史推荐

有了这款IDEA插件,再也不需要postman了

为了探究妹子对内衣的偏好,我爬了淘宝内衣店的数据!

阿里巴巴业务中台架构演进之路


http://www.taodudu.cc/news/show-5970707.html

相关文章:

  • CSP2019 游记
  • 走马桃花
  • 认清各种影视资源不同版本
  • SAMSUNG U608
  • 自己这一年来开发的几十个原创PHP程序,都有演示,大家可看下。
  • 诺基亚920终于到手了,如何验证正品?
  • 维护城市信息安全 打造绿色通信环境
  • 怎样辨别自己的手机是水货或行货?试试这个
  • 新产品·新技术·新领域 LabVIEW能为我们做什么
  • 信产部标志真伪鉴定部:辨别手机真伪有六招
  • 手机真伪验证
  • 手机真假识别(2)
  • Android设备信息的那些事
  • 如何辨别自己的手机是不是水货或者来源不明?
  • 关于手机移动通讯
  • 关于使用http://www.tenaa.com.cn/求证手机真假的方法
  • python第三方插件登录网易音乐_GitHub - TomoToTomoT/NeteaseCloudMusic-Python: 网易云音乐--python Api...
  • 转图片格式的PDF软件
  • 零散知识点小结(nginx/linux/mycat/redis/douubo/zookeeper)
  • 经典文案的两个万能套路,恭喜你在发文前看见了| 黎想
  • 首席新媒体运营商学院黎想:用户增长的万能公式
  • 实用微信小程序项目源码
  • 王者100星很厉害吗?来试试不一样的版本,王者拼图。我才是最强的。
  • Python爬虫新手入门教学(十一):最近王者荣耀皮肤爬取
  • 王者荣耀2.0继王者荣耀1.0后上线!C++
  • 德源希望教育救助中心第十所希望小学落户河北省涉县
  • 第二届全国智能制造(中国制造2025)创新创业大赛在京启动
  • MyBatis - 初学笔记
  • 浅谈汽车软件的质量保证
  • 钢琴陪练软件打分测试有必要吗,警惕钢琴陪练,这几点千万不要

爱奇艺会员服务在高可用架构的实战探索相关推荐

  1. 195元爱奇艺会员只卖5元 揭秘背后黑色产业链

    来源:法治周末 记者 马树娟 近两百元的视频网站年度会员资格,只需要区区数元就可以买到:而价值十余元的月度会员资格,甚至只需几分钱-- 此前,湖北用户刘栋(化名)从未意识到:这些以超低价出售视频网站会 ...

  2. 爱奇艺微服务标准技术架构实践

    背景 为数以亿计的用户提供优质的视频服务的爱奇艺技术产品团队,为了适应业务的快速迭代和创新,并支撑海量的用户请求,很多团队都对各自的业务系统自发地进行了微服务架构的改造. 在微服务化的过程中,各业务团 ...

  3. 爱奇艺会员多少钱一年最便宜

    很多爱看电影电视剧追剧的同学,不知道爱奇艺会员一年最便宜多少钱.下面就和大家分享关于爱奇艺会员多少钱一年最便宜的解答. 1.如果只是单独购买爱奇艺会员,黄金会员最低98元/年,白金会员最低248元/年 ...

  4. 爱奇艺会员怎么买便宜,爱奇艺会员最划算的购买方法

    很多用户都喜欢用爱奇艺来看电影电视剧,但是不知道爱奇艺会员怎么买便宜,下面办公人导航就和大家分享爱奇艺会员最划算最便宜的购买方法. 爱奇艺会员最划算的购买方法就是通过其官方的优惠活动链接进入购买. 1 ...

  5. 爱奇艺会员哪里买便宜,什么时候最便宜

    很多同学不知道爱奇艺会员哪里买便宜,什么时候最便宜.喜欢追剧看影视的朋友都会选择开通影视网站的会员,其中爱奇艺是选择比较多的一个,下面就和大家分享爱奇艺会员哪里买便宜,什么时候买最便宜. 1.购买爱奇 ...

  6. [经验教程]一个爱奇艺VIP会员帐号怎么共享给多个朋友家人使用同一个爱奇艺会员账号?

    爱奇艺VIP会员开通后又不能一直自己使用,在空闲时间就比较浪费.开通一个爱奇艺VIP会员账号怎么共享给多人(例如:爱人.家人.朋友)使用同一个爱奇艺会员账号享受VIP会员特权.虽然能够给爱人.家人.朋 ...

  7. 怎样取消连续包月自动续费_手机爱奇艺会员怎么取消自动续费 VIP关闭解除自动续费方法...

    爱奇艺会员办理提供了自动续费的功能,意思是会员快到期的话,就会自动付费继续开通,这样的操作给了一部分用户带来了便利,无需在刻意留意到期时间进行续费,不过也有很多小伙伴觉得不好,因为可能到期就不用了,这 ...

  8. 云原生时代微服务的高可用架构设计

    简介: 在8月20日"阿里巴巴技术质量精品课"上,来自蚂蚁的经国分享了对云原生时代微服务的高可用架构设计的全面解析,为大家介绍了应用架构演进路径.云原生时代的技术福利.高可用架构的 ...

  9. 可用性高达5个9!支付系统高可用架构设计实战

    可用性高达5个9!支付系统高可用架构设计实战 一.背景 对于互联网应用和企业大型应用而言,多数都尽可能地要求做到7*24小时不间断运行,而要做到完全不间断运行可以说"难于上青天". ...

最新文章

  1. 长篇自动驾驶技术综述论文(上)
  2. 使用DDMS中的内存监测工具Heap来优化内存
  3. Codeforces Round #636 (Div. 3) F. Restore the Permutation by Sorted Segments 思维 + 暴力
  4. 【引用】Json 定义与操作
  5. MyEclipse 6.5GA 下载 + 汉化方法
  6. 被坑的过来人告诉你,为什么数据中台永远都搞不成?
  7. linux下mysql用户_linux下mysql用户管理方法
  8. 关于extern的使用
  9. 浏览器文件服务器计算器设置,【魅蓝 U20使用总结】界面|浏览器|计算器|设置_摘要频道_什么值得买...
  10. python车辆型号识别_python获取服务器的厂商和型号信息
  11. JUCE框架教程(4)—— Slider Class入门
  12. vscode 初始化HTML结构
  13. 7-1 大師と仙人との奇遇 (20 分)
  14. 【模拟电子技术Analog Electronics Technology 22】—— 负反馈放大电路的稳定、自激振荡现象的产生,分析
  15. 4054原厂LTH7R座充充电管理IC
  16. Cosmos 与 PolkaDot 互解
  17. 她是中国的计算机女神!中国首台自主设计计算机的缔造者——夏培肃 (下)
  18. 微信公众号通过图片选取接口上传到阿里oss
  19. mLife Forum | 微生物组和数据挖掘
  20. 计算机在化工专业的应用PPT,计算机在化工中的应用课件

热门文章

  1. 茅台集团黔茅酒产品介绍
  2. append()函数的用法
  3. 自己动手编写一个简单的U盘杀毒程序
  4. Java实现简单图片浏览
  5. 部门销售总结汇报PPT模板
  6. git cherry-pick is a merge but no -m option was given.
  7. sws_scale 解释
  8. 【软件相关】如何用PS调整图片的亮度
  9. 反种族主义者是错误的共同种族差异问题
  10. idea如何使用git关联远程仓库