HAM(High Availability Manager)是HDS在2009年正式发布的VSP存储第一代双活存储特性。HAM使主机将一对镜像LUN当成单个LUN,管理镜像LUN的主从关系并在需要时进行主从切换以保证该LUN对应用始终可用,采用多路径(HDLM)切换、阵列间同步复制(TrueCopy)和第三方仲裁阵列来实现。

TrueCopy同步远程复制对含主、从两个LUN,主LUN称为Pvol,从LUN成为SvolHAM把两个VSP阵列间的Pvol和Svol虚拟化为一个LUN(Pvol和Svol的LUN ID、WWN、SNr等属性均一致),然后映射给主机。对于一个同时连接到VSP主从阵列上的主机,其与PVOL即主阵列相连的路径为主路径MCU(Main Control Unit),其路径状态为可读写Owner Path,其与SVOL即从阵列相连的路径为备用路径RCU,其路径状态为不可写Non-Owner Path。

正常状态下应用的IO通过Owner Path下发给Pvol。当主阵列或链路故障导致Pvol不可访问时,HAM检测后首先进行主从切换,将原来的Svol升级为可写状态,Non-Owner Path升级为Owner Path,主机端多路径软件即可将应用IO通过新的Owner Path下发给Svol保证业务连续。

HAM双活技术使得两台存储是工作在Active Passive模式下,不支持阵列两端双写,也不支持NAS双活,所以HDS推出Global Active Device(GAD)存储Active Active双活特性,并配合HNAS实现NAS双活

GAD从原理来说也是通过两个阵列组成一个集群,对其中的双活卷实现两个数据中心同时读写,数据通过VSP G1000的同步复制技术TrueCopy(通过复制、同步技术保持两边设备是完全一致)。为了防止脑裂,采用锁盘(Quorum)机制,每个存储支持32个仲裁盘,当心跳不通的时候,仲裁成功的站点就对外继续提供服务。

HDS首先在高端存储VSP G1000上支持,后来采用SVOS统一了高中端平台后,GAD在G200,G400,G600和G800上都得到了支持,在2016年10月发布G1500和F1500支持GAD,更新可以通过服务器本地磁盘做仲裁。

GAD采用Active Active架构,支持主从阵列同时读写,所有IO写操作都是先写主LUN后写从LUN,配置原厂HDLM多路径,可以支持本地优先读写策略,主从站点支持100KM距离,支持FC/IP复制链路,支持8条物理路径和阵列主机交叉组网

HDS在一台物理存储内允许用户按照业务和应用的要求定义多个Virtual Storage Machine(VSM),VSM与一台存储类似,具备自己的存储ID,设备序列号和端口WWN,通过VSM的定义,能够有效提高存储资源利用率,并实现最大的架构、业务的灵活性。GAD是利用VSP的虚拟控制器功能来实现VSP G1000的水平扩展和设备双活,最大支持8个VSM,但可以支持63231对双活的GAD卷

HDS GAD技术是通过设置SVM的方式使两台存储使用相同的虚拟序列号SN让主机把两台物理存储(可能包含多个SVM)看成一台存储。在一台物理存储内允许用户按照业务和应用的要求定义多个VSM。GAD是利用VSP的VSM功能来实现VSP G1000的扩展和设备双活能力,主卷(Pvol)和从卷(Svol)的LDEV 编号是一样的

主机识别LUN是通过虚拟序列号SN来识别,VDKC是VSP G1000上虚拟出来的一个虚拟控制器,它可以将多台存储底层的物理控制器虚拟成同一个控制器,这样主机通过虚拟控制器访问后端磁盘资源时,始终和一个控制器ID交互,无论后台存储如何变化主机都不会有感知,从而实现了双活等特性。

HDS GAD基于微码实现双活,主机、交换机、存储整个I/O路径不需新增任何设备。HDS GAD技术在主机写I/O过程中不会增加任何的多余步骤,实现方式就是增强的同步复制技术TrueCopy,两边写I/O完成后才返回给主机,全程确保数据完整性,两台主机同时写同一个存储块时,HDS会对写存储块加锁,保证数据的一致性

GAD的组网相对比较灵活,单机双阵列组网是用在数据中心内,只能实现存储层的双活能力,服务器主机是单点,只能防止存储故障,这种组网方式常用在不支持集群的应用中。

双机双阵列组网是比较常见的组网方式,这种组网需要服务器安装集群软件,来实现业务的切换。这种组网在存储层和应用计算层都可以实现业务双活。

交叉组网类似于双机双阵列组网方式,但在网络层实现了交叉冗余,这种方式是推荐的组网方式,也就是服务器都可以看到所有的存储,服务器同时采用集群软件和多路径软件来完成故障的切换,切换的方式更加合理,比如存储故障,服务器集群可以不切换,只需要多路径软件切换存储就可以了。

分布式集群和双活方案都需要仲裁机制防止脑裂,保证心跳故障后,整个集群系统能对外提供数据一致性存储服务。目前,仲裁的实现方式有下面几种。

  • 1、优先级站点方式。这种方式最简单,在没有第三方站点的情况下使用,从两个站点中选一个优先站点,发生脑裂后优先站点仲裁成功。但如集群果发生脑裂后,优先站点也发生故障,就是导致业务中断,因此这种方案并非推荐的方案。

  • 2、软件仲裁方式。这种方式应用比较普遍,采用专门的仲裁软件来实现,仲裁软件放在第三站点,可以跑在物理服务器或VM上,甚至可以部署到公有云上,PureStorage的ActiveCluster就把仲裁软件以OVF文件部署在公有云上。

  • 3、阵列仲裁盘方式。这种方式是在第三站点采用另外一台阵列创建仲裁盘。这种方式稳定性,可靠性比较高。GAD的仲裁机制原理是采用仲裁盘的方式实现。

HDS通过HNAS网关配合GAD支持NAS双活,NAS双活依赖SAN双活,HNAS目前支持2节点集群绑定GAD组成拉远的Active Passive双活,数据读写在主端完成,但是从端也可以通过配置Cache实现IO读取操作。整个HNAS文件系统数据保存在GAD双活设备上,HANS节点的主要工作是完成站点间元数据、状态和控制数据同步。


NAS集群数据复制链路采用10GE,复制链路和心跳、管理网络分离。NAS仲裁基于GE网络并采用仲裁服务器模式,SAN仲裁采用仲裁磁盘,SAN和NAS采用独立的两套仲裁系统。

  HNAS节点1和节点2组成了一个Stretched的集群,服务器NAS客户端的写IO首先写入节点1(主节点)的NVRAM中,并通过复制镜像到从端节点2的NVRAM中,然后返回客户端,完成写IO。通过时间策略,节点1将把NVRAM中的数据周期性的刷写到GAD SAN存储双活卷中,HNAS多路径支持优先选择PVOL卷下盘,GAD通过双活特性同步到从端的VSP设备中。

得益于HDS VSP存储自身特性,在存储Pool比较闲的时候,可以实现HDD降速(Spin Down)或休眠(Sleep)节省电力成本。支持接管异构第三方阵列并实现GAD双活。但是针对NAS双活,两站点间HNAS节点跟GAD采用独立的复制链路、心跳和管理网络,在管理上可能会有些复杂,故障处理也会比较复杂。

温馨提示:
请搜索“ICT_Architect”或“扫一扫”下面二维码关注公众号,获取更多精彩内容。

听说点赞和分享的朋友都已走上人生巅峰

深入剖析HAM/GAD双活数据中心存储方案相关推荐

  1. Oracle 远程 RAC 打造双活数据中心 | 从容灾迈向双活案例分享

    我们都知道,容灾系统是指在相隔较远的异地,建立两套或多套功能相同的 IT 系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如停电.UPS 故障.空调故障.火灾.地震等)停止工作时,整个 ...

  2. 从IT应用架构角度,畅谈双活数据中心容灾解决方案

    本文根据朱祥磊老师在[5月6日DBAplus社群济南数据库技术沙龙]现场演讲内容整理而成. 讲师介绍:朱祥磊 运营商系统架构师 负责业务支撑系统架构规划和建设.获国家级创新奖1项.通信行业级科技进步奖 ...

  3. 华为云计算IE面试笔记-请描述华为容灾解决方案全景图,并解释双活数据中心需要从哪些角度着手考虑双活设计

    容灾全景图: 按照距离划分:分为本地容灾 同城容灾 异地容灾  本地容灾包括本地高可用和本地主备.(本数据中心的两机房.机柜) 本地高可用这个方案为了保持业务的连续性,从两个层面来考虑: ①一个是从主 ...

  4. 渤海银行双活数据中心建设值得中小银行借鉴

    日前,渤海银行同城双活数据中心正式建成并投入运行,目前运营情况稳定.该双活中心的基础架构和重要信息系统的双活运行为渤海银行建立了一整套技术平台的新机制,为缓解基础平台异常风险.应对重大突发灾难提供了有 ...

  5. 云计算和大数据时代网络技术揭秘(八)数据中心存储FCoE

    数据中心存储演化--FCoE   数据中心三大基础:主机 网络 存储 在云计算推动下,存储基础架构在发生演变 传统存储结构DAS.SAN在发展中遇到了布线复杂.能耗增多的缺点(原生性),需要对架构做根 ...

  6. 双活数据中心对企业的帮助

    灾难是一种具有破坏性的突发事件,会对企业的正常运营和社会的正常秩序造成影响,最明显的影响是信息服务的中断和岩机,致使企业无法正常运营,出于灾备的考虑,一些企业一般都会建设2个或者多个数据中心,一个是主 ...

  7. 银行业双活数据中心-F5在双活数据中心中的应用

    随着移动互联.云计算及大数据等新技术与应用的飞速增长,金融机构对于数据中心的依赖程度也在日益加强,7*24全天业务连续运营已经成为核心关键业务的最基本需求之一.同时随着国家法规的不断健全,同城灾备.两 ...

  8. 数据中心存储解决方案市场将迎来快速增长

    数据中心存储解决方案主要用于管理数据中心内的所有资源.该解决方案包括硬盘驱动器.备份管理软件和网络技术.此外,还包括管理数据存储和检索整个过程的存储策略和过程. 发展中国家中智慧城市项目的建设不断增加 ...

  9. 同城容灾、异地容灾、 双活 数据中心、 两地三中心的区别

    常见的 容灾 模式可分为同城容灾.异地容灾. 双活 数据中心. 两地 三中心几种. 1. 同城 容灾 同城 容灾 是在同城或相近区域内 ( ≤ 200K M )建立两个数据中心 : 一个为数据中心,负 ...

最新文章

  1. 阿里云前端周刊 - 第 39 期
  2. angularjs ngTable -Custom filter template-calendar
  3. 【leetcode】
  4. C语言文件操作 fopen, fclose, mkdir(打开关闭文件,建文件夹,判断文件是否存在可读或可写)
  5. Android studio使用手册说明
  6. CADFANS2012网站源码
  7. 武汉大学 RSIDEA 团队开源LoveDA:可同时推进语义分割和迁移学习
  8. CVPR 2019|手写签名认证的逆鉴别网络
  9. java执行 scp_Java执行SSH/SCP之JSch
  10. 操作系统学习笔记:文件系统接口
  11. 文字表情 emoji 解析大全
  12. 用Python做一个连连看游戏辅助脚本,完整编程思路分享
  13. Spring Cloud版本说明
  14. Prisma note
  15. 研究生综合英语unit4 前四段
  16. 某工厂配电线路及变电所设计
  17. Python 四舍六入五成双
  18. 【MATLAB项目实战】基于RGB特征的火焰检测
  19. div vue 图片背景_div设置背景(vue设置div的背景图片)
  20. python ogr_解决python ogr shp字段写入中文乱码的问题

热门文章

  1. 贵港市高中2021高考成绩查询,2021贵港最新高中排名前十
  2. 【AHOI2002】哈利●波特与魔法石
  3. springboot模板整合(四)邮箱验证
  4. 【转】3-4岁幼儿生理心理发展特点
  5. 基于 wemos d1 智能感应开盖垃圾桶
  6. 祝您新春快乐!AVAL GLOBAL
  7. 数据结构考研学习笔记
  8. 高通开发系列 - System之分区调整增删快速格式化和挂载等
  9. [Servlet 1] JSP基础知识
  10. fieldset 标签样式自定义