什么是IBM Power Systems的地理分散弹性?

IBM®Power Systems™的地理分散弹性是一种创新的灾难恢复(DR)解决方案,于2016年发布,它为在IBMPOWER7®或IBM POWER8上运行的虚拟机(VM)的两个站点提供了简化且易于部署的灾难恢复解决方案。 ®基于处理器的服务器。 地理分散的弹性类似于VMware Site Recovery Manager和IBM zSystems®的IBMGDPS®解决方案,并且是GDPS灾难恢复解决方案系列的一部分。 由于应用程序和服务的灾难恢复是提供业务连续性的关键组件,因此IBM地理分散弹性解决方案可帮助客户在故障期间进行自动化的灾难恢复流程。

您可以在以下IBM developerWorks Wiki文档中了解有关Power Systems的地理分散弹性的更多信息: 为什么GDR是Power Systems和FAQ 的理想DR解决方案 。

控制系统(KSYS)是地理分散弹性解决方案的基本组件。 KSYS处理发现,监视,通知,恢复和验证方面。

初始配置完成后,KSYS节点将在活动站点和备份站点中发现所有由硬件管理控制台(HMC)管理的主机,并显示状态。 发现期间,KSYS节点监视选定站点内所有托管主机中所有逻辑分区(LPAR)或VM的发现。 KSYS节点收集每个LPAR的配置信息并显示状态。 KSYS节点发现每个VM的磁盘,并检查当前是否为存储设备镜像配置了VM。

站点发现完成后,KSYS节点将从HMC中获取信息,以检查备份站点在灾难期间是否能够托管VM。 KSYS节点还验证与存储复制相关的详细信息。

地理分散弹性解决方案支持计划内和计划外的灾难恢复方法。

  • 计划的灾难恢复 :在计划的移动中,当没有灾难事件且生产站点中的资源可以正常关闭时,管理员将启动移动。 启动这些类型的操作主要是为了执行DR测试演练,从一个站点移动到另一个站点,或者当其中一个站点需要脱机进行维护时。 在计划的迁移中,自动清理将由称为KSYS节点的控制器系统进行处理。
  • 计划外灾难恢复 :在计划外场景中,每当发生故障或自然灾害时,都会向管理员通知发生故障的灾难事件。 根据情况,管理员可以启动计划外的移动。 在计划外的迁移过程中,所有虚拟机都将突然关闭,并且生产站点上的虚拟机清理将不会由KSYS处理。 在这种情况下,管理员必须手动清理虚拟机。

本文中使用的关键术语

请参考下表以了解本文中使用的关键术语。

术语 描述
网站1 是在特定时间运行工作负载的生产站点(例如,印度)
网站2 是备份站点,在特定时间充当工作负载的备份(例如,奥斯汀)
HMC 1_1 是站点1上的HMC
HMC 2_1 是站点2上的HMC
主机1_1 是站点1上的受管系统(主机/ CPC)
主机2_1 是站点2上的受管系统(主机/ CPC)
VIOS 1_1 是站点1上的主要VIOS
VIOS 1_2 是站点1上的冗余VIOS
VIOS 2_1 是站点2上的VIOS
虚拟机1 是虚拟机
中央处理器组合(CPC) 是硬件的物理集合,由主存储器,一个或多个中央处理器,计时器和通道组成
CG 是存储阵列中基本卷的集合
知识系统 是一个控制系统,可为整个分散的电源系统弹性解决方案管理的整个环境提供单点控制

注意:我们使用EMC公司的VMAX存储和Symmetrix远程数据工具(SRDF)复制来演示本文。

问题陈述

最佳实践是,通常在生产环境中部署具有双虚拟I / O服务器(VIOS)配置的多路径,以实现冗余,更好的性能和维护VIOS的灵活性。 在这样的配置中,每个VM都有一个虚拟的光纤通道(FC)适配器,该适配器映射到每个VIOS。 通过多路径I / O,VM可以使用两条不同的路径访问存储磁盘,每条路径均由单独的VIOS提供。 但是,由于任何资源限制,可能无法始终部署双重VIOS配置。 在这种情况下,请考虑以下情况:主站点上的主机具有双重VIOS设置,而备份站点上的主机具有单一VIOS设置,如图1所示。

图1.具有两个VIOS的生产站点和具有单个VIOS的备份站点

图1中描述的环境在DR操作期间导致以下问题:

问题 。 在“地理分散的弹性”解决方案的验证阶段,KSYS管理器验证活动站点和备份站点上的主机是否具有相同的配置。 在这种环境下,由于VIOS配置不匹配,DR操作失败。

但是,如果在虚拟机的备份站点使用lose_vios_redundancy属性(本文稍后进行了说明)以单个VIOS配置启动虚拟机,并且稍后在将虚拟机移回活动站点时,在主站点lose_vios_redundancy丢失双VIOS配置。

使用Loss_vios_redundancy选项的地理分散弹性

ksysmgr命令提供了lose_vios_redundancy属性,以允许从源站点进行双重VIOS设置的VM恢复备份站点上仅具有单个VIOS实例的VM。 默认情况下,此属性设置为no ,这意味着在灾难恢复到备份站点期间会维护双VIOS设置。

该属性的值应设置为yes,以在备份站点由单个VIOS实例组成时允许DR操作,如图1所示。

# ksysmgr modify system lose_vios_redundancy=yes

在成功完成从站点1到站点2的灾难恢复操作之后,将lose_vios_redundancy选项设置为yes,在站点2上,VM1的路径将映射到单个VIOS 2_1,如图2所示。

图2.从站点1到站点2的灾难恢复之后的路径映射

站点1恢复后,假设从站点2到站点1发起了DR操作。成功进行DR操作后,与站点2相似的VIOS配置将保留在站点1。即,VM1的路径将通过VIOS 1_1或VIOS 1_2进行映射,如图3所示。

图3.从站点2到站点1进行灾难恢复之后可能的路径映射

这表明,即使将VM1移回站点1,站点1的初始配置(即具有双重VIOS配置功能的多路径)也会丢失。这是本文讨论的问题。 这可能与生产环境有关。 因此,在本文中,我们提供了一种解决方案,可在灾难恢复操作后使用双VIOS保留多路径的原始配置。

在灾难恢复之后使用双VIOS配置保留多路径的过程

本节提供解决方案摘要的高级详细信息,以解决本文介绍的问题:

  • 使用lose_vios_redundancy属性为DR操作做准备,以允许来自源站点的双VIOS设置中的VM恢复备份站点中仅具有单个VIOS实例的VM。
  • 从站点1到站点2执行计划外的DR操作。这有助于避免在站点1上自动清除双重VIOS配置。
  • 而不是从站点2到站点1进行DR操作,而是重新同步活动站点一致性组,修改配置参数,反转EMC磁盘镜像并激活站点1上的VM1配置文件。

注意 :建议不要在DR之后(即在站点2上)执行任何配置更改。 因为我们正在激活保存在生产站点(即站点1)上的VM配置文件。

在站点1具有双VIOS配置设置的VM

运行以下命令,检查VM1的路径信息(请参见图4)。

#hostname#uname -L#lscfg -vpl fcs0 | grep "Hardware location code"#lscfg -vpl fcs1 | grep "Hardware location code"#lspath | grep hdisk0
图4. VM从双VIOS访问SAN磁盘

在VIOS 1_1和VIOS 1_2上的lsmap -all -npiv命令的输出显示,VM具有所需的映射,以分别具有来自每个VIOS的路径(请参见图5和图6)。

图5. VIOS 1_1上的虚拟FC映射
图6. VIOS 1_2上的虚拟FC映射

使用losy_vios_redundancy属性(值为yes)准备DR操作

您需要执行以下步骤,以使用值为yeslose_vios_redundancy属性为灾难恢复操作做准备:

  1. 创建一个集群,并使用以下命令向其添加KSYS节点。

    # ksysmgr add ksyscluster <cluster name> ksysnodes=<node name>

    将CPC /主机,HMC和存储代理添加到两个站点。 配对两个每次点击费用。

    有关ksyscluster更多信息,请参阅集群创建的详细步骤 。

    图7.在KSYS上联机集群
  2. 使用以下命令在站点1(例如,印度)上启动发现:
    # ksysmgr -t discover site India
    图8.印度站点上的发现
  3. 使用以下命令将lose_vios_redundancy属性修改为yes。
    # ksysmgr modify system lose_vios_redundancy=yes
    图9.将lost_vios_redundancy属性设置为yes
  4. 使用以下命令启动灾难恢复之前,请在站点上执行验证检查。
    # ksysmgr -t verify site India
    图10. KSYS节点上的验证过程
  5. 使用以下命令在灾难恢复之后检查站点详细信息。
    #ksysmgr q site
    图11.活动和备份站点详细信息

    使用以下命令检查站点ID。

    #lsrsrc IBM.VMR_SITE
    图12.两个站点的站点ID

    使用以下命令检查IBM.VMR_SITE类属性(即ActiveSiteID )。

    #lsrsrc -c IBM.VMR_SITE | grep ActiveSiteID
    图13.活动站点ID

启动计划外的VM从站点1到站点2的迁移

需要执行以下步骤来启动计划外的VM从站点1迁移到站点2:

  1. 使用以下命令调用从活动站点到备份站点的计划外迁移,以避免自动清理站点1。

    #ksysmgr move site from=India to=Austin dr_type=unplanned
    图14.从站点1到站点2的意外迁移
  2. 确认DR操作是否成功。
    1. 确保在站点1上保留了VIOS配置。

      灾难恢复后,站点1上HMC 1_1上的VM1处于未激活状态。 不会在计划外的DR中删除配置文件信息,因此,将保留VIOS配置。

      图15. HMC 1_1上的VM状态
    2. 验证站点2的灾难恢复操作是否成功。

      进行灾难恢复后, 站点2的 HMC 2_1上的VM1处于“ 运行”状态。

      图16. HMC 2_1上的VM状态
    3. 运行以下命令以确认VM在灾难恢复之后具有双路径配置。
      #lspath | grep hdisk0
      图17. DR之后,VM1上的双路径磁盘
    4. 确保在灾难恢复之后磁盘正在获得多路径。

      在VIOS2_1上, # lsmap -all -npiv命令的输出确认VM1具有来自VIOS2_1的所有路径。

      图18.当前活动站点(例如,Austin)上的虚拟光纤通道适配器映射
    5. 在灾难恢复之后检查活动站点ID。
      图19. DR之后,活动站点ID更改为“ 2”
      图20. DR之后的活动站点和备份站点
    6. 执行以下命令,查看灾难恢复后一致性组的状态。
      # /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail

      -cg指一致性组名称。

      图21. DR之后的一致性组状态
  3. DR之后,一致性组状态将为Failed over 。 在KSYS节点上,重新同步活动站点一致性组(在此示例中为VMRDG_cluster1_Austin ),以将状态更改为Consistent

    使用以下命令重新同步一致性组。

    # /opt/IBM/ksys/storages/EMC/resync_emc_srdf_cg -s 196800573 -e <any string> -g VMRDG_cluster1_Austin -i 10.40.0.209 -t <any number>-s Active site storage id.-e Eyecatcher.-g CG_Name.-i IP address.-t Thread id.
    图22.重新同步一致性组

    重新同步后,您可以使用以下命令检查一致性组的状态:

    # /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail
    图23.重新同步复制后的一致性组状态

在站点1上保留VM的双VIOS配置的过程

您需要执行以下步骤来保留站点1上VM的双VIOS配置。

  1. 在站点2上停用VM1。

    图24.站点2上VM1的状态
  2. 在KSYS节点上,使用以下命令将EMC复制从当前备份站点(站点2)更改为生产站点(站点1):
    # /opt/IBM/ksys/storages/EMC/reverse_emc_srdf_cg -s 196800508 -e 5EoV6 -gVMRDG_cluster1_India -i 10.40.0.170 -t 892 -m UNPLAN
    图25. CG的反向复制

    在模拟器上反转复制或镜像后,使用以下命令显示一致性组的状态。

    # /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail
    图26.反转复制后的一致性组状态
  3. 将活动站点ID修改为1。要在不使用ksysmgr move命令的情况下启动DR,我们可以使用以下命令将ActiveSiteID修改为1,然后反转镜像路径。 再次进行灾难恢复后,这将保留站点1上的原始配置。
    # chrsrc -c IBM.VMR_SITE ActiveSiteID=1
    图27.将资源属性ActiveSiteID更改为1
  4. 在站点1上激活VM1配置文件。
    图28. HMC 1_1 GUI上站点1上VM1的状态
  5. 在站点2上调用清理。

    以下命令清除站点2上的VM1配置。

    #ksysmgr cleanup site <site name>
    图29.站点2上的清理过程

结论

本文演示了使用生产站点上的双VIOS配置和备份站点上的单VIOS配置执行灾难恢复操作的过程。 它还说明了在生产现场使用双VIOS保留多路径原始配置的过程。


翻译自: https://www.ibm.com/developerworks/aix/library/au-aix-preserving-redundant-vios-configuration/index.html

ibm vios_使用IBM地理分散弹性解决方案在生产现场保留冗余VIOS配置相关推荐

  1. ibm 行业解决方案_使用针对电源系统的IBM地理分散弹性解决方案的灾难恢复即服务(DRaaS)产品...

    什么是IBM Power Systems的地理分散弹性? 灾难恢复和高可用性(HA)解决方案主要基于两种技术:基于集群的技术和基于虚拟机重启的技术. 群集高可用性和灾难恢复解决方案通常会部署冗余的硬件 ...

  2. IBM智慧的云计算——白皮书、行业解决方案资料集

    IBM智慧的云计算--白皮书.行业解决方案资料集 IBM云计算:智慧企业云 桌面云 IBM 智慧企业桌面云,通过更加成本有效的方法对传统的桌面计算机环境进行虚拟化. IBM智慧企业桌面云 存储云 IB ...

  3. ibm tivoli_将IBM Tivoli Directory Integrator密码同步器与Tivoli Identity Manager集成

    ibm tivoli IBM Tivoli Directory Integrator支持跨异构系统的通用和身份数据的同步,转换和迁移. Tivoli Directory Integrator可帮助组织 ...

  4. ibm量子计算机蓝图,IBM 量子技术扩展蓝图

    原标题:IBM 量子技术扩展蓝图 回首 1969年,人类克服了空前的技术障碍,掀开新的历史篇章:载人成功登月并安全返航.现代计算机功能强大,但人类却依旧无法自如地用计算机精确捕捉浩渺宇宙中最为精细的部 ...

  5. 安装和使用IBM PowerVP和IBM AIX

    IBM PowerVP虚拟化性能 IBM的PowerVP工具于2013年11月可用.该工具旨在以增强的可视格式为IBM Power Systems™管理员提供性能信息. 目的是加快对性能瓶颈的识别,以 ...

  6. ibm cloud_使IBM Cloud成为您选择平台的十大理由

    developerWorks发布了许多有关如何使用IBM Cloud服务的技术内容 . 在本文中,我将为您所见过的所有技术内容添加一些变化,并为您选择IBM Cloud作为您选择的云平台的十大理由. ...

  7. js 时间比较_成都js聚合物弹性防水涂料生产厂家来电洽谈_鹏晨防水

    成都js聚合物弹性防水涂料生产厂家来电洽谈,I型属适用于屋面防水因为屋面24h温差大,基层易开裂.所以要用断裂伸长率高弹性好的适应基层开裂性的I型JS涂料,II型适用于卫生间车库地下室等长期有水浸泡水 ...

  8. RFID生产现场管理解决方案产生背景

    2008年中国服装行业面临结构性大洗牌.全球经济环境对出口影响进一步显现,中国内地新劳动合同法实施带来的成本和用工方面的连锁反应,人民币升值压力进一步加大等因素,企业生存环境更加严峻,而服装加工,生产 ...

  9. 智链ChainNova携手IBM推出端到端区块链解决方案

    在食品安全成为全民话题的今天,如何保障粮食安全并提升产粮区农民收入?智链ChainNova和IBM正计划通过构建区块链大农场来解决这一难题. "区块链大农场"不仅仅是国内首个实现区 ...

  10. IBM WebSphere MQ 常见报错码及解决方案

    在IBM WebSphere MQ的使用过程中会遇见的常见报错描述和初步解决方案,希望能帮助各位解决使用中可能存在的问题. 序号 错误编号1 原因 1 2033 可能由于队列为空,取不到值引起的 2 ...

最新文章

  1. 权威解读 | 世界互联网大会蓝皮书
  2. python反转列表不用切片,在Python中反转切片
  3. 迭代Iterator的用法
  4. .net core2.0下Ioc容器Autofac使用
  5. 女孩子狠起来可以多可怕?
  6. java 数据返回类_java返回数据工具类
  7. oc51--循环retain
  8. tensorflow 里metrics_深入理解TensorFlow中的tf.metrics算子
  9. NOSQL schema创建原则
  10. day03 Python爬虫
  11. 报表问题~~只有这么多分了~~~~-_-~
  12. 视觉SLAM十四讲_3-李群和李代数
  13. 微信公众号接入百度机器人
  14. CentOS 7 配置Ruby语言开发环境
  15. 299美元企业级账号申请过程
  16. 名门正派的设计,与歪门邪道的产品
  17. Android(cacerts.bks)添加根证书
  18. CSS属性(一)之outline属性
  19. 中天视听王 未来软件园
  20. 读取excel文件后计算指定行列笛卡儿积并写出

热门文章

  1. 疫情之后的2020长什么样
  2. AssertionError: Invalid device id
  3. 怎么用计算机弹奏忘羡,《忘羡,钢琴谱》魔道祖师 岚之调(五线谱 钢琴曲 指法)-弹吧|蛐蛐钢琴网...
  4. GIS应用技巧之密度分析
  5. 微信开发工具使用git
  6. JavaEE中的依赖性——依赖性注入
  7. ​说了你可能不信,这是一份王者荣耀接口文档
  8. 温故而知新,可以为师矣,学习到的东西不断回顾,往往能够发现自己的不足...
  9. ts 使用infer 推断类型
  10. LeetCode 1296. 划分数组为连续数字的集合