华为FusionSphere中有两个HA的概念,分别是主机组​​(Host Aggregate)​​​和高可用​​(Highly Available)​​。

一、Host Aggregate

​FusionSphere​​​可以在​​CPS​​​和​​OM​​​上配置主机组,但这两个系统的主机组不是同一个概念,这里主要是以​​OM​​上配置的主机组作为讲解。

  • CPS上的主机组:主要用于统一配置。即假设DC内有100台主机,需要配置相同的磁盘分区、物理网络、资源隔离等信息时,可以将这100台主机分配在同一个主机组上进行统一配置。​

  • OM上的主机组:主要用于资源隔离。与​​CPS​​上的主机组无关。在​​OM​​上可以将这100台主机划分成多个主机组进行使用。

概念:主机组,指的是多个相同配置的主机组成的集合。一个主机组包含多台主机,一台主机也可以加入多个主机组,在生产环境中,一般一台主机只属于一个主机组。作用

  • 隔离
  • 资源隔离:通过不同的主机组标签标识不同的主机,实现资源隔离。
  • 物理隔离:不同机房/机架的主机分别组成不同的主机组,实现隔离。

tips:当一个主机组存在不同配置的主机(硬件或配置)虚拟机迁移/HA可能会失败。

二、Highly Available

华为虚拟机的高可用机制称为HA,同样的机制在诺基亚平台遵循了​​OpenStack​​​的叫法,称为​​疏散机制​​。实现虚拟机高可用的方式有:软件狗机制、虚拟机本地HA、虚拟机异地HA。

1、软件狗机制

1.1 概述

华为​​FusionSphere​​​有两种软件狗,分别是​​IPMI软件狗​​​和​​I6300软件狗​​。这两种软件狗的具体实现不一样,但都为虚拟机提供一种心跳检测机制,用于监视VM内部系统的健康状态。

直白的说,​​FusionSphere​​​的软件狗就是通过qemu模拟一个软件狗设备挂载到虚拟机内部(如​​/dev/ipmi0​​),虚拟机需要有程序定时对软件狗设备进行写入(这个过程也称为喂狗),通过设置预订的超时时间,给用户提供感知虚拟机的机制。

软件狗服务器通过不断向​​FusionSphere​​​平台发送心跳信息来表明其正常运行,当虚拟机OS内部发生卡死等故障后,​​FusionSphere​​平台在用户设定的时间内如果没有收到来自软件狗服务的心跳消息,会根据用户设置的策略自动进行操作(告警、重启等)。

如果IPMI软件狗和I6300软件狗同时开启,只有I6300软件狗会生效,即I6300软件狗的优先级高于IPMI软件狗。

以公共的​​I6300​​​软件狗为例,该软件狗策略有三种,分别是空、​​none​​​和​​reset​​:

  • 空:标识不开启6300软件狗
  • none:软件狗超时后,上报告警。
  • reset:软件狗超时后,上报告警,并重启虚拟机。

1.2  配置

IPMI软件狗配置
1)全局配置:CPS > 配置 > OpenStack > Nova ,"IPMI软件狗开关"
2)多网元管理: CPS > 配置 > 多网元管理 > 主机组 > Nova,"IPMI软件狗开关"
3)单个虚拟机设置:

# 设置nova meta <虚拟机ID> set __instance_vwatchdog=False/True# 硬重启生效nova reboot --hard <虚拟机ID>

I6300软件狗配置
1)全局配置:CPS > 配置 > OpenStack > Nova,“I6300 ESB软件狗策略预超时时间”和“I6300 ESB软件狗启动故障计时超时时间”
2)镜像配置:注册镜像时,有“I6300 ESB软件狗策略”参数,可以设置为空、none和reset。
3)Flovor:有参数控制VM的开关和配置
4)单个虚拟机设置:

# 设置nova meta <虚拟机ID> set hw_watchdog_action=disable/none/reset# 硬重启生效nova reboot --hard <虚拟机ID>

tips:
1、I6300配置生效优先级:单个虚拟机 > 镜像 > 规格 > 全局
2、IPMI配置优先级:单个虚拟机 > 多网元主机组 > 全局

2、Highly Available

虚拟机HA机制可以在虚拟机出现异常时进行复位来恢复虚拟机;通过虚拟机本地自愈和异地重建功能,可以使虚拟机在自身出现故障或者物理节点出现故障时,自动进行恢复,提高虚拟机可用度,降低人工维护成本,缩短业务中断影响,有效提升虚拟机的可用性。

无论是本地HA还是异地HA,都是通过重新拉起虚拟机实现:

  • 本地HA:在本机重新挂载故障虚拟机的磁盘等资源,拉起虚拟机,虚拟机OS内数据不会丢失。
  • 异地HA:在其它满足条件的主机挂载故障虚拟机的磁盘等资源,拉起虚拟机,虚拟机OS内数据不会丢失。

Tips:
1、值得注意的是,虚拟机HA过程中,虚拟机服务是不可用的。
2、本地盘虚拟机异地HA:磁盘会被重置,即是一台新虚拟机。

FusionSphere在以下两种场景会出发虚拟机HA流程:

  • 主机异常:主机管理面断连时,主机会处于异常状态,这时候会触发虚拟机HA流程
  • 如果配置了探测VLAN,FusionSphere会通过探测平面去探测虚拟机的电源状态是否为running,如果为running,则终止HA流程。
  • 如果配置了防脑裂,则会检测防脑裂是否通过,不通过则终止HA流程
  • 开始异地HA,如失败,开始尝试本地HA,再失败,会继续尝试异地HA
  • 虚拟机ERROR
  • 如果配置了防脑裂,则会检测防脑裂是否通过,不通过则终止HA流程
  • 开始异地HA,如失败,开始尝试本地HA,再失败,会继续尝试异地HA

Tips:开始HA流程不一定就会进行HA,当所有的流程条件都满足时才会进行HA

虚拟机不支持HA的情况:
1、HA开关关闭:​​​nova-api​​​配置了​​ha_enable=False​​​2、处于删除态的虚拟机不会触发HA
3、指定主机创建的虚拟机不会触发HA
4、虚拟机所在的主机配置了​​ha_enable=False​​标签
5、虚拟机所在主机组配置了​​__ha_enable=False​​标签
6、虚拟机meta配置了​​_ha_policy_type=colse​​7、使用直通盘、挂载了ISO等特殊类型虚拟机
8、虚拟机所在主机设置了​​reserve​​标签


我是运维少年,欢迎关注我的同名公众号~

此HA非彼HA!FusionSphere这两种HA你分清楚了吗?相关推荐

  1. matlab函数输出语句,matlab两种输出语句分别是什么

    matlab两种输出语句分别是什么 发布时间:2021-02-26 14:21:27 来源:亿速云 阅读:79 作者:小新 这篇文章主要介绍了matlab两种输出语句分别是什么,具有一定借鉴价值,感兴 ...

  2. 【王道思维扩展1】求解斐波那契数列的递归和非递归算法,并分析两种时间复杂度

    1.斐波那契数列 2.递归与非递归的实现 1).递归 时间复杂度O(2^N) #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #incl ...

  3. python关系表达式的结果只有两种值、分别是_关系表达式的结果只有两种值,分别是____和____。...

    [判断题]当盾尾油脂密封在手动位时,不能按下每个位置的注脂按钮来进行手动注脂.( ) [简答题]What is trust? [填空题]Python语言中的运算符有三种,分别是____.____和__ ...

  4. 新概念英语的MP3下载(英音和美音两种版本,分课下载)

    新概念英音版1-2册 | 英音版3-4册 | 新概念美音版第1-2册 | 美音版第1-2册 | 返回首页 新概念美音版第三册 lesson 1 lesson 2 lesson 3 lesson 4 l ...

  5. “斐波那契数列”的两种算法

    "斐波那契数列"的两种算法 斐波那契数列有个规律:从第三个数开始,每个数是前两个数之和,比如: 1 1 2 3 5 8 13 21 34 55...... 现在通过两种方式(递归与 ...

  6. 音频信号输入itc服务器,音频信号的两种传输方式,你知多少?

    原标题:音频信号的两种传输方式,你知多少? 前 言 音频信号有两种传输方式,即平衡式(XLR)与非平衡式(RCA).关于两种传输模式究竟孰优孰劣,这个问题长久以来都有争论.萝卜青菜各有所爱,今天我们就 ...

  7. java 匿名list,java创造匿名对象的两种方法

    在java中有时候需要一些匿名对象的使用.可能有些小伙伴拿还不会创造,其实我们在学习一些方法时都或多或少的接触过.本篇所要讲到的创造匿名对象总结了两种方法,分别是静态工具方法和Lambda表达式,我们 ...

  8. 两种ICP的改进算法:PLICP与NICP

    前言 在之前的文章中(ICP方法详细推导),我们介绍了ICP的基本思想与详细的推导.本文将介绍ICP方法的两种改进,分别是:PLICP[1]与NICP[2].本文将分别介绍两种改进的基本思想,具体算法 ...

  9. Oracle 的两种工作模式Dedicated Server 和 Shared Server

    Oracle可以分成两种工作模式, 分别是 Dedicated Server 和 Shared Server                   1  Dedicated Server         ...

最新文章

  1. Spring Cloud云架构 - SSO单点登录之OAuth2.0登录流程(2)
  2. 某学校学生在计算机等级水平测试中,提高中职学校计算机等级考试(一级)通过率的教学策略研究...
  3. Linux中shell模块的考试,linux下的shell编程要考试了题目这里有可是表示不会 求帮忙...
  4. react中实现异步请求的方法一,react-thunk
  5. 怎样将GIS图形复制到Windows剪贴板,粘贴到Word中
  6. python 笔记数据类型
  7. 对象数组 —— 学生信息表
  8. Android 反编译指南
  9. Tbase基础积累一
  10. 7个最佳博客名称生成器,可帮助您找到好的博客名称提示
  11. 适合前端新手的十大网站
  12. APISpace 迎国庆
  13. 一个JAVA学习者应该具备的素质
  14. 隐马尔科夫模型 HMM 与 语音识别 speech recognition (1):名词解释
  15. 算法小讲堂之哈希表|散列表|考研笔记
  16. Android开发工具类集合
  17. Android逆向之去除APK中的广告
  18. RFID标签、读卡器、终端、接口的概念
  19. 两个人如何共享一个记账本收入支出明细
  20. Logstash的简单使用

热门文章

  1. pyhton控制手机截图和操作
  2. android简单计时器源码,Android 实现一个计时器
  3. 计算机在电影特技中的应用,数字视频特技在影视制作中的应用
  4. 元宇宙游戏救不了中国游戏公司
  5. Mac OS X 键盘标志、快捷键、开关机操作键、抓图工具
  6. 使用JavaScript语言配合开发者工具获取B站关注或粉丝的详细信息
  7. Echarts横坐标鼠标点击事件
  8. (转载)Python 应用发布技术
  9. 树莓派配置热点(即设置wifi)
  10. 缩水u盘如何制作u盘启动盘?