此HA非彼HA!FusionSphere这两种HA你分清楚了吗?
华为FusionSphere中有两个HA的概念,分别是主机组(Host Aggregate)
和高可用(Highly Available)
。
一、Host Aggregate
FusionSphere
可以在CPS
和OM
上配置主机组,但这两个系统的主机组不是同一个概念,这里主要是以OM
上配置的主机组作为讲解。
- CPS上的主机组:主要用于统一配置。即假设DC内有100台主机,需要配置相同的磁盘分区、物理网络、资源隔离等信息时,可以将这100台主机分配在同一个主机组上进行统一配置。
- OM上的主机组:主要用于资源隔离。与
CPS
上的主机组无关。在OM
上可以将这100台主机划分成多个主机组进行使用。
概念:主机组,指的是多个相同配置的主机组成的集合。一个主机组包含多台主机,一台主机也可以加入多个主机组,在生产环境中,一般一台主机只属于一个主机组。作用:
- 隔离
- 资源隔离:通过不同的主机组标签标识不同的主机,实现资源隔离。
- 物理隔离:不同机房/机架的主机分别组成不同的主机组,实现隔离。
tips:当一个主机组存在不同配置的主机(硬件或配置)虚拟机迁移/HA可能会失败。
二、Highly Available
华为虚拟机的高可用机制称为HA,同样的机制在诺基亚平台遵循了OpenStack
的叫法,称为疏散机制
。实现虚拟机高可用的方式有:软件狗机制、虚拟机本地HA、虚拟机异地HA。
1、软件狗机制
1.1 概述
华为FusionSphere
有两种软件狗,分别是IPMI软件狗
和I6300软件狗
。这两种软件狗的具体实现不一样,但都为虚拟机提供一种心跳检测机制,用于监视VM内部系统的健康状态。
直白的说,FusionSphere
的软件狗就是通过qemu模拟一个软件狗设备挂载到虚拟机内部(如/dev/ipmi0
),虚拟机需要有程序定时对软件狗设备进行写入(这个过程也称为喂狗),通过设置预订的超时时间,给用户提供感知虚拟机的机制。
软件狗服务器通过不断向FusionSphere
平台发送心跳信息来表明其正常运行,当虚拟机OS内部发生卡死等故障后,FusionSphere
平台在用户设定的时间内如果没有收到来自软件狗服务的心跳消息,会根据用户设置的策略自动进行操作(告警、重启等)。
如果IPMI软件狗和I6300软件狗同时开启,只有I6300软件狗会生效,即I6300软件狗的优先级高于IPMI软件狗。
以公共的I6300
软件狗为例,该软件狗策略有三种,分别是空、none
和reset
:
- 空:标识不开启6300软件狗
- none:软件狗超时后,上报告警。
- reset:软件狗超时后,上报告警,并重启虚拟机。
1.2 配置
IPMI软件狗配置
1)全局配置:CPS > 配置 > OpenStack > Nova ,"IPMI软件狗开关"
2)多网元管理: CPS > 配置 > 多网元管理 > 主机组 > Nova,"IPMI软件狗开关"
3)单个虚拟机设置:
# 设置nova meta <虚拟机ID> set __instance_vwatchdog=False/True# 硬重启生效nova reboot --hard <虚拟机ID>
I6300软件狗配置
1)全局配置:CPS > 配置 > OpenStack > Nova,“I6300 ESB软件狗策略预超时时间”和“I6300 ESB软件狗启动故障计时超时时间”
2)镜像配置:注册镜像时,有“I6300 ESB软件狗策略”参数,可以设置为空、none和reset。
3)Flovor:有参数控制VM的开关和配置
4)单个虚拟机设置:
# 设置nova meta <虚拟机ID> set hw_watchdog_action=disable/none/reset# 硬重启生效nova reboot --hard <虚拟机ID>
tips:
1、I6300配置生效优先级:单个虚拟机 > 镜像 > 规格 > 全局
2、IPMI配置优先级:单个虚拟机 > 多网元主机组 > 全局
2、Highly Available
虚拟机HA机制可以在虚拟机出现异常时进行复位来恢复虚拟机;通过虚拟机本地自愈和异地重建功能,可以使虚拟机在自身出现故障或者物理节点出现故障时,自动进行恢复,提高虚拟机可用度,降低人工维护成本,缩短业务中断影响,有效提升虚拟机的可用性。
无论是本地HA还是异地HA,都是通过重新拉起虚拟机实现:
- 本地HA:在本机重新挂载故障虚拟机的磁盘等资源,拉起虚拟机,虚拟机OS内数据不会丢失。
- 异地HA:在其它满足条件的主机挂载故障虚拟机的磁盘等资源,拉起虚拟机,虚拟机OS内数据不会丢失。
Tips:
1、值得注意的是,虚拟机HA过程中,虚拟机服务是不可用的。
2、本地盘虚拟机异地HA:磁盘会被重置,即是一台新虚拟机。
FusionSphere在以下两种场景会出发虚拟机HA流程:
- 主机异常:主机管理面断连时,主机会处于异常状态,这时候会触发虚拟机HA流程
- 如果配置了探测VLAN,FusionSphere会通过探测平面去探测虚拟机的电源状态是否为running,如果为running,则终止HA流程。
- 如果配置了防脑裂,则会检测防脑裂是否通过,不通过则终止HA流程
- 开始异地HA,如失败,开始尝试本地HA,再失败,会继续尝试异地HA
- 虚拟机ERROR
- 如果配置了防脑裂,则会检测防脑裂是否通过,不通过则终止HA流程
- 开始异地HA,如失败,开始尝试本地HA,再失败,会继续尝试异地HA
Tips:开始HA流程不一定就会进行HA,当所有的流程条件都满足时才会进行HA
虚拟机不支持HA的情况:
1、HA开关关闭:nova-api
配置了ha_enable=False
2、处于删除态的虚拟机不会触发HA
3、指定主机创建的虚拟机不会触发HA
4、虚拟机所在的主机配置了ha_enable=False
标签
5、虚拟机所在主机组配置了__ha_enable=False
标签
6、虚拟机meta配置了_ha_policy_type=colse
7、使用直通盘、挂载了ISO等特殊类型虚拟机
8、虚拟机所在主机设置了reserve
标签
我是运维少年,欢迎关注我的同名公众号~
此HA非彼HA!FusionSphere这两种HA你分清楚了吗?相关推荐
- matlab函数输出语句,matlab两种输出语句分别是什么
matlab两种输出语句分别是什么 发布时间:2021-02-26 14:21:27 来源:亿速云 阅读:79 作者:小新 这篇文章主要介绍了matlab两种输出语句分别是什么,具有一定借鉴价值,感兴 ...
- 【王道思维扩展1】求解斐波那契数列的递归和非递归算法,并分析两种时间复杂度
1.斐波那契数列 2.递归与非递归的实现 1).递归 时间复杂度O(2^N) #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #incl ...
- python关系表达式的结果只有两种值、分别是_关系表达式的结果只有两种值,分别是____和____。...
[判断题]当盾尾油脂密封在手动位时,不能按下每个位置的注脂按钮来进行手动注脂.( ) [简答题]What is trust? [填空题]Python语言中的运算符有三种,分别是____.____和__ ...
- 新概念英语的MP3下载(英音和美音两种版本,分课下载)
新概念英音版1-2册 | 英音版3-4册 | 新概念美音版第1-2册 | 美音版第1-2册 | 返回首页 新概念美音版第三册 lesson 1 lesson 2 lesson 3 lesson 4 l ...
- “斐波那契数列”的两种算法
"斐波那契数列"的两种算法 斐波那契数列有个规律:从第三个数开始,每个数是前两个数之和,比如: 1 1 2 3 5 8 13 21 34 55...... 现在通过两种方式(递归与 ...
- 音频信号输入itc服务器,音频信号的两种传输方式,你知多少?
原标题:音频信号的两种传输方式,你知多少? 前 言 音频信号有两种传输方式,即平衡式(XLR)与非平衡式(RCA).关于两种传输模式究竟孰优孰劣,这个问题长久以来都有争论.萝卜青菜各有所爱,今天我们就 ...
- java 匿名list,java创造匿名对象的两种方法
在java中有时候需要一些匿名对象的使用.可能有些小伙伴拿还不会创造,其实我们在学习一些方法时都或多或少的接触过.本篇所要讲到的创造匿名对象总结了两种方法,分别是静态工具方法和Lambda表达式,我们 ...
- 两种ICP的改进算法:PLICP与NICP
前言 在之前的文章中(ICP方法详细推导),我们介绍了ICP的基本思想与详细的推导.本文将介绍ICP方法的两种改进,分别是:PLICP[1]与NICP[2].本文将分别介绍两种改进的基本思想,具体算法 ...
- Oracle 的两种工作模式Dedicated Server 和 Shared Server
Oracle可以分成两种工作模式, 分别是 Dedicated Server 和 Shared Server 1 Dedicated Server ...
最新文章
- Spring Cloud云架构 - SSO单点登录之OAuth2.0登录流程(2)
- 某学校学生在计算机等级水平测试中,提高中职学校计算机等级考试(一级)通过率的教学策略研究...
- Linux中shell模块的考试,linux下的shell编程要考试了题目这里有可是表示不会 求帮忙...
- react中实现异步请求的方法一,react-thunk
- 怎样将GIS图形复制到Windows剪贴板,粘贴到Word中
- python 笔记数据类型
- 对象数组 —— 学生信息表
- Android 反编译指南
- Tbase基础积累一
- 7个最佳博客名称生成器,可帮助您找到好的博客名称提示
- 适合前端新手的十大网站
- APISpace 迎国庆
- 一个JAVA学习者应该具备的素质
- 隐马尔科夫模型 HMM 与 语音识别 speech recognition (1):名词解释
- 算法小讲堂之哈希表|散列表|考研笔记
- Android开发工具类集合
- Android逆向之去除APK中的广告
- RFID标签、读卡器、终端、接口的概念
- 两个人如何共享一个记账本收入支出明细
- Logstash的简单使用