先说一下环境:

一、硬件

8台服务器做的超融合架构,软件存储池,
每台服务器是96G内存,两颗Intel(R) Xeon(R) CPU E5-2670 0 @ 2.60GHz,32线程。
每台服务器是1T SSD加三块4T SATA,无raid卡,做的两副本。
服务器集成2个1G的网口,做端口聚合,对外提供服务。
另加一块四端口千兆网卡,做端口聚合,做内部数据传输。

二、软件

基础系统是Ubuntu 16.04 LTS,基于KVM,libvirt的虚拟化管理平台。
虚拟机:windows7中文专业版,32位,
每台虚拟机分配3071M内存,两颗CPU(2 sockets) 。
libvirt:1.3.1

三、现象

服务器上的windows,不定时的会卡死,多数每天发生一次到两次,少数三四天卡死一次,极少数会间隔时间更久,
多数发生在电脑空闲时间,
能上互联网的虚拟机多发,
此外无其他明显规律。

四、问题排查

1、先是排查了服务器配置,终端的配置,网络

因为这套架构已经在多地部署,并稳定运行多年,排查完客户的现场网络后,此原因基本排除。

2、后来怀疑存储的问题

使用iostat持续检测两台服务器的三个小时。

iostat -x -m 1

从记录下的日志看服务器存储的平均响应时间一直在正常范围,读写负载也不高。

3、检查服务器的日志

默认libvirt的日志是关闭的,编辑/etc/libvirt/libvirtd.conf,打开warnning级别的日志记录。

log_level = 3
log_outputs="3:file:/var/log/libvirt/libvirtd.log"

从/var/log/libvirt/libvirtd.log看libvirt日志:

2017-03-15 06:03:08.894+0000: 13919: info : libvirt version: 1.3.1, package: 1ubuntu10.5 (Stefan Bader <stefan.bader@canonical.com> Thu, 06 Oct 2016 13:07:20 +0200)
2017-03-15 06:03:08.894+0000: 13919: info : hostname: sc7
2017-03-15 06:03:08.894+0000: 13919: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'
2017-03-15 06:03:48.180+0000: 13914: error : qemuMonitorIO:689 : internal error: End of file from monitor
2017-03-15 06:03:48.180+0000: 13914: error : virNetClientProgramDispatchError:177 : Cannot open log file: '/var/log/libvirt/qemu/vm105.log': Device or resource busy
2017-03-15 06:04:22.540+0000: 13918: error : qemuMigrationCheckJobStatus:2641 : operation failed: migration job: unexpectedly failed
2017-03-15 06:04:57.546+0000: 13918: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'
2017-03-15 06:06:12.507+0000: 13916: error : qemuMigrationCheckJobStatus:2641 : operation failed: migration job: unexpectedly failed
2017-03-15 06:11:21.182+0000: 13918: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'
2017-03-15 06:13:08.112+0000: 13920: error : qemuMigrationCheckJobStatus:2641 : operation failed: migration job: unexpectedly failed
2017-03-15 06:15:09.467+0000: 13919: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'
2017-03-15 06:35:17.680+0000: 13914: error : qemuMonitorIO:689 : internal error: End of file from monitor
2017-03-15 06:35:17.680+0000: 13914: error : virNetClientProgramDispatchError:177 : Cannot open log file: '/var/log/libvirt/qemu/vm102.log': Device or resource busy2017-03-16 00:33:08.324+0000: 13914: error : virNetClientProgramDispatchError:177 : Cannot open log file: '/var/log/libvirt/qemu/vm105.log': Device or resource busy
2017-03-16 02:47:26.712+0000: 13919: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'
2017-03-16 02:52:03.184+0000: 13914: error : qemuMonitorIO:689 : internal error: End of file from monitor
2017-03-16 02:52:03.184+0000: 13914: error : virNetClientProgramDispatchError:177 : Cannot open log file: '/var/log/libvirt/qemu/vm113.log': Device or resource busy
2017-03-16 02:52:26.683+0000: 13919: warning : virStorageBackendVolOpen:1535 : ignoring permission error for '/media/vmpool/win7_test.img'

看到日志中有一些virStorageBackendVolOpen,virNetClientProgramDispa

一起KVM环境下windows7虚拟机异常死机(BSOD)的问题解决相关推荐

  1. 基于SDN环境下的DDoS异常攻击的检测与缓解--实验

    基于SDN环境下的DDoS异常攻击的检测与缓解--实验 基于SDN环境下的DDoS异常攻击的检测与缓解--实验 1.安装floodlight 2.安装sFlow-RT流量监控设备 3.命令行安装cur ...

  2. 云电脑-kvm环境下云服务器配置常见命令

    kvm环境下使用云电脑出问题了怎么办?雷电云电脑教大家轻松解决, 云电脑-kvm环境配置常见命令使用 查看所有虚拟机状态: [root@kvm7 vps] virsh list --all 查看指定虚 ...

  3. Struts2环境下Tomcat启动异常:Exception starting filter struts2,报了一个java.lang.ClassNotFoundException

    Struts2环境下Tomcat启动异常:Exception starting filter struts2,报了一个java.lang.ClassNotFoundException 参考文章: (1 ...

  4. atitit.js浏览器环境下的全局异常捕获

    atitit.js浏览器环境下的全局异常捕获 window.onerror = function(errorMessage, scriptURI, lineNumber) { var s= JSON. ...

  5. 解决锐捷校园网环境下VMware虚拟机无法上网问题

    解决锐捷校园网环境下VMware虚拟机无法上网问题 1.介绍: 在介绍笨方法之前首先得说一下VMware虚拟机无法上网的原因,虚拟机要想要上网主机里的VMnetDHCP和VMware NAT Serv ...

  6. Windows10环境下安装虚拟机virtualbox详解

    Windows10环境下安装虚拟机virtualbox详解 一.下载VirtualBox虚拟机 二.安装VirtualBox 一.下载VirtualBox虚拟机 下载官网:https://www.vi ...

  7. dnf一换线就服务器不稳定,网吧路由多线路环境下出现DNF换频道就掉线的问题解决方法...

    大家都知道,网吧路由设置不正确会引起各种奇怪的网络问题.特别是在网吧网络游戏上.目前网吧玩的游戏就那么几个,只要任何一个出现问题,顾客就会很火大.所以,掌握必备的网吧路由技术那是一个合格的网管必备的技 ...

  8. 服务器分配虚拟机算法,云计算环境下的虚拟机资源分配

    摘要: 云计算作为一种全新的信息技术,通过网络将大量的计算机连接起来,组成一个庞大的资源池,为用户提供服务.云计算可以降低用户在IT硬件.软件投资维护如购买办公电脑.服务器.企业办公软件以及相应的支持 ...

  9. ubuntu20.04部署KVM环境及创建虚拟机

    ubuntu20.04.4安装 KVM环境 检查硬件环境是否支持 sudo grep -Eoc '(vmx|svm)' /proc/cpuinfo #数字大于0,则代表CPU支持硬件虚拟化,反之则不支 ...

  10. 零入门kubernetes网络实战-7->Mac环境下为虚拟机磁盘空间进行扩容

    <零入门kubernetes网络实战>视频专栏地址 https://www.ixigua.com/7193641905282875942 在Mac环境下,使用PD软件创建的虚拟机磁盘空间不 ...

最新文章

  1. alibaba Fastjson的JOSN解析库 -
  2. Kafka官方文档翻译——实现
  3. LeetCode 142 环形链表 II
  4. TrueCrypt 为何决定终止项目
  5. 《属灵操练礼赞》读后感
  6. 【html5插入透明Webm视频】
  7. UG NX 12 将草图对象转化为参考线
  8. android网络编程-socket基础
  9. mysql打字竖线_如何打出竖线,教你怎样键盘打出竖线?
  10. 卫生保健所短信群发模板:预约挂号、就诊提醒、检查结果通知
  11. 学生信息管理系统V2.0
  12. Swift上写百度地图记录
  13. Tableau 入门系列之各种图形绘制
  14. 【BZOJ 1930】 [Shoi2003]pacman 吃豆豆 最大费用最大流
  15. 警惕 NFT 中可能存在的骗局
  16. 第2课:低风险基金: 货币基金 VS 债券基金
  17. MTK feature phone 音频功放开启关闭驱动示例
  18. 2022年五大开源数据可视化BI方案对比
  19. python在经济学中的应用论文_论数学在经济学中的应用
  20. Access数据库重复记录删除器 V1.04免费注册版

热门文章

  1. GC-SAN,GLRS常见baseline
  2. 【唐胡子俱乐部活动回顾】社群运营心得和资源共享交流会
  3. Win10 Build 19044.1889系统镜像
  4. springboot毕设项目基于javaweb的办公用品采购系统的设计与实现9il8s(java+VUE+Mybatis+Maven+Mysql)
  5. mysql上机练习题,access上机练习1
  6. 爬虫之爬取豆瓣图书名字及ID
  7. java初级工作总结_【初级java开发工作总结_初级java开发个人年终总结】-看准网...
  8. 工业控制计算机硬件基础知识,工业控制计算机的特点及要求
  9. Mac 如何判断下载Mac with Intel Chip 还是 Mac with Apple Chip
  10. 关于端口的关闭——Linux