一、问题描述

某次桌面发布交付验证过程中,一线人员反映,使用 nvidia 显卡的虚拟机,虚拟机桌面开机时,无法完成,报错:
“Could not initialize plugin ‘/usr/lib64/vmware/plugin/libnvidia-vgx.so’ for vGPU “profile_name””

二、分析处理

1、对故障vm执行gpu网卡自动检测配置,开机测试,未果;
2、对故障vm执行迁移到其他主机,开机测试,未果;
3、检查故障vm所在主机事件,发现某主机集中出现:

4、检查故障主机gpu显示模块,发现:

5、检查GPU集群其他主机,均正常;但其他主机也有几条同样的告警。

6、将故障vm迁移到其他主机,开机测试,正常开机。

7、将故障vm所在主机系统重启,验证未果。尝试vc导出主机日志分析。

三、其他类似错误

错误示例,报出:

The amount of graphics resource available in the parent resource pool is insufficient for the operation.
An error was received from the ESX host while powering on VM <VM_name>
Failed to start the virtual machine.
Module ‘DevicePowerOn’ power on failed.
Could not initialize plugin ‘/usr/lib64/vmware/plugin/libnvidia-vgx.so’ for vGPU ‘Profile_name’.
No graphics device is available for vGPU ‘Profile_name’.

可能原因:

当默认 GPU 模式为 Shared (vSGA) 而不是 Shared Direct (vGPU) 时,会出现此问题。

处理:
使用 vCenter Server 将 GPU 模式从 Shared (vSGA) 更改为 Shared Direct (vGPU),但过程出现报错:

因为修改后,需要/etc/init.d/xorg restart重启生效。可尝试ssh登录esxi主机尝试。这可能是由提供给主机的GPU显卡硬件引起的。执行以下确认gpu 模块:

grep -A 10 -i “Loading module nvidia” /var/log/vmkernel.log //正常可看到nvidia loaded successfully

esxcli hardware pci list –c 0x0300 –m 0xf //如果 Module Name 与 nvidia 不同,则显卡可能无法在 ESXi 主机上正确显示,从而导致 Xorg 服务无法启动。

通过运行以下命令删除 NVIDIA VMkernel 驱动程序:
vmkload_mod -u nvidia

通过运行以下命令识别 NVIDIA VIB 名称:
esxcli software vib list | grep NVIDIA

通过运行以下命令删除 VIB:
esxcli software vib remove -n nameofNVIDIAVIB //之后安装新的 NVIDIA GPU VIB

安装 NVIDIA GPU VIB:
1)https://nvid.nvidia.com/
For assistance logging in, see https://nvid.nvidia.com/NvidiaUtilities/#/needHelp
2)主机置于维护模式
3)esxcli software vib install -v /path_to_vib/nvidia_vib
4) Configure—> System---->Services---->X.Org Server ------>Edit Startup Policy.

确保 X.Org 服务器正在运行并设置为随主机启动和停止。打开虚拟机电源,确保启用远程桌面以允许远程连接到此来宾操作系统。加载 Nvidia 来宾操作系统驱动程序后,vSphere 控制台将不再可用,需要备用路径来管理机器。

虚拟机开机报错:“Could not initialize plugin ‘/usr/lib64/vmware/plugin/libnvidia-vgx.so‘ for vGPU “相关推荐

  1. 虚拟机开机报错:telling init to go to single user mode. init:rc main process killed by term signal init:rcs

    报错:telling init to go to single user mode. init:rc main process killed by term signal init:rcs-sulog ...

  2. linux oracle 失败怎么办,Linux开机报错unable to load selinux policy怎么办?

    Linux在开机的时候提示unable to load selinux policy错误,导致系统无法进入,通常是由2个情况所导致的,下面小编就给大家介绍下Linux开机报错unable to loa ...

  3. CentOS7.5虚拟机启动报错 Assuming drive cache:write through 和 SMBus Host Controller not enabled !

    CentOS7.5虚拟机启动报错 Assuming drive cache:write through 和 SMBus Host Controller not enabled ! 崭新的一天开始了,今 ...

  4. MATLAB读视频报错 Unable to initialize the video obtain properties (videoreader in Matlab)

    添加一种问题情况:可能是某个视频无法初始化,可以对视频重新处理再重新读取试试 其他解决思路:MATLAB读视频报错 Unable to initialize the video obtain prop ...

  5. 编译报错unable to initialize decompress status for section .debug_info

    编译报错unable to initialize decompress status for section .debug_info 错误信息 CXXLD tools/curve_keygen /us ...

  6. 【问题篇】Springboot解决报错“java.sql.SQLException: Unable to load authentication plugin ‘caching_sha2_passw”

    场景:从代码仓库拉取以前的代码,运行时发现报错"java.sql.SQLException: Unable to load authentication plugin 'caching_sh ...

  7. ibm笔记本修复计算机开机按,IBM X280开机报错,按了Esc后正常解决方法

    很多人购买了Thinkpad X280电脑,由于此机型尺寸小(A4纸张相仿大小),机身薄(薄至17.8mm),重量轻(仅1.3KG),接口多(机身带雷电3接口.USB-C接口.USB3.0.HDMI迷 ...

  8. VmWare虚拟机断电报错各种修复方案

    文章目录 VmWare虚拟机断电报错各种修复方案 问题1 解决1 linux7文件系统修复,Centos 7 LVM xfs文件系统修复 我的用情况1就解决了! 问题2 物理机异常断电,linux虚拟 ...

  9. linux虚拟机启动报错,Generating“/run/initramfs/rdsosreport.txt“

    linux虚拟机启动报错,Generating"/run/initramfs/rdsosreport.txt" 今天在使用k8s部署elk日志系统的时候,部署完成后一直在后台跑着, ...

最新文章

  1. silverlight、wpf中 dispatcher和timer区别
  2. ElasticSearch实战:Linux日志对接Kibana
  3. AS整理代码快捷键 ctl+alt+L
  4. SAP Spartacus B2B User list页面的数据加载逻辑
  5. J. Product of GCDs(莫比乌斯反演)(2021牛客暑期多校训练营2)
  6. 交叉表 列字段排序_百度App设计部:四步打造交互设计自查表
  7. 集合框架之ArrayList集合
  8. 使用SVN管理unityproject
  9. 笔者带你剖析轻量级Sharding中间件——Kratos1.x
  10. android 串流 ps4,就想要玩游戏!PS4有线串流到笔记本电脑实战
  11. JUCE框架教程(6)——通过AudioProcessorValuetTeeState链接数据和UI
  12. highcharts向下钻取饼图
  13. python自动发公众号_itchatmp | 基于python微信公众号接口
  14. 产品读书《粉丝经济:传统企业转型互联网的突破口》
  15. vmwareshanch删除快照以及删除快照时卡住的解决办法
  16. mysql数据库 auto_increment_mysql学习笔记(二:中的auto_increment 理解
  17. 小程序轮播图:点击放大长按保存。
  18. MFC -- ShowWindow(int nCmdShow)参数总结
  19. win10系统下vs2015编写的C++程序在XP系统里运行
  20. 任性杭州,骨感北京——面试汇总

热门文章

  1. Python将wav转amr,并转换成hex数组
  2. Dubbo 负载均衡
  3. WebAPI-DOM树,获取父节点、获取子节点的方法汇总
  4. 小程序商家如何享受到视频号的流量红利?
  5. linux开发工程师主要是干什么的
  6. 高精度随流检测技术助力金融行业实现智能运维
  7. JSP自定义标签开发(五)——标签类获取 request 、 session
  8. tcl卸载会怎么样 tvac_tcl电视用adb命令免root卸载系统自带第三方软件
  9. 无线路由服务器蹭网,如何查看他人已经用我的无线路由器蹭网了?
  10. 智能门禁通道闸机有哪些功能