nvidia-smi 常用命令:

nvidia-smi dmon -s xxx (device monitor) 查看设备的相关信息,下面是可选值

 如 nvidia-smi dmon -s t -i 1 查看gpu卡1的pcie读写带宽p:电源使用情况和温度(pwr:功耗,temp:温度)
u:GPU使用率(sm:流处理器,mem:显存,enc:编码资源,dec:解码资源)
c:GPU处理器和GPU内存时钟频率(mclk:显存频率,pclk:处理器频率)
v:电源和热力异常
m:FB内存和Bar1内存
e:ECC错误和PCIe重显错误个数
t:PCIe读写带宽

nvidia-smi dmon -i 0 -s mutc -d 1 -o TD 使用该命令可以直接查看gpu卡0当前运行相关的信息

#Date       Time        gpu    fb  bar1    sm   mem   enc   dec rxpci txpci  mclk  pclk
#YYYYMMDD   HH:MM:SS    Idx    MB    MB     %     %     %     %  MB/s  MB/s   MHz   MHz20221215   15:43:54      1  3217    13    10    15   100    30    15    14  6250  145520221215   15:43:55      1  3217    13     9    14    88    32    45    12  6250  150720221215   15:43:56      1  3217    13     9    13    80    30    23     9  6250  126020221215   15:43:57      1  3217    13     9    14    95    31    33    22  6250  137220221215   15:43:58      1  3217    13    10    15   100    30    44    25  6250  144020221215   15:43:59      1  3217    13    10    15   100    28    14    12  6250  153020221215   15:44:00      1  3217    13    10    15   100    30    39    15  6250  1297

nvidia-smi pmon -i 1 使用该命令可以查看gpu卡1当前运行程序占用情况

# gpu        pid  type    sm   mem   enc   dec   command
# Idx          #   C/G     %     %     %     %   name1    3524892     C     8    13    95    29   Pangu          1    3524892     C     8    14    94    29   Pangu          1    3524892     C     8    14    95    30   Pangu          1    3524892     C     9    14    96    30   Pangu          1    3524892     C     8    14    96    30   Pangu

lspci -vv |grep xxx -C50 (xxx 为设备名,如A16) 或 nvidia-smi -q -i 1 查看pci的设备的相关信息,可以找到GPU的pci速率。

Timestamp                                 : Thu Dec 15 15:51:49 2022
Driver Version                            : 515.43.04
CUDA Version                              : 11.7Attached GPUs                             : 4
GPU 00000000:47:00.0Product Name                          : NVIDIA A16Product Brand                         : NVIDIAProduct Architecture                  : AmpereDisplay Mode                          : DisabledDisplay Active                        : DisabledPersistence Mode                      : EnabledMIG ModeCurrent                           : N/APending                           : N/AAccounting Mode                       : DisabledAccounting Mode Buffer Size           : 4000Driver ModelCurrent                           : N/APending                           : N/ASerial Number                         : xxxxxxxxxxxxGPU UUID                              : xxxxxxxxxxxxMinor Number                          : 1VBIOS Version                         : 94.07.54.00.01MultiGPU Board                        : YesBoard ID                              : xxxxxxxxxxxxxxxGPU Part Number                       : xxxxxxxxxxxxxxxModule ID                             : 0Inforom VersionImage Version                     : G171.0200.00.04OEM Object                        : 2.0ECC Object                        : 6.16Power Management Object           : N/AGPU Operation ModeCurrent                           : N/APending                           : N/AGSP Firmware Version                  : 515.43.04GPU Virtualization ModeVirtualization Mode               : NoneHost VGPU Mode                    : N/AIBMNPURelaxed Ordering Mode             : N/APCIBus                               : 0x47Device                            : 0x00Domain                            : 0x0000Device Id                         : xxxxxxxxxxxBus Id                            : 00000000:47:00.0Sub System Id                     : xxxxxxxxxxxGPU Link InfoPCIe GenerationMax                       : 4Current                   : 1Link WidthMax                       : 16xCurrent                   : 4xBridge ChipType                          : N/AFirmware                      : N/AReplays Since Reset               : 0Replay Number Rollovers           : 0Tx Throughput                     : 2000 KB/sRx Throughput                     : 6000 KB/sFan Speed                             : 0 %Performance State                     : P8

问题分析举例

12路 cuda->nv12->nv12->cuda 编解码性能及pcie读写速度

#Date       Time        gpu    fb  bar1    sm   mem   enc   dec rxpci txpci  mclk  pclk
#YYYYMMDD   HH:MM:SS    Idx    MB    MB     %     %     %     %  MB/s  MB/s   MHz   MHz20221215   15:33:04      1  1149     7    22     6    31    11   566   635  6250  175520221215   15:33:05      1  1149     7    23     7    46    13   670   672  6250  175520221215   15:33:06      1  1149     7    22     6    35    11   619   738  6250  175520221215   15:33:07      1  1149     7    19     5    31    10   565   548  6250  175520221215   15:33:08      1  1149     7    20     6    36    11   485   641  6250  175520221215   15:33:09      1  1149     7    18     6    36    11   466   555  6250  175520221215   15:33:10      1  1149     7    20     5    31    10   481   595  6250  175520221215   15:33:12      1  1149     7    21     7    43    12   512   518  6250  175520221215   15:33:13      1  1149     7    18     6    32    10   564   593  6250  175520221215   15:33:14      1  1149     7    18     6    35    10   383   605  6250  175520221215   15:33:15      1  1149     7    21     6    39    11   497   601  6250  175520221215   15:33:16      1  1149     7    19     6    35    11   488   565  6250  175520221215   15:33:17      1  1149     7    20     6    36    11   504   539  6250  175520221215   15:33:18      1  1149     7    20     6    37    11   486   655  6250  175520221215   15:33:19      1  1149     7    19     6    36    10   643   703  6250  175520221215   15:33:20      1  1149     7    19     6    34    11   408   609  6250  175520221215   15:33:21      1  1149     7    21     6    36    11   356   580  6250  175520221215   15:33:22      1  1149     7    23     6    41    11   513   582  6250  175520221215   15:33:23      1  1149     7    21     6    36    11   691   654  6250  1755

30路cuda->cuda 编解码性能

#Date       Time        gpu    fb  bar1    sm   mem   enc   dec rxpci txpci  mclk  pclk
#YYYYMMDD   HH:MM:SS    Idx    MB    MB     %     %     %     %  MB/s  MB/s   MHz   MHz20221215   15:43:07      1  3203    13     9    14   100    30    47     8  6250  126020221215   15:43:08      1  3203    13     9    15   100    30    28     9  6250  150020221215   15:43:09      1  3203    13     9    15   100    30    27    13  6250  156720221215   15:43:10      1  3203    13     9    15   100    30    37    15  6250  155220221215   15:43:11      1  3203    13    10    15   100    30    19    20  6250  171020221215   15:43:13      1  3203    13    10    15   100    30    15     4  6250  174720221215   15:43:14      1  3205    13    10    15   100    30    62    12  6250  110220221215   15:43:15      1  3207    13    10    15   100    30    22    14  6250  143220221215   15:43:16      1  3209    13     8    13    88    31    39     6  6250  159020221215   15:43:17      1  3209    13     8    13    82    31    21    13  6250  148520221215   15:43:18      1  3215    13     8    13    87    31    42    16  6250  137220221215   15:43:19      1  3215    13     9    13    83    31    43    23  6250  144720221215   15:43:20      1  3215    13    10    15   100    30    16    12  6250  159020221215   15:43:21      1  3215    13    10    15   100    30    47     6  6250  1470

从12路时的 结果来看,无论是GPU显存,性能,还是编解码性能都未达到峰值,且之前怀疑的传输速率也仅为读:600MB/s 写:600MB/s , 而查看该卡的PCIE设置

             LnkCap: Port #0, Speed 16GT/s, Width x16, ASPM not supportedClockPM+ Surprise- LLActRep- BwNot- ASPMOptComp+LnkCtl: ASPM Disabled; RCB 64 bytes, Disabled- CommClk+ExtSynch- ClockPM+ AutWidDis- BWInt- AutBWInt-LnkSta: Speed 16GT/s (ok), Width x4 (downgraded)TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-

LnkCap为显卡配置,LnkSta为实际值,在有程序运行时Speed会从2.5GT/s (PCIE 1.0) 提升为 16GT/s (PCIE 4.0) ,而Width(lane) 虽然有降级,但是从表中可以得出依然有7.88GB/s的带宽。。。

可能影响性能的因素还有温度等,可是通过查看nvidia-smi -q -i 1 温度也没有达到使GPU降速的温度。。。

TemperatureGPU Current Temp                  : 87 CGPU Shutdown Temp                 : 98 CGPU Slowdown Temp                 : 95 CGPU Max Operating Temp            : 88 C

【音视频相关】nvidia-smi 命令扩展及问题分析举例(dmon/pmon/GPU性能相关)相关推荐

  1. 音视频开源基础 - ffmpeg命令

    一.ffmpeg.ffplay.ffprobe区别 ffmpeg:超快音视频编码器(类似爱剪辑) ffplay:简单媒体播放器 ffprobe:简单多媒体流分析器 二.帮助文档查看 2.1 ffmpe ...

  2. 【音视频开发系列】srs-webrtc-janus开源流媒体服务器分析

    全球最牛开源流媒体服务器源码分析 1.如何学习流媒体服务器 2.全球最牛流媒体服务器架构分析 3.我们能从全球最牛流媒体服务器得到什么 [音视频开发系列]srs-webrtc-janus流媒体服务器分 ...

  3. ffmpeg 命令_Qt音视频开发11-ffmpeg常用命令

    一.前言 大部分的格式转换工具比如格式化工厂等,都用到了ffmpeg来处理,ffmpeg编译后生成的ffmpeg.exe.ffplay.exe.ffprobe.exe等可执行文件,其实就封装了众多牛逼 ...

  4. NVIDIA SMI命令

    1.nvidia-smi用于显示所有GPU当前信息状态 显示的表格中: Fan:表示风扇的转速,N/A表示没有风扇 Temp:表示GPU温度 Perf:性能状态(P0:最大性能,P12:最小性能) P ...

  5. 音视频开发(31)---H.264格式分析

    H.264格式分析 一.H.264基本流结构 H.264 的基本流(elementary stream,ES)的结构分为两层,包括视频编码层(VCL)和网络适配层(NAL).视频编码层负责高效的视频内 ...

  6. 初学音视频(一)-RGB和YUV格式分析

    前言 有幸能够看到雷霄骅先生的博客,很感谢雷神能够这么无私把知识分享出来,对我这种新手的帮助实在是太大了.希望到另一个世界雷神不用再这么辛苦的. 本篇文章基本全是参考雷神的:视音频数据处理入门:RGB ...

  7. 音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理

    一.前言 FFMPEG 是特别强大的专门用于处理音视频的开源库.你既可以使用它的 API 对音视频进行处理,也可以使用它提供的工具,如 ffmpeg, ffplay, ffprobe,来编辑你的音视频 ...

  8. 《Android 音视频开发》笔记 - FFmpeg常用命令

    文章目录 FFmpeg简介 命令行工具概述 FFmpeg 处理音视频流程 FFmpeg常用命令 FFmpeg 基本信息查询 FFmpeg 录制 1) Windows上录制音频: 2) Mac 上录制音 ...

  9. 牛赞:音视频前端跨平台技术应用

    点击上方"LiveVideoStack"关注我们 Flutter是近两年大火的跨终端框架,实时音视频因为疫情的缘故也越来越融入到人们的日常工作生活中,如线上会议.在线教育等.两者结 ...

最新文章

  1. define 防 php,php中define防止跳墙
  2. redis setnx 分布式锁_手写Redis分布式锁
  3. 贪心算法很简单:跳跃游戏
  4. python装饰器_python装饰器完全指南之一
  5. 用WMI修改计算机名和IP
  6. boost::log模块实现loging到 syslog 服务器的示例
  7. win7安装mysql 5.7.25_Windows下安装mysql-5.7.25-winx64.zip
  8. Spark _13_topN
  9. linux e514写入错误,Linux上使用vim编辑文件保存时报错:E514: write error (file system full?)...
  10. 计算机用户被锁定如何解除,win10账户被锁定了怎么解除
  11. oracle1007错误,【问题处理】偶遇ORA- 01075: you are currently logged on错误
  12. linux该如何调度,如何选择调度策略linux
  13. python开发网络小工具_Python 实现简单网络应用程序开发
  14. 生活中不可或缺的赚钱智慧
  15. Unrecognized Android Studio (or Android Support plugin for IntelliJ IDEA) version ‘202.7660.26.42.74
  16. Shell /dev/null 文件的含义
  17. 计算机 无法自检,电脑开机不能自检是什么原因 电脑不能完成自检解决办法
  18. java作业Scanner收银
  19. 如何申请企业域名工作邮箱?注册企业域名邮箱多少钱?
  20. 129.精读《React Conf 2019 - Day2》

热门文章

  1. 如何找出电脑内的重复文件,查找电脑磁盘重复文件的方法
  2. UNIX经典命令详解
  3. 生物信息学算法之Python实现|Rosalind刷题笔记:003 中心法则:翻译
  4. HC32F460+RTthread U盘使用详解
  5. webp转换gif动图的方法-批量转换并保留动画效果
  6. uc浏览器、QQ浏览器的h5页面,点击分享按钮,分享到微信、qq、微博
  7. 中国SAP顾问在美国的跳槽经历
  8. 序列的运算、操作、函数/方法
  9. 速腾聚创16线雷达配置
  10. #有关汇编语言的org指令(许多不为人知的故事):