【音视频相关】nvidia-smi 命令扩展及问题分析举例(dmon/pmon/GPU性能相关)
nvidia-smi 常用命令:
nvidia-smi dmon -s xxx
(device monitor) 查看设备的相关信息,下面是可选值
如 nvidia-smi dmon -s t -i 1 查看gpu卡1的pcie读写带宽p:电源使用情况和温度(pwr:功耗,temp:温度)
u:GPU使用率(sm:流处理器,mem:显存,enc:编码资源,dec:解码资源)
c:GPU处理器和GPU内存时钟频率(mclk:显存频率,pclk:处理器频率)
v:电源和热力异常
m:FB内存和Bar1内存
e:ECC错误和PCIe重显错误个数
t:PCIe读写带宽
nvidia-smi dmon -i 0 -s mutc -d 1 -o TD
使用该命令可以直接查看gpu卡0当前运行相关的信息
#Date Time gpu fb bar1 sm mem enc dec rxpci txpci mclk pclk
#YYYYMMDD HH:MM:SS Idx MB MB % % % % MB/s MB/s MHz MHz20221215 15:43:54 1 3217 13 10 15 100 30 15 14 6250 145520221215 15:43:55 1 3217 13 9 14 88 32 45 12 6250 150720221215 15:43:56 1 3217 13 9 13 80 30 23 9 6250 126020221215 15:43:57 1 3217 13 9 14 95 31 33 22 6250 137220221215 15:43:58 1 3217 13 10 15 100 30 44 25 6250 144020221215 15:43:59 1 3217 13 10 15 100 28 14 12 6250 153020221215 15:44:00 1 3217 13 10 15 100 30 39 15 6250 1297
nvidia-smi pmon -i 1
使用该命令可以查看gpu卡1当前运行程序占用情况
# gpu pid type sm mem enc dec command
# Idx # C/G % % % % name1 3524892 C 8 13 95 29 Pangu 1 3524892 C 8 14 94 29 Pangu 1 3524892 C 8 14 95 30 Pangu 1 3524892 C 9 14 96 30 Pangu 1 3524892 C 8 14 96 30 Pangu
lspci -vv |grep xxx -C50
(xxx 为设备名,如A16) 或 nvidia-smi -q -i 1
查看pci的设备的相关信息,可以找到GPU的pci速率。
Timestamp : Thu Dec 15 15:51:49 2022
Driver Version : 515.43.04
CUDA Version : 11.7Attached GPUs : 4
GPU 00000000:47:00.0Product Name : NVIDIA A16Product Brand : NVIDIAProduct Architecture : AmpereDisplay Mode : DisabledDisplay Active : DisabledPersistence Mode : EnabledMIG ModeCurrent : N/APending : N/AAccounting Mode : DisabledAccounting Mode Buffer Size : 4000Driver ModelCurrent : N/APending : N/ASerial Number : xxxxxxxxxxxxGPU UUID : xxxxxxxxxxxxMinor Number : 1VBIOS Version : 94.07.54.00.01MultiGPU Board : YesBoard ID : xxxxxxxxxxxxxxxGPU Part Number : xxxxxxxxxxxxxxxModule ID : 0Inforom VersionImage Version : G171.0200.00.04OEM Object : 2.0ECC Object : 6.16Power Management Object : N/AGPU Operation ModeCurrent : N/APending : N/AGSP Firmware Version : 515.43.04GPU Virtualization ModeVirtualization Mode : NoneHost VGPU Mode : N/AIBMNPURelaxed Ordering Mode : N/APCIBus : 0x47Device : 0x00Domain : 0x0000Device Id : xxxxxxxxxxxBus Id : 00000000:47:00.0Sub System Id : xxxxxxxxxxxGPU Link InfoPCIe GenerationMax : 4Current : 1Link WidthMax : 16xCurrent : 4xBridge ChipType : N/AFirmware : N/AReplays Since Reset : 0Replay Number Rollovers : 0Tx Throughput : 2000 KB/sRx Throughput : 6000 KB/sFan Speed : 0 %Performance State : P8
问题分析举例
12路 cuda->nv12->nv12->cuda 编解码性能及pcie读写速度
#Date Time gpu fb bar1 sm mem enc dec rxpci txpci mclk pclk
#YYYYMMDD HH:MM:SS Idx MB MB % % % % MB/s MB/s MHz MHz20221215 15:33:04 1 1149 7 22 6 31 11 566 635 6250 175520221215 15:33:05 1 1149 7 23 7 46 13 670 672 6250 175520221215 15:33:06 1 1149 7 22 6 35 11 619 738 6250 175520221215 15:33:07 1 1149 7 19 5 31 10 565 548 6250 175520221215 15:33:08 1 1149 7 20 6 36 11 485 641 6250 175520221215 15:33:09 1 1149 7 18 6 36 11 466 555 6250 175520221215 15:33:10 1 1149 7 20 5 31 10 481 595 6250 175520221215 15:33:12 1 1149 7 21 7 43 12 512 518 6250 175520221215 15:33:13 1 1149 7 18 6 32 10 564 593 6250 175520221215 15:33:14 1 1149 7 18 6 35 10 383 605 6250 175520221215 15:33:15 1 1149 7 21 6 39 11 497 601 6250 175520221215 15:33:16 1 1149 7 19 6 35 11 488 565 6250 175520221215 15:33:17 1 1149 7 20 6 36 11 504 539 6250 175520221215 15:33:18 1 1149 7 20 6 37 11 486 655 6250 175520221215 15:33:19 1 1149 7 19 6 36 10 643 703 6250 175520221215 15:33:20 1 1149 7 19 6 34 11 408 609 6250 175520221215 15:33:21 1 1149 7 21 6 36 11 356 580 6250 175520221215 15:33:22 1 1149 7 23 6 41 11 513 582 6250 175520221215 15:33:23 1 1149 7 21 6 36 11 691 654 6250 1755
30路cuda->cuda 编解码性能
#Date Time gpu fb bar1 sm mem enc dec rxpci txpci mclk pclk
#YYYYMMDD HH:MM:SS Idx MB MB % % % % MB/s MB/s MHz MHz20221215 15:43:07 1 3203 13 9 14 100 30 47 8 6250 126020221215 15:43:08 1 3203 13 9 15 100 30 28 9 6250 150020221215 15:43:09 1 3203 13 9 15 100 30 27 13 6250 156720221215 15:43:10 1 3203 13 9 15 100 30 37 15 6250 155220221215 15:43:11 1 3203 13 10 15 100 30 19 20 6250 171020221215 15:43:13 1 3203 13 10 15 100 30 15 4 6250 174720221215 15:43:14 1 3205 13 10 15 100 30 62 12 6250 110220221215 15:43:15 1 3207 13 10 15 100 30 22 14 6250 143220221215 15:43:16 1 3209 13 8 13 88 31 39 6 6250 159020221215 15:43:17 1 3209 13 8 13 82 31 21 13 6250 148520221215 15:43:18 1 3215 13 8 13 87 31 42 16 6250 137220221215 15:43:19 1 3215 13 9 13 83 31 43 23 6250 144720221215 15:43:20 1 3215 13 10 15 100 30 16 12 6250 159020221215 15:43:21 1 3215 13 10 15 100 30 47 6 6250 1470
从12路时的 结果来看,无论是GPU显存,性能,还是编解码性能都未达到峰值,且之前怀疑的传输速率也仅为读:600MB/s 写:600MB/s , 而查看该卡的PCIE设置
LnkCap: Port #0, Speed 16GT/s, Width x16, ASPM not supportedClockPM+ Surprise- LLActRep- BwNot- ASPMOptComp+LnkCtl: ASPM Disabled; RCB 64 bytes, Disabled- CommClk+ExtSynch- ClockPM+ AutWidDis- BWInt- AutBWInt-LnkSta: Speed 16GT/s (ok), Width x4 (downgraded)TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-
LnkCap为显卡配置,LnkSta为实际值,在有程序运行时Speed会从2.5GT/s (PCIE 1.0) 提升为 16GT/s (PCIE 4.0) ,而Width(lane) 虽然有降级,但是从表中可以得出依然有7.88GB/s的带宽。。。
可能影响性能的因素还有温度等,可是通过查看nvidia-smi -q -i 1
温度也没有达到使GPU降速的温度。。。
TemperatureGPU Current Temp : 87 CGPU Shutdown Temp : 98 CGPU Slowdown Temp : 95 CGPU Max Operating Temp : 88 C
【音视频相关】nvidia-smi 命令扩展及问题分析举例(dmon/pmon/GPU性能相关)相关推荐
- 音视频开源基础 - ffmpeg命令
一.ffmpeg.ffplay.ffprobe区别 ffmpeg:超快音视频编码器(类似爱剪辑) ffplay:简单媒体播放器 ffprobe:简单多媒体流分析器 二.帮助文档查看 2.1 ffmpe ...
- 【音视频开发系列】srs-webrtc-janus开源流媒体服务器分析
全球最牛开源流媒体服务器源码分析 1.如何学习流媒体服务器 2.全球最牛流媒体服务器架构分析 3.我们能从全球最牛流媒体服务器得到什么 [音视频开发系列]srs-webrtc-janus流媒体服务器分 ...
- ffmpeg 命令_Qt音视频开发11-ffmpeg常用命令
一.前言 大部分的格式转换工具比如格式化工厂等,都用到了ffmpeg来处理,ffmpeg编译后生成的ffmpeg.exe.ffplay.exe.ffprobe.exe等可执行文件,其实就封装了众多牛逼 ...
- NVIDIA SMI命令
1.nvidia-smi用于显示所有GPU当前信息状态 显示的表格中: Fan:表示风扇的转速,N/A表示没有风扇 Temp:表示GPU温度 Perf:性能状态(P0:最大性能,P12:最小性能) P ...
- 音视频开发(31)---H.264格式分析
H.264格式分析 一.H.264基本流结构 H.264 的基本流(elementary stream,ES)的结构分为两层,包括视频编码层(VCL)和网络适配层(NAL).视频编码层负责高效的视频内 ...
- 初学音视频(一)-RGB和YUV格式分析
前言 有幸能够看到雷霄骅先生的博客,很感谢雷神能够这么无私把知识分享出来,对我这种新手的帮助实在是太大了.希望到另一个世界雷神不用再这么辛苦的. 本篇文章基本全是参考雷神的:视音频数据处理入门:RGB ...
- 音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理
一.前言 FFMPEG 是特别强大的专门用于处理音视频的开源库.你既可以使用它的 API 对音视频进行处理,也可以使用它提供的工具,如 ffmpeg, ffplay, ffprobe,来编辑你的音视频 ...
- 《Android 音视频开发》笔记 - FFmpeg常用命令
文章目录 FFmpeg简介 命令行工具概述 FFmpeg 处理音视频流程 FFmpeg常用命令 FFmpeg 基本信息查询 FFmpeg 录制 1) Windows上录制音频: 2) Mac 上录制音 ...
- 牛赞:音视频前端跨平台技术应用
点击上方"LiveVideoStack"关注我们 Flutter是近两年大火的跨终端框架,实时音视频因为疫情的缘故也越来越融入到人们的日常工作生活中,如线上会议.在线教育等.两者结 ...
最新文章
- define 防 php,php中define防止跳墙
- redis setnx 分布式锁_手写Redis分布式锁
- 贪心算法很简单:跳跃游戏
- python装饰器_python装饰器完全指南之一
- 用WMI修改计算机名和IP
- boost::log模块实现loging到 syslog 服务器的示例
- win7安装mysql 5.7.25_Windows下安装mysql-5.7.25-winx64.zip
- Spark _13_topN
- linux e514写入错误,Linux上使用vim编辑文件保存时报错:E514: write error (file system full?)...
- 计算机用户被锁定如何解除,win10账户被锁定了怎么解除
- oracle1007错误,【问题处理】偶遇ORA- 01075: you are currently logged on错误
- linux该如何调度,如何选择调度策略linux
- python开发网络小工具_Python 实现简单网络应用程序开发
- 生活中不可或缺的赚钱智慧
- Unrecognized Android Studio (or Android Support plugin for IntelliJ IDEA) version ‘202.7660.26.42.74
- Shell /dev/null 文件的含义
- 计算机 无法自检,电脑开机不能自检是什么原因 电脑不能完成自检解决办法
- java作业Scanner收银
- 如何申请企业域名工作邮箱?注册企业域名邮箱多少钱?
- 129.精读《React Conf 2019 - Day2》