mmdetection测试模型显存占用与推理速度
mmdetection版本:2.11.0
显存占用
跑起模型推理后实时监控显存占用
watch -n .5 nvidia-smi
推理速度
mmdetection/tools/test.py
看你的程序走的是single_gpu_test还是multi_gpu_test。在具体工程中,一般都是多卡训的,就算你是用的单卡来测速度和显存,也是走的multi_gpu_test。
if not distributed:model = MMDataParallel(model, device_id=[0])outputs = single_gpu_test(model, dataloader, args.tmpdir, args.show_score_thr)
else:model = MMDataParallel(model.cuda(),devices_id=[torch.cuda.current_device()],broadcast_buffers=False)outputs = multi_gpu_test(model, data_loader, args.tmpdir, args.show_score_thr)
*mmdetection/mmdet/apis/test.py
以multi_gpu_test为例。
找到:
result = model(return_loss=False, rescale=True, **data)
改为:
torch.cuda.synchronize()
start = time.time()
result = model(return_loss=False, rescale=True, **data)
torch.cuda.synchronize()
end = time.time()
print(end - start, "s")
单位为秒s。
因为pytorch中程序的执行是异步的,因此
torch.cuda.synchronize()
是必须加的,要不然结果会有问题。
mmdetection测试模型显存占用与推理速度相关推荐
- torch.cuda.amp自动混合精度训练 —— 节省显存并加快推理速度
torch.cuda.amp自动混合精度训练 -- 节省显存并加快推理速度 文章目录 torch.cuda.amp自动混合精度训练 -- 节省显存并加快推理速度 1.什么是amp? 2.为什么需要自动 ...
- 模型显存占用及其计算量
1. 显存的占用 当在GPU上跑一个模型时,显存的占用主要有两部分: 模型的输出(特征图.特征图的梯度).模型的参数(权重矩阵.偏置值.梯度) 1. 模型参数的显存占用:(例如:卷积核的参数.BN层. ...
- 【NVIDIA】GeForce-GTX-1080Ti单算法服务内存显存占用
[NVIDIA]GeForce-GTX-1080Ti单算法服务内存显存占用 1.背景 2.关于Gunicorn 服务器 3.测试内存显存占用 3.1 使用1个工作进程 3.2 使用2个工作进程 3.3 ...
- 浅谈深度学习:如何计算模型以及中间变量的显存占用大小
原文链接:https://oldpan.me/archives/how-to-calculate-gpu-memory 前言 亲,显存炸了,你的显卡快冒烟了! torch.FatalError: cu ...
- 什么软件测试显卡占用率,到底多少才算够 GTA5显存占用情况测试
1GTA5显存情况占有测试 自由.不羁.快意恩仇.做想做却又不敢做的事,甚至是尽情舒展自己阴暗的一面,这就是GTA V当中所描绘的世界.也许其中的洛圣都并不真实存在,但R星所缔造的这片世界却又是那么的 ...
- 模型测试时显存爆炸解决
with torch.no_grad():pass Reference:模型训练或测试时候显存爆掉(RuntimeError:CUDA out of memory)的几种可能及解决方案_洗千帆,还少年 ...
- CNN模型的计算量、参数、显存占用
经典CNN模型的计算量.参数.显存占用 文章目录 经典CNN模型的计算量.参数.显存占用 1. 深度学习复杂度 2. FLOPS概念 3.参数量计算 4. 输出特征图尺寸 5. 常用模型的FlOPs和 ...
- 超硬核 ICML’21 | 如何使自然语言生成提速五倍,且显存占用减低99%
文 | 炼丹学徒 编 | 小轶 我们忽略掉引言和介绍,直接把工作的效果丢上来,相信就足够令自然语言生成的相关同学心动--对于任何一个已有的Transformer生成模型,只需根据本文算法更改atten ...
- 后向重计算在OneFlow中的实现:以时间换空间,大幅降低显存占用
撰文 | 赵露阳 2016年,陈天奇团队提出了亚线性内存优化相关的"gradient/activation checkpointing(后向重计算)"等技术[1],旨在降低深度学习 ...
最新文章
- 错误:Parameter ‘0‘ not found.Available parameters are [arg1, arg0, param1, param2]的解决方法
- 开发日记-20190515 关键词 汇编语言(八) MVVM
- 转载:二叉树的前中后和层序遍历详细图解(递归和非递归写法)
- flex buider 4.6 打开设计模式(designer)时提示内存不足错误的解决办法
- 马斯克:特斯拉Model S Plaid交付时间将推迟至6月10日
- linux voip客户端,linux搭建VOIP
- 登录日志怎么实现_运维必看:日志标准化必须面对的 4 类问题
- 计算机基础(四):C语言字符串处理文件保存
- Spring Boot + Thymeleaf + Activiti 快速开发平台项目,附源码!
- 请描述计算机软件分类,2014年计算机一级考试MsOffice模拟题
- 智能机器人机器人心得_如果机器人说到上帝
- java俄罗斯方块程序_java基础俄罗斯方块
- w10如何共享计算机硬盘,w10共享盘怎么设置_win10如何共享硬盘
- 手机黑圆点怎么打_两个字中间的圆点怎么打?黑色圆点符号怎么打出来?
- 随意发软件如何自动发帖已更新2022
- 斯诺登逃亡之路上的守护天使都有谁
- Win10电脑用360杀毒一全盘杀毒就蓝屏
- 北大计算机本科生如何保研清华,高考无缘清华、北大,选择这五所985大学,保研几率大...
- day55 django 模型层,orm连表操作
- 支付宝:支付宝里面国际驾照认证件的申请领取步骤
热门文章
- 虚拟机连不上网-主ip地址网络信息不可用 解决方案
- oracle-12154 dblink,oracle连接DBLINK报错:ORA-12154: TNS:could not resolve service name的解决方法(转)...
- zencart模板文件列表
- 环境变量是什么?一看就懂
- 【图像隐藏】基于小波变换+SURF、RANSAC、LT码、CRC码多种算法实现图像隐藏(抗多种攻击)matlab源码
- chatgpt测试在线工具
- 2021搞技术社区的一点点心得
- 使用Python调用ChatGPT
- Js强制类型转换——String类型 / Number类型/Boolean类型
- 圆角矩形PCB板框规划