pytorch跑Unet代码,gpu利用率在0%-20%闪现,主要问题是GPU一直在等cpu处理的数据传输过去。利用top查看cup的利用率也是从0省道100%且显然cup的线程并不多,能处理出的数据也不多。在一般的程序中,除了加载从dataloader中数据和model的运行需要gpu,其余更多的dataset、dataloader、loss的计算和日志的输出很多部分都需要cup的计算。
所以,可以提升的方面包括 从class dataset的优化、dataloader的优化和其他部分代码的优化。当然代码的优化是一个长期的考验代码能力的问题。那么短期的提升在于对dataloader的优化:
1.batchsize调大 提高GPU内存占用率
2.num_works 调到适当值,一般情况下为8、16是比较合适的值。太小就会出现我上述讲道的一些问题。太大的话cpu线程增加会导致gpu的利用率降低。因为模型需要将数据平均分配到几个子线程去进行预处理,分发等数据操作,设高了反而影响效率。(具体原因请参考,分析很全面的一篇文章)
3.pin_memory =True 省掉了将数据从CPU传入到缓存RAM里面,再给传输到GPU上;为True时是直接映射到GPU的相关内存块上,省掉了一点数据传输时间。

pytorch 提高gpu利用率相关推荐

  1. python视频处理加速的库_VPF:适用于 Python 的开源视频处理框架,加速视频任务、提高 GPU 利用率...

    原标题:VPF:适用于 Python 的开源视频处理框架,加速视频任务.提高 GPU 利用率 雷锋网 AI 开发者按:近日,NVIDIA 开源了适用于 Python 的视频处理框架「VideoProc ...

  2. 香侬科技Service Streamer:加速深度学习Web服务、极大提高GPU利用率。| 百万人学AI评选

    2020 无疑是特殊的一年,而 AI 在开年的这场"战疫"中表现出了惊人的力量.站在"新十年"的起点上,CSDN[百万人学AI]评选活动正式启动.本届评选活动在 ...

  3. 多个cuda 被单进程沾满_报名 | 提高GPU利用率,听英伟达专家分享这个CUDA工具

    随着 NVIDIA GPU 计算性能的不断提升,如何提升 GPU 利用率是开发者普遍关心的问题之一.从 Kepler 架构开始,NVIDIA GPU 支持多个 CUDA kernels 函数的并发执行 ...

  4. 机器学习如何提高GPU利用率

    前言 首先,如果你现在已经很熟悉tf.data+estimator了,可以把文章x掉了╮( ̄▽ ̄"")╭ 但是!如果现在还是在进行session.run(-)的话!尤其是苦恼于GP ...

  5. VPF:适用于 Python 的开源视频处理框架,加速视频任务、提高 GPU 利用率

    0 背景 近日,NVIDIA 开源了适用于 Python 的视频处理框架「VideoProcessingFramework(VPF)」.该框架为开发人员提供了一个简单但功能强大的 Python 工具, ...

  6. Win10显卡跑不满?是时候给系统洗洗澡了,换系统提高GPU利用率

    有些模型用Win7或Win8跑的好好的,换成Win10以后就跑不动了?这是个什么问题呢,经过查询发现的确是Windows10系统的锅,请看:Win10 CUDA效率问题.也就是说Win10系统会默认预 ...

  7. 提高 Kubernetes 中的 GPU 利用率

    提高 Kubernetes 中的 GPU 利用率 对于可扩展的数据中心性能,NVIDIA GPU 已成为必备品. 由数千个计算内核支持的 NVIDIA GPU 并行处理能力对于加速不同行业的各种应用程 ...

  8. 聊聊GPU利用率那些事

    引言 众所周知,GPU本身的计算能力是越来越强大,特别是新一代的NVIDIA AMPERE架构发布之后,又一次刷新了大家对AI算力的认知.目前,确实有不少大规模分布式训练对更大算力的渴求是极其强烈的, ...

  9. 深度学习PyTorch,TensorFlow中GPU利用率较低,CPU利用率很低,且模型训练速度很慢的问题总结与分析

    在深度学习模型训练过程中,在服务器端或者本地pc端,输入nvidia-smi来观察显卡的GPU内存占用率(Memory-Usage),显卡的GPU利用率(GPU-util),然后采用top来查看CPU ...

最新文章

  1. 切换apache的prefork和worker模式
  2. 皮一皮:家里出了个不孝子...
  3. 互联网架构,究竟为啥要做服务化?
  4. 深入理解Java:内省(Introspector)
  5. ActiveMQ入门-ActiveMQ跟SpringBoot整合发送接收Topic
  6. RedMine项目管理系统邮件推送设置(Windows环境)
  7. 滤波器的优点_声光可调谐滤波器
  8. spring + hibernate + 实体类 注解配置代码
  9. PYTHON——TCPUDP:socketserver实现多人聊天
  10. 链表(python版)
  11. Java经典算法题(一,kafka权威指南百度网盘
  12. 切莫止步于 TOGAF® 认证
  13. u盘iso安装服务器系统怎么安装win7系统安装方法,win7系统iso镜像文件通过U盘安装的操作方法...
  14. 当“程序猿”遇到“母亲节”,看他们是如何送上特殊的祝福
  15. MAC软件-Photoshop2015破解安装
  16. QQ一键登录助手_DedeCMS插件_适合FOR V55 V56 V57_GBK.zip
  17. [ Azure | Az-900 ] 基础知识点总结(二) - 核心组件服务
  18. unity 画球面_unity3d第一个例子--制作一个简单的球体碰撞墙面
  19. java判断经纬度是否在扇形内_地图学复习 (题) (带答案)
  20. Android 解决RecyclerView瀑布流刷新之后Item位置改变

热门文章

  1. 干货 | 想学数据分析不知道该读什么书、从哪本读,翻遍专业知识类网站最全的整理!
  2. 《史蒂夫·乔布斯传》读后感
  3. 雷军20年前作文:我会当一辈子程序员 + 分享雷军22年前写的代码
  4. STM32RTC时钟和日历
  5. 华为微认证ModelArts实现智能花卉识别稳过 笔记资料
  6. 下载网页视频并自动转码为mp4
  7. 稳定伴侣问题c语言步骤,稳定匹配问题
  8. @PathVariable注解
  9. 【L2-023 图着色问题】天梯赛详解
  10. office365和office2016jihuo