cuda编程性能 分析工具 nvprof的使用
ubuntu环境上,安装cuda,会自动安装一些工具nvcc ,nvprof nvcc-gdb....
1.编译生成可执行文件
2.nvprof ./test
可以把性能分析数据输出到文件中
nvprof ./test -o test.nvvp
可以把在nvidia visual profiler现实更加直观
一些常用的配置参数:
achieved_occupancy参数:每个sm在每个cycle能够达到的最大activewarp 占总warp的比例。
nvprof --metrics achieved_occupancy ./a.out
gld_throughput: global load throughput (查看memory 的throughput)
nvprof --metrics gld_throughput ./a.out
gld_efficiency: global memory loadefficiency: device memory bandwidth的使用率
nvprof –metrics gld_efficiency ./a.out
查看运行时候的信息:IPC(instruction per cycle)
nvprof --metrics ipc ./a.out
查看所有的以上信息:
nvprof --metrics all ./a.out
cuda编程性能 分析工具 nvprof的使用相关推荐
- .NET 11 个 Visual Studio 代码性能分析工具
原文地址 软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行 ...
- 11个Visual Studio代码性能分析工具
软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...
- 11 个 Visual Studio 代码性能分析工具
软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...
- Windows phone 7应用之代码性能分析工具——Profile.
前端时间断断续续的写了几篇关于Windows phone 7本地数据库访问文章. 最近在Window phone 7 APPStore上注册Apphub账号看到很多很有意思的小应用, 也结识几个专职做 ...
- 前端性能分析工具-Lighthouse
1.前言 对于前端开发人员来说,除了实现页面功能外,那就是页面的性能响应问题也要关注.同样对于测试人员在进行性能测试时,也要关注前端页面的性能指标.测试前端性能市面上可以用到的工具也比较多,比如可以用 ...
- C++ 性能分析工具调研
文章目录 0. 前言 1. gprof 3. valgrind 4. gperftools 5. perf 0. 前言 目标:性能分析(profile)包含的内容特别多,但目前我只关注运行时间. 详细 ...
- 正确使用 Android 性能分析工具——TraceView
前面唠叨 最近公司app中有些列表在滑动的时候会有卡顿现象,我就开始着手解决这些问题,解决问题之前首先要分析列表滑动的性能瓶颈在什么地方.因为之前不会正确使用TraceView这个工具,主要是看不懂T ...
- php性能分析工具 - xhprof的安装使用
一.前言 有用的东西还是记录下来吧,也方便以后的查询:这次记录一下xhprof的安装使用: xhprof是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低, ...
- 系统级性能分析工具perf的介绍与使用
测试环境:Ubuntu16.04 + Kernel:4.4.0-31 apt-get install linux-source cd /usr/src/tools/perf make &&am ...
最新文章
- C# 视频监控系列 序 [完]
- 一个把ListString转化为以,隔开的字符串的方法
- 【MongoDB】增删改查基本操作
- dns是指网络域名系统_域名系统(DNS)是Internet的骨干。 这就是全部的运作方式。...
- C# Winform 窗体美化(八、Icon)
- 隐藏esp_汽车一键启车主必须知道的几个“隐藏”技巧
- python制作饼状图
- java16进制取前几位_16位16进制数怎么取前8位和后8位
- Deep Learning(深度学习)网络资源
- SDN的机遇与挑战 让宽带利用率与硬件不再是难题
- redhat linux 设置ip,REDHAT LINUX企业版更改IP地址,网关,DNS和MAC地址----字符界面
- ArcSDE:C#创建SDE要素数据集
- 软件测试正交表用在哪里,使用正交试验法设计测试用例中的一些常用的正交表...
- 坯子库怎么导入插件_坯子库实用的插件安装器-SketchUp坯子插件库2020下载v2020.1正式版管理器-西西软件下载...
- c语言中立方和乘法怎么表示什么区别,C语言程式设计中的平方立方怎么表示
- 计算机vb输入框函数,VB基本函数大全
- 牛客网算法之洗牌详解
- 郭德纲 相声下载(续)
- 卷积神经网络感受野的计算
- 财报向好背后,特步的持续爆发力
热门文章
- sql statements_Postgresql监控sql模块之pg_stat_statements模块--部署篇
- linux下collada-dom编译,Building Collada
- 静态网页托管_求职季,教你制作一份精美的在线网页简历,程序员必看!!
- 10大最高效的Java库盘点
- Java技术知识点的一些总结
- win7查看 本地计算机策略,win7系统本地组策略编辑器打不开怎么办
- sun 些命令可以将服务器设置至ok模式_Python 高手之路:从零开始打造一个Web服务器...
- 【LeetCode笔记】19.删除链表的倒数第N个结点(Java、快慢指针)
- 计算机意外关闭原因 安全问题,win7弹出“计算机意外地重新启动或遇到错误”处理方法...
- 安卓开发怎么调用photopicker_谷歌出手整顿安卓应用程序乱象:无良权限的APP们再见了!...