栗子 发自 凹非寺
量子位 出品 | 公众号 QbitAI

英伟达的CUDA 10工具包,终于可以下载了。

与9字头的前辈相比,10.0是第一次为图灵GPU定制的版本。

英伟达新近发布的GeForce RTX 20系列和Quadro RTX系列显卡,以及新一代GPU Tesla T4,都是基于图灵架构。

官网的评价是,要编写GPU加速的应用程序,CUDA 10是最强大的开发平台

10.0是重大更新

CUDA工具包,都是为开发GPU加速的应用程序而存在。

而针对图灵GPU定制的10.0,主要发生了以下变化:

图灵架构

10.0支持图灵架构,包括最新的Tesla T4 GPU (适用于超大规模的数据中心等等) 。

CUDA平台

CUDA Graphs,是新的异步任务图像 (Task-Graph) 编程模型,让内核启动和执行更高效。

另外,CUDA和图形API之间的互操作性 (Interoperability) 增强了。

CUDA库

许多库的性能得到了优化。比如,做快速傅里叶变换(FFT)、线性代数以及矩阵乘法用的那些库。

开发者工具

增加了Nsight系列产品,用来追踪、分析、Debug。

操作系统

除此之外,CUDA 10支持的操作系统编译器,也比以前更多了。

操作系统:

编译器:

CUDA库性能大幅提升

cuFFT 10.0

做快速傅里叶变换 (FFT) 的库,16 GPU时最高可以达到17 teraFlops (3D FFT, size 1024) 。

cuBLAS 10.0

做矩阵运算的库,包含了图灵优化的混合精度 (Mixed-Precision) 。做矩阵乘法 (GEMM) 时,最高可以达到90 teraFlops

cuSOLVER 10.0

线性代数用的库,在对称的特征值求解 (eigensolver) 中,速度最多提升4倍

下载,下载

9月27日,在SIGGRAPH大会上正式发布的一个多月之后,CUDA 10的下载入口姗姗来迟。

英伟达发了一篇超长博客,事无巨细地描述了这次进化。

GPU应用开发者的各位,请速前去下载。

下载传送门:
https://developer.nvidia.com/cuda-downloads

博客传送门:
https://devblogs.nvidia.com/cuda-10-features-revealed/

加入社群

量子位AI社群28群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

英伟达CUDA 10终于开放下载了相关推荐

  1. 解决英伟达CUDA和cuDNN下载过慢的问题

    文章目录 为什么会慢 为什么会快 怎么加速下载英伟达CUDA和cuDNN 推荐下载工具-2021-01-19更新 为什么会慢 英伟达开发者网站最近的服务器位于日本东京,带宽也是很感人的. 可以看到下载 ...

  2. 微软官宣!与英伟达签署10年游戏合作;星巴克推出橄榄油咖啡 | 美通企业日报...

    美通社要闻摘要: 微软与英伟达签署10年游戏合作.LG新能源.福特和土耳其KOC将合资建立电池工厂.星巴克推出橄榄油咖啡.安迈任命袁皈泰为交易咨询亚洲区联席领导人并常驻上海.迪拜国际金融中心2022年 ...

  3. 英伟达CUDA太难!OpenAI出手要取代它,新语言性能相当但编程更简单

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用CUDA为GPU编程实在太难了. 为了让没有CUDA编程经验的人写出和专家效率相当的GPU代码,现在OpenAI推出了一种新的语言和编译器 ...

  4. 【报告分享】2023人工智能企业研究报告:为什么是英伟达?.pdf(附下载链接)...

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 无需翻墙,无需注册,ChatGPT4直接使用 ChatGPT提词手册,学完工作效率提升百倍 马斯克谈AI:中美差 ...

  5. cuda和对应英伟达显卡驱动下载

    在安装完显卡后,要安装对应的cuda很麻烦,一不小心对应不上就需要卸载重新下载 在多次下载之后,经验是 先不下载英伟达显卡驱动,直接下载cuda,在下载cuda的选项里选择英伟达显卡驱动,一步到位 不 ...

  6. 黄仁勋没有回应,英伟达没有新品

    晓査 乾明 假装发自 苏州 量子位 出品 | 公众号 QbitAI 黄仁勋上台,然后下台. 在今天上午的GTC China大会上,黄教主没能拿出让人惊艳的新品,也没有只字片语回应英伟达的目前的&quo ...

  7. 携手320+合作伙伴,英伟达扔下一枚自动驾驶炸弹,打响新年越野赛 | CES2018

    来源:36Kr 概要:英伟达宣布世界首个自动机器处理器英伟达DRIVE Xavier,2018年第一季度发布,称这是英伟达有史以来最大的研发投入,研发投入高达 20 亿美元. 还是那个伸手就可以从兜里 ...

  8. 英伟达公开课 | 手把手教你部署一辆高速目标检测Jetbot智能小车

    主讲人 | 何琨 英伟达 量子位编辑 | 公众号 QbitAI 3月26日,英伟达图像处理系列公开课第三期线上开播,来自NVIDIA开发者社区的何琨老师,与数百位开发者共同探讨了: 利用NVIDIA迁 ...

  9. 软硬件解耦太难!英伟达竟“越来越像Mobileye”

    尽管Mobileye已经愿意推行"软硬件解耦",但由于车企自己目前还没有能力搞定算法,Mobileye便"不得不"又回到软硬一体化的老路上. 随着软件能力越来越 ...

最新文章

  1. 存储过程结果更改编码_Docker安装Minio存储服务器详解
  2. 【企业管理】《管理者实践》读书笔记--管理者及其工作
  3. 广州 adobe 技术者开发日回归
  4. python基础知识纵览(下)
  5. ios 不被遮挡 阴影_为何你没见到日环食?你不知道的天象常识原来还有这么多 | 返朴...
  6. CVTE前端笔试编程题
  7. 【OpenCV 例程200篇】78. 频率域图像滤波基础
  8. 在这个功能上,iOS 落后 Android 了
  9. 通过F12控制台退订育碧(Ubisoft)邮件
  10. putty界面最友好的颜色配置参考
  11. allego如何输出pdf_[LaTeX 尝试] 利用 PDF 附件和终端输出,从 Overleaf 里获得更多信息...
  12. ZKTeco/熵基科技F18指纹门禁考勤一体机 破解管理员
  13. ip雷达3.0_本周在我们的雷达上:轻松如1.0、2.0、3.0
  14. 设计模式之观察者模式——猫抓老鼠2
  15. Qt 5.15.7 arm交叉编译+tslib-1.22+openssl-3.0.7+alse-1.2.8
  16. ibm service guide
  17. No.102-HackTheBox-Linux-Joker-Walkthrough渗透学习
  18. 4.2.3 编程题《将一笔钱换算成1分、2分和5分的硬币组合》
  19. 原生js去除前后空格
  20. 智慧楼宇、智能社区、园区、楼宇管理系统、可视化、可视化数据、送排风、给排水、能源、运维、变配电、门禁、停车场、楼控系统、智能照明、电梯系统、安防系统、视频监控、防盗报警、电子巡更、设备台账、运维管理

热门文章

  1. 苹果抛弃 OpenGL!
  2. 网络中没有 计算机,计算机中没有检测到任何网络硬件是什么原因
  3. c# 后台传到前台乱码_ASP.NET关于前台脚本传递中文参数,后台获取乱码问题(乱码为方框,黑色方框等。。)...
  4. eclipse 集成svn客户端_SVN的介绍以及使用
  5. linux查看usb文件,linux下查看usb个数
  6. 广技师计算机毕业都去哪,广东哪间大学的计算机专业比较好???
  7. ansys本地的help文件_PostgreSQL本地/远程登陆配置
  8. AbortController 中止一个或多个Web请求
  9. React17事件委托的变更
  10. 合肥信息技术职业学院计算机模拟考试准考证,【通知】全国计算机等级考试模拟测试通知...