一、Why GPU

其实GPU计算比CPU并不是“效果好”,而是“速度快”。

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放到实际应用中效果也很好,只不过速度会很慢罢了。

GPU的起源

GPU全称叫做graphics processing unit,图形处理器,顾名思义就是处理图形的。

电脑显示器上显示的图像,在显示在显示器上之前,要经过一些列处理,这个过程有个专有的名词叫“渲染”。以前的计算机上没有GPU,渲染就是CPU负责的。渲染是个什么操作呢,其实就是做了一系列图形的计算,但这些计算往往非常耗时,占用了CPU的一大部分时间。而CPU还要处理计算机器许多其他任务。因此就专门针对图形处理的这些操作设计了一种处理器,也就是GPU。这样CPU就可以从繁重的图形计算中解脱出来。

由于GPU是专门为了渲染设计的,那么他也就只能做渲染的那些事情。

渲染这个过程具体来说就是几何点位置和颜色的计算,这两者的计算在数学上都是用四维向量和变换矩阵的乘法,因此GPU也就被设计为专门适合做类似运算的专用处理器了。为什么说专用呢,因为很多事情他做不了。

CPU通用性强,但是专用领域性能低。工程就是折衷,这项强了,别的就弱了。再后来游戏、3D设计对渲染的要求越来越高,GPU的性能越做越强。论纯理论计算性能,要比CPU高出几十上百倍。

人们就想了,既然GPU这么强,那用GPU做计算是不是相比CPU速度能大大提升呢?于是就有了GPGPU(general purpose GPU,通用计算GPU)这个概念。但我们前面提到了,GPU是专门为了图像渲染设计的,他只适用于那些操作。但幸运的是有些操作和GPU本职能做的那些东西非常像,那就可以通过GPU提高速度,比如深度学习

深度学习中一类成功应用的技术叫做卷积神经网络CNN,这种网络数学上就是许多卷积运算和矩阵运算的组合,而卷积运算通过一定的数学手段也可以通过矩阵运算完成。这些操作和GPU本来能做的那些图形点的矩阵运算是一样的。因此深度学习就可以非常恰当地用GPU进行加速了。

以前GPGPU(通用GPU)概念不是很火热,GPU设计出来就是为了图形渲染。想要利用GPU辅助计算,就要完全遵循GPU的硬件架构。而现在GPGPU越来越流行,厂家在设计和生产GPU的时候也会照顾到计算领域的需求了。比如今年英伟达发布M40和P100的时候,都在说”针对深度学习设计“,当然其实这里面炒概念的成分更大了,但至少可以看出厂家越来越多地看重通用GUGPU计算了。

二、GPGPU与GPU的区别

GPU的产生是为了解决图形渲染效率的问题,但随着技术进步,GPU越来越强大,尤其是shader出现之后(这个允许我们在GPU上编程),GPU能做的事越来越多,不再局限于图形领域,也就有人动手将其能力扩展到其他计算密集的领域,这就是GP(General Purpose)GPU。

三、为什么快

比如说你用美图xx软件,给一张图片加上模糊效果的时候,CPU会这么做:

使用一个模糊滤镜算子的小窗口,从图片的左上角开始处理,并从左往右,再从左往右进行游走处理,直到整个图片被处理完成。因为CPU只有一个或者少数几个核,所以执行这种运算的时候,只能老老实实从头遍历到最后。

但是有一些聪明的读者会发现,每个窗口在处理图片的过程中,都是独立的,相互没有关系的。那么同时用几个滤镜窗口来处理是不是更快一些? 于是我们有了GPU, 一般的GPU都有几百个核心,意味着,我们可以同时有好几百个滤镜窗口来处理这张图片。

所以说,GPU起初的设计目标就是为了处理这种图形图像的渲染工作,而这种工作的特性就是可以分布式、每个处理单元之间较为独立,没有太多的关联。而一部分机器学习算法,比如遗传算法,神经网络等,也具有这种分布式及局部独立的特性(e.g.比如说一条神经网络中的链路跟另一条链路之间是同时进行计算,而且相互之间没有依赖的),这种情况下可以采用大量小核心同时运算的方式来加快运算速度。

参考
https://www.zhihu.com/question/35063258

为何GPU可以用于加速人工智能或者机器学习的计算速度(并行计算能力)相关推荐

  1. Light-Head R-CNN : 旷世提出用于加速two-stage detector的通用结构,速度达102fps

    论文提出Light-Head R-CNN,一个精简的two-stage目标检测器设计准则,在表达能力很强的精简特征图上使用轻量级的R-CNN子网,不仅大量减少推理耗时,还提高了准确率,结合Xcepti ...

  2. 亚马逊云科技在中国区域上线机器学习新服务,打造广泛而深入的人工智能与机器学习工具集

    2021年5月11日,在完全托管的机器学习服务Amazon SageMaker落地中国区域一周年之际,亚马逊云科技宣布通过与光环新网和西云数据的紧密合作在中国区域进一步落地多项人工智能与机器学习的新服 ...

  3. AWS副总裁Swami:现在是人工智能和机器学习的黄金时代

    "在人工智能领域,机器学习是一个非常有意思的话题.包括亚马逊CEO杰夫·贝索斯在内,很多人都会经常谈论它."谈起人工智能与机器学习,已经在亚马逊云服务(AWS)工作了15年的AWS ...

  4. 利用 GPU 加速人工智能:新型计算模式

    纽约大学本周有一场探讨 "人工智能的未来" 的年度座谈会,Yann LeCun 邀请NVIDIA 联合创始人兼首席执行官黄仁勋 (Jen-Hsun Huang)先生在座谈会上发言. ...

  5. 揭秘人工智能、机器学习和深度学习的神秘面纱

    1 题记 AI.机器学习.监督学习.无监督学习.分类.决策树.聚类.深度学习和算法.深度学习.机器学习,人工智能--这些时下流行语代表着对未来技术的分析. 在这篇文章中,我们将通过现实世界中成熟的例子 ...

  6. 干货!一文读懂人工智能和机器学习有什么关系

    人工智能的演变 符号人工智能 人工智能作为计算机科学的一个分支出现于 20 世纪 50 年代.它的两个主要目标是:1) 通过在计算机上建模和模拟来研究人类智能,以及 2) 通过像人类一样解决复杂问题来 ...

  7. 干货丨机器学习必备:前20名Python人工智能和机器学习开源项目

    如今机器学习和人工智能已经变得家喻户晓,有很多爱好者进入了该领域.但是,什么才是能够进入该领域的正确路径呢?如何保持自己跟上该领域的发展步伐呢? 为了解决以上两个问题,可以通过利用高级专业人员每天使用 ...

  8. 盘点52个全球人工智能和机器学习重要会议

    Notes:本文盘点未收录 CVPR.ACL.ICLR 和 EMNLP 等计算机视觉 自然语言处理细分领域的重要大会. Notes:本文盘点未收录 CVPR.ACL.ICLR 和 EMNLP 等计算机 ...

  9. python与人工智能编程-Python是人工智能和机器学习的最佳编程语言,证据在此!...

    人工智能与机器学习是IT行业的新兴热门领域.虽然有关其发展安全性的讨论日益增多,但开发人员仍在不断扩展人工智能的能力与存储容量.如今,人工智能已远远地超出科幻小说中的构想,成为了现实.人工智能技术广泛 ...

  10. 机器学习必备:前20名Python人工智能和机器学习开源项目

    摘要: 机器学习之旅必了解:前20名Python人工智能和机器学习开源项目! 如今机器学习和人工智能已经变得家喻户晓,有很多爱好者进入了该领域.但是,什么才是能够进入该领域的正确路径呢?如何保持自己跟 ...

最新文章

  1. begin end会产生事务吗_无线信号放大器会产生同频干扰吗?
  2. MybatisPlus入门之介绍
  3. centos7.4 kubeadm安装Kubernetes 1.14.1 集群
  4. viper4android使用时,ViPER4Android 目前进度 [11-21,13时16分]
  5. ACL2021 | OntoED:利用本体表示学习实现低资源的事件抽取
  6. [知识库:python-tornado]异步调用中的上下文控制Tornado stack context
  7. 互联网企业架构初期选择--初期技术选型
  8. gin框架-2-返回是html格式的网页数据
  9. 用户计算机证书在哪里找,用户、计算机或服务的“证书”管理单元 怎么进?...
  10. office插件开发_进一步拓展wps办公软件的功能——安装vba开发环境插件
  11. 控制反转和依赖注入的个人理解
  12. 游戏建模师自学3D建模有哪些教材?自学难吗?
  13. 课程回顾丨基于FPGA的OFDM可见光通信系统实现
  14. 新学期|新气象,青春有为,不负韶华
  15. 车牌识别-模板匹配-BP神经网络-卷积神经网络[深度学习]
  16. Vue自定义指令的妙用
  17. PPT如何导出高清eps?
  18. pt, px,em,ex,in等这类长度单位
  19. 透过2W条评论看动漫《博人传-火影忍者新时代》
  20. 华为M2 无法写入外置sd卡 文件

热门文章

  1. android svg 开源库,SVG-Android开源库——项目简单接入与使用
  2. 项目经理跨部门沟通的9个诀窍
  3. dhu 5.2 二叉树:建立存储结构(层次次序)
  4. C# Revit二次开发基础/核心编程---课程体系介绍
  5. 发作性睡病的病程和预后如何?
  6. Castellano 西班牙语学习——Castellano字母发音
  7. 4515DO-DS3BI010DS压差传感器气流检测
  8. 2021年全球α-蒎烯收入大约201.1百万美元,预计2028年达到249.9百万美元
  9. 哈希表练习题(C/C++)
  10. SunCertPathBuilderException: unable to find valid