并行计算(Parallel Computing)指同时使用多种计算资源解决计算问题的过程,它的基本思想是将待求解问题分解成多个子问题,在相同的时间用不同的处理器计算各个子问题,从而有效地节约计算的时间。早期的并行计算只能由专门设计的大型并行计算机或是多个计算机构成的集群完成。但拥有众多处理器的大型并行计算机往往制造成本昂贵、使用功耗巨大,因此在一般的研究过程中实用性不强。利用图形处理器,也就是我们常说的GPU进行并行计算正在成为发展趋势。

同名字一样,GPU起初的设计目的是辅助CPU完成图像渲染等计算机图形学功能。由于图像渲染等相关问题具有高度并行的特点,因此GPU与CPU的硬件设计理念是不同的。CPU将更多的资源(晶体管)用到控制(Control)及缓存(Cache)部分,而GPU则将更多的资源用于计算单元(ALU),如图3-1所示。

GPU与CPU硬件架构上的区别导致了它们在计算中的优势不同:CPU拥有更加完备的逻辑与缓存单元,因此更加适用于计算不规则的数据结构、不可预测的存取模式与单线程程序;而GPU拥有更多的并行计算单元,因此更加擅长处理规则数据结构、可预测存取模式与多线程的程序。

随着硬件及相关软件体系的不断完善,GPU的应用已不再局限于计算机图形处理,基于GPU的通用并行计算研究引发了广泛的关注。在图像处理、视频播放、信号处理、金融分析、石油勘探及天文计算等领域中,基于GPU的并行计算正逐渐成为人们提高运算效率的一个重要手段。但早期将GPU用于计算的方法十分复杂, OpenGL与DirectX等图形接口是研究人员与GPU交互的唯一方式,这就要求研究人员拥有极为丰富的图形接口编程知识,这一点极大地限制了基于GPU的并行计算的发展。

并行计算及GPU简介相关推荐

  1. [并行计算] 2. OpenMP简介

    OpenMP简介 (这篇翻译只涉及与C/C++相关的代码和示例,忽略了与Fortran相关的代码和示例,感兴趣的读者可以参考原文) 1 摘要 OpenMP是由一组计算机硬件和软件供应商联合定义的应用程 ...

  2. pytorch利用多个GPU并行计算多gpu

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/Answer3664/article/d ...

  3. Matlab 并行计算及GPU计算

    转载链接:https://blog.csdn.net/enjoyyl/article/details/41929033

  4. 一文了解GPU并行计算CUDA

    了解GPU并行计算CUDA 一.CUDA和GPU简介 二.GPU工作原理与结构 2.1.基础GPU架构 2.2.GPU编程模型 2.3.软件和硬件的对应关系 三.GPU应用领域 四.GPU+CPU异构 ...

  5. 【STL切片算法文献笔记】基于GPU并行计算的3D打印切片算法

    3D打印模型切片算法研究 文章目录 3D打印模型切片算法研究 论文介绍 前言 一.介绍 二.基于反向光线追踪的切片算法 1.反向光线追踪算法 2.快速获取切片轮廓 三.轮廓提取和NUBRS拟合优化 1 ...

  6. [人工智能-深度学习-40]:英伟达GPU CUDA 编程框架简介

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

  7. 基于GPU的医学图像三维重建体绘制技术综述

    2019独角兽企业重金招聘Python工程师标准>>> 1 前言 随着医学图像三维重建体绘制技术的发展及其研究的深入,医生对数据的分析不再局限于简单的观察输出结果,还要求能对结果进行 ...

  8. GPU架构(三十三)

    一.导言 对于大多数图形渲染开发者,GPU是既熟悉又陌生的部件,熟悉的是每天都需要跟它打交道,陌生的是GPU就如一个黑盒,不知道其内部硬件架构,更无从谈及其运行机制. 本文以NVIDIA作为主线,将试 ...

  9. GPU编程--CPU和GPU的设计区别

    本篇结构 前言 概论 CPU简介 GPU简介 并行计算 CPU/GPU对比 适于GPU计算的场景 GPU开发环境 参考博文 一.前言 因为工作需要,需要从github上找一个CUDA的DBSCAN聚类 ...

最新文章

  1. 机器学习中算法的性能评估
  2. OpenLayers 动态添加标记(Marker)和信息窗(Popup)
  3. 【NLP】一文速览 | 对话生成预训练模型
  4. 华为计算机如何计算sina,一道华为的“简单四则运算”题
  5. android view存储为jpg,Android长按imageview把图片保存到本地的实例代码
  6. java aop注解拦截_Spring AOP 拦截指定注解标识的类或方法
  7. eclipse项目一直显示有错,但是一直找不到错误在哪里
  8. 电影院终于要开门了!一大波搁浅的春节档大片即将上映...
  9. 最简单的视频编码器:基于libvpx(编码YUV为VP8)
  10. c语言指针教学word,C语言中的指针和指针教学
  11. ES6 阮一峰阅读学习
  12. if语句的基本使用语法
  13. 台式计算机设置热点,台式机怎么设置无线热点
  14. 【渗透测试笔记】之【MSF 信息搜集】
  15. 全球上市公司和VC们如何布局元宇宙,是资本盛宴还是炒作概念?
  16. 【规律】Cunning Friends
  17. 实践练习二(必选):手动部署 OceanBase 单副本集群
  18. 路由控制配置apply cost命令解析
  19. 电子信息工程与计算机就业现状,电子信息工程现状及发展前景
  20. Word2Vec详解-公式推导以及代码

热门文章

  1. UA OPTI570 量子力学4 带不含时的标量势的粒子的薛定谔方程
  2. UA MATH523A 实分析3 积分理论例题 控制收敛定理计算一元积分的极限
  3. C# 使用new 关键字显式隐藏从基类继承的成员和内部类的使用
  4. VC++中Depends工具的使用和DLL函数的动态调用方式示例
  5. 浅谈对Fragment的认识
  6. css样式之 direction
  7. HDU 5001 概率DP || 记忆化搜索
  8. [译] 第五天: GruntJS - 为你解决繁琐重复的任务
  9. POJ 1821 Fence ★(单调队列优化DP)
  10. (转)Android SharedPreferences的使用