GPU

GPU又称图形处理器、显卡, 负责渲染图片、视频以及2D、3D内容的显示。

相比于CPU的4核, 8核, GPU则是由成千上万个为多任务而设计的小核心封装而成的, nvidia管他叫CUDA, AMD叫它流处理器。

事实上大部分CPU也集成了核心显卡, 也就是说能够承担GPU的工作,即CPU和GPU公用一块内存,所以和中高档的独立显卡比起来,其性能差的可不是一点半点。

那么我们怎么来分辨GPU的好坏呢? 一分价钱一分货吗? 那也太不专业了。 下面, 就列举出几个GPU的核心参数, 通过核心参数的对比来从入门级的角度比较GPU的性能差别。

在架构相同的情况下, GPU的性能主要是由流处理器数量, 核心频率, 显存,等决定的。

  • 流处理器
    流处理器是GPU的基础计算单元,相当于CPU的一个核心,流处理单元的个数可以说是直接影响显卡的图形处理能力。同样以GTX 1080为例,其流处理单元数量为2560个。

  • 核心频率
    GPU的核心频率和CPU的主频差不多一个概念,核心频率有基础频率和加速频率之分,单位为MHz。一般显卡都会标注这个范围,核心频率是衡量显卡性能的一个重要的参数,但除了频率高低外,流处理器的数量也非常重要。在流处理器数量不同的情况下, 核心频率越高不代表显卡就越强劲。

  • 显存
    显存,又被叫做帧缓存,是用来储存GPU处理过的或即将处理的渲染数据,GPU的显存相当于CPU的内存。其中, 显存位宽是显存在一个时钟周期内所能传输数据的位数, 位数越大则相同周期内传输的数据越多, 送到流处理器的数据也就越多, 显卡“吞吐量”也就更大。 而显存带宽是指核心与显存之间的传输速率; 显存带宽 = 等效频率×显存位宽 / 8 。 目前主流的显卡提供超过75GB/S的显存带宽。 由于显存带宽是核心与显存之间的交换速度, 因此, 显存带宽越大, GPU的性能也就越强, 这是判断显卡好换的关键之一。

补充

NVIDIA显卡怎么看
Nvidia的GPU命名有4个层次:

  • GPU 架构(microarchitecture), 表示GPU在芯片设计层面上的不同处理方式,包括的内容有计算单元(SIMD)的个数、有无L1,L2缓存、是否有双精度支持等。按时间顺序依次是Tesla, Fermi, Kepler, Maxwell, Pascal。
  • 显卡系列:根据使用场景的不同,分成GeForce, Quadro, Tesla。GeForce用于家庭和个人电脑,包括游戏和娱乐等;Quadro用于工业渲染、艺术设计,工作站等场合。而Tesla用于科学计算,深度学习加速等场景。当然这三者的使用场景并没有严格的边界,比如GeForce 系列的GTX 1080也可以用来做深度学习实验。
  • 芯片型号,例如GT200、GK210、GM104、GF104, K80, M40等。其中第二个字母表示架构,如K40 中的K表示是Kepler架构,P100中的P表示Pascal架构。
  • 针对GeForce系列,还有2系列,3系列,200系列,400系列等分类,像GeForce GTX 1080 就是10系列。**

RTX : 在高端的2080TI和2080都统称为“RTX”,在统称中的“RT”所代表的是光线追踪(ray tracing的缩写),其意思是RTX 2080TI和RTX 2080显卡都拥有非凡的光线追踪性能,所谓的光线追踪是指在游戏中有着更好更真实的显示效果(其中包括阴影,光线,反射等),RTX 20显卡所采用的“图灵”架构加入RT计算单元,使得RTX20显卡的光线追踪性能和上一代产品相比提升数倍,使得游戏看起来更加真实,给玩家营造更好的游戏体验。
GTX : GTX是英伟达游戏显卡的一个系列,性能较强, 属高端显卡;
GTS : 定位是中端显卡;
GT : 定位是中低端显卡;
GS : 低端显卡;
MX :就是轻薄本的一种显卡,目前也就只有940MX和MX150两款, 性能较弱;

参考文章:
【1】桌面显卡性能天梯图
【2】从深度学习选择什么样的gpu来谈谈gpu的硬件架构
【3】关于英伟达显卡命名的姿势
【4】硬件科普之显卡参数你看懂了吗?

计算机硬件科普——GPU相关推荐

  1. 计算机硬件科普——CPU

    CPU 我们通常将cpu比喻为人类的大脑,是计算机的核心部件, 决定了一台电脑的运算性能好坏.通常cpu核心参数有:架构.缓存.主频.核心.线程. 架构 1.CPU架构是CPU厂商给属于同一系列的CP ...

  2. 计算机硬件科普——机械键盘

    机械键盘 机械键盘的优势 1.机械键盘与传统薄膜键盘最大的不同,就在于整体的手感.前者段落感清晰.敲击时会发出明显的声音,能够让用户体验到敲击键盘的乐趣,这就像我们所说的驾驶乐趣一样.而后者手感相对于 ...

  3. 【深度学习】一文看懂 (Transfer Learning)迁移学习(pytorch实现)

    前言 你会发现聪明人都喜欢"偷懒", 因为这样的偷懒能帮我们节省大量的时间, 提高效率. 还有一种偷懒是 "站在巨人的肩膀上". 不仅能看得更远, 还能看到更多 ...

  4. 迁移学习 Transfer Learning—通俗易懂地介绍(常见网络模型pytorch实现)

    前言 你会发现聪明人都喜欢"偷懒", 因为这样的偷懒能帮我们节省大量的时间, 提高效率. 还有一种偷懒是 "站在巨人的肩膀上". 不仅能看得更远, 还能看到更多 ...

  5. 认识机器学习与深度学习

    目录 1. 认识机器学习 1.1 什么是机器学习? 1.2 机器学习可以解决的问题 1.3 机器学习的基础知识 2. 认识深度学习 2.1 什么是深度学习? 2.2 深度学习能做什么? 2.3 深度学 ...

  6. CUDA PTX ISA阅读笔记(一)

    不知道这是个啥的看这里:Parallel Thread Execution ISA Version 5.0. 简要来说,PTX就是.cu代码编译出来的一种东西,然后再由PTX编译生成执行代码.如果不想 ...

  7. Tensorflow高阶内容(五)- Deep Learning

    高阶内容 5.1 Classification分类学习 5.2 什么是过拟合(Overfitting) 5.3 Dropout 解决 Overfitting 5.4 什么是卷积神经网络CNN(Conv ...

  8. 科普帖:深度学习中GPU和显存分析

    深度学习最吃机器,耗资源,在本文,我将来科普一下在深度学习中: 何为"资源" 不同操作都耗费什么资源 如何充分的利用有限的资源 如何合理选择显卡 并纠正几个误区: 显存和GPU等价 ...

  9. 华为最强科普(1):什么是集成电路?工艺/CPU/GPU又是哪路大神?

    [前言]:最近看到公众号[华为麒麟]推出的集成电路(IC)系列科普文章,浅显易通,内容幽默风趣,非常适合于入门集成电路设计的新人和非集成电路专业的想要一窥集成电路行业大概的人阅读. 这是第一篇文章,主 ...

最新文章

  1. (转)七牛云phpSDK使用笔记
  2. linux shell数组定义、元素获取及其长度获取
  3. SqlServer与.NET的数据类型映射关系图
  4. 服务器上次文件命令,服务器上次文件命令
  5. 调查显示:被黑过的公司难以找到投资
  6. Array 的方法们 和 object 那些让人纠结的问题 ......
  7. python实战运用_python实例运用
  8. Eclipse配置反编译问题
  9. CAM350对比电路图方法
  10. 一次Rpc调用报错排查
  11. [UE4]IES光源概述文件
  12. Java 面向对象基本特征
  13. javacv 人脸追踪_基于JavaCV的人脸识别程序
  14. 正睿20秋季普转提day3
  15. Linux解压缩解压tar.gz文件
  16. 学习 | 文献通读《基于LDA的游客网络评论主题分类:以故宫为例》
  17. 电影资源详细信息爬取
  18. 【每周一库】- teloxide (电报群机器人)
  19. Others2_谈谈个人常用的软件
  20. 数据分析之Numpy创建二维空数组

热门文章

  1. 数据结构课程主页-2015级
  2. 长乐未央——记高桥留美子的辉煌三十年
  3. FCFS磁盘调度算法(C语言实现)
  4. IOS 实现植物大战僵尸
  5. 视频mp4与m4v格式区别
  6. 8Flask-----------Flask框架------------安装使用、基本介绍
  7. Spice Model 解读
  8. 牛客BM99-顺时针旋转矩阵-C++
  9. 怎样知道mysql的驱动是什么_MySQL连接查询到底什么是驱动表?看了这里你应该就明白了...
  10. 孙鑫Java视频教程(全12CD)