高性能计算(HPC)利用超级计算机和并行处理技术,快速完成耗时较长的任务或同时完成多个任务。HPC市场既是一个传统的市场,又是一个新兴的、高速发展的市场。定位高端用户、标杆项目,影响力大、平民化趋势、快速发展。


高性能计算的工作原理

在高性能计算中,处理信息的两种主要方式为:

串行处理,由中央处理器 (CPU) 完成。每个 CPU 核心通常每次只能处理一个任务。CPU 对于运行各种功能而言至关重要,如操作系统和基本应用程序(如文字处理、办公生产力工具等)。

并行处理,可利用多个 CPU 或图形处理器 (GPU) 完成。GPU 最初是专为图形处理而设计的。它可在数据矩阵(如屏幕像素)中同时执行多种算术运算。同时在多个数据平面上工作的能力使 GPU 非常适合在机器学习 (ML) 应用任务中进行并行处理,如识别视频中的物体。

突破超级计算的极限需要不同的系统架构。大多数高性能计算系统通过超高带宽将多个处理器和内存模块互连并聚合,从而实现并行处理。一些高性能计算系统将 CPU 和 GPU 结合在一起,被称为异构计算。

计算机计算能力的度量单位被称为“FLOPS”(每秒浮点运算次数)。截至 2019 年初,现有的高端超级计算机可以执行 143.5 千万亿次 FLOPS (143 × 1015)。此类超级计算机被称为千万亿次级,可以执行超过千万亿次 FLOPS。相比之下,高端游戏台式机的速度要慢 1,000,000 倍以上,可执行约 200 千兆次 FLOPS (1 × 109)。超级计算在处理和吞吐量方面的重大突破很快将会实现超级计算的下一个重大级别——百亿亿次级,该级别的速度比千万亿次级约快 1,000 倍。这意味着百亿亿次级超级计算机每秒将能够执行 1018(或者 10 亿 x 10 亿)次运算。

“FLOPS”是对理论处理速度的描述,实现该速度需要连续向处理器传输数据。因此,系统设计必须考虑到数据吞吐量这一因素。系统内存以及处理节点之间的互连会影响数据传输到处理器的速度。

为了实现1百亿亿次级 FLOPS 的下一级超级计算机处理性能,大概需要 5,000,000 个台式机。*假定每个台式机具备 200 千兆次 FLOPS 的能力。


术语知识

  • 高性能计算 (HPC):一个广义上的强大计算系统,其范围涵盖简单计算机(如 1 个 CPU + 8 个 GPU),乃至世界一流的超级计算机

  • 超级计算机:最先进的高性能计算机,以不断提高的性能标准为依据

  • 异构计算:优化串行 (CPU) 和并行 (GPU) 处理能力的高性能计算架构

  • 内存:在高性能计算系统中为实现快速访问而存储数据的地方

  • 互连:可令处理节点互相通信的系统层;在超级计算机中存在多个级别的互连

  • 千万亿次级:为达到每秒执行千万亿次 (1015) 运算而设计的超级计算机

  • 百亿亿次级:为达到每秒执行百亿亿次 (1018) 运算而设计的超级计算机


为什么要做高性能计算?

从系统的角度:集成系统资源,以满足不断增长的对性能和功能的要求

从应用的角度:适当分解应用,以实现更大规模或更细致的计算

解决问题:科学和工程问题的数值模拟与仿真(计算密集、数据密集、网络密集、三种混合)。

声明:本文来源智能计算芯世界,转载此文目的在于传递更多信息,版权归原作者所有。


欢迎加入Imagination GPU与人工智能交流2群

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读

Vulkan完全光线追踪硬阴影

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech !

浅谈高性能计算(HPC)相关推荐

  1. 万丈高楼平地起 ——浅谈网格计算基础

    万丈高楼平地起 --浅谈网格计算基础 网格技术的产生.发展必须具备以下三个基本条件:计算资源的广域分布.网络技术(特别是Internet)以及不断增长的对资源共享的需求.在计算器技术发展的早期阶段,只 ...

  2. 高性能计算(HPC)

    需求的膨胀推动着技术变革,技术的革新进一步丰富着我们的生活,如今大数据.云计算技术已经自身疲惫了.然而跨界竞争和技术融合迫使我们不断换血和补充能量来适应一次次变革.那么在人工智能.虚拟现实.物联网等技 ...

  3. 不会崩的报名系统才是好报名系统,之浅谈

    ​​首先,标题已注明是浅谈,也就不会太高深,适合各种技术类.非技术类人员参阅.由于才疏学浅,可能存在不到之处,还请大神指正,勿喷.谅解. 随着各地人事机构招考需求不断增强,规模不断扩大,考务管理工作难 ...

  4. 浅谈MySQL存储引擎-InnoDBMyISAM

    浅谈MySQL存储引擎-InnoDB&MyISAM 存储引擎在MySQL的逻辑架构中位于第三层,负责MySQL中的数据的存储和提取.MySQL存储引擎有很多,不同的存储引擎保存数据和索引的方式 ...

  5. 【大话设计模式】——浅谈设计模式基础

    初学设计模式给我最大的感受是:人类真是伟大啊!单单是设计模式的基础课程就让我感受到了强烈的生活气息. 个人感觉<大话设计模式>这本书写的真好.让貌似非常晦涩难懂的设计模式变的生活化.趣味化 ...

  6. 学校计算机机房好处,浅谈学校计算机机房维护

    浅谈学校计算机机房维护    现在的学校机房都配置了数量较多的计算机,而且机房的使用非常频繁.对于怎样维护好计算机,特别是计算机软件系统,对广大计算机教师来说是一个很重要且非常现实的问题.下面就本人在 ...

  7. java 中的单元测试_浅谈Java 中的单元测试

    单元测试编写 Junit 单元测试框架 对于Java语言而言,其单元测试框架,有Junit和TestNG这两种, 下面是一个典型的JUnit测试类的结构 package com.example.dem ...

  8. mybatis与php,浅谈mybatis中的#和$的区别

    浅谈mybatis中的#和$的区别 发布于 2016-07-30 11:14:47 | 236 次阅读 | 评论: 0 | 来源: 网友投递 MyBatis 基于Java的持久层框架MyBatis 本 ...

  9. 浅谈GCC预编译头技术

    浅谈GCC预编译头技术 文/jorge --谨以此文,悼念我等待MinGW编译时逝去的那些时间. 其 实刚开始编程的时候,我是丝毫不重视编译速度之类的问题的,原因很简单,因为那时我用BASICA.后来 ...

最新文章

  1. 14.4 exportfs命令 14.5 NFS客户端问题 15.1 FTP介绍 15.2/15.3
  2. Linux执行yum不显示时间,Linux停的yum命令详解(朝花夕拾)
  3. solver.prototxt文件里面参数含义及其设置
  4. 基于Verilog语言的伪随机码的编写
  5. 【No.1 Ionic】基础环境配置
  6. camera---(3)双camera 生态链
  7. 91Android万能驱动最新版,NVIDIA万能驱动电脑版下载|NVIDIA万能驱动官方安装版下载 -爱安卓...
  8. 真不是炼丹,务实敢为的 MoCo v3
  9. java反编译jar包并修改class文件重新打包
  10. 大数据离线分析之企业实战分享
  11. python 官网下载+安装(Mac)
  12. 世界上最简单的会计书(利润表)
  13. 男人就是要对自己狠一点
  14. vue添加背景及页面留白处理方法
  15. 菜鸟学习Docker实例
  16. SSM框架将数据库数据导出为Excel文件
  17. 2021 年使用 WordPress 作为 CMS 的 25 个热门网站
  18. 钉钉请假单如何下载到电脑打印
  19. python字符串模糊匹配 - RapidFuzz
  20. 10组团队项目-Alpha冲刺-2/6

热门文章

  1. GPS从入门到放弃(十五)、DCB差分码偏差
  2. 项目管理笑话集之诸葛亮借东风
  3. SAAS-HRM-day1
  4. 自动控制原理复习——第一章绪论
  5. 阿里云 服务器,云盾的ip占用大量流量的问题
  6. frp-内网穿透-远程桌面
  7. 知识产权行业拓客的10个经典方法
  8. ThinkPad T460S 拆解图 拆解图
  9. 2022年执业兽医考试综合试题及答案
  10. 算法学习之“Big Oh Notation”