在大数据时代,随着各行各业数字化转型进程的加快,算力成为重要的新型生产力。而算力是芯片单位时间里处理数据的能力,算力越高,单位时间里处理的数据量越大,芯片的性能越好。

在 2022 年 10 月 25 日长沙 ·中国 1024 大会中,我们特别设立了算力和芯片的挑战与突破论坛,重磅邀请了来自超算、芯片、RISC-V 架构等领域的代表,分享他们对算力与芯片发展的思考和实践,以及对当代开发者的建议,更有精彩的圆桌对话环节,探究开源新时代,创“芯”之路。

《算力和芯片的挑战与突破论坛》精彩回放:https://live.csdn.net/room/csdnlive2/Hed0PPek

算力如何进行提升?

在本论坛上伊始,来自阿里巴巴高级技术专家郁磊首先带来了《国产芯片的Python-AI算力优化》主题演讲。他表示,在如今 CNN 在图像和语音领域应用广泛,其中卷积计算占用了大部分的算力。想要实现卷积计算,可以使用矩阵乘法。

当谈及为什么在众多方案中要选择使用矩阵操作时,郁磊解释道,是因为在很多实践中已经证明矩阵操作是可以被优化的。GEMM 通过优化内容局部性和向量指令,可以比朴素实现快约 10 倍。不过,GPU、CPU 都支持了矩阵加速,但是众所周知,GPU 的算力是 CPU 很多倍,不在一个数量级,但是在这里依然选择使用 CPU 进行推理,主要是因为 CPU 存在优势场景,它比较轻量与简单,不需要额外的硬件,成本比较低,推理很多是在线服务,可以直接在 CPU 做计算,比较遗憾的就是没有可大规模使用 AMX 和 SME 实例。

在解决方案上,郁磊剖析道,可以用 BF16 数据类型来解决,主要是它可以方便地和 IEEE Float 32 做转换,拥有较少的存储空间可提高计算吞吐。为此,阿里平头哥发布了倚天 710 CPU,采用了先进的 ARM 架构,并支持 BF16 指令扩展。在具体的提高资源使用率,充分利用算力资源,行业中最常用的一种方法便是Serverless-Python。

AI 的到来,为高性能技术服务化带来了哪些改变?

紧接着,国家超级计算长沙中心总工程师、湖南大学教授唐卓在《高性能计算服务化——从算力网到AI融合计算》的演讲中说道,超高性能技术服务化是一个面向业务需求领域的全流程服务化,比较通用的行业是科学与工程计算,计算流程是从实际问题出发,然后将其提炼为数学模型,通过算法导入求解器中求解,然后按照模型或者数据分解为并行执行的任务,再通过任务调度并行计算得到计算结果。人工智能计算的整体流程也是从实际问题出发,然后通过建模,将数据输入,其中数据输入可以作为样本,进入模型训练,最终得到参数模型,再进行模型推断。

近年来,超高性能技术服务化和人工智能计算面临着多重的挑战,唐卓表示主要有三个方面:

  1. 大规模模型不断突破人工智能的算法能力,给传统高性能计算系统带来了巨大算力挑战;
  2. 传统科学计算的维度灾难挑战,其中 AI 有望解决 HPC 的不可解问题
  3. 传统超算在操作使用上难以原生适应智能应用场景、AI 计算特性为高性能计算服务化提出的更高要求,带来高基础设施挑战性能云服务

面对这些挑战,当前行业亟需解决一些高性能计算服务化的关键技术,主要涵盖以下几个方面,如任务调度与资源分配、高效的分布式机器学习环境、融合高性能计算与机器学习算子。

结合这些关键性技术,超算云服务平台应运而生,简单来看,该平台主要包含了三个子系统,即高性能计算资源池及管理子系统、跨域资源管理与多云级联、大数据并行处理与建模分析子系统。

算力背后,芯片的挑战

正如文章伊始所述,算力越高,芯片的性能越好,而芯片便是硬件领域最重要的根技术之一。

所谓根技术,进迭时空创始人兼首席执行官陈志坚表示,它是近几年频繁被提及的一个名词。顾名思义,是指所有技术的根,其能够衍生出并支撑着一个或多个技术簇,包含了芯片制造、架构、芯片与计算系统、软件、开源体系。

平常我们常见的电脑、PC、云服务都属于计算技术,计算系统的根技术包含了指令集、计算芯片、操作系统、数据库。

从计算系统角度来看,指令集是其计算系统的根。纵观指令集系统的演变,最为众人所熟知的主要有两种:x86 和 ARM 架构。其中,x86 是一种全封闭架构,主要被 Intel 和 AMD 享有,ARM 是一种半封闭架构,采用了与 x86 完全不同的商业模式,它是有 ARM 公司开发的,并开发了基于这个架构的处理器核,然后将处理器核卖到芯片公司,再者芯片公司集成这个处理器核之后去售卖。现如今,ARM 架构在全球已经占到 80%的份额,相比 x86 后来者居上。因此,从整个指令系统的演变中,也可以总结出两个规律,一个是指令集架构是一个高度马太效应的事务,当有越来越多的人使用时,意味着其生态壁垒越来越高,能够吸引越来越多开发者参与进来。第二个指令架构的竞争更多是商业模式的竞争,ARM 采用的更开放的架构。

x86 是伴随着 PC/互联网成长起来的,ARM 是随着移动互联网起来,面向当前的 AIoT 市场,陈志坚认为,其应用多样化适合 RISC-V 架构。作为开放架构,现在 RISC-V 起步晚,但是加速度快,我们要对 RISC-V 发展要持以乐观的态度,RISC-V 将成为下个时代的主流计算体系。

依靠开源,RISC-V 将改变世界

在 RIOS 实验室联合主任,睿思芯科创始人兼董事长谭章熹看来,摩尔定律还在继续,但是我们不应该继续追逐“彩虹”。先进工艺是有很高的风险,而芯片和硬件/软件协同设计(DSA)才是个重要的方向,即在系统层面进行端到端优化。

通过 RISC-V、OpenEDA 等开源的方式,这将会改变世界。不过需要注意的是,要意识到法律和知识产权对开源技术的商业成功至关重要。

开源时代,创“芯”未来

在圆桌对话环节,当提及算力的巨大提升对芯片的影响时,英特尔研究院副总裁、英特尔中国研究院院长宋继强表示,算力是用来处理数据的,而数据从量的方面有了指数级的增长,很多数据来源对自然世界传感的数据,如自动驾驶、智能工厂、智能城市等,这些数据与过往有很大的不同,数据形式很多样。不过,传统的 CPU、GPU 来处理,已经无法满足需求,需要很多不同的计算加速硬件来处理它。这就使得对实时性要求特别高,未来算力的发展需要多种不同架构的芯片去支撑多种数据要求,如xPU等。

中国科学院计算技术研究所研究员唐志敏则表示,算力的增长,未必是一种好的现象。算力的增长也意味着能源的巨大消耗,这也是很多公司为什么要将数据中心建设到能源便捷的地方的主要原因。算力的增长带来的能源消耗问题,其实与全社会的碳中和等目标是背道而驰的。因此在算力迅速增长的今天,也需要从全系统的角度想出比较平衡的方案。

不过,在支撑算力的芯片领域,进迭时空创始人兼首席执行官陈志坚表示,最为主流的三大架构中,x86 宛如五六十岁的老人,ARM 宛如三四十岁的青年,而 RISC-V 宛如一个七八岁的小朋友,需要直面现实的是,RISC-V 在架构完善度上是比不上 x86 和 ARM 的。不过开源已经在软件领域证明了自己强大的生命力,从上世纪 90 年代起,UNIX、Linux 便是开源的见证与实践者。 RISC-V 的到来,其实是打开了硬件领域开源的大门,这对中国的意义非常重要。

那么如何吸引更多的人参与到芯片以及 RISC-V 的生态构建中,谭章熹认为,前提是需要有一个完整的教育体系。人才是整个行业发展的核心,计算机的知识教育需要培养其系统化。尽可能地通过开源,带来先进的教学理念与系统化的设计,这是对国内乃至全球化人才培养直观重要的。

在最后,鉴释首席执行官梁宇宁表示,秉持开放与共享,向着 Linux 的方向,越来越好。通过商业模式和开源的协同与合作,大家都可以在生态中实现商业化,未来也希望 RISC-V 打破地理位置的限制,越来越好。

《算力和芯片的挑战与突破论坛》精彩回放:https://live.csdn.net/room/csdnlive2/Hed0PPek

如何破解算力与芯片这道难题?相关推荐

  1. 如何破解区块链应用落地难题

    链得得大文 区块链服务网络BSN 红枣科技.Thoughtworks.四方精创和链得得联合发起了此次讨论,主题为"如何破解区块链落地应用难题",北京红枣科技CEO何亦凡.Thoug ...

  2. 国产汽车级可编程线性霍尔传感器CHA611,可以替代Allegro的A1363系列产品,解决汽车级芯片缺货难题

    A1363是Allegro的一款SIP封装0至>1000A传感器IC产品,A1363是带先进的温度补偿和高带宽(120kHz)模拟输出的低噪音.高精度.可编程线性霍尔效应传感器IC,但由于目前国 ...

  3. 苹果电脑删除软件_易我Mac数据恢复软件,解决苹果电脑T2芯片数据恢复难题!

    苹果加入T2芯片,数据恢复成为难题 一直以来,苹果公司都不希望用户自行拆解和维修它的产品,并于2017年12月在iMac Pro中加入了T2芯片,用于多种安全目的,包括保护启动进程,保护加密密钥,以及 ...

  4. 一套OA系统 破解中小企业4大管理难题

    中小企业在发展的过程中,会遇到很多问题,单就企业内部管理来说,最常出现的有四大问题:制度不健全导致管理乱.知识管理缺失导致积累难.人才配置不齐导致负担重.缺乏执行力导致发展难.这些问题困扰企业发展,1 ...

  5. 智能座舱的交互革命,高算力AI芯片赋能全时全域交互体验

    当前,中国智能座舱市场正在全面升级,基于手势.面部.语音等感知的主动化交互已经成为了座舱智能化的大趋势. 直至今年9月,地平线征程系列汽车智能芯片及Halo车载智能交互方案已成功登陆长安UNI-T.智 ...

  6. 21岁就破解困扰人们300年难题的天才,却一生坎坷,怀才不遇,至死还得不到认可...

    这不是难题 本来就是无解 何谓数学? 数学家Eduardo曾这样回答 "数学是永恒,是真理,是一切的答案." 回首往昔 数学始终伴随我们左右 纵横交错的几何.繁琐复杂的运算 难以求 ...

  7. 跨链技术如何破解区块链的可扩展性难题?

    区块链技术的初衷是将所有数据的流转.智能合约的运行等放在同一条链上进行,打造一个全球一体化的共享开放平台.但是,在此后的实践和应用过程中,诸多技术和商业因素的限制让我们越来越发现这样一个美好愿景有些不 ...

  8. 私有云厂商云宏破解金融行业转型“数字底座”难题

    中国人民银行于近日印发<金融科技发展规划(2022-2025年)>(以下简称<规划>),在<规划>中明确提出要布局先进高效的算力体系,进一步夯实金融创新发展的&qu ...

  9. 一副对联,是否破解了年终奖发放难题?

    临近年终,面对满怀期待的员工,领导们也是操碎了心.如何"发红包"历来是对管理者的年终大考.以下案例的做法,不代表杂志社的观点,欢迎读者留言发表看法. "什么?把年终奖发得 ...

最新文章

  1. 看漫画学python 豆瓣_漫画,小莉要学Python后端,看大牛是怎么教她的!
  2. 如何高性能的给UIImageView加个圆角
  3. opencv高效遍历图像
  4. 【每周CV论文】初学深度学习图像修复应该要读的文章
  5. 政策表达式截取json_json格式数据如何提取指定中文字符串。
  6. oracle dump 转储
  7. python 将os.getcwd()获取路径中的\替换成\\
  8. java用easyexcel实现读取excell表格内容
  9. linux 查看文件哈希码,使用linux的sha1sum命令查看效验文件哈希值命令
  10. 程序员书籍哪里找?有这个GitHub项目就够了
  11. Bailian4109 公共朋友-Common Friends【关系】
  12. 苹果好还是华为好_苹果手机好还是华为手机好?专业手机测评师给出答复!
  13. C语言 fread 函数 - C语言零基础入门教程
  14. Hilo - 阿里巴巴出品的免费开源 H5 游戏引擎,轻巧无依赖,适合用来开发营销互动小游戏
  15. java保留字详解_保留字
  16. TF_REPEATED_DATA ignoring data with redundant timestamp for frame left_wheel at time
  17. linux trace 进程 文件路径,linux panic 问题定位
  18. Lucene.net和盘古分词使用小结
  19. 关于心跳包的实现手法
  20. matlab中的sjy定义,sjy(sjy是什么缩写)

热门文章

  1. 古剑奇谭显示服务器维修,古剑奇谭OL出现千人混战,满地图都是红名,服务器差点打宕机...
  2. 关于linux和shell的相关书籍
  3. 最新去水印小程序源码,支持图集,功能齐全
  4. Java实现 蓝桥杯 算法训练 数字游戏
  5. GHOST备份系统的利弊
  6. 【老脸教你做游戏】小鸟飞过障碍物的游戏(下)
  7. Java流程控制语句——学习笔记(3)
  8. 戴尔计算机更新程序,戴尔计算机已准备好进行win10 2004更新
  9. spring mvc重复提交解决办法
  10. vc6.0调用mysql5.7_win7 mysql安装和vc6.0调用mysql测试