阿里平头哥

布局行业4年之久,在经历了成立达摩院立项突破、资本并购等多轮铺垫之后,阿里巴巴正式宣布成立独立芯片公司并将其命名为平头哥半导体有限公司,旨在推进云端一体化的芯片布局。希望通过自研的强大的技术平台和生态系统整合能力,推动国产自主芯片的产业化落地。

3月25日,阿里平头哥在玄铁910处理器、计算存储一体化及AI硬件基准测试等方面的研究成果的三篇论文入选计算机体系结构顶会ISCA 2020,创国内芯片企业纪录。

ISCA是计算机体系结构领域的顶级学术会议,包括谷歌、英特尔、英伟达等企业在ISCA上发表的多项研究成果都已在半导体行业广泛应用。平头哥此次入选三篇论文(包括两篇合作论文),成为ISCA历史上论文入选最多的中国企业。

玄铁910处理器

其中一篇论文首次阐述了玄铁910的设计方法。玄铁910是平头哥发布的基于RISC-V的处理器IP核,开发者可以免费下载FPGA代码,开展芯片原型设计架构创新。

作为平头哥首款产品,玄铁910也是目前业界性能最强的RISC-V处理器。为解决RISC-V性能瓶颈,玄铁910率先将多发射乱序内存访问技术引入RISC-V架构,并通过自适应混合分支处理技术以及多通道、多模式数据预取技术大幅提升了指令及数据访问带宽。

第三方测试平台数据显示,玄铁910已达到业界主流商用高性能架构的水平。该论文团队表示,玄铁910不仅突破了RISC-V处理器的性能边界,也为RISC-V打开了新的应用场景,玄铁系列处理器已经实现了终端、边缘端及云端场景的全覆盖。

计算存储一体化

从2012年开始,AI训练所用的计算量呈现指数增长,平均每3.43个月便会翻倍,那就代表着从2012年到现在,计算量扩大了300,000倍,这已经触碰了传统冯诺依曼架构的天花板。

冯诺依曼瓶颈是冯诺依曼架构本身带来的一些限制。冯诺依曼架构的明显特征是将CPU与存储器分开,计算单元是从内存中读取数据,然后再将结果存回到内存。但这种架构在当初构建的时候,是假设CPU和内存速度接近,但后续的发展是CPU的性能提升速度远远超过了内存的性能提升,这就给两者之间制造了一道存储墙。

为突破AI算力瓶颈,平头哥提出了一种可解决存储墙问题的基于近存储体架构的可编程硬件和软件架构。

AI硬件基准测试

平头哥以及及与谷歌、微软、Facebook等科技公司联合研发的MLPerf推理基准0.5版本,这是目前业界主流的AI硬件性能测试平台。

MLPerf推理基准0.5版本其中包括5项内容,主要针对目前常见的应用,包括图像识别、物体检测及机器翻译项目。而且测试模拟的场景都与真实情况相关。其中单流检测评估如智能手机用户拍照,多流检测评估如检测障碍物的多摄像头气测系统。服务器场景针对在线请求,而离线检测针对批处理系统,主要测试系统的吞吐量。这套测试中还包括了一个负载生成器LoadGen,除了生成负载外,还要负责验证结果的准确性并计算最终的指标。

MLPerf Inference推理基准测试让GPU、AI芯片有了更加全面的测试。

点击查看往期内容回顾

梦幻显示器,国产屏幕OLED崛起

国产系统UOS与office完成适配后的使用亲测体验

长按二维码,关注我们

新睿云,让云服务触手可及

云主机|云存储|云数据库|云网络

三大研究成果入选ISCA ,推动国产自主芯片的产业化落地相关推荐

  1. 数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB

    近日,国际顶级数据库学术会议 VLDB 2022 在澳大利亚悉尼举办.阿里云与达摩院空天数据库引擎团队有关 Ganos 的两项研发成果被 VLDB 2022 收录. VLDB 与 SIGMOD.ICD ...

  2. 7.07亿TPC-C背后的技术突破,OceanBase研究成果入选VLDB

    近日,国际顶级数据库学术会议 VLDB 2022 在澳大利亚悉尼开幕.OceanBase 研究成果论文"OceanBase: A 707 Million tpmC Distributed R ...

  3. 阿里 AI 研究成果入选国际顶会 ICML 2020,AI 推理速度提升 3 倍

    近日,人工智能国际顶会ICML 2020公布了论文收录结果,阿里巴巴7篇论文入选,是入选论文数量最多的中国科技公司.ICML是机器学习领域全球最具影响力的学术会议之一,今年接受率仅为21.8%. 根据 ...

  4. 阿里云视频云视频增强领域最新研究成果入选国际顶级学术会议

    ICASSP 2022(International Conference on Acoustics, Speech and Signal Processing)是全球最全面的信号处理及其应用方面的顶级 ...

  5. 支付宝安全实验室研究成果入选AAAI-20,将进一步提升安全风控能力

    被业内誉为"人工智能研究风向标"的国际人工智能领域顶级学术会议AAAI-20(The Thirty-Fourth AAAI Conference on Artificial Int ...

  6. 国产自主GPU架构“天狼星”在北京亮相

    GPU(Graphic Processing Unit)即图形处理器,是数字世界图形内容生成的基石,不管是桌面应用.游戏.电影.数字孪生还是元宇宙:与此同时,强大的并行计算能力业已成为各种应用加速的主 ...

  7. 自主芯片+国产系统!天河三号原型机研制完成,中国超算有望重回No.1

    岳排槐 发自 凹非寺 量子位 出品 | 公众号 QbitAI △ 天河三号E级原型机机柜 我国超级计算机又有新突破! 经过两年多的持续关键技术攻关和突破,"天河三号"E级原型机研制 ...

  8. 华为云的研究成果又双叒叕被MICCAI收录了!

    语义/实例分割问题是近年来医学图像计算领域的一个热门研究课题,70%以上的国际竞赛都是围绕着它展开.在临床上,分割方法使能临床辅助决策.术前规划.肿瘤动态监控等任务,具有极高的临床使用价值. 2020 ...

  9. 像人类一样理解言外之意,阿里AI最新研究成果被国际顶会收录

    AI的语言理解能力又进一步了!7月30日,在全球线上举行的人工智能顶会SIGIR 2020上,阿里巴巴研究团队表现突出,共有29项研究成果入选,是全球论文数量最多的科技公司.据悉,阿里在多个成果中展现 ...

最新文章

  1. ios runloop学习
  2. spark从hbase读数据到存入hbase数据两种版本写法
  3. C语言状态机编程思想
  4. python utc 时间
  5. JSON-JSON 百科
  6. java编程计算加减乘除_Java程序完成加减乘除四则运算
  7. python实现的简版iconv
  8. python编程是啥-什么是Python编程课程
  9. yii2环境搭建(ubuntu下nginx+php+mysql+yii2)
  10. 高斯克吕格投影 python2.x 版本
  11. 数据结构与算法面试题(2022版本)
  12. 数据库建模多表一对多和多对一、一对一、多对多
  13. lisp 图层字体式样替换_ps将不同图层字体修改成相同字体的方法
  14. C语言编写红色警戒外挂
  15. word2010计算机实验报告,Word2010计算机实验报告--
  16. Micro:Bit手柄试用之一MagicPad (解决蓝牙与gamePad包共存)
  17. cobaltstrike如何安装使用(包含CS联动MSF详细用法!)? (゚益゚メ) 渗透测试
  18. 操作系统作业之银行家算法(c语言实现)
  19. java 导出wps_java如何导出word和wps文档
  20. 如何查看C++ 编译的DLL函数

热门文章

  1. 基于PHP的网上租车租赁网站设计与实现
  2. 精益生产的定义和特征解读
  3. 明日之星家校共育项目“一知一做”正式启动
  4. 2021年低压电工最新解析及低压电工考试技巧
  5. 《国富论》阅读笔记04
  6. 极复杂编码,下载《原神》角色高清图、中日无损配音,爬虫 16 / 120 例
  7. 园艺应用的计算机知识,第一章 计算机在农业上的应用 绪论 ppt课件.ppt
  8. 微信中点击下载链接提示无效的解决方案
  9. 《软件工程—实践者的研究方法》读书笔记
  10. 开源夏令营《基于HackRF开发GPS信号仿真模拟器》工作总结(五)