嘉宾介绍:谭光明,中国科学院计算技术研究所副研究员、博士生导师。

主要研究方向为并行算法、编程与体系结构,负责计算机体系结构国家重点实验室和曙光团队的并行算法小组的研究工作。作为科研骨干参加了863项目曙光4000/5000/6000(星云)系统的研制;承担并参与了多项国家自然科学基金项目和973项目;2006年8月至2007年8月访问University of Delaware,参与了IBM Cyclops-64众核体系结构的研究。在高性能计算方面发表了论文三十余篇,包括超级计算领域的国际会议和期刊如SC、ICS、SPAA、PPoPP、TPDS和JPDC等。曾担任多个国际会议的程序委员会委员(ICS 2010、ICPP 2012、HiPC 2011-12等),并担任了多个期刊的审稿人(TPDS、JPDC、PC、IJHPCA等)。2007年获得中国科学院院长优秀奖,2008年获得中国计算机学会优秀博士论文奖,2010年获得中科院卢嘉锡青年人才奖,2011年入选中科院青年创新促进会。

演讲主题:面向GPU的快速稠密矩阵乘算法设计和实现

主题概述:双精度稠密矩阵乘(DGEMM)是科学与工程计算应用中重要的性能关键的核心算法,本工作介绍一种基于现有的GPU体系结构如NVIDIA Fermi和AMD Cypress的高度优化的DGEMM设计和实现。针对两种GPU存在的共同的存储墙问题,开发了算法性能模型确定最优分块因子的以缓解其内存带宽瓶颈。进一步考虑到两种GPU上不同的来自体系结构方面的性能瓶颈,提出了新的半自动自动调度算法和细粒度软件流水算法,并分别在NVIDIA Fermi和AMD Cypress的GPU平台上实现了优化的DGEMM程序。在NVIDIA Fermi平台上,优化DGEMM的浮点峰值从原来的302GFLOPS(效率58%)提升到362GFLOPS(效率70%),超过比CUBLAS4.0版本20%;在AMD Cypress平台上,浮点峰值从优化前的438GFLOPS(47%)提升到758GFLOPS(82%)。二者都是目前为止公开报道的在上述两种GPU体系结构上性能最高的DGEMM实现,在NVIDIA Fermi上优化实现的DGEMM已经被集成到评测CPU-GPU超级计算机的基准测试程序HPL GPU版本中。

中科院计算机所副研究员,中科院计算技术研究所副研究员 谭光明相关推荐

  1. 作者:张家琳(1983-),女,中国科学院计算技术研究所副研究员。

    张家琳(1983-),女,中国科学院计算技术研究所副研究员,主要研究方向为在线算法.近似算法.社交网络.算法博弈论等.

  2. 作者:靳小龙,中国科学院计算技术研究所副研究员,博士生导师。

    靳小龙(1976-),男,中国科学院计算技术研究所副研究员,博士生导师,中国科学院网络数据科学与技术重点实验室网络数据科学研究部负责人,CCF大数据专家委员会委员.主要研究兴趣包括社会计算.社会网络. ...

  3. 作者:许洪波,男,博士,中国科学院计算技术研究所副研究员、硕士生导师。...

    许洪波,男,博士,中国科学院计算技术研究所副研究员.硕士生导师,主要研究方向为互联网挖掘与搜索.大数据分析与计算等.

  4. 作者:兰艳艳,女,中国科学院计算技术研究所副研究员、硕士生导师。

    兰艳艳,女,中国科学院计算技术研究所副研究员.硕士生导师,目前主要从事机器学习与数据挖掘领域的研究工作,在ACMSIGIR.NIPS.ICML等本领域顶级会议发表论文20余篇,并荣获SIGIR最佳学生 ...

  5. 黄晁(1972-),男,博士,中国科学院计算技术研究所副研究员,宁波中国科学院信息技术应用研究院院长。...

    黄晁(1972-),男,博士,中国科学院计算技术研究所副研究员,宁波中国科学院信息技术应用研究院院长,主要研究方向为视频处理技术.智慧城市系统.大数据等.在国际国内学术会议及期刊发表论文数十篇,申请国 ...

  6. 胡瑜 简介中科院计算机所,胡瑜--中科院计算所计算机体系结构国家重点实验室...

    国际刊物论文 [1]Yu Hu, Yinhe Han, Xiaowei Li, Huawei Li, Xiaoqing Wen, "Compression/Scan Co-Design fo ...

  7. 港大计算机学院副院长,中科院许榕生教授、香港大学邹锦沛博士等一行访问我校...

    2012年3月7日至11日,应南京邮电大学计算机学院.软件学院的邀请,中国科学院高能物理研究所网络安全实验室首席科学家许榕生教授和香港资讯保安及鉴证公会(ISFS)主席.香港大学计算机科学与资讯系统系 ...

  8. 中国科学院计算机博士张弛,张驰(中国科学院地质与地球物理研究所副研究员)_百度百科...

    张驰 (中国科学院地质与地球物理研究所副研究员) 语音 编辑 锁定 讨论 上传视频 本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧! 张驰,男, 1982年05月生于湖北省宜昌 ...

  9. 作者:包阳(1978-),男,北京系统工程研究所副研究员。

    包阳(1978-),男,北京系统工程研究所副研究员,主要研究方向为大数据.机器学习.软件测试.

最新文章

  1. 0基础学习数据分析必须掌握的技能有哪些?
  2. Boost:bimap双图信息的测试程序
  3. 多个常见代码设计缺陷
  4. IDE 插件新版本发布,开发效率 “biu” 起来了
  5. glide 加载webp_如何使您的网站通过WebP图像快速加载闪电
  6. 漫步数理统计五——条件概率与独立(上)
  7. linux touch 源码,每天一个Linux命令(09)--touch命令
  8. 黑科技之后迎来“小仙女”!小米官宣全新手机系列CC
  9. gdb当前哪一行_GDB原理之ptrace实现原理
  10. 【转】卡巴斯基安全公告称甲骨文数据库存在加密漏洞
  11. SiamFC论文解读及代码实现
  12. Android 安装包没有签名文件问题
  13. 数据结构c语言版ppt答案,《数据结构(C语言版)》习题答案.ppt
  14. ZABBIX 3.0 使用详解
  15. 手机edge浏览器无法打开三方应用
  16. JavaScript知识要点 - Web前端开发必备
  17. 4. PCIe 接口时序
  18. linux命令之partprobe
  19. C语言disp的头文件,TM1638.h 单片机C语言头文件
  20. 测试创新——拓宽自己的边界

热门文章

  1. Redis的应用场景
  2. Asp代码转换java代码器_asp下实现对HTML代码进行转换的函数
  3. linux 手机root原理,手机root原理
  4. 专题·置换【including 置换,置换快速幂,洛谷·[HNOI2001]洗牌机
  5. 九连环课程设计c语言,九连环C语言程序
  6. java cookbook 3_CookBook/Java核心/3-Java反射.md at master · Byron4j/CookBook · GitHub
  7. GAMMA初学笔记三
  8. C基础_Python_基本常用语法快速学习
  9. 一些bugku的题目wp
  10. 使用FTPClient封装FtpUtil