今晚8:00 | CEI Lab 软硬件协同优化专题,顶会MICRO最佳论文作者来啦
点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
杜克大学 CEI Lab
杜克计算进化智能中心(CEI Lab)隶属于杜克大学电子与计算机工程系,在陈怡然教授和李海教授的共同指导下,开展关于处理认知任务的新型计算平台的前沿研究。组内主要研究方向集中在纳米电子元件,新型及仿生的计算体系架构,新型存储器件,嵌入式与边缘计算系统,以及大型神经网络的加速、安全与联邦学习。
4月13日、14日、15日晚上8:00,本期特别邀请陈怡然教授和杜克大学CEI Lab的七位学者们将给大家带来精彩的分享!
扫描二维码预约直播
(或点击阅读全文预约)
4月15日 20:00-21:00
软硬件协同优化专题
李石宇:
本科毕业于清华大学自动化系,目前是杜克大学电子与计算机工程系三年级博士生,师从李海和陈怡然老师。他的主要研究方向为计算机体系结构以及深度学习系统的软硬件协同设计。
分享内容:
通过软硬件协同设计加速稀疏卷积神经网络
报告简介:
通过剪枝去除冗余权值是一种常见的压缩神经网络的方法。然而,由于剪枝所生成的稀疏模式较为随机,难以有效被硬件利用,之前方法实现的压缩比与硬件上实际时间的推理加速有较大的差距。而结构化剪枝方法又因为对剪枝过程加以限制,只能实现较为有限的压缩比。为了解决这一问题,本工作中,我们设计了一种硬件友好的压缩方法。通过分解原始权重矩阵,我们将原来的卷积分解为两个步骤,对输入特征的线性组合以及使用基卷积核的卷积操作。基于这一结构,我们相应设计了稀疏神经网络加速器来高效地跳过冗余操作,实现提升推理性能和能耗比的目的。
谢知遥:
本科毕业于香港城市大学,博士毕业于杜克大学,师从陈怡然和李海教授。研究方向包括机器学习与芯片设计自动化,尤其是智能化的芯片设计方法。谢知遥将加入香港科技大学任助理教授。他曾在多家半导体公司实习,包括Cadence,Synopsys,NVIDIA,Arm。
分享内容:
可用于大规模商业化处理器的全自动化功耗模拟架构
报告简介:
而随着摩尔定律日益失效,获得每一代CPU性能提升变得越来越困难。为了获得更好的性能,CPU内的功耗与电流需求不断增加,CPU的功耗成为一个日益严重的问题。相比之下 CPU的输电技术进展依然缓慢。这导致最终CPU获得的电压低于设计电压。为了解决这些问题,本报告将介绍APOLLO框架,它使用一套统一的机器学习模型同时对设计和运行阶段的CPU功耗进行极低开销的快速实时计算。它自动选取极少量与功耗最相关的CPU信号作为输入,然后建立快速的模型,用于对每个周期的功耗进行预测或监测。这种功耗计算能力可能会极大改变CPU的设计和使用方式,同时开启新的应用领域。同时这个方法的整个流程是完全自动化的,不依赖任何工程师的经验。所以理论上它可以用于任何芯片设计。它在商业化的CPU设计Neoverse N1和Cortex-A77上得到了充分验证。
直播结束后大家可以在群内进行提问,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“PhD-4”,将拉您进“AI TIME PhD 交流群-4”!
AI TIME微信小助手
主 办:AI TIME
合作媒体:AI 数据派、学术头条
合作伙伴:智谱·AI、中国工程院知领直播、学堂在线、蔻享学术、AMiner、 Ever链动、科研云、络绎科学
往期精彩文章推荐
记得关注我们呀!每天都有新知识!
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了550多位海内外讲者,举办了逾300场活动,超120万人次观看。
我知道你
在看
哦
~
点击 阅读原文 预约直播!
今晚8:00 | CEI Lab 软硬件协同优化专题,顶会MICRO最佳论文作者来啦相关推荐
- 函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化
作者:修踪 审核&校对:Chang Shuai.望宸 编辑&排版:雯燕 背景 函数计算在 2020 年 8 月创新地提供了容器镜像的函数部署方式.AWS Lambda 在 2020 年 ...
- 函数计算GB镜像秒级启动:下一代软硬件架构协同优化
简介: 优化镜像加速冷启动大致分为两种做法:降低绝对延迟和降低冷启动概率.自容器镜像上线以来我们已经通过镜像加速技术,分阶段降低了绝对延迟.本文在此基础上,介绍借助函数计算下一代IaaS底座神龙裸金属 ...
- 共创软硬件协同生态:Graphcore IPU与百度飞桨的“联合提交”亮相MLPerf
本文已在飞桨公众号发布,查看请戳链接: 共创软硬件协同生态:Graphcore IPU与百度飞桨的"联合提交"亮相MLPerf AI领域最负盛名的产业级基准测试榜单MLPerf T ...
- 基于Zynq的光流法软硬件协同设计与实现
基于Zynq的光流法软硬件协同实现 一. 前言 光流场(Optical Flow Field)[1]是指图像中所有像素点构成的一种二维(2D)瞬时速度场,其中的二维速度矢量是景物中可见点的三维速度矢量 ...
- SDSoC软硬件协同设计流程系列——1.基于SDSoC的软硬件协同设计流程简介
基于SDSoC的软硬件协同设计流程简介 Software Define 的概念 近年来"Software Define"软件定义这个词持续火热,全球知名技术研究和咨询公司Gartn ...
- Carla+SUMO联合仿真多交叉路口信号灯配时协同优化策略
Carla+SUMO联合仿真多交叉路口信号灯配时协同优化策略 一.背景 博主近期基于研发项目驱动,项目第一阶段需求为基于仿真环境,探索多交叉路口信号灯配时协同优化策略.由于研发内容偏向智慧交通流方向, ...
- 基于SDSoC的软硬件协同设计
文章目录 基于SDSoC的软硬件协同设计 一 基于SDSoC的软硬件协同设计流程简介 二 SDSoC使用 三 SDS指令简介 SDS指令简介 SDS Pragma组合 四 搭建SDSoC Platfo ...
- 操作系统研究:面向软硬件协同的车载操作系统驶入快车道
已剪辑自: https://mp.weixin.qq.com/s?__biz=MzA4NTcwMDQwMg==&mid=2650818860&idx=1&sn=06f15812 ...
- 耶鲁大学等机构提出的脑机接口软硬件协同设计,增加脑机的更大潜力
脑机接口(brain -computer Interfaces, BCIs)或脑机接口(brain - machine Interfaces, BMIs)自从被医生和研究人员使用以来,已经为治疗神经系 ...
- 【深度学习】新的深度学习优化器探索(协同优化)
[深度学习]新的深度学习优化器探索(协同优化) 文章目录 1 RAdam VS Adam 2 自适应优化 3 LookAhead3.1 "侵入式"优化器3.2 LookAhead ...
最新文章
- DDoS攻击已成掩盖真实网络攻击的烟雾弹
- 我还不懂什么是分布式事务
- stun 协议 NAT穿透方式 简介
- vue踩坑- 报错npm ERR! cb() never called!
- 【NLP】word2vec中的数学模型
- 最后一天,特邀小姐姐配音拉票,今日可投28票
- nioqrc oracle,程序停在 readnocancel () from -lib-tls-libpthread.so.0
- 老司机带你在MySQL领域“大吉大利,晚上吃鸡”
- java定义一个静态类_Java中的静态类
- QT每日一练day2:day1优化以及QT内存管理机制
- Educational Codeforces Round 51: F. The Shortest Statement(最短路+LCA)
- Vue,Javascript--时间戳的操作
- 解决Required String parameter xxx is not present异常
- 我刷uvaoj的经历(1)
- 小编详解网络蜘蛛的安全隐患及预防方法
- python爬虫可以找种子吗_python3爬取torrent种子链接实例
- MT7628学习笔记(13)——ipk软件包编写与应用
- 对numpy的数组取补集运算
- 2015年2月8日工作日志------赵鑫
- “死亡之星”——“阿波非斯”