近来,物理、数学与机器学习领域之间相互交叉,促进了使用机器学习框架来优化物理模型,并进一步促进研究人员开发了许多令人兴奋的新机器学习模型(例如神经ODE,哈密顿神经网络等),它们借鉴了物理学的概念。

来自斯坦福大学Shanhui Fan组的研究员,就对物理学本身可以用作计算引擎的观点特别感兴趣。换句话说,就是对可以用作硬件加速器或用作快速有效的机器学习计算的专用模拟处理器的物理系统感兴趣。

本文通讯作者,斯坦福大学教授Shanhui Fan

在他们最近发表在《Science Advances》上的论文中,证明了波的物理特性能够直接映射到RNN的时间动态中。使用此连接,研究人员证明了可以训练声学/光学系统(通过PyTorch开发的数值模型),从人类说话者的录音中准确地对元音进行分类。本质上是将元音波形启动到物理模型中,并允许优化器在域内各个点的1000处添加和删除材料,本质上充当了模型的权重。

因为此机器学习模型实际上对应于物理系统,所以这意味着可以采用经过训练的材料分布并将其“打印”到实际的物理设备中。结果将类似于ASIC(专用集成电路),但用于特定的RNN计算。

研究人员认为它们指出除了脉冲本身所携带的能量之外,还能够完全被动地执行复杂的循环机器学习计算,而没有能耗。

 论文解读:声波、光波都可视作循环神经网络 

模拟机器学习硬件平台有望比数字化平台更快,更节能。与数字化模式相比,物理学中的声波和光波是为时变信号构建模拟处理器的自然选择。本文确定了各类波的形式与循环神经网络中的计算之间的映射。该映射表明,可以使用神经网络的标准训练技术来训练物理波系统,学习时间数据中的复杂特征。

逆向设计的不均匀介质可以对原始音频信号进行元音分类,从而达到与循环神经网络的标准数字实现相当的性能。这些发现为新型模拟机器学习平台铺平了道路。

 波的动力学与RNN之间的等价关系 

RNN通过在输入过程的每个步骤中对输入序列的每个成员应用相同的基本操作,将输入序列转换为输出序列。先前时间步骤的记忆被编码为RNN的隐藏状态,并在每个步骤中进行更新。隐藏状态使RNN可以保留过去的信息,并学习数据中的时间结构和长期依赖关系。在给定的时间步长t处,RNN对序列xt的当前输入向量和上一步ht-1的隐藏状态向量进行运算,以生成输出向量yt以及更新的隐藏向量状态,ht。

尽管RNN有许多形式的变体,一般常见的实现方式可由下列方程描述:

与标准RNN相似,隐藏状态与波的动力学方程的输入和输出之间的连接也由线性算符定义,可以如下方式给出:

输入和输出矩阵定义了空间域内的注入点和测量点。与标准RNN不同,输入和输出矩阵很密集,波动方程的输入和输出矩阵很稀疏,因为它们仅在注入点和测量点处为非零值,而且这些矩阵在训练过程中不会改变。

RNN和波量度系统的概念比较如图1所示:

图1 标准RNN与基于波的物理尺度系统的概念比较

图2 元音识别设置和训练过程示意图

图3 元音识别训练结果

 未来:波与RNN概念互联,机器学习新平台大有可为 

本文中介绍的基于波原理的RNN具有许多优势,使其成为处理时间编码信息的有希望的接班人。

另外,与常规RNN不同,波动方程强制执行节能约束,能够防止隐藏状态和输出信号范数的无限增长。相比之下,定义标准RNN更新关系的无约束的矩阵会导致梯度消失和梯度爆炸,这正是训练传统RNN时需要防范的重大问题。

本文证明,波的动力学方程在概念上与RNN可以实现等效。这种概念上的互联为新型的模拟硬件平台的诞生提供了机会。这种利用物理学计算的方法可能会催生出用于模拟机器学习设备的新平台,比数字化的同类产品具备更自然,更高效地执行计算任务的潜力。

Q&A环节:作者回应网友疑问和质疑

Reddit网友对此表现出浓厚的兴趣,但也同时对该研究有很多疑惑。OP也非常耐心的做了解答。

问:声学中的非线性是否足够强大到足以使其不只是另一个光荣的线性模型?

答:在我们的方案中,物质响应是为隐藏状态非线性激活函数提供隐藏状态的要素,而检测电路是提供输出非线性的要素。在声学方面,流体存在一些有趣的可能性。例如,已知具有小气泡的液体具有非常强的非线性声学响应。我相信这些效果在医学超声成像中很容易遇到。通常由于线性运算在数字处理器上仍然会非常昂贵,因此拥有一个非常高性能的线性单元(例如在ONN中)仍然具有很多价值。与此相关的是,我们还有另一篇论文提出了基于电光电路的ONN的激活功能。

问:是通过真的某个地方播放并使用探头或扬声器测量声音在介质中的传播方式创建输出的,还是模拟数字环境并使用它创建不同的输出?

答:演示用的数值模拟。在本文精确配置中,麦克风探针或接收器电路还需要执行其记录的一些时间积分,以及不同探针处的时间积分信号之间的一些附加比较逻辑。但方案中大多数分类工作量已被转移到训练介质中波的传播和散射上。

问: 你谈了很多物理学,但是本文并未论证正在研究的现象背后的物理学的基本知识。我已经通过3-5个神经元MLP(每个元音)完成了在线元音识别,所以我知道这并不难。

答:重点并不是要说此特定任务对其他模型来说太难了。我们的工作重点是说基于波的物理系统可以成为循环机器学习(也许通常是计算)的引人注目的模拟计算引擎。

问:这很可能会遇到“现实差距”,训练会利用物理模型中存在的,与现实中不同或不存在的现象。当使用如此多的自交互(由于非线性)自由度时,即使是很小的离散误差,各处都可能产生令人惊讶的与现实的差异。

答:我们在离散化误差意义上(理想情况下)收敛的仿真环境中进行操作。这意味着如果我们假设模拟参数(例如波速和非线性材料参数)能够反映现实世界的值,那么模拟应该很好地表示现实情况。我们可能希望改善对结构中最小特征尺寸的约束。我们还需要考虑三维效果(本文中的演示仅为二维)。但是,应该没有根本性的问题去解决这些问题。

问:有趣的研究!你知道这样的方法是否可以达到多少计算能力的上限?

答:这绝对是一个很好的问题,但是很难提供一个封闭形式的答案,这是我们正在积极研究的东西。波动方程具有一些属性,即因果关系和能量守恒,我们可以期望它们会限制系统可以产生的响应形式。

论文地址:

https://advances.sciencemag.org/content/advances/5/12/eaay6946.full.pdf

Reddit讨论:

https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/

————

编辑 ∑Gemini

来源:新浪专栏·创事记

☞数学家探索两个几何世界之间的镜像链接

☞数学天才帕吉特:他有如电影般的人生际遇

☞世界上最奇怪的数学天才,被奖励100万却拒领,宁愿过得像乞丐

☞斯坦福大学教育学院院长:学习本身就是一门学问

☞如果没有数学,我们如何测量

☞数学的真相:物理时空的数字模型还是现实本身?

算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域,经采用我们将奉上稿酬。

投稿邮箱:math_alg@163.com

欢迎加入算与数学术交流群,请添加微信:nhyilin(备注:算数粉丝)

斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应相关推荐

  1. 陈天奇任CTO,TVM团队成立OctoML:让任何硬件都能部署机器学习模型

    陈天奇任CTO,TVM团队成立OctoML:让任何硬件都能部署机器学习模型 据机器之心消息,知名人工智能青年学者.华盛顿大学博士陈天奇于近期参与创建了创业公司 OctoML,担任 CTO 一职. 随着 ...

  2. 斯坦福大学新研究:声波、光波等都是RNN

    2020-01-30 15:39:50 选自Reddit 作者:Ian Williamson机器之心编译 参与:王子嘉.魔王 斯坦福大学的一项研究发现:物理学中波动与 RNN 中的计算存在对应关系. ...

  3. 算法精解 c语言描述 豆瓣,斯坦福大学教授亲授,这本美亚4.7星的算法书,新手程序员都看得懂!...

    原标题:斯坦福大学教授亲授,这本美亚4.7星的算法书,新手程序员都看得懂! "算法会扩展并提高大家的编程技巧,而学习基本的算法设计范式,可以和许多不同领域的不同问题密切相关,还能作为预测算法 ...

  4. Stanford-CV华人教授李飞飞写给她学生的一封信,如何做好研究以及写好PAPER,受益匪浅

    Stanford-CV华人教授李飞飞写给她学生的一封信,如何做好研究以及写好PAPER,受益匪浅 转载 2014年01月20日 22:55:01 1051 0 2 李飞飞是斯坦福大学计算机视觉领域的牛 ...

  5. 性能比GPU高100倍!华人教授研发全球首个可编程忆阻器AI计算机

    译者 | 陆离 责编 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 导读:近日,密歇根大学研发成功第一台可编程的忆阻器计算机,它不仅是一个通过外部计算机运行的忆阻器阵列,而且还是可以 ...

  6. 量子前沿英雄谱|引领量子科技三十年:斯坦福NTT教授Yoshihisa Yamamoto

    斯坦福大学应用物理与电气工程名誉教授.NTT Reasech PHI Labs主任.量子科技领域三十年来领导者Yoshihisa Yamamoto教授 (图片来源:NTT Research) Yosh ...

  7. 12岁上中科大,17岁哈佛读博,面对质疑,31岁成为哈佛最年轻华人教授

    文章 | 新华网.百度百科.中科大官微.精彩英语演讲等 来源 | 列文虎克网 图片来源:哈佛官网 12上中科大少年班 17岁到哈佛硕博连读 打破哈佛本校博士不得在本校继续博士后研究的惯例 31岁成为哈 ...

  8. 直播预告 | 斯坦福助理教授马腾宇:深度学习中的隐式和显式正则化

    人工智能作为科技领域最具代表性的技术,日益成为国际竞争的新焦点.当下,我国正逐步开展全民智能教育普及,设置人工智能相关课程,致力于建设人工智能的人才高地. 在此背景下,中关村海华信息技术前沿研究院立足 ...

  9. 名校华人教授专门设局诈骗中国留学生,4年吸金超百万美元,连亲戚也没放过...

    鱼羊 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 中国学生出国留学,被骗学费-- 骗人的却是华人教授? 事情发生在美国威斯康星大学密尔沃基分校(UMW),一位叫做的Yue Liu的教授以免除 ...

最新文章

  1. 不忘初心,砥砺前行——写在数据院成立四周年之际
  2. 大名鼎鼎的红黑树,你get了么?2-3树 绝对平衡 右旋转 左旋转 颜色反转
  3. java.lang.StackTraceElement类
  4. PHP多种序列化/反序列化的方法 (转载)
  5. java对两个表进行排序_Excel工作簿中多个worksheet工作表,如何对工作表进行排序?...
  6. 160 - 3 Afkayas.2
  7. java 连接oracle_「事件驱动架构」使用GoldenGate创建从Oracle到Kafka的CDC事件流
  8. ssh:could not resolve hostname XXX:Temporary failure in name resolution
  9. ORACLE的程序包1-程序包的基
  10. ubuntu手动下载安装软件包
  11. threejs 管子_使用webgl(three.js)搭建一个3D智慧园区、3D建筑,3D消防模拟,web版3D,bim管理系统——第四课...
  12. 全面反攻,不给割肉者任何机会
  13. 职场工作人员需不需要写日报
  14. mysql auto reconnect_Mysql5的auto Reconnect异常
  15. 到底什么是微前端,框架qiankun如何使用(基于vue,附代码)
  16. 数据结构课程设计预习——项目1:中国计算机设计大赛赛事统计
  17. 软件项目管理课程复习题
  18. (转)两性学堂——《搭讪入门指南》
  19. sdcc编译器使用makefile
  20. Ubuntu18.04安装Ceres库和G20库

热门文章

  1. java 类加载生命周期_Java类的加载与生命周期
  2. devtools安装_R语言如何批量安装软件包
  3. jenkins 集成java搅拌_如何将Gauge与Jenkins集成
  4. python max取下标_Python 变量类型总结
  5. 多屏互动协议 linux,【Linux系统多屏互动电视】Linux系统多屏互动电视报价及图片大全-列表版-ZOL中关村在线...
  6. animate动画案例_animate动画案例——小小购物狂
  7. Java学习四步曲,助你成长!
  8. python cursor游标_第二十三天 python中游标的使用
  9. 【学习笔记】第三章——内存 IV(虚拟内存、请求分页、页面置换、缺页中断、抖动现象)
  10. android 调用系统下载apk,如何在自己的App中调用Android系统自带的安装/卸载程序...