百度首席科学家 Andrew Ng谈深度学习的挑战和未来

一早出发,8点20就赶到现场, 人越聚越多,Ng提前几分钟到达现场,掌声一片。

   Ng的报告总体上提到了五个方向。
   1)Deep Learning相比于传统方法的优势
             首先,一个很直观的图,随着训练量的提高,传统方法很快走到天花板,而Deep Learning的效果还能持续走高,后来这个在提问环节也有同学问道,是否会一直提高,Andrew Ng也坦诚需要面对不同的问题来讨论,而且任何方法都有天花板。
           
            这个问题蛮关键的,我补充回答一下,其实这是一个特征表达力的问题,传统方法特征表达力,不如Deep Learning的多层学习得到的更有效果的表达。举个例子,假定有一种疾病,这种疾病容易在个高且胖的人群,以及个矮且瘦的人群中易感。那么任意从给一个特征角度上看,比如肥胖,那么胖的这部分人中,得此病的概率为50%,不胖的也是50%,那么"胖"这个特征没有表达力。
          

用学术上的术语来说,身高和体型是两个Marginally independent的变量,即如果观察到了他们产生的结果,他们就不独立了。也就是如果身高和体型在用于检测这种疾病的时候,他们就不独立了,因此需要有一种特征表示的方式来表示他们的这种不独立性,能够combine他们以形成更好的特征。而这种更结构化的特征,需要大量的语料才能training到位。而独立性的特征,往往少部分语料就可以获得很好的结果,但随着语料数量的提高,无法observe到结构化的特征,因此更多的语料就浪费了。我们都知道这是AI领域的XOR问题,也就是二层

神经网络就能求解,换言之,多层神经网络mining出来更好的特征。
     
      接着Ng也直观的展示了,从像素级特征(表达力最弱)到edges级特征,直到object级特征。 从edges特征大家看到的这个形式,其实是深度神经网络的edges中的一个小块,就是input layer到第一个hidden layer之间的一组边(如果是RBM 的话)或者是第一个hidden layer到output layer的一组边,这组边可以理解成training的成果。而hidden layer是一个sparse coding的向量,用来combine不同组的边来还原出input layer。
  
      因此可以看到,通过深度学习的处理,无需tagged data,通过自学习的方式,就可以做到特征的表达力从像素级,提高到了 object models,多么美妙啊,难怪Ng用了Amazing这个词,而且再一次地露出了特有的微笑。
    2)Deep Learning存在的问题
         Ng提到了,通常学生试验在10 million connections这个水平,因为在大已经超出计算的能力,但如果采用并发的方法,160000万个CPUs的情况下,可以达到1 billion connections这个水平。如果采用特制的GPU来计算,可以达到10 billion connections的水平。
       从我自己的实验结果看,目前做千万connection是没问题的,时机成熟我就开放出来,但受限于CPU在向量计算的劣势,再大的话,每一轮训练的时间就会大大提高,变得不可计算,而分布式Parameter server的搞法,虽然能够第一步把语料shard一下,然后各自训练, 到了最高层用类似transform learning的法子再combine(这段话是我自己猜测的,Ng的报告这里我没听太懂,图片是按照记忆画出)
     
         我个人的理解,就是一个巨大语料切成n个部分,每个部分产生表达力强的特征,而这些表达力强的特征在一个阶段,就是那个长条哪里进行combine,也就是这个hidden layer可以很好的表达来自不同shard的特征,最后在展开各层,用不同shard上的tagged data 来进一步调整每条边的权重。
  
   3)Deep Learning的Idea
       

这个可能没什么可说的,但我认为很重要,这段话不难翻译,人脑中大部分感知器是一个非常简单的计算过程。但通过组合可以达到很高的理解力。但问题是如何组合,感知的过程如何从低级阶段到高级阶段,从明暗,色彩的感知,到人类喜怒哀乐的情感,整个过程的每一步可能都是naive得,但整个认知链条的末端一定是语义的,有感情的,上升到概念的。另外,通常还有一个体会,比如看一本小说,脑海中就能自然浮现画面,可见不同神经感知器也不是完全独立的,而是彼此联系的。

 
    4)Deep Learning的一些成果
         报告中提到很多成果,特别是提到了图像识别中,在DL面前,SIFT特征提取算法弱爆了,我还是为Ng的自信和霸气,略震了一下。按照常规,学术界的同志应该谦虚,尊重下老前辈,尊重下传统的。。
       后来的提问环节,也有同学问到,那些old 算法框架怎么办呢?Ng说无论怎样,这就是科学技术的趋势,当一个东西产生明显效果后,越来越多的方法会采用这些新方法,而传统方法,不是说研究者就立马到zero,但的确会fewer and fewer。当时我心里想,无论如何如何,总得有留下少部分坚守的同志,没准10年后翻身也难说,但大部队应该扑新方法的。
      
    5)未来趋势
     

未来趋势基本是一些喜闻乐见的东西,没什么新意,包括后来提问环节也有人提问,让Ng透露未来的一些计划。Ng说未来的事情总是千变万化的,如果真是希望了解产业界的一些计划,可以来百度打工,和最优秀的工程师一起做事。

   提问环节有很多有趣的话题,比如有人问百度,以及Andrew Ng本人对Spark的评价,Ng回答到,百度用了很多开源工具,但机器学习的很多问题太Uniq了,太特殊了,而Spark这种通用的东西很难满足需求,当然不是说SPark不好,只是Ng本人也很少用(用了Less这个词汇)。还有包括为什么效忠百度,Ng说了三个原因,第一他认为机器学习是Transform世界,Transform互联网的一种方式,相比coursera更加感兴趣。第二百度拥有大量优秀的科学家,高质量的同事,比如余凯,张潼,徐伟同志等等。第三,百度拥有大量的data, 还有个同学要DL的Reading List,Ng给了个这个:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Recommended_Readings ,还说里面有邓侃号召中国青年的贡献在里面。另外根据网友@ fiona_duan  的反馈。最后Andrew提到的是他出生于香港,长在英国和新加坡,之后在美求学和生活。他和媳妇都在美国。他媳妇叫Carol Reiley. Carol 是约翰·霍普金斯大学的医学博士以及在读计算机博士,研究方向是生物医学方向的机器人应用。
       整个报告大概就是这样,我的理解也难免偏颇,水平难免有限,但我坐在第一排,努力的听每一个细节,并快速思考,能量消耗蛮大的,另外就是百度来了几个美女,看上去比较有知识,跑前跑后的拍照。
      上次在清华的报告,这里也一并推荐阅读下: http://blog.sina.com.cn/s/blog_593af2a70101bqyo.html

2014-7 Andrew Ng 自动化所报告听后感-梁斌相关推荐

  1. 2014-7 Andrew Ng 自动化所报告听后感

    转载自:http://blog.sina.com.cn/s/blog_593af2a70102uwhl.html 一早出发,8点20就赶到现场, 人越聚越多,Ng提前几分钟到达现场,掌声一片.     ...

  2. Andrew ng清华报告听后感

    转载自:http://blog.sina.com.cn/s/blog_593af2a70101bqyo.html Andrew ng今天来清华作报告,我就几点重要的内容,谈谈理解和想法.     1) ...

  3. 读《java的讲座》后感,老师讲座听后感

    老师讲座听后感 上周五,学习了名师任小艾的教育理念和方法后,触动很大,也收获颇深,尤其是她的"一则"."三言"."五心",给了我很大的启示. ...

  4. 计算机网络安全知识征文,2018关于网络的作文50字篇网络安全教育听后感

    2018关于网络的作文50字篇网络安全教育听后感 相关内容: 9月24日今天是我第一天上班,我实习的班级是小班,一共有31名小朋友.平时看的都是书上的理论,完全都是自己凭空想象,自己应该怎么扮演好一个 ...

  5. 读《java的讲座》后感,专题讲座听后感作文500字

    接着小主人报的强老师给我们上了堂生动的办报课. 专题讲座听后感作文500字 我在学校里听了一堂世博小报的专题讲座,让我懂得了许多办报的知识,认识到了水的重要性. 下午12:45专题讲座正式开始.先是& ...

  6. 计算机音乐必须会各种乐器吗,乐器音乐大会听后感

    设计意图:我班幼儿的性格大都比较内向,文静,不喜欢大大咧咧的表现自我,属于那种比较害羞的类型.因而根据本班幼儿的这一特点,我选择了这一教学内容.一方面考虑到"打击乐"的活动一向深受 ...

  7. 《听后感-罗振宇2023“时间的朋友”跨年演讲》

    听老罗的"时间的朋友"也有几年了,简单聊聊2023年的时间的朋友.先大致过一下2023的内容,总共7章. 第一章:空间.时间和葡萄酒 故事1.<电动车与书店> 我要讲的 ...

  8. 数据库的缓存管理[ASPNET2.0深入挖掘系列听后感]

    工作时间也不短了,说实话感觉是越来越郁闷:以前经常为实现某项功能而高兴半天,现在这种感觉仿佛离我越来越远:整天工作大部分就是Copy,Edit,一点创意都没有,而且那些代码我自己看起来都感觉很垃圾.不 ...

  9. 台大教授张文亮-台湾大学公开课-《人生的意义-爱情的意义》课程听后感

    目录 1.张文亮个人简介 1.1. 从问题学生成为台大教授 1.2. 问题学生在传统学校机制下的遭遇 1.3. 问题学生认识和提升自我的机遇 2.<人生的意义>-爱情的意义节选 2.1.为 ...

最新文章

  1. 透明代理Transparent Proxy
  2. [导入]ASP.NET 2.0 读取配置文件[INI](示例代码下载)
  3. 表达提交返回信息_盘锦市2020年义务教育阶段招生入学信息服务平台家长填报指南...
  4. Spring4中的@Value的使用(学习笔记)
  5. 基于 OData 模型和 JSON 模型的 SAP UI5 表格控件行项目的添加和删除实现
  6. python人工智能pdf_800G人工智能学习资料:AI电子书+Python语言入门+教程+机器学习等限时免费领取!...
  7. iPhone 史上最大优惠;摩拜「裁员门」反转;百度网盘缩减空间 | 极客头条
  8. ArcEngine这本书怎么样
  9. Dubbo源码解析-Dubbo架构的实现
  10. typora里插入图片,设置图片大小和位置
  11. openstack rabbitmq报错导致识别不到计算节点 解决方案
  12. java 解压rar_java 解压rar文件
  13. 软件测试---UI界面测试点
  14. python mysqldb_python MySQLdb API手册
  15. Node.js中的npm与包
  16. 《数组》包括一维数组二维数组的创建和初始化,在内存中的存储和使用方法,数组越界和作为函数参数的情况
  17. Oracle---SQL语句
  18. Big Sur + karabiner + kernelmanagerd = 可能发烫
  19. 概率论的基本概念、样本空间、随机事件(二)
  20. Kmeans K均值聚类,OpenCV实现

热门文章

  1. 一文搞懂MySQL XA如何实现分布式事务
  2. HTML使用onmouseover属性更改背景颜色
  3. 一大波趣图:关于遗留代码的那些事儿
  4. 苹果logo_苹果推送5款联名AirPods Pro耳机壳/VIVO推出印度制造LOGO/荷兰Indigo设计奖获奖名单...
  5. Android SDK 无法更新或更新慢解决方法
  6. 众昂矿业:探究多色萤石的多姿多彩
  7. 人体解剖学复习题(带答案的)
  8. 树莓派+GPS之调试测试记录篇
  9. 未找到可用于建立连接的介质筛选器组合
  10. Lua与c++交互实战基础篇-夏曹俊-专题视频课程