//2014年11月7日

//http://quweiprotoss.blog.163.com/blog/static/4088288320099178652101/

机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。

不少人其实并没有真正想过,这是不是自己喜欢搞的东西,只不过看见别人都在搞,觉着跟大伙儿走总不会吃亏吧。

问题是,真有个“大伙儿”吗?就不会是“两伙儿”、“三伙儿”?如果有“几伙儿”,那到底该跟着“哪伙儿”走呢?

很多人可能没有意识到,所谓的machine learning community,现在至少包含了两个有着完全不同的文化、完全不同的价值观的群体,称为machine learning "communities"也许更合适一些。

第一个community,是把机器学习看作人工智能分支的一个群体,这群人的主体是计算机科学家。

现在的“机器学习研究者”可能很少有人读过1983年出的“Machine Learning: An Artificial Intelligence Approach”这本书。这本书的出版标志着机器学习成为人工智能中一个独立的领域。它其实是一部集早期机器学习研究之大成的文集,收罗了若干先贤(例 如Herbert Simon,那位把诺贝尔奖、图灵奖以及各种各样和他相关的奖几乎拿遍了的科学天才)的大作,主编是Ryszard S. Michalski(此君已去世多年了,他可算是机器学习的奠基人之一)、Jaime G. Carbonell(此君曾是Springer的LNAI的总编)、Tom Mitchell(此君是CMU机器学习系首任系主任、著名教材的作者,机器学习界没人不知道他吧)。Machine Learning杂志的创刊,正是这群人努力的结果。这本书值得一读。虽然技术手段早就日新月异了,但有一些深刻的思想现在并没有过时。各个学科领域总有 不少东西,换了新装之后又粉墨登场,现在热火朝天的transfer learning,其实就是learning by analogy的升级版。

人工智能的研究从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,是有一条自然、清晰的脉络。人工智能出身的机器学习研究者,绝大部分 是把机器学习作为实现人工智能的一个途径,正如1983年的书名那样。他们关注的是人工智能中的问题,希望以机器学习为手段,但具体采用什么样的学习手 段,是基于统计的、代数的、还是逻辑的、几何的,他们并不care。

这群人可能对统计学习目前dominating的地位未必满意。靠统计学习是不可能解决人工智能中大部分问题的,如果统计学习压制了对其他手段的研 究,可能不是好事。这群人往往也不care在文章里show自己的数学水平,甚至可能是以简化表达自己的思想为荣。人工智能问题不是数学问题,甚至未必是 依靠数学能够解决的问题。人工智能中许多事情的难处,往往在于我们不知道困难的本质在哪里,不知道“问题”在哪里。一旦“问题”清楚了,解决起来可能并不 困难。

第二个community,是把机器学习看作“应用统计学”的一个群体,这群人的主体是统计学家。

和纯数学相比,统计学不太“干净”,不少数学家甚至拒绝承认统计学是数学。但如果和人工智能相比,统计学就太干净了,统计学研究的问题是清楚的,不象人工智能那样,连问题到底在哪里都不知道。在相当长时间里,统计学家和机器学习一直保持着距离。

慢慢地,不少统计学家逐渐意识到,统计学本来就该面向应用,而机器学习天生就是一个很好的切入点。因为机器学习虽然用到各种各样的数学,但要分析大 量数据中蕴涵的规律,统计学是必不可少的。统计学出身的机器学习研究者,绝大部分是把机器学习当作应用统计学。他们关注的是如何把统计学中的理论和方法变 成可以在计算机上有效实现的算法,至于这样的算法对人工智能中的什么问题有用,他们并不care。

这群人可能对人工智能毫无兴趣,在他们眼中,机器学习就是统计学习,是统计学比较偏向应用的一个分支,充其量是统计学与计算机科学的交叉。这群人对统计学习之外的学习手段往往是排斥的,这很自然,基于代数的、逻辑的、几何的学习,很难纳入统计学的范畴。

两个群体的文化和价值观完全不同。第一个群体认为好的工作,第二个群体可能觉得没有技术含量,但第一个群体可能恰恰认为,简单的才好,正因为很好地 抓住了问题本质,所以问题变得容易解决。第二个群体欣赏的工作,第一个群体可能觉得是故弄玄虚,看不出他想解决什么人工智能问题,根本就不是在搞人工智 能、搞计算机,但别人本来也没说自己是在“搞人工智能”、“搞计算机”,本来就不是在为人工智能做研究。

两个群体各有其存在的意义,应该宽容一点,不需要去互较什么短长。但是既然顶着Machine Learning这个帽子的不是“一伙儿”,而是“两伙儿”,那么要“跟进”的新人就要谨慎了,先搞清楚自己更喜欢“哪伙儿”。

引两位著名学者的话结尾,一位是人工智能大奖得主、一位是统计学习大家,名字我不说了,省得惹麻烦:

“I do not come to AI to do statistics”

“I do not have interest in AI”

机器学习两大派别--南大周志华相关推荐

  1. 【大咖论道】周志华,唐杰教授等专家,站在 2022,展望大模型的未来

    28 日,阿里巴巴达摩院发布 2022 十大科技趋势.其中,"大模型参数竞赛进入冷静期,大小模型将在云边端协同进化"的断言,在 AI 圈备受关注. 2021 是大模型爆发之年,我们 ...

  2. 《机器学习》(西瓜书)周志华 -学习心得

    第一章绪论 基本术语 记录&示例&样本:"=",意思是取值为,每一条记录是关于一个对象或事件的描述.eg:(色泽=浅白:根蒂=硬挺:敲声=清脆) 数据集:记录的集合 ...

  3. 【MLA首日报告摘要】周志华、马毅等教授分享机器学习最新进展

    来源:专知 概要:第15届中国机器学习及其应用研讨会今天11月4日在北京交通大学举行,海内外从事机器学习及相关领域研究的10余位专家与会进行学术交流. 第15届中国机器学习及其应用研讨会今天11月4日 ...

  4. 纯国产的大佬周志华,如何扛起了智能学界的一面大旗

    原创:HyperAI超神经 关键词:周志华  机器学习  IJCAI 身为 AI 领域里的大神级学者,周志华教授在科学研究,人才培养,著作传播上都投入了极高的热忱,而他不凡的学术贡献,更是让其获得嘉奖 ...

  5. 南大周志华清华胡事民入围院士候选!计算机领域共计7人

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2021 ...

  6. IJCAI 2021:周志华任大会首个华人程序主席,南大校友获AIJ杰出论文奖

    来源:新智元 [导读]近日,IJCAI 2021在线上开幕,IJCAI史上首位华人程序主席南大周志华教授分析本届大会论文接收情况:中国投稿量最多,最热门的前四个领域论文接收率占56%,此外还总结了通过 ...

  7. 南大周志华教授入围院士候选!计算机领域共计7人

    明敏 发自 凹非寺 来源 | 量子位 QbitAI 2021年中国科学院院士增选初步候选人名单现已公布. 人工智能领域有南京大学人工智能学院院长周志华教授.清华大学胡事民教授入围增选. 计算机领域共有 ...

  8. 周志华:华为-南大LAMDA人工智能联合实验室正式成立

      转载于 新智元   来源:新智元综合报道 编辑:金磊 [新智元导读]"到华为去",说到做到.昨日,南京大学计算机系主任.人工智能学院院长周志华发布朋友圈表示:华为-南大 LAM ...

  9. NIPS论文排行榜出炉,南大周志华5篇论文入选

    作者 | 非主流 出品 | AI科技大本营 作为人工智能领域的顶会,已经有 30 年历史的 NIPS 今年以来一直风波不断.先是被爆出 NIPS 2017 出现了性骚扰行为,然后又被 diss 会议名 ...

最新文章

  1. 《嵌入式系统开发之道——菜鸟成长日志与项目经理的私房菜》——02-08项目人力资源(Human Resource)管理...
  2. Android中五种常用的menu
  3. 数据埋点:用户唯一标识
  4. Django项目的创建Django项目的修改配置文件
  5. php表单显示mysql数据库_php用表单形式显示数据库信息
  6. python中单行注释采用的符号是什么_Python注释符号使用说明(多行注释和单行注释),用法,详解,攻略...
  7. Matlab imcrop函数功能小结(20190123)
  8. js 利用数组队列模拟多线程操作
  9. 萤火虫算法求解简单TSP问题
  10. 18. shell当中的until,until语法,无限循环,until示例
  11. 金蝶凭证序时簿在哪_怎么用金蝶kis记账王打开会计分录序时簿
  12. mysql 联合主键_mysql的联合主键与复合主键区别
  13. iOS -- 第三方登录之微信登录 (Swift代码)
  14. Android开发该学习哪些东西?
  15. 安卓开发中的 “Android高手” ,需要具备哪些技术?
  16. 520. Detect Capital
  17. python查找第k大的数_寻找数组中第K大的数
  18. 第三讲 Matlab/Simulink入门——离散系统仿真实例
  19. 使用 GPSD 快速读取 GPS 信息
  20. Wav ,flac,mp3,ogg 等的区别

热门文章

  1. 深入浅出MyBatis:「映射器」全了解
  2. Django开发微信公众平台
  3. SpringMVC从入门到精通之第一章_慕课文章
  4. JavaWeb之tomcat安装、配置与使用(一)
  5. Exchange 2013 SP1部署系列7:发送连接器的配置
  6. ORACLE 11g安装图解
  7. Robotium 数据驱动测试框架
  8. YlmF WinXP SP3精简版安装显卡驱动技巧
  9. C#程序集Assembly学习随笔(第一版)_AX
  10. Oracle备份与恢复 关于expdp导出远程数据到本地的使用