近日,Reddit 上出现了一个颇有争议性的问题,提问者怀疑深度学习的低门槛会破坏这个领域的声誉。业余者的加入甚至会成为深度学习成长的障碍,因为他们会轻率地将自己不成熟的知识和观念传播出去,最终会影响到业界对深度学习的认同。对此,人们从研究者和工程师的对比、技术成熟阶段性、行业标准和个人经验等角度进行了广泛而热烈的讨论。机器之心编译了其中的重点讨论,原文链接请见文末。


问题

长期以来,我看到很多人自封为深度学习专家、奇才,或者诸如此类的称呼。没有机器学习或者深度学习的教育经历或研究背景,他们仅仅安装了 tensorflow 或 keras,然后跑了几段 github 代码就以为掌握了专业的深度学习知识。接着他们立刻称自己为深度学习专家,撰写博客教程,甚至有胆量教课写书。不久前,我收到了两个人关于深度强化学习一类书的写作计划,他们没有任何在机器学习、深度学习抑或深度强化学习方面的教育经历和工作经验,只是觉得自己已然是专家,不得不写本书出来...

为什么这使我困扰?

这破坏了深度学习的声誉。很多公司无法辨认这些所谓的「专家」。面试官不了解深度学习,对 NIPS、ICML 等毫不关心,无法正确地评估面试者。因此他们最终雇佣了这些所谓的「专家」,然后当其「深度学习」方案最终失败,面试官得出结论,深度学习毫无价值,就是炒作。随着越来越多的公司遇到这种情况,他们对深度学习更加怀疑。现在业界人士已经半开玩笑地把人工作智能称为人工智障。

你怎么看?你是否同意上述观点?如果你同意,我们该做什么?启动一个深度学习招聘网站吗?

补充:我所谓的低进入门槛并不是指低学历。我指的是你无需掌握足够的机器学习或深度学习知识,便能成功解决一些经典问题;但是对于全新的问题,你确实需要具备专业知识和研究经验。

回答与讨论


NichG:实际情况是,绝大多数公司更受用的是工程师而不是研究者。现在大多数手头工作是把标准技术应用于具体的商业用例上。投资新研究往往得不偿失。

因此大多数情况下,满意于从正确位置复制粘贴正确代码这种工作方式的人才是你真正需要的。当然,除此之外也要知道标准技术什么时候不工作及其原因是什么。

hippomancy:说的好。我的公司最近组建了一个深度学习团队,包括两名统计学博士、一名机器学习博士和一名博士工程师。统计学家试图构建聪明的分布近似以更好地选择特征。机器学习博士提供解决该问题的前沿对抗性方法,并写好了 tensorflow 模型。工程师则写了「from sklearn.ensemble import random_forest」,因为她知道这很可能工作不错。一天结束之时,统计学家的假设错了,对抗性模型缺乏足够的数据进行训练,但是随机森林一切正常。

BadGoyWithAGun:在绝大多数领域,工程师无需假装成研究者。

automated_reckoning:这很可能是由于工程师实际负责现实世界中事物的运转。最后,研究者由于研究成果拿到钱,工程师由于解决方案拿到钱。

demonFudgePies:而且,作为一个在「四大」工作的人,我认为不仅仅是由于其有更好的服务器,它们还十分明确地让工程师从事工程工作,研究者从事研究工作。研究者被其他知识渊博、有影响力的研究专家聘用,他们知道如何区分所谓的「专家」与专家。

visarga:你无权「保护你的声誉」。人们有权利自由使用 AI 工具,进行相关写作。如果一个公司不知道如何招聘深度学习人才,只好自食其果。

FermiAnyon:我的问题不同,但是相关。我在这个领域属于半路出家,获得了物理学博士学位,自高中开始一直坚持写代码。近一年来我阅读了手头所有关于机器学习的东西,并拿自己的个人项目练手。虽然我是机器学习新手,但在编程方面很老练。最近我为投简历的事很苦恼,有很多人在这两方面是新手,他们只是看了一些 youtube 视频,也许随便学了些教程,但从没有把技术应用到实际问题上,而我至少有机器学习方面的实操经验。我根据自身情况就说这么多,供面试官参考。

FutureIsMine:深度学习目前很火,任何时候有什么技术火起来的时候,就会有一些自称为专家的狂热者出现。这在移动设备领域出现过,在上个世纪 90 年代 Java 领域出现过,在大数据领域也出现过。这并不是深度学习的错,只是行业标准尚未树立起来的现象而已。

我并不认为近年大部分当前最佳声明是(如你所说的)不可重现的。每一样事物的成长都需要经历加德纳技术成熟度曲线(gartner hype cycle),有些领域(比如图像转换)甚至会有多重标准。你所说明的问题其实是,出现了很多视觉化和形象化的 AI 成果,但实际上要在特定的案例中实现是很困难的。

mszarvas:当前最佳(SOTA)结果不可重现是什么意思,有具体的例子吗?是第三方无法重现,还是甚至用发布的参考代码也无法重现?

我曾经见过即使用发布的代码也不能重现的情况,这使我怀疑大多数的声明结果。但我仍然想保持乐观,也许作者只是出现了一些失误。在我看来,这个领域需要树立一些标准,不应该接受任何没有标准差的孤立结果(缺少对比)。孤立结果可能只是异常值而已。

在这样的研究环境下,很多 SOTA 声明其实都不堪一击。更糟糕的是,视发表这些错误的 SOTA 声明为正当合理的,会把那些使用正确研究方法的研究者排除在竞争之外。

我们至少应该鼓励,以后的论文发表还需要:

1. 发布代码;

2. 发表实验的完整日志。

这两样东西有助于寻找研究中的错误。

jbcraigs:低门槛其实是一件好事,因为产业中不仅需要高级研究员,还需要能将概念实现到日常应用中的工程师。

_MandelBrot:在商业领域中,构建一个真正的学习/数据管道是相当大的挑战。尤其是使用了多个无法访问的旧有 IT 系统工作的时候,而很多企业服务完全就是这样子的。

torvoraptor:我面试过的大多数 PhD 都没有做出什么有意思的成果,使他们能和一个彻底了解 DL/ML/GenML 工程师相提并论。而理论基础扎实的工程师和有实践能力的 PhD 都是很罕见的。

PhD 过分关注创新性,而不够重视简单性和对现有知识的复用,这对于构建现实世界中的系统是很不利的。而大多数工程师刚好相反。

目前可能只有少于 200 个人是真正能持续做出有意义的成果的,但也并不意味着其他人应该就此放弃。还有,并不因为这少于 200 个人都有 PhD,于是每一个机器学习博士毕业生都将自动成为「高级研究者」。只因为他们发表过一些论文,提出一些新的深度学习架构,而并没有人有兴趣去重现他们的结果。

693sniffle:这其实和个人计算机发展迅猛的年代很类似。突然间有无数的人建立了软件设计公司,然后拿出糟糕的 App 产品,没有人知道谁将成为比尔盖茨。

目前这样的现状是因为产业的需求量特别大,供不应求,因此会出现很多的投机者。

unnamedn00b:机器学习领域有今天的成就并不和开放性、包容性相斥,而是依赖于它们。并且,开放性的文化也是社区的一大优势,这并不是巧合。

always_trade:不同意!这不过是该领域中真正的专家和从业者取得巨大成就的结果,仅仅意味着公司们需要有更好的眼光,以找到货真价实的人,不需要担心。

realSatanAMA:我有 20 年的专业编程经验,并自学了 6 年的机器学习。我现在从事的工作几乎完全是机器学习的,但我仍然远远称不上是「专家」。我的公司雇佣了 4 个 PhD 以接替我的工作,但他们还不能从两年的研究成果中提取出任何比我的哪怕是很简单的实现要更好的东西。面向客户的机器学习的意义是,最容易的部分是设计出有预测能力的模型,且在可接受的误差范围之内。而最难的部分是构建系统以把所有模型整合到现有的基础架构中,并搭配 UI 展示,以说服客户接受你的产品。我大部分的时间都用于扩展云服务器群集,用于传输数据。对于机器学习「专家」来说,学习如何让模型在大规模数据中运行得更快,比提出一个新模型更加有用。

gabrielgoh:计算机编程是很困难的,非常非常的难!从菜鸟到编程专家乃至真正的大师需要走很长的路。在真正开始写自己的第一行代码之前,你需要熟悉抽象代数、离散数学和计算复杂度的基本概念。直到精通了多项式分层之前,不要妄想真的能找到工作!你需要阅读《The art of computer programming》的全 8 卷内容,完成所有的练习。然后阅读《Concrete mathematics》,再从头到尾一口气看完 PCP 理论的证明,不理解的话就从头再来。你需要发明自己的汇编语言,并编写一个 C 编译器,自己在 Linux 内核上运行它。一步一步来,记得随时写笔记。最后,当你完成了启动顺序(boot sequence)的时候,再从 Python 解释器开始学习。当你终于能写下自己的完整代码,并且成功编译的时候,恭喜你!已经掌握了基础知识。但是,离真正的程序员还很远。

低门槛究竟是深度学习的危机,还是契机?相关推荐

  1. 基于场景的数据集究竟对深度学习落地有何影响(明厨亮灶,智慧工地,平安校园,电力,智慧交通),以yolox 训练检测为例

    为了和各位开发爱好者深入合作交流,特此准备分批次开放数据集拱大家交流学士研究使用,整理的非常细腻,有些是专业队伍标注的,主要是菲律宾那边的团队进行标注的.依据众多算法搭建的算法平台主体算法包括   人 ...

  2. 基于深度学习的图像识别进展:百度的若干实践

    来源:<中国计算机学会通讯> 2015年第4期<专题> 作者:都大龙 余轶南 罗 恒 等 概述:深度学习和图像识别 近年来在人工智能领域最受关注的,非深度学习莫属.自2006年 ...

  3. 神经网络、深度学习、人工智能、智能制造2018资料汇编(公号回复“AI2018资料”下载PDF资料,欢迎转发、赞赏支持科普)

    神经网络.深度学习.人工智能.智能制造2018资料汇编(公号回复"AI2018资料"下载PDF资料,欢迎转发.赞赏支持科普) 秦陇纪 科学Sciences 今天 科学Science ...

  4. 神经网络与深度学习【自用】

    神经网络与深度学习 1.1深度学习概述 深度学习(Deep Learning)就是更复杂的神经网络(Neural Network) 神经网络(Neural Network) 引入神经网络模型的概念: ...

  5. 旷视落子天元:深度学习框架开源,是成为伟大AI企业的第一步

    "机器必须有自己独特的思考,机器必须做人类做不到的事情." 作者 / 刘亚杰 编辑 / 刘 煜 人工智能的飞速发展离不开深度学习和算法的演进.人工智能是怎样实现的?算法又是怎样产生 ...

  6. MLPerf结果证实至强® 可有效助力深度学习训练

    MLPerf结果证实至强® 可有效助力深度学习训练 · 核心与视觉计算事业部副总裁Wei Li通过博客回顾了英特尔这几年为提升深度学习性能所做的努力. · 目前根据英特尔® 至强® 可扩展处理器的ML ...

  7. 爆火的深度学习面试书现可白嫖!GitHub上线2周1.5K Star,之前售价146元

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 面试宝典千千万,但这一份,应当是深度学习领域里不容错过的那一个了. 这不,才在arXiv"上架"12天,GitHub就狂 ...

  8. 吴恩达《优化深度神经网络》精炼笔记(1)-- 深度学习的实用层面

    AI有道 不可错过的AI技术公众号 关注 吴恩达的深度学习专项课程的第一门课<神经网络与深度学习>的所有精炼笔记我已经整理完毕.迷路的小伙伴请见文章末尾的推荐阅读: 在接下来的几次笔记中, ...

  9. Coursera吴恩达《优化深度神经网络》课程笔记(1)-- 深度学习的实用层面

    红色石头的个人网站:redstonewill.com Andrew Ng的深度学习专项课程的第一门课<Neural Networks and Deep Learning>的5份笔记我已经整 ...

  10. 领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

    本文转载自公众号:美团技术团队. 本文介绍了大众点评搜索核心排序层模型的演化之路,包括结合知识图谱信息构建适合搜索场景的Listwise深度学习排序模型LambdaDNN以及特征工程实践和相关工具建设 ...

最新文章

  1. xilinx的FPGA动态局部重配置(DPR)
  2. Gradle引人注目的特性集
  3. 腾讯AI Lab联合清华,港中文长文解析图深度学习的历史、最新进展到应用
  4. 【蓝桥杯真题】地宫取宝(搜索-记忆化搜索详解)
  5. E - 嗯? 51Nod - 1432(二分)
  6. c/c++整理--c++面向对象(1)
  7. Tensorflow2.0模型构建与训练
  8. 超简单炫彩抽象线条感海报PSD分层素材,一切变得简单!
  9. 性能测试概念点分析与过程讲解(三)
  10. bzoj1612 奶牛的比赛
  11. 苹果分屏软件_Mac软件推荐
  12. idea开发java前端_Web前端开发神器 Intellij IDEA
  13. vue中显示实时时间
  14. 关于actel FPGA下载的学习报告
  15. [Luogu P3704] [BZOJ 4816] [SDOI2017]数字表格
  16. python练习五——PTA
  17. r语言绘制精美pcoa图_「R」数据可视化5:PCA和PCoA图
  18. Conflux 创始人龙凡教授向浙江省委书记车俊汇报 Conflux 最新研发进展
  19. c语言测试软件的编写,用c语言编写智商测试软件
  20. Qt下实现录制麦克风声音

热门文章

  1. 12行js核心代码实现满屏升空气球
  2. mysql 开启预编译_mysql 预编译 为什么默认不开启?
  3. 微信小程序-tempfilePath、cloudPath、fileID到底是个什么东西
  4. 《Java程序员由笨鸟到菜鸟》
  5. 智慧树中java答案_最有助于确诊肾动脉狭窄的检查是A.磁共振成像B.肾动脉造影C.静脉肾盂造影D.放射性核素肾图E.肾动...
  6. 转:从写程序的那天起,我都没打算些程序
  7. 如何删除计算机新用户名和密码是什么,教你Windows10系统管理员账户密码怎么删除...
  8. SQLSTATE[HY000] [2003] Cant connect to MySQL server
  9. 新支点B4G+5G聚合路由器亮相2020国际安全和应急博览会
  10. python 爬取京东 商品数据