很多人对机器学习的边界范围似是而非,机器学习是人工智能吗?机器学习与大数据、云计算有什么关系?机器学习是不是就是数据挖掘?机器学习是不是就是算法,就是统计学?深度学习是不是机器学习的升级版?

还记得以前的中关村开会的例子吗:你住在北京南4环以外,明天周一早上9点需要在北4环的中关村开个会,你给计算机输入出发地点,开会时间和开会地点,计算机根据很长一段时间内周一到周日每个时间段北京各条道路的堵车指数数据,经过学习后,自动计算输出:几点几分出发。

看到这里,很多人就会说,这不就是“人工智能”吗!计算机学习过往的经验数据,自己判断、自己决策什么是最优的出发时间。那么它同时也是“深度学习”吗?

没错,这是人工智能(Artificial Intelligence, AI),但是不是“深度学习”现在还不好说,关于“深度学习”以后会再讲。这里要说明的是,人工智能是一个涵盖范围非常广的概念,或者说是一个非常宽泛的概念。

可以这样说:

深度学习属于机器学习,机器学习又属于人工智能。

画成图就是这样:

你可以这样理解:人工智能就如同是北京的房子,我们都知道北京的房子贵,也知道人工智能很高级,但都是宽泛的概念。北京的房子有学区房、商住房、两限房,经济适用房等,还要分区域,是东城区的房子还是丰台区的房子。我们只有围绕具体的环境、具体的应用谈论北京的房子才有意义,是门头沟区的经济适用房,还是海淀区的学区房。

因此:

如果把人工智能比作北京的房子,那机器学习就是北京的学区房,而深度学习就是学区房中的西城区学区房。

注:西城区是北京核心区,故宫和中南海所在地,北京最好的中小学都在西城区。

稍微拓展下话题。从上面的图中可以看出,我故意把机器学习占人工智能范围的比例画的比较大,而深度学习又占了机器学习非常大的比例,这不是没有缘由的。

事实上,人工智能领域近些年来突然热门起来,毫不客气的说是机器学习尤其是深度学习的发展而带动的。自上世纪50年代人工智能提出后,其发展就一直非常缓慢,半个多世纪都没有看到足够震撼的技术进步,我在十多年前所学专业就是人工智能方向,那时虽不是冷门专业,但也谈不上是热门专业。

直到近些年机器学习在一些专业领域,例如语音识别、产品推荐、图像识别、棋类游戏等达到了跟人类相当甚至远远超出的程度,才使得计算机终于有了接近人类智能的水平。

而这些震撼成果的取得,几乎都离不开机器学习或者说离不开“深度学习”。深度学习简单说就是基于深度神经网络的学习,由于其模拟了人类大脑的神经网络构成,极有可能是真正实现人工智能梦想的关键所在。像科大讯飞的语音识别输入法,著名的Google围棋程序AlphaGo,无人驾驶汽车等都是基于深度学习的。

近些年深度学习的发展极大的提升了机器学习的地位,更进一步的,促进了整个人工智能水平的提高,使得人工智能重新站在了时代的浪潮之巅。关于深度学习以后专题再聊,现在你只需要知道“深度学习”是“机器学习”的一个分支或者说重要组成部分。

再回到最前面,机器学习与大数据、云计算、数据挖掘、模式识别、统计学等有什么关系?

以前我们提到,机器学习有一个必要前提:必须有过往的经验,或者说有过往的数据。如果这个过往的经验或者说数据非常庞大,就涉及到“大数据”的处理

大数据,顾名思义,就是非常大的数据,而“云计算”又可以简单理解为利用互联网的分布式并行处理、分布式数据库和异地存储、虚拟化等技术进行“大数据”处理的工具,而且是“大数据”必然要使用的工具。

机器学习需要用到的数据,可以是少量数据,也可以是很大的数据。如果是很大的数据,那机器学习和大数据就紧密结合了,但是两者并不等同。而云计算和大数据,你可以理解为一个硬币的正反2面,云计算就是为大数据而生的,而大数据也必须要用云计算来处理。

对于数据挖掘,你可以认为:数据挖掘现在约等同于机器学习。但是,数据挖掘是更宽泛的概念,就像“发消息”,可以“用短信发消息”,也可以“用微信发消息”,只不过现在“发消息”默认是“用微信发消息”,就像“数据挖掘”现在默认是用机器学习的方法来挖掘数据一样,以前可以自制图表挖掘,也可以用excel数据表格挖掘,这些方法现在看来比较low了。也许将来某一天,机器学习也变low了,数据挖掘用了更高级的方法。

对于模式识别,十几年前我所学的专业就是这个,当时的专业名称叫“模式识别与智能系统”。模式识别,顾名思义就是识别事物中的模式、规律,你可以认为:模式识别等同于机器学习。只不过模式识别源自工业界的叫法,机器学习源自计算机业界的叫法。当然,模式识别这个词现在用的比较少了,作为一个术语而言,在上世纪80、90年代比较流行,现在已经有点过时了,你可以用机器学习代替它。

对于统计学,你可以理解为:统计学是机器学习的基础,就像数学是物理学的基础一样。机器学习中的大多数方法都来自于统计学,就像物理学中的大多数方法来自于数学,区别就在于统计学(数学)更偏重理论,机器学习(物理学)更偏重应用。

你绝对能懂的“机器学习”(三)相关推荐

  1. 机器学习三个部分:输入、算法、输出 资料收集

    机器学习三个部分:输入.算法.输出. 输入:驱动机器学习的数据 输入是训练和算法需要的数据集.从源代码到统计数据,数据集可以包含任何东西: GSA / data(美国总务管理局数据):https:// ...

  2. 机器学习三要素之数据、模型、算法

    参考:https://gitbook.cn/gitchat/column/5ad70dea9a722231b25ddbf8/topic/5b1086eccad6fe44db4c1268 1. 机器学习 ...

  3. 机器学习(三)线性回归、广义线性回归、非线性回归

    机器学习(三)线性回归模型.广义线性回归模型.非线性回归模型 线性回归(数据集要满足正态分布) 一元线性回归模型: 在这里会想到,如何确定方程中的系数呢?我们先来了解最小二乘法,简单来说就是这个点作y ...

  4. 机器学习三种学习方法和感知器

    机器学习三种主要的学习方式: 监督学习:使用有类标的训练数据构建模型,即在训练过程中,所有的数据都是知道它的类别的.通过构建的这个模型对未来的数据进行预测.在监督学习的下面,又可以分为分类(利用分类对 ...

  5. 机器学习(三):一文读懂线性判别分析(LDA)

    一.什么是线性判别分析? 线性判别分析(Linear Discriminant Analysis,LDA)的一种经典的线性学习方法(属于监督学习),这里先借用周志华教授的<机器学习>中的图 ...

  6. 教程 | 一文读懂自学机器学习的误区和陷阱(附学习资料)

    来源:机器学习与统计学 本文约6296字,建议阅读10分钟. 本文为你指出一些自学的误区,推荐学习资料,提供客观可行的学习表并给出进阶学习的建议. 后台回复"20190426"获取 ...

  7. 人人可懂的机器学习入门要点和阅读路径:学什么?怎样学?

    导读:这是一篇保证你"看得下去"的文章.让你真正搞懂机器学习学什么?怎样学? 作者:莫凡 来源:华章计算机(ID:hzbook_jsj) 00 有关机器学习的三个问题和机器学习&q ...

  8. 人人都能看懂的机器学习!3个案例详解聚类、回归、分类算法

    导读:机器是怎样学习的,都学到了什么?人类又是怎样教会机器学习的?本文通过案例给你讲清楚各类算法的原理和应用. 机器学习,一言以蔽之就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预 ...

  9. 小白也能读懂的机器学习入门指南

    点击上方"程序员江湖",选择"置顶或者星标" 你关注的就是我关心的! 这篇文章写得真的很好,忍不住转给大家. 转自:博客园,作者:计算机的潜意识 从机器学习谈起 ...

最新文章

  1. 执行“conda create -n scrapyEnv python=3.6”,结果出现了“CondaHTTPError: HTTP 000 CONNECTION FAILED for url <h
  2. python3华丽gui_Python3.7 - tkinter Gui 03 Options的用法
  3. 【知识图谱】关于知识图谱,我们接下来该研究什么?斯坦福教授们给出了答案...
  4. JAVA如何判断两个字符串是否相等(亲测第二种方式)
  5. [COGS2426][HZOI 2016]几何
  6. oracle 文件写 n r,[oracle]log_archive_dest_n与DB_RECOVERY_FILE_DEST
  7. Not Equal on a Segment CodeForces - 622C
  8. 【数字逻辑设计】基本逻辑门
  9. Mac下卸载Idea
  10. JavaScript 浏览器对象BOM
  11. 双层玻璃窗的功效模型matlab,数学建模实例双层玻璃的功效
  12. vue.js引入外部CSS样式和外部JS文件的方法
  13. HTML实用的网页代码大全
  14. 中兴ZXV10 B860AV1.1 全TTL操作完美破解
  15. slitaz linux 包管理器,SliTaz
  16. 在 Python 中使用机器学习进行人体姿势估计
  17. excel的lookup函数
  18. 更新linux yum源,CentOS 更新yum源
  19. python 邮件之发信人和发信地址
  20. 大型建筑公司如何实现数字化转型

热门文章

  1. 关于分布式锁的面试题都在这里了
  2. 2 个月的面试亲身经历告诉大家,如何进入 BAT 等大厂?
  3. Oracle存储过程procedure与函数function区别
  4. python有多少关键字_Python挖词脚本,挖出几十万关键词不是梦带搜索量
  5. sharemouse切窗口就锁定了什么原因_Excel表格如何锁定,被锁定的表格又该如何解除锁定呢?...
  6. (SpringMVC)RestFul和Controller
  7. 在ListView中使用BaseAdapter进行适配
  8. 策略模式(Strategy)简介
  9. shiro表单登录认证及退出(自定义form认证器)
  10. iOS - 数据的归档和反归档