一、人工智能、机器学习、深度学习三者之间的关系

人工智能是一个领域,是一个目标,而机器学习是实现这一目标的一类方法,深度学习只是机器学习这一类方法中的一种。

二、人工智能

1.人工智能的定义

使一部机器像人一样进行感知、认知、决策、执行的人工程序或系统。

2.人工智能的三个层面

  • 计算智能(能存能算)
  • 感知智能(能听会说、能看会认)
  • 认知智能(能理解、会思考)

3.人工智能的发展脉络

  • 早期:知识工程/专家系统(根据专家定义的知识和经验,进行推理和判断,从而模拟人类专家的决策过程来解决问题)
  • 目前阶段:机器学习

知识工程vs机器学习

知识工程:

  • 基于手工设计规则建立专家系统
  • 结果容易解释
  • 系统构建费时费力
  • 依赖专家主观经验,难以保证一致性和准确性

机器学习:

  • 基于数据自动学习
  • 减少人工繁杂工作,但结果可能不易解释
  • 提高信息处理的效率,且准确率较高
  • 来源于真实数据,减少人工规则主观性,可信度高

三、机器学习

1.机器学习的定义

最常用定义:计算机系统能够利用经验提高自身的性能

可操作定义:机器学习本质是一个基于经验数据的函数估计问题

统计学定义:提取重要模式、趋势,并理解数据,即从数据中学习

总之,机器学习就是一个从数据中自动提取知识的方法。

2.机器学习学习的方法

(1)模型

对要学习问题映射的假设(问题建模,确定假设空间)

模型分类

根据数据标记,分为监督学习模型、半监督学习模型、无监督学习模型、强化学习模型。

根据数据分布,分为参数模型和非参数模型。

根据建模对象,分为判别模型和生成模型。

a.监督学习模型:监督学习的样本具有标记,监督学习从数据中学习标记分界面(输入-输出的映射函数),适用于预测数据标记。

b.无监督学习模型:无监督学习的样本没有标记,从数据中学习模式,适用于描述数据。

c.半监督学习模型:部分数据标记已知,适用于标记样本难以获取、无标记样本相对廉价,未标记样本与标记样本独立同分布的情况。

d.强化学习模型:数据标记未知,但知道与输出目标相关的反馈,适用于决策类问题。

e.参数模型:对数据分布进行假设,待求解的数据模式或映射可以用一组有限且固定数目的参数进行刻画。(线性回归、逻辑回归、感知机、K均值聚类)

f.非参数模型:不对数据分布进行假设,数据的所有统计特性都来源于数据本身。(K近邻、SVM、决策树、随机森林)

参数模型 非参数模型
优点 数据需求少、训练快速 对数据适应性强,可拟合不同的函数形式
缺点 模型复杂度有限,与真实目标函数拟合度小 数据需求大、容易过拟合

g.判别模型:对已知输入X条件下输出Y的条件分布P(Y|X)建模,直接学习P(Y|X)。

h.生成模型:对输入X和输出Y的联合分布P(X,Y)建模,先从数据中学习联合概率分布,再利用贝叶斯公式求条件概率分布。

(2)策略

从假设空间中学习/选择最优模型的准则(确定目标函数)

(3)算法

根据目标函数求解最优模型的具体计算方法(求解模型参数)

四、深度学习

1.深度学习的三个助推剂

  • 大数据
  • 算法
  • 计算力

2.深度学习的“不能”

(1)算法输出不稳定,容易被“攻击”;

(2)模型复杂度高,难以纠错和调试;

(3)模型层级复合程度高,参数不透明;

(4)端到端训练方式对数据依赖性强,模型增量性差;

(5)专注直观感知类问题,对开放性推理问题无能为力;

(6)人类知识无法有效引入进行监督,机器偏见难以避免。

3.深度学习的“不能”与解释性

4.M-P神经元

5.激活函数

激活函数表示的是神经元继续传递信息,产生新连接的概率(超过阈值被激活,但不一定传递)。

没有激活函数相当于矩阵相乘,多层神经网络与一层神经网络一样,只能拟合线性函数。

激活函数举例:

6.万有逼近定理

如果一个隐层包含足够多的神经元,三层前馈神经网络(输入-隐层-输出)能以任意精度逼近任意预定的连续函数。

线性分类任务组合后可以解决非线性分类任务。

当隐层足够宽时,双隐层感知器(输入-隐层1-隐层2-输出)可以逼近任意非连续函数:可以解决任何复杂的分类问题。

7.神经网络每一层的作用

神经网络学习如何利用矩阵的线性变换加激活函数的非线性变换,将原始输入空间投影到线性可分的空间去分类/回归。

增加节点数:增加维度,即增加线性转换能力。

增加层数:增加激活函数的次数,即增加非线性转换次数。

那么对于同一问题应该选择更宽的网络还是更深的网络呢?

在神经元总数相当的情况下,增加网络深度可以比增加宽度带来更强的网络表示能力:产生更多的线性区域。深度和宽度对函数复杂度的贡献是不同的,深度的贡献是指数增长的,而宽度的贡献是线性的。

8.梯度消失

(1)误差反向传播

(2)梯度和梯度下降

梯度:多元函数f(x,y)在每个点可以有多个方向,每个方向都可以计算导数,称为方向导数。梯度是一个向量,方向是最大方向导数的方向,模为方向导数的最大值。

(3)梯度消失

增加深度会造成梯度消失,误差无法传播;

多层网络容易陷入局部极值,难以训练;

预训练、新激活函数使深度成为可能。

9.逐层预训练

没有新的激活函数、没有dropout等优化技术下,逐层无监督预训练使得深度网络的训练有了可能,但是逐层预训练无法本质上解决梯度消失的问题。

10.解决梯度消失的问题

人工智能、机器学习、深度学习相关推荐

  1. 图解人工智能机器学习深度学习的关系和区别

    图解人工智能机器学习深度学习的关系和区别,先直观看下图的关系: AI(Artificial Intelligence.人工智能).机器学习(machine learning).深度学习(Deep le ...

  2. 人工智能-机器学习-深度学习的区别与联系

    AI,机器学习,深度学习,这些术语使很多人感到困惑.如果您也是其中之一,那么人工智能-机器学习-深度学习的区别与联系– AI vs Machine Learning vs Deep Learning绝 ...

  3. 【人工智能 机器学习 深度学习】基础选择题 31~60题 练习(题目+答案),亦含 判断题

    目录 一.前情回顾 二.31~40题 2.1 题目 2.2 答案 三.41~50题 3.1 题目 3.2 答案 四.51~60题 4.1 题目 4.2 答案 一.前情回顾 [人工智能 & 机器 ...

  4. 深度学习(一): 人工智能-机器学习-深度学习的区别

    人工智能-机器学习-深度学习 他们之间是有区别的 先来一张图做一下解释 从发展历史上来看 AI:让机器展现出人类智力 回到1956年夏天,在当时的会议上,AI先驱的梦想是建造一台复杂的机器(让当时刚出 ...

  5. 人工智能 机器学习 深度学习

    人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集.机器学习与深度学习都是需要大量数据来"喂"的,是大数据技术上的一个应用,同时深度学习还需要更 ...

  6. 人工智能-机器学习-深度学习-电子书大全

    MATLAB函数速查手册(修订版)-邓薇, R的极客理想--工具篇 (数据分析技术丛书)-张丹 著, R语言与网站分析 (数据分析技术丛书)-李明著, R语言实战 (图灵程序设计丛书)-Robert ...

  7. 人工智能/机器学习/深度学习:学习路线图

                着重掌握机器学习.深度学习.迁移学习.

  8. 计算机专业 人工智能 机器学习 深度学习 统计 专业英语单词(一)

    把自己最近学到的计算机人工智能 机器学习 统计自然语言处理相关英语单词整理记录一下,持续更新,学到一些就记录一些. 语言科学 linguistic science 摘要 summarizing 自然语 ...

  9. 《正版 图解语音识别 语音识别入门实践教程 语音识别技术书 人工智能机器学习深度学习计算机网络编程书籍R3Z978》[日]荒木雅弘著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 图解语音识别 定价 59.00 出版社 人民邮电出版社 版次 1 出版时间 2020年04月 开本 32开 作者 [日]荒木雅弘 装帧 平装-胶订 页数 字数 ISBN编码 97871155 ...

  10. 人工智能-机器学习=深度学习-其他

    机器学习课程:coursera上的课程,吴恩达主讲 https://www.coursera.org/learn/machine-learning 从ReLU到GELU,一文概览神经网络的激活函数 h ...

最新文章

  1. Linux 实时查看日志文件的 4 种方法
  2. 海量数据处理简要说明(一)
  3. Data Guard组件等相关介绍
  4. 【每日算法Day 92】经典面试题:编辑距离
  5. asp.net 数据绑定 使用eval 时候报 “字符文本中的字符太多” 问题解决
  6. 百度爱番番实时 CDP 建设实践
  7. 新版本安装包需求汇总
  8. 如何循序渐进向DotNet架构师发展(转)
  9. Windows10下安装原生TensorFlow GPU版
  10. CNN 解析 --唐宇迪
  11. MySQL 性能优化一
  12. 将OSM地图转化成OpenDRIVE
  13. 什么是用户故事 (User Story)?
  14. 谈谈我们熟悉但未必了解的磁带库
  15. java overload
  16. Machine Translation and Datasets - 机器翻译与数据集(RNN循环神经网络)
  17. <转载>主机ping虚拟机ip请求超时解决办法
  18. javase笔记基础篇
  19. 高通MDM平台通过USB共享文件
  20. nt6安装win7:发现系统安装文件,但该分区不支持本安装模式

热门文章

  1. Cypress学习笔记(二)——钩子函数before,after,beforeEach,afterEach
  2. sphinx配置的详解
  3. 九龙证券|今年1月份境外投资者 对境内股票投资创单月历史新高
  4. html loader使用方法,webpack中loader的使用方法,以及几个常用loader的应用小实例
  5. JavaScript控制input输入框的required属性值
  6. JVM内存区域划分Eden Space\Survivor Space\Tenured Gen\Perm Gen
  7. 中国大模型的落地DNA,写在这个双螺旋结构里
  8. 7-1 检查宿舍卫生(20分)
  9. Python机器学习零基础理解PCA主成分分析
  10. php模板引擎smaty之介绍