我们先一张一张PPT来分析讲解[1]。

总体框图



这张图表明了接下来的知识脉络体系,也可以看成目前学术界、工业界的几大研究方向。整体上分为:
监督学习、半监督学习、无监督学习、迁移学习、强化学习。
对于监督学习又分为:回归、分类、结构化学习[2]
对于分类问题,整体上分为线性模型和非线性模型,非线性模型包括深度学习、SVM、决策树、KNN等。
接下来一个一个说明。
 李大大对回归有一个例子说明:

该图是一个预测PM2.5的回归问题,由今天上午PM2.5的数值和昨天上午的PM2.5的数值等输入数据预测明天上午PM2.5的数值。输入输出数据分别如下:

接下来,李大大谈到分类问题,

分类问题


 分类分为二分类和多分类问题。

二分类问题李大大举个例子,邮箱是否具有某个功能,多分类例子比如新闻分类问题。


既然是分类问题,那我们用什么方法学习呢,首先想到的是线性模型,然而线性模型因为其模型过于简单、特征工程量大等特性不会简简单单的一个模型使用。其次就是非线性模型了,非线性模型中深度学习越来越热,也扮演着重要的角色。

深度学习用于分类问题在很多方面已经成熟应用。比如,图像识别,输入是一张未知动物的图片,经过一个函数(for example,CNN,这个函数相当于model,该model的训练数据是一堆已经标记好猴子、猫、狗的标签数据)的判断出该张图片属于哪一个类别的动物。

比如,判断一盘围棋接下来落子该如何走。输入是一盘围棋,经过一个函数(model的训练数据是一堆棋谱)判断接下来一步该走到哪一个位置,每一位置可以看成一个类别。多分类问题。

半监督学习

  
  半监督学习李大大说了,就像这样的:
  
在辨别猫和狗的例子中,有一部分是标注好的标签数据,一部分是非标签数据。那么Semi-supervised
Learning做的就是利用Unlabeled data优化function,也常用于数据不足时进行学习[3]。

迁移学习


迁移学习,顾名思义,是在迁移中学习。这个是指模型具有可迁移性从而可以节省模型训练时间。比如:

上个例子说,输入数据中的一部分标注好label的cat和dog和另一部分与猫狗无关的一些图片(比如,大象啊,狮子啊,还有凉宫春日有木有~可以标注好label,也可以是没标注的~)。那么Transfer Learning就是利用这些data优化function[3][4]。

无监督学习

比如,机器阅读,


机器阅读是这个样子的,给机器一丢丢材料,然后喂给机器一个”Apple”的词语让机器学习出这个词是个啥东西。

另一个是机器画画,训练数据是一丢丢图片,然后给到一串code,生成一幅图片(例子里是咖啡)。

结构化学习

此类问题在实际运用中,常常会遇到Beyond Classification的情况,比如语音识别,人脸识别,语言翻译等,是结构化输出。此类问题常配合Reinforcement Learning 解决。(这是为啥,黑人问号,求解答——博主理解为强化学习是调整策略以达到最佳效果,语音识别一类问题无法通过分类问题有效解决,依靠策略性靠近实现)

 
接下来就是最后一类学习了,强化学习。

强化学习

监督学习 vs 强化学习
举例1、用一个语音识别的例子来解释:
Supervised 就像给了机器一个点读机,他听到一句话时可以看到其含义,每一句话都有标签,就像有一个手把手教他的老师。而Reinforcement Learning 就像跟女朋友对话,反复讲来回讲很多句话,直到女朋友觉得你无言以对愤然离去,机器唯一可以知道的就是他做的好还是不好,除此之外没有任何information。而这更像人类现实生活中的学习过程,必须自己像哪里做得好做得不够好,怎么修正。

另一个例子,下围棋。
举例2:
supervised: 给机器一堆棋谱,告诉机器,情况a则落子在“5-5”处,情况b则落子在……
Reinforcement Learning: 让机器自己下棋,下过几百手之后,机器只知道自己赢了还是输了,下的好还是不好,机器必须自己想办法做提高。

换句话说,我们可以这么来理解,监督学习是在对于有标签的数据进行训练并对未知数据进行预测,对于强化学习是在某一个环境中依靠某一个策略逐步修正的过程。
最后来一个总结:

以下截图总结来源于[3]:
蓝色部分代表scenario,意思是你现在有什么类型的 training data。

红色部分代表task,意思是现在function的output是什么,只体现在supervised中,但其实可以插在以上五种Learning的每一种内。

绿色部分代表Method方法模型,比如在Classification中有Linear模型 or Non-linear模型,我们可以将绿色部分插入任何红色部分中。即在监督学习中都可以用到线性和非线性模型。
Ref:
1、http://101.96.10.64/speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/Learning%20Map%20%28v2%29.pdf
2、https://blog.csdn.net/qq_32690999/article/details/78840312
3、https://blog.csdn.net/soulmeetliang/article/details/72591054
4、http://cs231n.github.io/transfer-learning/

李洪义机器学习课程(一)——Learning Map学习笔记相关推荐

  1. python线性回归预测pm2.5_李洪义——机器学习作业——1-线性回归:预测PM2.5,李宏毅,1LinearRegression,PM25...

    1-Linear Regression:预测PM2.5 注意 :这篇博客的任何操作是在已经下载好Python的前提下,如果还没有下载Python,可以参考以下链接下载Python https://bl ...

  2. Hinton机器学习与神经网络课程的第二章学习笔记

    Hinton机器学习与神经网络课程的第二章学习笔记 该笔记为自己以后方便查阅,要是有大神感觉我的笔记有哪些地方记的有误差或者不对的话也欢迎指出 文章目录 Hinton机器学习与神经网络课程的第二章学习 ...

  3. 台大李宏毅Machine Learning 2017Fall学习笔记 (1)Introduction of machine Learning

    台大李宏毅Machine Learning 2017Fall学习笔记 (1)Introduction of machine Learning 台大李宏毅讲的这门课应该不错,课程链接: http://b ...

  4. ScalersTalk 机器学习小组第 21 周学习笔记(深度学习-10)

    ScalersTalk 机器学习小组第 21 周学习笔记(深度学习-10) Scalers点评:机器学习小组是成长会的内部小组,这是成长会机器学习小组第21周学习笔记,也是深度学习第10次的复盘笔记 ...

  5. 台大李宏毅Machine Learning 2017Fall学习笔记 (11)Convolutional Neural Network

    台大李宏毅Machine Learning 2017Fall学习笔记 (11)Convolutional Neural Network 本博客主要整理自: http://blog.csdn.net/x ...

  6. 台大李宏毅Machine Learning 2017Fall学习笔记 (9)Keras

    台大李宏毅Machine Learning 2017Fall学习笔记 (9)Keras 本节课主要讲述了如何利用Keras搭建深度学习模型.Keras是基于TensorFlow封装的上层API,看上去 ...

  7. 台大李宏毅Machine Learning 2017Fall学习笔记 (4)Gradient Descent

    台大李宏毅Machine Learning 2017Fall学习笔记 (4)Gradient Descent 这节课首先回顾了利用梯度下降法优化目标函数的基本步骤,然后对梯度下降法的应用技巧和其背后的 ...

  8. 《机器学习》周志华 学习笔记

    <机器学习>周志华 学习笔记 第一章 绪论 1.1 引言 机器学习:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能. 经验:"经验"通常以"数据& ...

  9. Yoshua Bengio——《Deep Learning》学习笔记1

    版权声明:此为Yoshua Bengio的新书<Deep Learning>学习笔记,本文为博主在研究工作中经验分享,包括学习笔记.摘录.研究成果,以便以后工作参考之用,欢迎交流和批评:其 ...

最新文章

  1. HTMLCanvasElement.toDataURL()
  2. 和rgb画面质量谁好_双11内存RGB灯条如何选?低于400元,只聊酷兽和阿斯加特
  3. python自动抢红包软件_快过年啦,还怕手速慢,我用Python自动抢红包!
  4. Python挑战题目,你会了吗?
  5. 《leetcode》longest-substring-without-repeating
  6. 【小姨子】 基本信息(拼音,读音等)
  7. I00010 打印1到输入数之间的回文数
  8. 关于虚拟机virtualbox使用无线卡上网的设置
  9. c语言中反余切三角函数,三角函数(反双曲)正弦,余弦,正切,余切,正割,余割在线计算器_三贝计算网_23bei.com...
  10. 计算机获取信息的过程是,“获取信息的过程与方法”的教学案例
  11. Rstudio中修改工作路径的三种方法
  12. 小王梦游记五---最美丽的湖
  13. 《致橡树》–by 舒婷
  14. 虚拟机从光盘启动方法
  15. 网吧运行linux,开Linux网吧行不行得通?
  16. 小米10至尊纪念版和Redmi K30至尊纪念版的区别 哪个好
  17. Java数据结构与算法(十三):程序员常用的10种算法
  18. 卖锁小老板的创业之路,如何从入不敷出到月入30万的方案分享
  19. 荣耀手环5篮球版的使用方法
  20. 读后感:微软首席数据科学家谢梁的AI故事

热门文章

  1. DS二叉排序树之查找
  2. Unity Application.wantsToQuit使用注意项
  3. 51单片机--AD/DA
  4. python爬取json接口
  5. 算法 图2 Saving James Bond - Easy Version
  6. 求点到直线的垂足和最近点
  7. axure 8 表格合并_规范交互原型图包含哪些要素? | 附Axure 模版源文件
  8. mysql时间相减得到天数保留两位_MySQL计算两个日期相差的天数、月数、年数
  9. 树上倍增的写法和应用(详细讲解,新手秒懂)
  10. Android 10.0 Launcher3桌面禁止左右滑动