机器学习

机器学习简单来说就是让机器进行自我学习,举个例子作为学生的我们经常参加考试,考试在考场上遇到的题目我们未必做过,但是在考试之前我们会刷很多的题目,通过刷题总结解题方法,这样上了考场也能以不变应万变。
其实机器学习的思路也类似,我们可以利用一些训练数据(已经做过的题),使机器能够利用它们(解题方法)分析未知数据(考场的题目)。


一句话概括:机器学习就是让机器从大量的数据集中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好。

监督学习

定义: 根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。也就是说,在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。监督学习我们可以理解成我们去教电脑做事。
监督学习的分类:回归、分类
回归回归问题是针对于连续型变量的。
举例:预测房屋价格
假设想要预测房屋价格,绘制了下面这样的数据集。水平轴上,不同房屋的尺寸是平方英尺,在竖直轴上,是不同房子的价格,单位时(千万$)。给定数据,假设一个人有一栋房子,750平方英尺,他要卖掉这栋房子,想知道能卖多少钱。这个时候,监督学习中的回归算法就能派上用场了,我们可以根据数据集来画直线或者二阶函数等来拟合数据。


通过图像,我们可以看出直线拟合出来的150k,曲线拟合出来是200k,所以要不断训练学习,找到最合适的模型得到拟合数据(房价)。
回归通俗一点就是,对已经存在的点(训练数据)进行分析,拟合出适当的函数模型y=f(x),这里y就是数据的标签,而对于一个新的自变量x,通过这个函数模型得到标签y。

分类
和回归最大的区别在于,分类是针对离散型的,输出的结果是有限的。
假设某人发现了一个乳腺瘤,在乳腺上有个z肿块,恶性瘤是危险的、有害的;良性瘤是无害的。
假设在数据集中,水平轴是瘤的尺寸,竖直轴是1或0,也可以是Y或N。在已知肿瘤样例中,恶性的标为1,良性的标为0。那么,如下,蓝色的样例便是良性的,红色的是恶性的。


这个时候,机器学习的任务就是估计该肿瘤的性质,是恶性的还是良性的。
那么分类就派上了用场,在这个例子中就是向模型输入人的各种数据的训练样本(这里是肿瘤的尺寸,当然现实生活里会用更多的数据,如年龄等),产生“输入一个人的数据,判断是否患有癌症”的结果,结果必定是离散的,只有“是”或“否”。所以简单来说分类就是,要通过分析输入的特征向量,对于一个新的向量得到其标签。

无监督学习

定义:我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。可以这么说,比起监督学习,无监督学习更像是自学,让机器学会自己做事情,是没有标签(label)的。
对于平时的考试来说,监督学习相当于我们做了很多题目都知道它的标准答案,所以在学习的过程中,我们可以通过对照答案,来分析问题找出方法,下一次在面对没有答案的问题时,往往也可以正确地解决。 而无监督学习,是我们不知道任何的答案,也不知道自己做得对不对,但是做题的过程中,就算不知道答案,我们还是可以大致的将语文,数学,英语这些题目分开,因为这些问题内在还是具有一定的联系。

如下图所示,在无监督学习中,我们只是给定了一组数据,我们的目标是发现这组数据中的特殊结构。例如我们使用无监督学习算法会将这组数据分成两个不同的簇,,这样的算法就叫聚类算法。


无监督学习在生活中的一应用:

  1. Google新闻按照内容结构的不同分成财经,娱乐,体育等不同的标签,这就是无监督学习中的聚类。
  2. 根据给定基因把人群分类。如图是DNA数据,对于一组不同的人我们测量他们DNA中对于一个特定基因的表达程度。然后根据测量结果可以用聚类算法将他们分成不同的类型。这就是一种无监督学习, 因为我们只是给定了一些数据,而并不知道哪些是第一种类型的人,哪些是第二种类型的人等等。

监督学习和无监督学习对比总结相关推荐

  1. 无监督学习 k-means_无监督学习-第1部分

    无监督学习 k-means 有关深层学习的FAU讲义 (FAU LECTURE NOTES ON DEEP LEARNING) These are the lecture notes for FAU' ...

  2. 监督学习、无监督学习、半监督学习

    监督学习.无监督学习.半监督学习 监督学习.无监督学习.半监督学习 监督学习 无监督学习 半监督学习 监督学习.无监督学习.半监督学习 监督学习 特点:训练过程中样本都是有标签的. 训练集的每一个数据 ...

  3. 机器学习概念 — 监督学习、无监督学习、半监督学习、强化学习、欠拟合、过拟合、后向传播、损失和优化函数、计算图、正向传播、反向传播

    1. 监督学习和无监督学习 监督学习 ( Supervised Learning ) 和无监督学习 ( Unsupervised Learning ) 是在机器学习中经常被提及的两个重要的学习方法. ...

  4. 强化学习(Reinforcement Learning)是什么?强化学习(Reinforcement Learning)和常规的监督学习以及无监督学习有哪些不同?

    强化学习(Reinforcement Learning)是什么?强化学习(Reinforcement Learning)和常规的监督学习以及无监督学习有哪些不同? 目录

  5. 机器学习系列 1:监督学习和无监督学习

    https://www.toutiao.com/a6690813539747103246/ 2019-05-15 09:31:00 机器学习系列 1:监督学习和无监督学习 机器学习就是通过一大堆数据集 ...

  6. 监督学习和无监督学习

    自理解机器学习的概念时,没有深刻理解监督学习和无监督学习的区别,在网上查找了部分资料,现在总结如下: 总的来说,机器学习任务将根据训练样本是否有label,可以分为监督学习和无监督学习,这是最简单直接 ...

  7. 机器学习一 -- 什么是监督学习和无监督学习?

    机器学习中的监督学习和无监督学习 说在前面 最近的我一直在寻找实习机会,很多公司给了我第一次电话面试的机会,就没有下文了.不管是HR姐姐还是第一轮的电话面试,公司员工的态度和耐心都很值得点赞,我也非常 ...

  8. 聚类(序)——监督学习与无监督学习

    聚类系列: 聚类(序)----监督学习与无监督学习 聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类 Hierarchical Clusteri ...

  9. 小白都看得懂的监督学习与无监督学习

    hello~一晃就十一月啦!开始写简书也半个月啦!之前对机器学习中的监督学习与无监督学习,只是有个概念,前几天学习知识的时候,又遇到了,所以打算好好记录下来. 在理解监督学习和无监督学习之前,我们先来 ...

最新文章

  1. boost::log::formatting_ostream用法的测试程序
  2. .net使用SqlBulkCopy类操作DataTable批量插入数据库数据,然后分页查询坑
  3. 鸿蒙3部曲先看哪部,讨论雪鹰与鸿蒙三部曲的关系
  4. 计算思维c语言软件,C语言编程入门与计算思维
  5. Java - 安装jdk并设置环境变量
  6. 若依集成aj-captcha实现滑块验证码(单体版)
  7. 面试题——股票利益最大化
  8. 软考中级软件设计师备考经验分享
  9. excel填充序列_EXCEL如何填充字母序列
  10. 从传统文化中领悟贵金属白银现货走势分析方法
  11. python自动拨号_python adsl拨号
  12. 地理位置坐标标准以及转换
  13. 基于C++控制台(Windows平台)的一个吃豆人小游戏
  14. Android开源项目合集
  15. Android工具类 全国省市的Json文件
  16. 笔记本“电源已接通,未充电”的解决办法
  17. 做为零基础的我,是怎么成功转入云计算行业年入30万的?
  18. 【Prompting】ChatGPT Prompt Engineering开发指南(5)
  19. C#,21根火柴棍问题(21 Matchticks Problem)的算法与源代码
  20. 用AI人脸识别技术实现抖音特效

热门文章

  1. 40句话简读Messari万字研报
  2. Android MaterialButton的一些问题
  3. FT260学习笔记7-HID2IIC
  4. PHP 基于ThinkPHP实现每日签到及奖励功能
  5. 用深度学习算法预测未来股票走势
  6. Springboot——拦截器
  7. thinkphp 安装memcache 以及测试(windows764位下)
  8. windows server 2012 r2 打补丁时提示此更新不适用于您的计算机
  9. 计算机有哪些自主模式,计算机自主学习模式的初探
  10. SQL server 数字转字符串