基本术语(告诉你西瓜书为什么叫西瓜书)
为什么这本《机器学习》,封面会有很多西瓜?
为什么要叫他西瓜书?
就因为封面是西瓜?
因为所有的这些个基本术语的理解和后续一些问题的解释以及比喻 ,周大大都是用西瓜来做比喻滴!!!
通俗易懂!恰到好处!
注意:下面只做我归纳的简单介绍,如有不全,可以去百度一哈!
收集关于西瓜的数据,例如(色泽=青绿;根蒂=蜷缩;敲声=浊响)等
记录的集合称为一个“数据集”(data set) 而西瓜称为一个“示例”(instance)或者“样本”(sample)
反映的对象的性质的。例如“色泽”,“根蒂”,“敲声”称为“属性”(attribute)或者“特征”(feature)
若预测的是离散值,此学习任务称为“分类”(classification)
若预测的是连续值,此学习任务称为“回归”(regression)
学得模型后,使用其进行预测的过程称为“测试”(testing)
被预测的样本称为“预测样本”(testing sample)
Fx: 学得f 后,对X进行测试,可得到其预测标记,即 y=f(X)
我们还可以对西瓜做“聚类”(clustering),即将训练集中西瓜分成若干组,每组称为一个“簇”(cluster),这些自动形成的簇可能对应潜在的概念划分,例如“浅色瓜”“深色瓜”等。
但是,“浅色瓜”,“本地瓜”这样的概念,在聚类学习中,都是事先不知道的,通常不拥有标记信息。
根据训练数据是否有标记信息,学习任务可分为以下两大类:“监督学习”(supervised learning)和“无监督学习”(unsupervised learning)
分类和回归是前者的代表,而聚类则是后者的代表。
机器学习使学得的模型适用于“新样本”,学得的模型适用于新样本的能力,称为“泛化”(generalization)能力。
通常假设样本空间中全体样本服从一个未知的“分布”(distribution)D,我们获得的每个样本都是独立地从这个分布上采样获得的,即“独立同分布”(independent and identically distributed).训练样本越多,得到关于D的信息越多,越可能通过学习获得强泛化能力的模型
以上只是基本的一些术语,如果能够理解当然是最好的咯!如果不能理解可以拿西瓜作为例子!下面我也会对上面的一些术语给出一些理解,让你们理解的更深刻一点!
首先机器学习也就是让一段代码数据结构,能够习得符合实际问题的规律,从而对将来可能发生的事情进行有限的预测!!
所以刚刚上面说的都是预测的分类,包括分类,回归,聚类等。
为什么要把这些个预测问题来分开来研究和分析呢?因为你预测的结果有离散和线性之分,导致不同的学习算法对不同问题的适应性不同,所以分开研究更容易在某一部分问题得出更好的结果。
至于监督学习和无监督学习:
打一个最简单的比喻,西瓜!!
我们的目的是为了能够用机器来代替我们的经验来判断一个西瓜到底是不是好瓜!
有两种办法,第一种就是告诉机器现有的瓜,让一个经验丰富的瓜农来帮你分好哪些是好瓜,哪些是坏瓜,让你根据特征来学习!这就是有人告诉你对错!就是受到教育!
第二种就是给你一堆瓜,啥的都不告诉你,你跟进你的观察和思考,自主将这些瓜分类,这一堆瓜有都是本地的,这一堆瓜都是深绿色的,然后根据调整,自己找到好瓜的那一堆!也就是放养!自学!
那监督和无监督哪个好呢?
需要针对具体问题,有的人服管教,需要人引导,就监督好。有的人自觉性高,喜欢自主,那就无监督好!西瓜也是如此,机器学习也是如此!
配个图,希望大家从不明真相的吃瓜群众,变成 emmmmmm 还是吃瓜群众吧!
基本术语(告诉你西瓜书为什么叫西瓜书)相关推荐
- 宝贝,来,满足你,二哥告诉你学 Java 应该买什么书?
(这次的标题是不是有点皮,对模仿好朋友 guide 哥的,我也要皮一皮) 高尔基说过,对吧?宝贝们,"书籍是人类进步的阶梯",不管学什么,买几本心仪的书读一读,帮助还是非常大的.尽 ...
- 我的书架——对一些书和如何买书的见解
(作者doggyzone是一位淡泊名利的大好人,估计不太愿意主动把这篇帖子转到CSDN来.我就越俎代庖了.) 近日在网上看了不少帖子,感到我们的计算机图书市场还真是发生了很大的变化.CSDN刚开坛的时 ...
- 小红书产品运营的书有哪些,爆款笔记的套路
随着小红书平台的规模逐渐扩大,已经不仅仅局限于单一的产业了,甚至于出现了多元化的一个现象.有关小红书运营的书的出版就是最好的证明.今天,就来和大家一起探讨一下小红书产品运营的书有哪些,爆款笔记的套路. ...
- 小红书笔记_小红书推广如何打造爆文笔记?
如果素人账号做出爆文,类似于下面的爆文笔记呢? 如果达人种草过程中,出爆文呢? 为了解决这两个问题,二师兄首先分析下现阶段小红书推广品牌方推广时遇到的几大困扰和如果做好爆文笔记. 1.笔记收录难,尤其 ...
- 中国谋略第一书:《素书》全文解析
中国谋略第一书:<素书>全文解析 <素书>以道家思想为宗旨,集儒.法.兵的思想发挥道的作用及功能,同时以道.德.仁.义.礼为立身治国的根本.揆度宇宙万物自然运化的理数,以此认识 ...
- 如何进行小红书推广?小红书平台适合推广什么产品?
小红书作为一个生活方式社区,其最大独特性就在于,大部分互联网社区更多是依靠线上的虚拟身份,而小红书用户发布的内容都来自于真实生活,一个分享用户必须具备丰富的生活和消费经验,才能有内容在小红书分享,继而 ...
- picACG本地缓存目录_饭团追书怎么返回目录 饭团追书和饭团探书区别
饭团追书应用程序是阅读小说的神奇工具.它旨在为用户提供免费的图书资源.凡客诚品追书app内容新颖,内容涵盖面广.合法书籍是免费阅读的.饭团追书应用程序有更多相关建议.你可以第一次更新连载小说,离线缓存 ...
- 尽信书则不如无书、尽信标准则不如无标准(也谈JM8.6代码中的手误)
看代码时,无意看到了JM8.6中的两个手误,虽然不影响程序,但还是揪出来看看长什么样. 在start_sequence的注释中,单词alternative写成了alterbative,这个很容易理解, ...
- 反编译简书app和小红书app滑动效果sticky粘性头布局的实现CoordinatorLayout+behavior
反编译简书app和小红书app滑动效果sticky粘性头布局的实现CoordinatorLayout+behavior 小红书效果: 简书效果: demo效果图: github地址:https://g ...
- 亚马逊 Amazon Kindle Book 代购 英文原版 正版书 图书 电 子 书-淘宝网
亚马逊 Amazon Kindle Book 代购 英文原版 正版书 图书 电 子 书-淘宝网 亚马逊 Amazon Kindle Book 代购 英文原版 正版书 图书 电 子 书
最新文章
- Spring EL运算符实例
- 终极JPA查询和技巧列表–第2部分
- javascript实用库_编写实用JavaScript的实用指南
- 如何主动触发时间选择器弹窗_请合理使用Alert弹窗
- 判断x是否为2的n次幂
- python发邮件详解_用Python3发送邮件详解
- 计算机会计学ufo报表,计算机会计学 第四章 报表子系统.pdf
- AppScan 的安装+激活以及+漏扫dvwa,生成安全报告
- guge图标——ps
- 48-Elasticsearch-2(DSL查询_搜索结果处理_RestClient查询文档)
- shell笔记(C语言中文网)
- 一到两年工作经验的看完这些面试轻松拿offer
- 01 电阻的简介及常见电路分析
- Duang~MySQLi 扩展库来袭
- Matter理论介绍-通用-1-03:桥接器-数据结构
- TP-LINK无线路由器WR340G+ 54M支持WDS - 东莞市泰讯电子科技有限公司
- 要传送的报文共 x ( bit )。从源点到终 点共经过 k 段链路,每段链路的传播时延为 d ( s ),数据率为 b ( bit / s )。在电路交换时电路的建立时间为 s ( s )。在分组交
- 广州签发全国首张微信身份证,AI成主要证明技术
- matlab写函数教程,【Matlab基础】 自定义函数
- Python求黑色星期五问题