写在开始之前

一直感觉机器学习/图像处理/人工智能这些词很高端,但是始终没有真正下决心去跨入这些领域。直到前两个月,在进入科研所后感觉自己不能再做一个纯搬砖的码农,必须向学术方面发展,于是买了周志华的《机器学习》来入门。之前是零基础,以后学习的心得都会记录在博客上,算是监督自己吧!

《机器学习》阅读心得记录

一、绪论
机器学习是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。所研究的主要内容,是在计算机上通过数据中产生“模型”的算法,即“学习算法”。
1.1基本概念
进行学习之前,我们需要一批样本的集合(即数据集),每一个样本都包含着同样的属性。在属性张成的空间中,每个样本都可以用空间的一个点表示,因此可以称为一个特征向量。从数据集中学习到的模型都在一定程度上反映了数据的规律,因此可以称为“假设”。
我们需要获得样本的结果信息才能根据模型对未来进行预测。结果信息在这里称为“标记”,所有标记形成的空间称为“标记空间”或“输出空间”。
根据训练数据是否有标记信息,学习任务可以分成两类:“监督学习”和“无监督学习”。通俗的来讲就是有标准答案和没有标准答案的区别。分类和回归是监督学习的代表,而聚类是无监督学习的代表。
如果预测的结果是离散的,如“好”/“坏”,那么学习任务称为“分类”。如果预测的结果是连续的,那么学习任务称为“回归”。而聚类就是将样本根据一定规则分成若干组。
1.2假设空间
当样本的属性类别确定后,事实上所有假设组成的空间大小也确定了。从另外一个角度来看,学习过程可以看做是从所有假设组成的空间中进行穷举的过程,搜索的目标是与训练集匹配。
那么问题来了,如果存在多个假设与训练集匹配,但是应用到新样本的时候结果不一致,应该采用哪一个呢?这时算法本身必须要有一个“偏好”,对假设进行过滤,否则无法产生确定的学习结果。
在制定偏好方面,“奥卡姆剃刀”是一种一般性的基本原则,即“若有多个假设与观察一致,则选最简单的那个”。算法的偏好能否与问题相匹配,很大程度上直接决定了算法能否取得好的性能。
值得注意的是,数学上已经证明,如果假定所有潜在的问题出现的机会相同,那么所有学习算法的期望性能都是一样的。这就是NFL定理(No Free Launch)。所以离开具体的问题谈论什么算法更好是没有意义的,算法一定是针对具体问题的 。
1.3发展历程
机器学习是人工智能发展到一定阶段的产物。人工智能经历了逻辑推理时期、专家知识时期、机器学习时期。机器学习在早期被划分为:机械学习、示教学习、类比学习、归纳学习。机械学习相当于死记硬背,并没有进行真正的学习;示教学习即从指令中学习;类比学习即通过观察和发现学习;归纳学习即从样例中归纳出学习结果。目前大多数学习方式是归纳学习。
二十世纪八十年代,主要是符号主义学习,代表方法包括决策树和基于逻辑的学习。二十世纪九十年代,主要是基于神经网络的连接主义学习。连接主义学习是黑箱模型,在理论上不严谨,但是应用很成功。九十年代中期,主要是统计学习,代表技术是支持向量机(SVM)。但到了二十一世纪初,由于计算机算力、数据储量大幅提高,发源于连接主义的多层神经网络学习(深度学习)被广泛应用,取得了很好的效果。

《机器学习》阅读心得--一、绪论相关推荐

  1. DenseNet阅读心得体会

    ** DenseNet阅读心得体会 ** \qquad深度学习是机器学习的一个分支,它是伴随着计算机硬件技术的发展而兴起的.关于深度学习的起源可以追溯到1943年,心里学家麦卡洛克和数学逻辑学家皮兹发 ...

  2. java课程设计心得体会绪论

      java课程设计心得体会绪论[篇1] 在上学期的最后一周和本学期的第一周,我和同组的学员在学校机房进行了JAVA暑期实训,现在已经结束了. 回首上学期的java学习,重点还是在学习概念等一些常识性 ...

  3. 如何快速全面建立自己的大数据知识体系? 大数据 ETL 用户画像 机器学习 阅读232 作者经过研发多个大数据产品,将自己形成关于大数据知识体系的干货分享出来,希望给大家能够快速建立起大数据

    如何快速全面建立自己的大数据知识体系? 大数据 ETL 用户画像 机器学习 阅读232  作者经过研发多个大数据产品,将自己形成关于大数据知识体系的干货分享出来,希望给大家能够快速建立起大数据产品的体 ...

  4. libevent源码学习-----阅读心得

    框架设计思路 libevent使用统一事件源将所有问题都转化为event,比如将套接字/信号/描述符都在内部转化为event,由相应的io多路复用函数进行监控. 为了提供对超时event的支持,lib ...

  5. 《让大象飞》阅读心得

    该书作者是史蒂文·霍夫曼,硅谷重量级创业教父.天使投资人.演讲人,<福布斯>杂志排名第一的创业孵化器Founders Space创始人,人称 "霍夫曼船长".个人建议正 ...

  6. 假如给我三天光明阅读心得收获

    假如给我三天光明阅读心得收获(篇一) <假如给我三天光明>是我读过的最励志的一本书,没有之一.读完这本书,会让你整个人发生蜕变.这本书流露出的真情实感让人印象特别深刻,让你觉得你的命运和海 ...

  7. 《卓有成效的管理者》阅读心得

    物尽其用 人尽其才 --<卓有成效的管理者>阅读心得 12330227 计应2班 吕顺 读过潘老师推荐的彼得德鲁克的经典著作<卓有成效的管理者>,我深深地为其中的发人深省的管理 ...

  8. 协作通信关键技术(王辉)阅读心得

    协作通信关键技术(王辉)阅读心得 第五章 LTE/LTE-A系统CoMP关键技术 5.3 CoMP系统综述 5.3.1 CoMP场景 5.3.2 下行CoMP 第五章 LTE/LTE-A系统CoMP关 ...

  9. 【PaddlePaddle论文复现】LARGE SCALE GAN TRAINING FOR HIGH FIDELITY NATURAL IMAGE SYNTHESIS阅读心得

    [PaddlePaddle论文复现]LARGE SCALE GAN TRAINING FOR HIGH FIDELITY NATURAL IMAGE SYNTHESIS阅读心得 作者:Andrew B ...

最新文章

  1. .net采集网页方法大全(5种)
  2. mysql if exist坑
  3. Sql Server 清除日志的存储过程 Procedure of cleaning sql server's log
  4. Pod定义YAML文件详解
  5. Java中的参数传递 --Java
  6. OpenCASCADE绘制测试线束:几何命令之曲面创建
  7. 2.Nginx学习-The HTTP Core module
  8. 海量数据库的查询优化及分页算法方案(一)
  9. 网络抓包工具--网路岗
  10. 清华来了第二位菲尔兹奖得主,是丘成桐力荐的老朋友Caucher Birkar
  11. js ajax 访问java函数,将url分配给Java EE项目中的ajax(js)函数
  12. mac os android连接wifi密码,Mac使用小技巧:找回WiFi密码
  13. CodeForces Round #280 (Div.2)
  14. java中String类的用法
  15. 《51单片机应用开发从入门到精通》——2.10 变频报警实例
  16. 产品经理日常工作之PRD文档
  17. Python爬取城市二手房数据
  18. python 操作excel 表格
  19. 硬件测试的思考和改进:有道词典笔的高效测试探索
  20. AndroidTV语音搜索

热门文章

  1. 你应该放弃「To-Do List」,拥抱日程表
  2. 16年几个月汽车管理
  3. 幼子嘟嘟谈美国文化系列6 美国文化另一重要主线--体育(下)
  4. 数十亿数量级评论系统的SQL调优实战
  5. 谷歌创始人退位!印度籍 CEO “接管”美国科技圈?
  6. 手把手教你安装虚拟机(官网下载VMware)
  7. SpringMVC学习笔记——视频补充2
  8. SD卡分配卡相对地址 RCA
  9. 齐姐漫画:排序算法(二)
  10. 漫画讲解Advantage-Actor-Critic(A2C)