1. 机器学习简介

机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

2. 基本思想

K 折交叉验证:将数据 D 划分为 k 个大小相等的互斥子集;然后用其中的 k-1 个子集作为训练集,余下的那个子集作为测试集;这样就可以得到 k 组训练集/测试集,这样就可以进行 k 次训练和测试,最终返回的是这 k 个测试结果的平均值。
  留一法:k 折交叉验证的一种特例,每次取一个样本作为测试集,其余的样本组成的集合作为训练集,训练和测试的次数等于样本的个数。

3. 大数据环境下的机器学习现状

随着大数据时代各行业对数据分析需求的持续增加,通过机器学习高效地获取知识,已逐渐成为当今机器学习技术发展的主要推动力。大数据时代的机器学习更强调“学习本身是手段"机器学习成为一种支持和服务技术。如何基于机器学习对复杂多样的数据进行深层次的分析,更高效地利用信息成为当前大数据环境下机器学习研究的主要方向。所以,机器学习越来越朝着智能数据分析的方向发展,并已成为智能数据分析技术的一个重要源泉。另外,在大数据时代,随着数据产生速度的持续加快,数据的体量有了前所未有的增长,而需要分析的新的数据种类也在不断涌现,如文本的理解、文本情感的分析、图像的检索和理解、图形和网络数据的分析等。使得大数据机器学习和数据挖掘等智能计算技术在大数据智能化分析处理应用中具有极其重要的作用。

4. 总结

总结一下,机器学习最适合的应用场景是什么样的呢?首先是允许一定的错误,而且是那种不完全可控的错误;同时问题本身又复杂得难以直接总结出好的规则,那我们就可以考虑使用机器学习了。例如搜索和推荐这两个常见的问题,出错时并不会有啥大问题(推荐错了一个商品并不是啥大事),只要整体推荐的准确率能提高,那就很有意义。而这两个问题本身也比较复杂,数据量也够大,非常适合训练机器学习模型来解决,而不仅仅靠总结规则。而自动看病等一旦出错就会有严重后果的问题,机器学习的应用难度就大很多。而一些简单统计等写几个规则就搞定的事情,就完全不需要机器学习出马了。

参考文献

[1] 基于机器学习方法的智能机器人探究.万方.2019
[2] 陈海虹、黄彪、刘峰、陈文国.机器学习原理及应用.成都:电子科技大学出版社,2017:2-19
[3] 机器学习及其相关算法简介.万方.2019
[4] 大数据下的机器学习算法探讨.万方.2019
[5] 零基础理解机器学习的基本思想.知乎.欧阳.2018-11-01
[6] 机器学习理论基础-常用算法思想要点.博客园.泰初.2019-12-06

机器学习之道学习笔记相关推荐

  1. Python3《机器学习实战》学习笔记(八):支持向量机原理篇之手撕线性SVM

    原 Python3<机器学习实战>学习笔记(八):支持向量机原理篇之手撕线性SVM 置顶 2017年09月23日 17:50:18 阅读数:12644 转载请注明作者和出处: https: ...

  2. 《基于张量网络的机器学习入门》学习笔记7

    <基于张量网络的机器学习入门>学习笔记7 量子算法 什么是量子算法 三个经典量子算法 Grover算法 背景 基本原理 例题 量子算法 什么是量子算法 例如我们求解一个问题,一个111千克 ...

  3. 《基于张量网络的机器学习入门》学习笔记6

    <基于张量网络的机器学习入门>学习笔记6 密度算符(密度矩阵) 具体到坐标表象 在纯态上 在混合态上 纯态下的密度算符 混合态下的密度算符 密度算符的性质 量子力学性质的密度算符描述 第一 ...

  4. 《基于张量网络的机器学习入门》学习笔记5

    <基于张量网络的机器学习入门>学习笔记5 量子概率体系 事件 互斥事件 概率与测量 不相容属性对 相容属性对 量子概率与经典概率的区别 量子测量 量子概率体系 我们将经典的实数概率扩展到复 ...

  5. 《基于张量网络的机器学习入门》学习笔记4

    <基于张量网络的机器学习入门>学习笔记4 量子概率 将概率复数化 分布与向量的表示 事件与Hilbert空间 不兼容属性及其复数概率表示 为什么一定要复数概率 量子概率 将概率复数化 在经 ...

  6. 台湾大学林轩田机器学习技法课程学习笔记4 -- Soft-Margin Support Vector Machine

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了Kernel SVM.先将特征转换和计算内积这两个步骤合并起来,简化计算.提高计算速度,再用Dual SVM的求解方法来解决. ...

  7. 台湾大学林轩田机器学习技法课程学习笔记1 -- Linear Support Vector Machine

    红色石头的个人网站:redstonewill.com 关于台湾大学林轩田老师的<机器学习基石>课程,我们已经总结了16节课的笔记.这里附上基石第一节课的博客地址: 台湾大学林轩田机器学习基 ...

  8. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  9. 机器学习knn算法学习笔记使用sklearn库 ,莺尾花实例

    ** 机器学习knn算法学习笔记使用sklearn库 ,莺尾花实例. 具体knn算法是怎样的我这里就不再详细论述.在这里我注意总结我使用knn算法进行一个分类的分析 ** 分析过程 1.前期准备 引入 ...

最新文章

  1. java 读取excel_Java12POI操作Excel
  2. 新东家要哭了,雅虎终于承认上亿用户数据被盗
  3. 文巾解题 596. 超过5名学生的课
  4. 【Web安全】通过机器学习破解验证码图片
  5. 隆冬寒骨,风吹十一豪迈
  6. 从零开始学习python编程-从零开始学Python程序设计 PDF 完整影印版
  7. python RE表达式规则剩余规则
  8. 2014.12.03 页面控件
  9. HTML5微数据学习笔记
  10. ES中文分词器-ik分词器安装
  11. addr2line的使用
  12. YouTube技术架构
  13. 深度学习损失函数 分类损失回归损失
  14. 整一篇整一篇,python3实现自动重启路由器的上的花生壳(selenium)
  15. Learned Motion Matching-动作生成算法
  16. 谈谈医疗行业数据治理的四个关键阶段【后附医院数据治理案例】
  17. C#学习笔记----C#连接MySQL数据库
  18. 商业银行表内业务与表外业务
  19. Mac 安装 node.js 并进行配置
  20. 计算机网络学习相关的一些网站

热门文章

  1. 斐讯免费路由的内幕与真相:留后门劫持流量窃取用户隐私
  2. dao,dto,vo,pojo,bo
  3. 各种论文网站收集整理,巨大巨全
  4. 凹凸技术揭秘:618 大促解析
  5. 返回键退出程序与不退出程序应用
  6. 华科计算机专业考研专业课难度,我来谈谈我所经历的华中科技大学计算机考研复试...
  7. visualVm插件中心
  8. 值得一读的10本人工智能技术书籍!
  9. 开源矿工的备用矿池设计与实现
  10. 行测之图推题判断笔画数