================== 简介 ==================

机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。

机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。

================== 定义 ==================

机器学习有下面几种定义:

  • 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
  • 机器学习是对能通过经验自动改进的计算机算法的研究。
  • 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

一种经常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

================== 分类 ==================

机器学习可以分成下面几种类别:

  1. 监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。
  2. 监督学习和非监督学习的差别就是训练集目标是否人标注。他们都有训练集 且都有输入和输出
  3. 无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有生成对抗网络(GAN)、聚类。
  4. 半监督学习介于监督学习与无监督学习之间。
  5. 增强学习机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的。

================== 算法类别 ==================

机器学习算法有:

  • 构造间隔理论分布:

    • 聚类分析和模式识别 (cluster analysis and pattern recognition)
    • 人工神经网络(artificial neural networks)
    • 决策树(decision tree)
    • 感知器(perceptron)
    • 支持向量机(support vector machine)
    • 集成学习AdaBoost(ensemble learning AdaBoost)
    • 降维与度量学习(dimension deduction and distance metric learning)
    • 聚类(clustering)
    • 贝叶斯分类器(Bayesian classifier)
  • 构造条件概率:
    • 回归分析和统计分类(regression analysis and statistical classification)
    • 高斯过程回归(Gaussian process regression)
    • 线性判别分析(linear discriminant analysis)
    • 最近邻居法(nearest neighbor)
    • 径向基函数核(radiant basis function kernel)
  • 通过再生模型构造概率密度函数:
    • 最大期望算法(expectation maximization algorithm, i.e. EM algorithm)
    • 概率图模型:包括贝叶斯网和Markov随机场(probabilisitc graphical model: Bayesian networks and Markov random field)
    • 生成拓扑映射(Generative Topographic Mapping)
  • 近似推断技术:
    • 马尔可夫链(Markov chain)
    • 蒙特卡罗方法(Monte carlo method)
    • 变分法(varational method/calculus of variations)
  • 最优化:大多数以上方法,直接或者间接使用最优化算法。

================== Reference ==================

  • Bishop, C. M. (1995). 《模式识别神经网络》,牛津大学出版社. ISBN 0-19-853864-2.
  • Bishop, C. M. (2006). 《模式识别与机器学习》,Springer. ISBN 978-0-387-31073-2.
  • Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分类》(第2版), New York: Wiley. ISBN 0-471-05669-3.
  • MacKay, D. J. C. (2003). 《信息理论、推理和学习算法》,剑桥大学出版社. ISBN 0-521-64298-1
  • Mitchel.l, T. (1997). 《机器学习》, McGraw Hill. ISBN 0-07-042807-7
  • Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.

【机器学习】入门001相关推荐

  1. 机器学习入门学习笔记:(2.2)线性回归python程序实现

      上一篇博客中,推导了线性回归的公式,这次试着编程来实现它.(机器学习入门学习笔记:(2.1)线性回归理论推导 )   我们求解线性回归的思路有两个:一个是直接套用上一篇博客最后推导出来的公式:另一 ...

  2. 【转】 机器学习入门——浅谈神经网络

    [转] 机器学习入门--浅谈神经网络 本文转自:https://blog.csdn.net/bitjoy/article/details/50464989 先从回归(Regression)问题说起.我 ...

  3. 【经典】吴恩达——机器学习笔记001

    [经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...

  4. 《Web安全之机器学习入门》笔记:第十六章 16.7 识别异常操作

    本小节通过RNN识别异常操作. 1.数据集 def load_user_cmd_new(filename):cmd_list=[]dist=[]with open(filename) as f:i=0 ...

  5. python 非线性回归_机器学习入门之菜鸟之路——机器学习之非线性回归个人理解及python实现...

    本文主要向大家介绍了机器学习入门之菜鸟之路--机器学习之非线性回归个人理解及python实现,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助. 梯度下降:就是让数据顺着梯度最大的方向,也 ...

  6. 【机器学习入门】(13) 实战:心脏病预测,补充: ROC曲线、精确率--召回率曲线,附python完整代码和数据集

    各位同学好,经过前几章python机器学习的探索,想必大家对各种预测方法也有了一定的认识.今天我们来进行一次实战,心脏病病例预测,本文对一些基础方法就不进行详细解释,有疑问的同学可以看我前几篇机器学习 ...

  7. 【机器学习入门】(10) 特征工程:特征抽取,字典特征抽取、文本特征抽取,附完整python代码

    各位同学好,今天和大家介绍一下python机器学习中的特征工程.在将数据放入模型之前,需要对数据的一些特征进行特征抽取,方法有: (1) 字典特征抽取 DictVectorizer(),(2) 文本特 ...

  8. matlab 职坐标,机器学习入门之机器学习实战ByMatlab(四)二分K-means算法

    本文主要向大家介绍了机器学习入门之机器学习实战ByMatlab(四)二分K-means算法,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助.前面我们在是实现K-means算法的时候,提到 ...

  9. 十年公务员转行IT,自学AI三年,他淬炼出746页机器学习入门笔记

    整理 | Jane 编辑 | Just 出品 | AI科技大本营(ID:rgznai100) 近期,梁劲传来该笔记重大更新的消息.<机器学习--从入门到放弃>这本笔记的更新没有停止,在基于 ...

  10. 我的机器学习入门清单及路线!

    Datawhale干货 作者:桔了个仔,南洋理工大学,Datawhale成员 知乎:https://www.zhihu.com/people/huangzhe 这是我个人的机器学习入门清单及路线,所以 ...

最新文章

  1. 【Android】ADT中使用NDK编译已有的C++实现的库文件
  2. 浏览器html5/css3兼容性检测的javascript类库 - Modernizr简单介绍
  3. mysql innodb创建数据文件失败
  4. 四、Netty 实现心跳机制与断线重连
  5. python从数分到数编(part2)--随机数及数组
  6. 安装配置 radicale
  7. sync.Map 源码学习
  8. C语言printf控制光标位置和清空屏幕
  9. 转岗测试工作三年经验总结(前端开发转测试)
  10. 继续开源还是走向封闭?谷歌未来
  11. c#数据格式化之DataFormatString
  12. 彩扩机项目--NPN和PNP三极管作为开关管的区别
  13. 【vue+springboot】excel模板下载、导入功能实现
  14. HowToDoIt 开源框架爱好者组织发布第一份项目总结
  15. SQL Server数据分析面试题(202008)
  16. Error: Failed to load config “standard“ to extend from
  17. kaldi学习笔记-三音素训练2
  18. 优维科技携EASYOPS3.0亮相GOPS深圳站
  19. Android Espresso 测试框架探究
  20. ionic+vue+capacitor系列笔记--capacitor3.X和2.X+android自定义capacitor的JSbridge插件注册与使用(不同版本注册方式不同,返回值格式也不同,使用

热门文章

  1. WIN10实用小技巧——快速回到桌面
  2. win7 32位浏览器不能打开,64位浏览器正常的解决方法
  3. 蔡氏电路matlab,蔡氏电路matlab仿真报告.doc
  4. 【工具】动图展示 60+ 个前端常用插件库合集
  5. 阿里云CentOS7下mysql5.6安装问题总结
  6. 卷积神经网络图像分类的性能评估指标有哪些
  7. 北大最强扫地僧“韦东奕”爆红全网
  8. halcon_halcon图像处理基本运算
  9. 计算机视觉相关学习项目(上)——附MATLAB源代码
  10. 华为云硬盘备份(VBS)服务