机器学习关键步骤(二)

机器学习有四个关键步骤。

(1) 数据准备,理和准备待分析的数据。
(2) 算法选择,根据需求挑选算法为数据建立模型。
(3) 参数调优,优化模型结果。
(4) 模型评估,根据准确度评价模型选出最好的。

2算法选择

2 选择算法

如何选择算法,取决于任务类型。任务大致可以分为 3 大类,每一类对应一些算法,如表所示。
表各种算法及其对应的任务类型

2.1 无监督学习

任务目标:指出数据中隐藏的模式。

当希望找出数据集中隐藏的模式时,可以使用 k 均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法。之所以称之为无监督学习算法,是因为不知道要找的模式是什么,而是要依靠算法从数据集中发现模式。

以上表中的数据为例,可以应用无监督学习模型找出哪些商品是顾客经常搭配购买的,或者根据购买的商品对顾客进行分类、)。

通过间接手段,可以对无监督学习模型输出的结果进行验证,比如检查得到的顾客分类是否与我们熟悉的分类(如食草动物和食肉动物)相符合。

2.2 监督学习

任务目标:使用数据中的模式做预测。

当需要做预测时,就会用到回归分析、k 最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法。之所以称之为监督学习算法,是因为它们的预测都基于已有的模式。

以上表中的数据为例,监督学习模型可以根据“顾客类别”以及“是否买鱼”(二者皆为预测变量)来预测“水果购买量”。

通过输入非表中顾客的预测变量值(“顾客类别”和“是否买鱼”),并且对比预测结果和实际的“水果购买量”,可以直接评估监督学习模型的准确度。

像“水果购买量”这样的整型数值或连续数值的预测过程,实际上是在解决回归问题,如图a所示。二元值或分类值的预测过程,如预测是否会下雨,则是在解决分类问题,如图b 所示。尽管如此,大部分分类算法也可以生成连续的概率值,比如预测“降水概率是 75%”,这种预测精度更高。

回归会产生一条趋势线,而分类则会把数据点分组。请注意,这两项任务都可能出错:在回归过程中,某些数据点可能会远离趋势线;在分类过程中,某些数据点可能被错误地分组

2.3 强化学习

任务目标:使用数据中的模式做预测,并根据越来越多的反馈结果不断改进。

无监督学习模型和监督学习模型在部署之后便无法更改。不同于此,强化学习模型自身可以通过反馈结果不断改进。

暂且抛开上表中的动物顾客,举一个实际的例子:假设要比较两个在线广告的效果。首先,让这两个广告的投放频率一样,然后确定每个广告的点击人数。接着,利用强化学习模型把点击人数作为衡量广告受欢迎程度的指标,并根据这个指标提高受欢迎广告的投放频率。通过这样的迭代过程,模型不断得到改进,最终会让广告投放取得更好的效果。

2.4 注意事项

除了要了解算法适用的任务类型之外,还要了解它们在其他方面的不同,比如各种算法对不同数据类型的分析能力,以及结果的本质。

机器学习关键步骤(二)相关推荐

  1. 机器学习关键步骤(一)

    机器学习关键步骤(一) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...

  2. 机器学习关键步骤(四)

    机器学习关键步骤(四) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...

  3. ML之回归预测:机器学习中的各种Regression回归算法、关键步骤配图

    ML之回归预测:机器学习中的各种Regression回归算法.关键步骤配图 目录 机器学习中的各种回归算法 1.回归算法代码 2.各种回归算法 3.各种回归算法大PK 机器学习中的各种回归算法 1.回 ...

  4. 基于模板的通用代码生成器LKGenerator(二)-使用时的关键步骤,注意事项及实例

    通过本文,您将了解本代码生成器使用时的关键步骤,使用时的注意事项及实例. 本代码生成器的原理:提供一个可被jvm加载的class文件,然后通过java的注解和反射技术读取信息,通过本工具放入到Velo ...

  5. 机器学习关键的几门课程_互联网上每门机器学习课程,均按您的评论排名

    机器学习关键的几门课程 by David Venturi 大卫·文图里(David Venturi) 互联网上每门机器学习课程,均按您的评论排名 (Every single Machine Learn ...

  6. 谷歌VR/AR业务副总裁:Daydream是关键步骤,要解决设备摩擦问题

    [转] http://36kr.com/p/5076363.html 编者按:2017年谷歌 I/O 开发者大会开幕前,谷歌虚拟现实和增强现实副总裁 Clay Bavor 在 Medium 上分享了一 ...

  7. 经验分享:布线测试关键步骤有哪些 ?

    我们都知道在布线完成之后都免不了布线测试这一环节,但是常常会被忽略几个布线测试关键步骤.今天小编就来说说布线测试关键步骤有哪些. 布线测试关键步骤有哪些:通断测试是基础 通断测试是测试的基础,是对线路 ...

  8. ML之GB:GB算法相关论文、相关思路、关键步骤、代码实现、配图集合、案例应用之详细攻略

    ML之GB:GB算法相关论文.相关思路.关键步骤.代码实现.配图集合.案例应用之详细攻略 目录 GB算法相关文献.论文 GB算法关键步骤 GB算法代码实现 GB案例应用 1.GB用于回归 2.GB用于 ...

  9. EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略

    EL:集成学习(Ensemble Learning)的概念讲解.算法分类.问题应用.关键步骤.代码实现等相关配图详细攻略 目录 集成学习Ensemble Learning 1.集成学习中弱分类器选择 ...

最新文章

  1. 2021年2月反思与总结
  2. define() vs const 该如何选择?
  3. linux中自动挂载脚本,LIUNX一键自动挂载脚本,宝塔磁盘LIUNX一键分区磁盘 | 帮助信息-动天数据...
  4. 带弹簧的Hazelcast分布式执行
  5. 苹果x和xsmax有什么区别_苹果手机不卡的真相是什么,安卓和iOS有本质区别
  6. Java高并发编程详解系列-线程异常处理
  7. Golang channel 快速入门
  8. Python入门教程100天:Day09-面向对象进阶
  9. 2018 Multi-University Training Contest 2: 1007. Naive Operations
  10. JS Date.Format
  11. 怎么跳伞_和平精英跳伞怎么快速落地 和平精英跳伞技巧琵琶网
  12. 在nvidia AGX 边缘服务器安装kubeEdge
  13. PayPal完成对区块链公司的投资首秀
  14. CAPM模型的Python版详解
  15. Matlab 旋转坐标轴标记文本
  16. java常见编程练习hw二(中等难度)
  17. 程序员员为什么总是要加班呢?不加班会被开除吗?
  18. nuxt / ssr简介以及要不要使用服务端渲染(SSR)?
  19. streamsets问题总结
  20. Stanford机器学习---第六周.学习曲线、机器学习系统的设计

热门文章

  1. PaddleOCR在文字检测方面上存在问题
  2. 复习新托福iBT英文写作经验汇总
  3. 帮我用java写一个维吾尔语和汉语的翻译引擎
  4. html网页设计大学生作业成品——公益校园网站设计与实现(HTML+CSS+JavaScript)
  5. 【云原生】设备入云之FlexManager实际项目操作流程
  6. php生成 word,使用PHPWord生成word文档的方法详解
  7. scp 远程拷贝 被拒 ” Connection closed by remote host“
  8. WasmEdge Book 文档贡献翻译征招募|赢树莓派、开源贡献证书
  9. 两间三层小型别墅图片_两间三层中式别墅外观图片
  10. 游戏推广的原理,利用空间,产品的分类