机器学习关键步骤(二)
机器学习关键步骤(二)
机器学习有四个关键步骤。
(1) 数据准备,理和准备待分析的数据。
(2) 算法选择,根据需求挑选算法为数据建立模型。
(3) 参数调优,优化模型结果。
(4) 模型评估,根据准确度评价模型选出最好的。
2算法选择
2 选择算法
如何选择算法,取决于任务类型。任务大致可以分为 3 大类,每一类对应一些算法,如表所示。
表各种算法及其对应的任务类型
2.1 无监督学习
任务目标:指出数据中隐藏的模式。
当希望找出数据集中隐藏的模式时,可以使用 k 均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法。之所以称之为无监督学习算法,是因为不知道要找的模式是什么,而是要依靠算法从数据集中发现模式。
以上表中的数据为例,可以应用无监督学习模型找出哪些商品是顾客经常搭配购买的,或者根据购买的商品对顾客进行分类、)。
通过间接手段,可以对无监督学习模型输出的结果进行验证,比如检查得到的顾客分类是否与我们熟悉的分类(如食草动物和食肉动物)相符合。
2.2 监督学习
任务目标:使用数据中的模式做预测。
当需要做预测时,就会用到回归分析、k 最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法。之所以称之为监督学习算法,是因为它们的预测都基于已有的模式。
以上表中的数据为例,监督学习模型可以根据“顾客类别”以及“是否买鱼”(二者皆为预测变量)来预测“水果购买量”。
通过输入非表中顾客的预测变量值(“顾客类别”和“是否买鱼”),并且对比预测结果和实际的“水果购买量”,可以直接评估监督学习模型的准确度。
像“水果购买量”这样的整型数值或连续数值的预测过程,实际上是在解决回归问题,如图a所示。二元值或分类值的预测过程,如预测是否会下雨,则是在解决分类问题,如图b 所示。尽管如此,大部分分类算法也可以生成连续的概率值,比如预测“降水概率是 75%”,这种预测精度更高。
回归会产生一条趋势线,而分类则会把数据点分组。请注意,这两项任务都可能出错:在回归过程中,某些数据点可能会远离趋势线;在分类过程中,某些数据点可能被错误地分组
2.3 强化学习
任务目标:使用数据中的模式做预测,并根据越来越多的反馈结果不断改进。
无监督学习模型和监督学习模型在部署之后便无法更改。不同于此,强化学习模型自身可以通过反馈结果不断改进。
暂且抛开上表中的动物顾客,举一个实际的例子:假设要比较两个在线广告的效果。首先,让这两个广告的投放频率一样,然后确定每个广告的点击人数。接着,利用强化学习模型把点击人数作为衡量广告受欢迎程度的指标,并根据这个指标提高受欢迎广告的投放频率。通过这样的迭代过程,模型不断得到改进,最终会让广告投放取得更好的效果。
2.4 注意事项
除了要了解算法适用的任务类型之外,还要了解它们在其他方面的不同,比如各种算法对不同数据类型的分析能力,以及结果的本质。
机器学习关键步骤(二)相关推荐
- 机器学习关键步骤(一)
机器学习关键步骤(一) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...
- 机器学习关键步骤(四)
机器学习关键步骤(四) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...
- ML之回归预测:机器学习中的各种Regression回归算法、关键步骤配图
ML之回归预测:机器学习中的各种Regression回归算法.关键步骤配图 目录 机器学习中的各种回归算法 1.回归算法代码 2.各种回归算法 3.各种回归算法大PK 机器学习中的各种回归算法 1.回 ...
- 基于模板的通用代码生成器LKGenerator(二)-使用时的关键步骤,注意事项及实例
通过本文,您将了解本代码生成器使用时的关键步骤,使用时的注意事项及实例. 本代码生成器的原理:提供一个可被jvm加载的class文件,然后通过java的注解和反射技术读取信息,通过本工具放入到Velo ...
- 机器学习关键的几门课程_互联网上每门机器学习课程,均按您的评论排名
机器学习关键的几门课程 by David Venturi 大卫·文图里(David Venturi) 互联网上每门机器学习课程,均按您的评论排名 (Every single Machine Learn ...
- 谷歌VR/AR业务副总裁:Daydream是关键步骤,要解决设备摩擦问题
[转] http://36kr.com/p/5076363.html 编者按:2017年谷歌 I/O 开发者大会开幕前,谷歌虚拟现实和增强现实副总裁 Clay Bavor 在 Medium 上分享了一 ...
- 经验分享:布线测试关键步骤有哪些 ?
我们都知道在布线完成之后都免不了布线测试这一环节,但是常常会被忽略几个布线测试关键步骤.今天小编就来说说布线测试关键步骤有哪些. 布线测试关键步骤有哪些:通断测试是基础 通断测试是测试的基础,是对线路 ...
- ML之GB:GB算法相关论文、相关思路、关键步骤、代码实现、配图集合、案例应用之详细攻略
ML之GB:GB算法相关论文.相关思路.关键步骤.代码实现.配图集合.案例应用之详细攻略 目录 GB算法相关文献.论文 GB算法关键步骤 GB算法代码实现 GB案例应用 1.GB用于回归 2.GB用于 ...
- EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略
EL:集成学习(Ensemble Learning)的概念讲解.算法分类.问题应用.关键步骤.代码实现等相关配图详细攻略 目录 集成学习Ensemble Learning 1.集成学习中弱分类器选择 ...
最新文章
- 2021年2月反思与总结
- define() vs const 该如何选择?
- linux中自动挂载脚本,LIUNX一键自动挂载脚本,宝塔磁盘LIUNX一键分区磁盘 | 帮助信息-动天数据...
- 带弹簧的Hazelcast分布式执行
- 苹果x和xsmax有什么区别_苹果手机不卡的真相是什么,安卓和iOS有本质区别
- Java高并发编程详解系列-线程异常处理
- Golang channel 快速入门
- Python入门教程100天:Day09-面向对象进阶
- 2018 Multi-University Training Contest 2: 1007. Naive Operations
- JS Date.Format
- 怎么跳伞_和平精英跳伞怎么快速落地 和平精英跳伞技巧琵琶网
- 在nvidia AGX 边缘服务器安装kubeEdge
- PayPal完成对区块链公司的投资首秀
- CAPM模型的Python版详解
- Matlab 旋转坐标轴标记文本
- java常见编程练习hw二(中等难度)
- 程序员员为什么总是要加班呢?不加班会被开除吗?
- nuxt / ssr简介以及要不要使用服务端渲染(SSR)?
- streamsets问题总结
- Stanford机器学习---第六周.学习曲线、机器学习系统的设计
热门文章
- PaddleOCR在文字检测方面上存在问题
- 复习新托福iBT英文写作经验汇总
- 帮我用java写一个维吾尔语和汉语的翻译引擎
- html网页设计大学生作业成品——公益校园网站设计与实现(HTML+CSS+JavaScript)
- 【云原生】设备入云之FlexManager实际项目操作流程
- php生成 word,使用PHPWord生成word文档的方法详解
- scp 远程拷贝 被拒 ” Connection closed by remote host“
- WasmEdge Book 文档贡献翻译征招募|赢树莓派、开源贡献证书
- 两间三层小型别墅图片_两间三层中式别墅外观图片
- 游戏推广的原理,利用空间,产品的分类