随机森林的随机性体现和优缺点
随机森林的随机性体现和优缺点
- 1.随机性主要体现在两个方面:
- 2.优点
- 3.缺点:
1.随机性主要体现在两个方面:
- 训练每棵树时,从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的数据集进行训练(即bootstrap取样)
- 在每个节点,随机选取所有特征的一个子集,用来计算最佳分割方式。
2.优点
在当前的很多数据集上,相对其他算法有着很大的优势,表现良好
它能够处理很高维度(feature很多)的数据,并且不用做特征选择
PS:特征子集是随机选择的
在训练完后,它能够给出哪些feature比较重要
在创建随机森林的时候,对generlization error使用的是无偏估计,模型泛化能力强
训练速度快,容易做成并行化方法
PS:训练时树与树之间是相互独立的
在训练过程中,能够检测到feature间的互相影响
实现比较简单
对于不平衡的数据集来说,它可以平衡误差。
如果有很大一部分的特征遗失,仍可以维持准确度。
3.缺点:
随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟
对于有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的。
随机森林的随机性体现和优缺点相关推荐
- xgboost、随机森林和逻辑回归的优缺点
转载自https://www.nowcoder.com/ta/review-ml/review?query=&asc=true&order=&page=99 Xgboost: ...
- 12_信息熵,信息熵公式,信息增益,决策树、常见决策树使用的算法、决策树的流程、决策树API、决策树案例、随机森林、随机森林的构建过程、随机森林API、随机森林的优缺点、随机森林案例
1 信息熵 以下来自:https://www.zhihu.com/question/22178202/answer/161732605 1.2 信息熵的公式 先抛出信息熵公式如下: 1.2 信息熵 信 ...
- 随机森林调参 - python
文章目录 1.一般的模型调参原则 2.随机森林的随机性体现在哪几个方面? 2.1 数据集的随机选取 2.2 待选特征的随机选取 3.为什么使用随机森林? 4.随机森林的构建过程 5.随机森林优缺点总结 ...
- python 随机森林调参_Python机器学习实践:随机森林算法训练及调参-附代码
原标题:Python机器学习实践:随机森林算法训练及调参-附代码 文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 博客园 作者 | 战争热诚 ...
- 随机森林分类算法python代码_Python机器学习笔记:随机森林算法
随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...
- 随机森林算法训练及调参-附代码
随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...
- Python机器学习笔记——随机森林算法
随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...
- 随机森林(Random Forest)面试高频题
推荐一篇写的很好的博客:[Machine Learning & Algorithm] 随机森林(Random Forest). 一.随机森林算法的原理 随机森林算法是Bagging集成框架下的 ...
- Python机器学习实践:随机森林算法训练及调参-附代码
文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 博客园 作者 | 战争热诚 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法 ...
最新文章
- redis-sentinel 主从复制高可用
- 全国铁路查询系统_火车票查询时刻表 全国列车时刻表 火车时刻表查询系统使用说明...
- 基于应用日志的扫描器检测实践
- 《无边界触达——数字化时代的高等教育》白皮书,附下载地址
- 使命召唤16计算机内存不足,使命召唤16出现一个问题怎么解决
- MatLab的排序函数-sort
- Android的快速开发框架 afinal
- LeetCode算法,多多路上从左到右有N棵树(编号1~N),其中第i个颗树有和谐值Ai。 多多鸡认为,如果一段连续的树,它们的和谐值之和可以被M整除,那么这个区间整体看起来就是和谐的....
- 【Excel】Excel条件格式设置背景色
- Macbook外接windows键盘,设置快捷键
- 读书笔记—中国跑步指南
- 副业真没想你的这么容易做!
- Apache详解(一)Internet和HTTP协议
- python操作excel表格【自定义表格样式基础】
- 驼峰命名法和下划线命名法互转
- 《Microduino实战》——2.5 Microduino传感器系列
- Linux工作站usb口无反应,usb接口没反应怎么办 usb接口没反应解决方法
- 非自锁物理按键实现自锁功能控制的方法总结
- 彼岸夏花(一个爱与救赎的凄美故事)
- java中 引用传递_Java中的引用传递
热门文章
- c语言 截止频率6低通滤波器,C语言 低通滤波器带通滤波器高通滤波器.doc
- 企业即时沟通软件有哪些?要如何选择?
- Android 12.0 rom定制专栏系列解读
- 区块链革命 - 推荐序二 区块链已成为金融科技的底层技术
- FSC-COC供应链管理体系认证、认证培训标准、审核清单、认证公司
- OpenGL ES freeglut 下载和使用
- 学术圈的人是如何赚钱的?
- C# 调用xktComm 与西门子PLC通讯
- 计算机网络大作业——抓包和分析
- java计算机毕业设计自动评测系统源码+mysql数据库+系统+部署+lw文档