随机森林的随机性体现和优缺点

  • 1.随机性主要体现在两个方面:
  • 2.优点
  • 3.缺点:

1.随机性主要体现在两个方面:

  • 训练每棵树时,从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的数据集进行训练(即bootstrap取样)
  • 在每个节点,随机选取所有特征的一个子集,用来计算最佳分割方式。

2.优点

  • 在当前的很多数据集上,相对其他算法有着很大的优势,表现良好

  • 它能够处理很高维度(feature很多)的数据,并且不用做特征选择

      PS:特征子集是随机选择的
    
  • 在训练完后,它能够给出哪些feature比较重要

  • 在创建随机森林的时候,对generlization error使用的是无偏估计,模型泛化能力强

  • 训练速度快,容易做成并行化方法

     PS:训练时树与树之间是相互独立的
    
  • 在训练过程中,能够检测到feature间的互相影响

  • 实现比较简单

  • 对于不平衡的数据集来说,它可以平衡误差。

  • 如果有很大一部分的特征遗失,仍可以维持准确度。

3.缺点:

  • 随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟

  • 对于有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的。

随机森林的随机性体现和优缺点相关推荐

  1. xgboost、随机森林和逻辑回归的优缺点

    转载自https://www.nowcoder.com/ta/review-ml/review?query=&asc=true&order=&page=99 Xgboost: ...

  2. 12_信息熵,信息熵公式,信息增益,决策树、常见决策树使用的算法、决策树的流程、决策树API、决策树案例、随机森林、随机森林的构建过程、随机森林API、随机森林的优缺点、随机森林案例

    1 信息熵 以下来自:https://www.zhihu.com/question/22178202/answer/161732605 1.2 信息熵的公式 先抛出信息熵公式如下: 1.2 信息熵 信 ...

  3. 随机森林调参 - python

    文章目录 1.一般的模型调参原则 2.随机森林的随机性体现在哪几个方面? 2.1 数据集的随机选取 2.2 待选特征的随机选取 3.为什么使用随机森林? 4.随机森林的构建过程 5.随机森林优缺点总结 ...

  4. python 随机森林调参_Python机器学习实践:随机森林算法训练及调参-附代码

    原标题:Python机器学习实践:随机森林算法训练及调参-附代码 文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 博客园 作者 | 战争热诚 ...

  5. 随机森林分类算法python代码_Python机器学习笔记:随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  6. 随机森林算法训练及调参-附代码

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  7. Python机器学习笔记——随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  8. 随机森林(Random Forest)面试高频题

    推荐一篇写的很好的博客:[Machine Learning & Algorithm] 随机森林(Random Forest). 一.随机森林算法的原理 随机森林算法是Bagging集成框架下的 ...

  9. Python机器学习实践:随机森林算法训练及调参-附代码

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 博客园 作者 | 战争热诚 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法 ...

最新文章

  1. redis-sentinel 主从复制高可用
  2. 全国铁路查询系统_火车票查询时刻表 全国列车时刻表 火车时刻表查询系统使用说明...
  3. 基于应用日志的扫描器检测实践
  4. 《无边界触达——数字化时代的高等教育》白皮书,附下载地址
  5. 使命召唤16计算机内存不足,使命召唤16出现一个问题怎么解决
  6. MatLab的排序函数-sort
  7. Android的快速开发框架 afinal
  8. LeetCode算法,多多路上从左到右有N棵树(编号1~N),其中第i个颗树有和谐值Ai。 多多鸡认为,如果一段连续的树,它们的和谐值之和可以被M整除,那么这个区间整体看起来就是和谐的....
  9. 【Excel】Excel条件格式设置背景色
  10. Macbook外接windows键盘,设置快捷键
  11. 读书笔记—中国跑步指南
  12. 副业真没想你的这么容易做!
  13. Apache详解(一)Internet和HTTP协议
  14. python操作excel表格【自定义表格样式基础】
  15. 驼峰命名法和下划线命名法互转
  16. 《Microduino实战》——2.5 Microduino传感器系列
  17. Linux工作站usb口无反应,usb接口没反应怎么办 usb接口没反应解决方法
  18. 非自锁物理按键实现自锁功能控制的方法总结
  19. 彼岸夏花(一个爱与救赎的凄美故事)
  20. java中 引用传递_Java中的引用传递

热门文章

  1. c语言 截止频率6低通滤波器,C语言 低通滤波器带通滤波器高通滤波器.doc
  2. 企业即时沟通软件有哪些?要如何选择?
  3. Android 12.0 rom定制专栏系列解读
  4. 区块链革命 - 推荐序二 区块链已成为金融科技的底层技术
  5. FSC-COC供应链管理体系认证、认证培训标准、审核清单、认证公司
  6. OpenGL ES freeglut 下载和使用
  7. 学术圈的人是如何赚钱的?
  8. C# 调用xktComm 与西门子PLC通讯
  9. 计算机网络大作业——抓包和分析
  10. java计算机毕业设计自动评测系统源码+mysql数据库+系统+部署+lw文档