Python 随机森林分类

1 声明

本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。

2 决策树分类简介

相关概念见下:

决策树的最大问题是树在训练集生成的过于茂密,导致过拟合(即在训练集上表现卓越但在测试集上效果很差)。这时随机森林就应运而生了。在随机森林里会有很多决策树,而每颗决策树只接收自举样本且每个节点仅围绕部分特征寻找最好的分割。随机决策树的森林最后通过投票的方式选出最后的预测分类。

注:自举样本是指从一个较大的样本中 "自举 "出来的较小样本。Bootstrap是一种重新取样的方法,即从一个原始样本中反复抽取大量相同大小的小样本,并进行替换。

随机森林分类里的几个参数:

max_features:每个节点选择的特征的最大数

boostrap:指定是否以自举采样

n_estimators: 指定决策树的个数

n_jobs:并行数量,等于-1是最大化计算资源

3 随机森林分类代码与注释示例

# 加载随机森林分类包
from sklearn.ensemble import RandomForestClassifier
from sklearn import datasets
# 加载数据与模型创建
iris = datasets.load_iris()
features = iris.data
target = iris.target
randomforest = RandomForestClassifier(random_state=0, n_jobs=-1)
# 训练模型
model = randomforest.fit(features, target)
# 预测分类
observation = [[ 5, 4, 3, 2]]
# Predict observation's class
print(model.predict(observation))

4 总结

Python 随机森林分类相关推荐

  1. python 随机森林分类 DecisionTreeClassifier 随机搜索优化参数 GridSearchCV

    @python 随机森林分类模型 随机优化参数 学习笔记 随机森林 1.随机森林模型 随机森林算法是基于决策树算法的Begging优化版本,通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策 ...

  2. 数学建模_随机森林分类模型详解Python代码

    数学建模_随机森林分类模型详解Python代码 随机森林需要调整的参数有: (1) 决策树的个数 (2) 特征属性的个数 (3) 递归次数(即决策树的深度)''' from numpy import ...

  3. python与算法社区_【Python算法】分类与预测——Python随机森林

    [Python算法]分类与预测--Python随机森林 1.随机森林定义 随机森林是一种多功能的机器学习算法,能够执行回归和分类的任务.同时,它也是一种数据降维手段,在处理缺失值.异常值以及其他数据探 ...

  4. 随机森林分类算法python代码_Python机器学习笔记:随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  5. Python实现GWO智能灰狼优化算法优化随机森林分类模型(RandomForestClassifier算法)项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjal ...

  6. Python 随机森林特征重要度

    Python 随机森林特征重要度 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理. 2 随机森林特征重要度简介 决策树的优点是通过树 ...

  7. GEE东拼西凑之随机森林分类

    这里记录一下使用landsat5做随机森林分类的代码,理一下思路.很多内容都是到处找教程东拼西凑的,十分感谢各位大佬. 导入研究区.制作标签 首先加载研究区边界,查看需要分类时间的原影像.在影像上添加 ...

  8. python随机森林 交叉验证_随机森林算法详解及Python实现

    一 简介 随机森林是一种比较有名的集成学习方法,属于集成学习算法中弱学习器之间不存在依赖的一部分,其因为这个优点可以并行化运行,因此随机森林在一些大赛中往往是首要选择的模型. 随机森立中随机是核心,通 ...

  9. 随机森林图像分类实战:随机森林分类聚类(Kmeans)降维后的数据、随机森林分类聚类(Kmeans)降维后的合成(append)数据

    随机森林图像分类实战:随机森林分类聚类(Kmeans)降维后的数据.随机森林分类聚类(Kmeans)降维后的合成(append)数据 目录

最新文章

  1. Spring框架入门
  2. Apache Kafka消息格式的演变(0.7.x~0.10.x)
  3. 1019 General Palindromic Number (20分)_18行代码AC
  4. halcon模板匹配干扰边缘消除办法(最硬核方式)
  5. HK-2000 数采仪系统说明之 7.HK7710 DTU 简单配置说明
  6. Atitit.印章文化 印章的起源历史与发展 v2 r99 .docx
  7. IE10、IE11 ASP.Net 网站无法写入Cookie 问题
  8. Linux下使用dd命令向U盘中写入ISO镜像
  9. FDDB人脸检测测评数据集介绍
  10. MAXON RE40直流有刷电机在Elmo SimplIQ cello系列驱动器的增益调节
  11. 分销商城业务逻辑设计_功能思维导图_OctShop
  12. 服务器的日常维护需要做什么?
  13. Ceres Solver:从入门到使用
  14. Swift 调用微信分享
  15. 主引导记录MBR详解
  16. SOEM-Ethercat源代码解析一(数据类型定义)
  17. 利用js实现抽奖小游戏
  18. 批量修改照片(图片)格式、批量旋转照片方向(图片)、批量命名照片(图片)
  19. QA特辑 | 看了这场直播,我找到了设备指纹“从不说谎”的原因
  20. miniPCIe标准

热门文章

  1. JavaScript实现k-Means算法(附完整源码)
  2. wxWidgets:拖放概述
  3. boost::mp11::mp_fill相关用法的测试程序
  4. boost::hana::fold_right用法的测试程序
  5. boost::hana::fix用法的测试程序
  6. Boost:自定义小矢量的测试程序
  7. Boost:使用/type <>语法测试功能对象
  8. ITK:详尽的优化器
  9. ITK:将itk :: Image转换为vtkImageData
  10. DCMTK:Telnet发起程序(ti)主程序