集成学习能够通过训练数据集产生多个学习模型,然后通过一定的结合策略生成强学习模型。

bagging 可以并行执行 每一棵树权重是一样的

  • 随机森林

Bagging是bootstrap aggregating的简写。先说一下bootstrap,bootstrap也称为自助法,它是一种有放回的抽样方法,目的为了得到统计量的分布以及置信区间。具体步骤如下

  • 采用重抽样方法(有放回抽样)从原始样本中抽取一定数量的样本
  • 根据抽出的样本计算想要得到的统计量T
  • 重复上述N次(一般大于1000),得到N个统计量T
  • 根据这N个统计量,即可计算出统计量的置信区间

boosting 串行执行的,后一棵树学习的是前一棵树模型的error

  • gbdt xgboost lightgbm

提升方法(Boosting)是一种可以用来减小监督学习中偏差的机器学习算法。主要也是学习一系列弱分类器,并将其组合为一个强分类器。Boosting中有代表性的是AdaBoost(Adaptive boosting)算法:刚开始训练时对每一个训练例赋相等的权重,然后用该算法对训练集训练t轮,每次训练后,对训练失败的训练例赋以较大的权重,也就是让学习算法在每次学习以后更注意学错的样本,从而得到多个预测函数。

stacking

  • gbdt+lr

  • xgboost+lr (做推荐的时候经常使用)

    • xgboost 做特征交叉

    • xgboost预测过程中使用到的特征组合+原始特征=》LR

Stacking方法是指训练一个模型用于组合其他各个模型。首先我们先训练多个不同的模型,然后把之前训练的各个模型的输出为输入来训练一个模型,以得到一个最终的输出。理论上,Stacking可以表示上面提到的两种Ensemble方法,只要我们采用合适的模型组合策略即可。但在实际中,我们通常使用logistic回归作为组合策略。

集成学习bagging, boosting, stacking相关推荐

  1. 机器学习--集成学习--Bagging,Boosting,Stacking

    在一些数据挖掘竞赛中,后期我们需要对多个模型进行融合以提高效果时,常常会用到Bagging,Boosting,Stacking等这几个框架算法.下面就来分别详细讲述这三个框架算法.这里我们只做原理上的 ...

  2. 集成学习——Bagging、Boosting、Stacking

    目录 偏差与方差 投票法 集成学习 Bagging Bootstraps Bagging Boosting 基本概念 Adaboost 前向分步算法 梯度提升树(GBDT) XGBoost Light ...

  3. 树模型系列之集成学习(Bagging、Boosting、Stacking)

    文章目录 树模型系列之集成学习(Bagging.Boosting.Stacking) bagging Boosting Stacking 偏差与方差 集成学习的偏差与方差 Bagging 的偏差与方差 ...

  4. 集成学习-Bagging和Boosting算法

    文章目录 集成学习 Bagging 随机森林 Bosting Adaboost GBDT XGBoost 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到网 ...

  5. 集成学习——BAGGING和随机森林

    集成学习--BAGGING和随机森林 集成学习--BAGGING和随机森林 1.什么是集成学习 2.怎样进行集成学习 3.Bagging方法 4.Bagging方法训练.预测过程 5.Bagging方 ...

  6. 集成学习之Boosting

    集成学习之Boosting 1.boosting集成原理 1.1 什么是boosting 随着学习的积累从弱到强 简而言之:每新加入一个弱学习器,整体能力就会得到提升 代表算法:Adaboost,GB ...

  7. R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型、并评估模型在测试集和训练集上的分类效果(accuray、F1、偏差Deviance):Bagging算法与随机森林对比

    R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型.并评估模型在测试集和训练集上的分类效果(accuray.F1.偏差Deviance):Bagging算法与随机森林对比 ...

  8. 机器学习 - [集成学习]Bagging算法的编程实现

    机器学习 - [集成学习] Bagging算法的编程实现 李俊才 的 CSDN 博客:https://blog.csdn.net/qq_28550263?spm=1001.2101.3001.5343 ...

  9. 集成学习(bagging/boosting/stacking)BERT,Adaboost

    文章目录 集成学习(ensemble learning) 1.bagging(装袋法) 2.boosting(提升法) 3.stacking(堆叠法) 集成学习(ensemble learning) ...

最新文章

  1. Drug Target Review | 超越表型:基于AI更好地了解疾病
  2. 凤凰城将很快迎来无人驾驶汽车
  3. Apache服务器配置技巧
  4. 逻辑回归阈值_逻辑回归or线性回归,傻傻分不清楚
  5. Sa身份登陆SQL SERVER失败的解决方案
  6. 常用SQL语句书写技巧-
  7. 贝叶斯网的R实现( Bayesian networks in R)bnlearn(3)
  8. python read_csv dtype_Pandas read_csv low_memory和dtype选项
  9. Python简单游戏代码
  10. 串口485接法图_RS232转换为RS485的接线方法最好有图
  11. Matlab图像、矩阵旋转、翻转函数 rot90、flipud、fliplr、imrotate、flipdim、flip详解
  12. 垂直门户网站与SEO
  13. Android Gradle plugin requires Java 11 to run. You are currently using Java 1.8
  14. 域名申请:一定要进行实名认证吗?
  15. echarts 的初始化
  16. screen基本操作
  17. 中国不是没有根服务器吗?《流浪地球2》的根服务器怎么在北京?
  18. iOS应用架构谈 网络层设计方案--RTNetworking
  19. GitLab完整搭建(版本6.3.1)
  20. C语言 队列(循环队列和链队初始化进出队等基本操作)

热门文章

  1. python求知讲堂-wms学习笔记
  2. PyQt5制作一个简单的登录界面
  3. mysql 删除大量数据库_大量删除数据库记录
  4. 西门子精智和精简面板区别_西门子精智面板6AV2124-0QC02-0AX1详细概述
  5. AMQ 虚拟topic
  6. 高仿膜拜单车安卓APP--Mobike 之Splash欢迎界面SplashActivity
  7. 移动支付系统贴牌,自由对接支付宝微信或者银行等
  8. cpa机考可以用计算机吗,盘点可以带进CPA考场的机型!不允许携带计算器可以这样解决!...
  9. 粒子群算法原理|python实现|参数调优
  10. 怎么在自己的电脑上录音,电脑录音的软件有哪些