问题:

之前在lightgbm中使用了早停early_stopping参数,于是我也想在xgboost中使用类似的方法进行早停,从其他地方找到的代码大致都是这样写的:

from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 5}clf = XGBClassifier(**param)clf.fit(X_train, y_train, eval_set=[(x_val, y_val)], early_stopping_rounds=100)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)

此时出现了错误,错误为

WARNING: ../auc.cc:330: Dataset is empty, or contains only positive or negative samples.

(数据集为空,或仅包含正样本或负样本。)

可能的原因:

在处理分类问题时,错误地设置了类别数。例如,在处理二分类问题时,误将n_classs参数设置错误5.

原因二:类别极不均衡,导致划分之后的训练集中只有一个类别的样本

解决方法:将类别数修改正确即可

from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 2}clf = XGBClassifier(**param)clf.fit(X_train, y_train, eval_set=[(x_val, y_val)], early_stopping_rounds=100)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)

疑问:

发现即便错误地将n_classs参数设置为5,但是只要不使用early_stooping_rounds参数,就不会出现上方的错误,不知道为什么会这样。。

from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 5}clf = XGBClassifier(**param)clf.fit(X_train, y_train)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)

这样就不会报错。。

使用XGBClassifier出现Dataset is empty, or contains only positive or negative samples.错误相关推荐

  1. PaddlePaddle文本卷积实现情感分类和微博女友情绪监控AI

    本期文章我们将使用文本卷积和StackLSTM层来实现一个情感分类网络,这样你就可以拥有一个属于自己的情感监控AI啦,甚至通过微博的接口来监控你女朋友的情绪.而要实现这一切,你不需要别的什么东西,你只 ...

  2. PDF或图片文档内容识别、关系抽取

    需求 自动识别法院和公积金中心的文书(调解书.判决书.裁定书.通知书)扫描件(PDF或图片),获取特定结构的数据,自动对比.抽取结构如: ['标题','诉讼案号','执行案号','公积金',{'原告' ...

  3. 工程师程序员的自我修养 Episode.4 基于百度飞桨PaddlePaddle框架的女朋友情绪分析防被打消息推荐深度学习系统

    具体为什么想到这个题目呢...大概是我也想不出别的什么有趣的话题或者项目的工作了吧. 有一天,柏拉图问老师苏格拉底什么是爱情?老师就让他到理论麦田里去,摘一棵全麦田里最大最金黄的麦穗来,期间只能摘一次 ...

  4. 机器学习 阴性集的选择 —— drug-target interactions (DTIs)

    文章目录 前言 一.已存在的阴性集选择方法 1.未知的DTIs 2. wang et al.的两种策略 2.1 策略一 2.2 策略二 3. 基于guilt-by-association反向选择 4. ...

  5. DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations – CVPR 2016

    DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations – CVPR 2016 论文( ...

  6. 梯度方向直方图和物体检测Histogram of Oriented Gradients and Object Detection

    If you've been paying attention to my Twitter account lately, you've probably noticed one or twoteas ...

  7. [机器学习]XGBoost 和 LightGBM 参数对比与调参

    XGBoost 参数介绍 XGBoost的参数一共分为三类(完整参数请戳官方文档): 通用参数:宏观函数控制. Booster参数:控制每一步的booster(tree/regression).boo ...

  8. 计算机视觉论文-2021-06-15

    本专栏是计算机视觉方向论文收集积累,时间:2021年6月15日,来源:paper digest 欢迎关注原创公众号 [计算机视觉联盟],回复 [西瓜书手推笔记] 可获取我的机器学习纯手推笔记! 直达笔 ...

  9. 计算机视觉论文-2021-05-11

    本专栏是计算机视觉方向论文收集积累,时间:2021年5月11日,来源:paper digest 欢迎关注原创公众号 [计算机视觉联盟],回复 [西瓜书手推笔记] 可获取我的机器学习纯手推笔记! 直达笔 ...

最新文章

  1. NSBundle使用:获取文件路径
  2. c改java_Android NDK开发:C修改Java的属性
  3. Asterisk权威指南/第一章 一场电话革命
  4. python可视化报表制作教程_如何使用Python快速制作可视化报表
  5. 将long型转换为多少MB的方法
  6. GitHub 学习和使用
  7. css两列等高,多种方法实现div两列等高(收集整理)
  8. 透明与不透明物体共存
  9. 删除商品信息恢复的java_零基础学习java------35---------删除一个商品案例,删除多个商品,编辑(修改商品信息),校验用户名是否已经注册(ajax)...
  10. Word文档粘贴的表格中文字有淡灰色背景的去除方法
  11. 阿根廷世界杯夺冠,跨境卖家如何借势营销?
  12. Unity鼠标滚轴缩放大小
  13. 微信ipad协议稳定版826的底层逻辑
  14. 3-wireshark网络安全分析——ARP欺骗攻击
  15. excel打印时显示服务器脱机怎么办,打印机脱机怎么办 打印机总是脱机的解决方法教程[多图]...
  16. 【每周一文】Ad Click Prediction: a View from the Trenches(2013)
  17. LeetCode875 珂珂吃香蕉
  18. C# WebSocketSharp 框架的用法
  19. 在CorelDRAW中如何完成属性的复制
  20. linux qt如何获取权限,如何让Qt程序在运行时获取UAC权限

热门文章

  1. 移动端触摸事件(touchstart,touchend,touchmove)的使用!
  2. 间歇的转载(双剑的内涵)
  3. 深度优先搜索及其优化
  4. php 聚丙烯酰胺作用,聚丙烯酰胺的作用范围
  5. .net Entity Framework
  6. 神通数据库ShenTong7在CentOS7上的安装与MySQL迁移遇到的兼容性问题
  7. 什么是linux系统镜像,什么是镜像(Image)?
  8. 【蓝桥杯练习】妖梦拼木棒
  9. 聊聊车企与碳纤维的那些事儿
  10. 路漫漫其修远兮,吾将上下而求索---我的五年工作总结