使用XGBClassifier出现Dataset is empty, or contains only positive or negative samples.错误
问题:
之前在lightgbm中使用了早停early_stopping参数,于是我也想在xgboost中使用类似的方法进行早停,从其他地方找到的代码大致都是这样写的:
from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 5}clf = XGBClassifier(**param)clf.fit(X_train, y_train, eval_set=[(x_val, y_val)], early_stopping_rounds=100)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)
此时出现了错误,错误为
WARNING: ../auc.cc:330: Dataset is empty, or contains only positive or negative samples.
(数据集为空,或仅包含正样本或负样本。)
可能的原因:
在处理分类问题时,错误地设置了类别数。例如,在处理二分类问题时,误将n_classs参数设置错误5.
(原因二:类别极不均衡,导致划分之后的训练集中只有一个类别的样本)
解决方法:将类别数修改正确即可
from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 2}clf = XGBClassifier(**param)clf.fit(X_train, y_train, eval_set=[(x_val, y_val)], early_stopping_rounds=100)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)
疑问:
发现即便错误地将n_classs参数设置为5,但是只要不使用early_stooping_rounds参数,就不会出现上方的错误,不知道为什么会这样。。
from xgboost import XGBClassifierparam = {"objective": "multi:softmax","num_class": 5}clf = XGBClassifier(**param)clf.fit(X_train, y_train)preds = model.predict(X_val)acc = accuracy_score(y_val, preds)
这样就不会报错。。
使用XGBClassifier出现Dataset is empty, or contains only positive or negative samples.错误相关推荐
- PaddlePaddle文本卷积实现情感分类和微博女友情绪监控AI
本期文章我们将使用文本卷积和StackLSTM层来实现一个情感分类网络,这样你就可以拥有一个属于自己的情感监控AI啦,甚至通过微博的接口来监控你女朋友的情绪.而要实现这一切,你不需要别的什么东西,你只 ...
- PDF或图片文档内容识别、关系抽取
需求 自动识别法院和公积金中心的文书(调解书.判决书.裁定书.通知书)扫描件(PDF或图片),获取特定结构的数据,自动对比.抽取结构如: ['标题','诉讼案号','执行案号','公积金',{'原告' ...
- 工程师程序员的自我修养 Episode.4 基于百度飞桨PaddlePaddle框架的女朋友情绪分析防被打消息推荐深度学习系统
具体为什么想到这个题目呢...大概是我也想不出别的什么有趣的话题或者项目的工作了吧. 有一天,柏拉图问老师苏格拉底什么是爱情?老师就让他到理论麦田里去,摘一棵全麦田里最大最金黄的麦穗来,期间只能摘一次 ...
- 机器学习 阴性集的选择 —— drug-target interactions (DTIs)
文章目录 前言 一.已存在的阴性集选择方法 1.未知的DTIs 2. wang et al.的两种策略 2.1 策略一 2.2 策略二 3. 基于guilt-by-association反向选择 4. ...
- DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations – CVPR 2016
DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations – CVPR 2016 论文( ...
- 梯度方向直方图和物体检测Histogram of Oriented Gradients and Object Detection
If you've been paying attention to my Twitter account lately, you've probably noticed one or twoteas ...
- [机器学习]XGBoost 和 LightGBM 参数对比与调参
XGBoost 参数介绍 XGBoost的参数一共分为三类(完整参数请戳官方文档): 通用参数:宏观函数控制. Booster参数:控制每一步的booster(tree/regression).boo ...
- 计算机视觉论文-2021-06-15
本专栏是计算机视觉方向论文收集积累,时间:2021年6月15日,来源:paper digest 欢迎关注原创公众号 [计算机视觉联盟],回复 [西瓜书手推笔记] 可获取我的机器学习纯手推笔记! 直达笔 ...
- 计算机视觉论文-2021-05-11
本专栏是计算机视觉方向论文收集积累,时间:2021年5月11日,来源:paper digest 欢迎关注原创公众号 [计算机视觉联盟],回复 [西瓜书手推笔记] 可获取我的机器学习纯手推笔记! 直达笔 ...
最新文章
- NSBundle使用:获取文件路径
- c改java_Android NDK开发:C修改Java的属性
- Asterisk权威指南/第一章 一场电话革命
- python可视化报表制作教程_如何使用Python快速制作可视化报表
- 将long型转换为多少MB的方法
- GitHub 学习和使用
- css两列等高,多种方法实现div两列等高(收集整理)
- 透明与不透明物体共存
- 删除商品信息恢复的java_零基础学习java------35---------删除一个商品案例,删除多个商品,编辑(修改商品信息),校验用户名是否已经注册(ajax)...
- Word文档粘贴的表格中文字有淡灰色背景的去除方法
- 阿根廷世界杯夺冠,跨境卖家如何借势营销?
- Unity鼠标滚轴缩放大小
- 微信ipad协议稳定版826的底层逻辑
- 3-wireshark网络安全分析——ARP欺骗攻击
- excel打印时显示服务器脱机怎么办,打印机脱机怎么办 打印机总是脱机的解决方法教程[多图]...
- 【每周一文】Ad Click Prediction: a View from the Trenches(2013)
- LeetCode875 珂珂吃香蕉
- C# WebSocketSharp 框架的用法
- 在CorelDRAW中如何完成属性的复制
- linux qt如何获取权限,如何让Qt程序在运行时获取UAC权限
热门文章
- 移动端触摸事件(touchstart,touchend,touchmove)的使用!
- 间歇的转载(双剑的内涵)
- 深度优先搜索及其优化
- php 聚丙烯酰胺作用,聚丙烯酰胺的作用范围
- .net Entity Framework
- 神通数据库ShenTong7在CentOS7上的安装与MySQL迁移遇到的兼容性问题
- 什么是linux系统镜像,什么是镜像(Image)?
- 【蓝桥杯练习】妖梦拼木棒
- 聊聊车企与碳纤维的那些事儿
- 路漫漫其修远兮,吾将上下而求索---我的五年工作总结