sklearn.model_selection.StratifiedKFold

class sklearn.model_selection.StratifiedKFold(n_splits=5, *, shuffle=False, random_state=None)

StratifiedKFold是k-fold的变种,会返回Stratified(分层)的折叠;每个小集合中,各个类别的样例比例大致和完整数据集中相同。

参数:
n_splits:int, default=5 表示把数据划分成几等分
shuffle:bool, default=False 在每次划分时,是否进行洗牌

  • 当shuffle为True,random_state会影响索引的顺序,每次划分的结果会不一样
    random_stateint or RandomState instance, default=None :随机种子数`
>>> from sklearn.model_selection import StratifiedKFold>>> X = np.ones(10)
>>> y = [0, 0, 0, 0, 1, 1, 1, 1, 1, 1]
>>> skf = StratifiedKFold(n_splits=3)
>>> for train, test in skf.split(X, y):
...     print("%s  %s" % (train, test))
[2 3 6 7 8 9] [0 1 4 5]
[0 1 3 4 5 8 9] [2 6 7]
[0 1 2 4 5 6 7] [3 8 9]

参考:
sklearn中文文档:http://scikitlearn.com.cn/0.21.3/30/#31221-k
StratifiedKFold和KFold生成交叉验证数据集的区别:https://blog.csdn.net/MsSpark/article/details/84455402

sklearn.model_selection.StratifiedKFold相关推荐

  1. sklearn.model_selection的StratifiedKFold实例

    from sklearn.model_selection import StratifiedKFold X = np.array([[1, 2], [3, 4], [1, 2], [3, 4], [5 ...

  2. 【模型评估与选择】sklearn.model_selection.KFold

    1. 描述 KFold divides all the samples in k groups of samples, called folds (if k = n, this is equivale ...

  3. sklearn中sklearn.model_selection的应用与实践

    强大的sklearn库可以解决的问题: train_test_split返回切分的数据集train/test: train_test_split(*array,test_size=0.25,train ...

  4. sklearn.model_selection.train_test_split随机划分训练集和测试集

    1 函数用途 train_test_split()是交叉验证中常用的函数,功能是将数组或矩阵按比例随机划分为训练集和测试集,使用方法为: X_train,X_test, y_train, y_test ...

  5. 【模型评估与选择】sklearn.model_selection.train_test_split

    1. 描述 Split arrays or matrices into random train and test subsets 2. 语法 train_test_split(*arrays, ** ...

  6. 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}

    数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...

  7. TensorFlow 人脸识别实验 ImportError: No module named 'sklearn.model_selection'

    今天在运行TensorFlow 人脸识别 python项目时,报 ImportError: No module named 'sklearn.model_selection',当我使用pip inst ...

  8. python sklearn.model_selection.ShuffleSplit()函数的用法

    sklearn.model_selection.ShuffleSplit类用于将样本集合随机"打散"后划分为训练集.测试集

  9. 11_模型的选择与调优,交叉验证,超参数搜索-网格搜索sklearn.model_selection.GridSearchCV

    1.交叉验证 交叉验证:为了让被评估的模型更加准确可信. 交叉验证:将拿到的数据,分为训练和验证集.以下图为例:将数据分成5份,其中一份作为验证集.然后经过5次(组)的测试,每次都更换不同的验证集.即 ...

最新文章

  1. 【HDU/算法】最短路问题 杭电OJ 2544 (Dijkstra,Dijkstra+priority_queue,Floyd,Bellman_ford,SPFA)
  2. CentOS6 英文系统安装ibus
  3. python 教程 网盘-python教程网盘
  4. 30分钟全面解析-SQL事务+隔离级别+阻塞+死锁
  5. ssd内部是多个flash一起操作_一键自毁军工级SSD固态硬盘的技术亮点
  6. lock 线程 java_JAVA多线程-基础Lock Condition 并发集合
  7. iPhone未来怎么走?将融入脸部以及指纹辨识系统
  8. JavaScript入门基础知识总结
  9. 强烈推荐APP破解常用工具集合!
  10. 用css做一个3d相册
  11. 遭遇Trojan.PSW.ZhengTu,Trojan.PSW.OnlineGames,Trojan.PSW.ZhuXian.b等
  12. 【第005问 Unity中如何显示三角形中心法线?】
  13. 科技型中小企业申报时间?
  14. 短视频优质作者必备|配音神器分享|那些你刷视频时肯定听过的声音
  15. 网络技术| 说说计算机网络及IP地址 -- 网络基础 跳线制作 IP地址配置
  16. 群晖设置腾讯云ddns显示认证失败的两种解决办法【实测第二种成功了】
  17. nrm是什么?以及nrm的安装与命令
  18. S.M.A.R.T.
  19. C语言程序设计 使用结构体类型处理组合数据——用户自定义数据类型
  20. vs中/EHa、/EHs、/EHsc的区别

热门文章

  1. 酷狗繁星新人如何把握第一个月?酷狗繁星新人小白教学必读
  2. 2345王牌输入法及使用教程
  3. 请问大学毕业在招商银行广州分行工作怎么样
  4. jar包只可调用,无法直接启动使用?Nocas篇之. 配置中心实战(一)
  5. Rapid Object Detection using a Boosted Cascade of Simple Features
  6. 贝微微为什么学计算机,微微一笑为什么能倾城——成为贝微微你必须知道的五件事...
  7. SEO相关概念以及如何进行优化
  8. 词源学习法第二集---alarm
  9. 国产防盗版加密芯片安全性分析
  10. (2019) PHP Strom php 开发环境搭建 教程(详解)