关于sklearn.model_selected中的KFold.split的理解

作用:返回样本切分之后数据集的indices,即索引

返回:

train: ndarray。如果KFold设置shuffle参数是True,是混乱的。

test: ndarray。如果KFold设置shuffle参数是True/False,是按照顺序连续!!

示例

ab_range = np.array(range(0,100))*100

ab_rangey = np.array(range(0,100))/100.0

print(len(ab_range),len(ab_rangey))

array([ 0, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000,

1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100,

2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200,

3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300,

4400, 4500, 4600, 4700, 4800, 4900, 5000, 5100, 5200, 5300, 5400,

5500, 5600, 5700, 5800, 5900, 6000, 6100, 6200, 6300, 6400, 6500,

6600, 6700, 6800, 6900, 7000, 7100, 7200, 7300, 7400, 7500, 7600,

7700, 7800, 7900, 8000, 8100, 8200, 8300, 8400, 8500, 8600, 8700,

8800, 8900, 9000, 9100, 9200, 9300, 9400, 9500, 9600, 9700, 9800,

9900])

array([ 0. , 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08,

0.09, 0.1 , 0.11, 0.12, 0.13, 0.14, 0.15, 0.16, 0.17,

0.18, 0.19, 0.2 , 0.21, 0.22, 0.23, 0.24, 0.25, 0.26,

0.27, 0.28, 0.29, 0.3 , 0.31, 0.32, 0.33, 0.34, 0.35,

0.36, 0.37, 0.38, 0.39, 0.4 , 0.41, 0.42, 0.43, 0.44,

0.45, 0.46, 0.47, 0.48, 0.49, 0.5 , 0.51, 0.52, 0.53,

0.54, 0.55, 0.56, 0.57, 0.58, 0.59, 0.6 , 0.61, 0.62,

0.63, 0.64, 0.65, 0.66, 0.67, 0.68, 0.69, 0.7 , 0.71,

0.72, 0.73, 0.74, 0.75, 0.76, 0.77, 0.78, 0.79, 0.8 ,

0.81, 0.82, 0.83, 0.84, 0.85, 0.86, 0.87, 0.88, 0.89,

0.9 , 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99])

100 100

kf = KFold(5, random_state=123)

# 一、仅仅打印test(即代码中model)的indices

for i, model in kf.split(ab_range, ab_rangey):

print('*' * 10);

# print(i, len(i));

print(model, len(model));

print('*' * 10)

**********

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19] 20

**********

**********

[20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39] 20

**********

**********

[40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59] 20

**********

**********

[60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79] 20

**********

**********

[80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99] 20

**********

结果中test在5折切分中是从0-99按照顺序切分。

# 二、仅仅输出train数据集的indices

for i, model in kf.split(ab_range, ab_rangey):

print('*' * 10);

print(i, len(i));

# print(model, len(model));

print('*' * 10)

**********

[20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

95 96 97 98 99] 80

**********

**********

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 40 41 42 43 44

45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

95 96 97 98 99] 80

**********

**********

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 60 61 62 63 64 65 66 67 68 69

70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

95 96 97 98 99] 80

**********

**********

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49

50 51 52 53 54 55 56 57 58 59 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

95 96 97 98 99] 80

**********

**********

[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49

50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74

75 76 77 78 79] 80

**********

结果中train在5折切分中是从0-99中随机选出80个,对应顺序即是混乱的。

kfold_关于sklearn.model_selected中的KFold.split的理解相关推荐

  1. 关于sklearn.model_selected中的KFold.split的理解

    关于sklearn.model_selected中的KFold.split的理解 作用:返回样本切分之后数据集的indices,即索引 返回: train: ndarray.如果KFold设置shuf ...

  2. Python中的KFold与StratifiedKFold

    skearn做数据集的处理需要用到这两个比较重要的函数:KFold与StratifiedKFold,作用是在机器学习中进行交叉验证来使用. 这两个函数都是sklearn模块中的,在应用之前应该导入: ...

  3. ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解

    ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解 目录 sklearn库中的ShuffleSplit()函数和St ...

  4. kfold_机器学习gridsearchcv(网格搜索)和kfold validation(k折验证)

    网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法. 以决策树为例,当我们确定了要使用决策树算法的时候,为了能够更好地拟合和预测,我们需要调整它的参数.在决策树算法中,我们通常选择的参数是决 ...

  5. python svr回归_使用sklearn库中的SVR做回归分析

    sklearn中的回归有多种方法,广义线性回归集中在linear_model库下,例如普通线性回归.Lasso.岭回归等:另外还有其他非线性回归方法,例如核svm.集成方法.贝叶斯回归.K近邻回归.决 ...

  6. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  7. ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略

    ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略 目录 sklearn.metrics中常用的函数参数 con ...

  8. ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略

    ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...

  9. java 中以||作为split分隔符正确的写法

    java 中以||作为split分隔符正确的写法 今天项目中需要在后台处理前台传递过来的拼接字符串,一开始写成str.split("\||"),得不到正确的结果,通过百度查找发现 ...

最新文章

  1. 新手探索NLP(十二)——文本聚类
  2. dedecms织梦模板修改专题路径的方法
  3. springboot+vue的前后端分离与合并方案
  4. [漏洞检测]Proxpy Web Scan设计与实现(未完待续)
  5. 银河水滴打响步态识别商用第一枪!3大产品1.35亿订单,工业视觉平台免费开放...
  6. C++ STL min_element和max_element的使用方法
  7. 蓝桥集训之位运算和相关函数
  8. java park_我可以在纯Java中实现park / unpark方法吗?
  9. 如何利用c语言写九九乘法表
  10. LM算法求解最小二乘问题
  11. linux如何安装ut880驱动下载,ut880驱动
  12. OpenWrt路由器无线中继、桥接、信号放大、访客网络的实现方案
  13. 元宇宙构建基石:三维重建技术
  14. 用python制作正态分布图_使用python绘制3维正态分布图的方法
  15. 申请高德地图API【流程记录】
  16. 【游戏开发实战】Unity 2D游戏手指控制移动摄像机镜头和双指缩放镜头(愤怒的小鸟为例)
  17. Android 实现扫描二维码功能
  18. 21考研复习规划和北邮计算机考研介绍
  19. 这些程序员常用快捷键你了解吗?让你的双手在键盘上起舞
  20. shell 关闭电脑wifi_笔记本通过命令配置wifi win7系统

热门文章

  1. 《Java入门》计算油费:本题要求编写程序,根据输入顾客的加油量a,汽油品种b(90、93或97)和服务类型c(m - 自助,e - 协助),计算并输出应付款。
  2. 高分子PEG:DSPE PEG PDP,474922-24-2,磷脂PEG巯基吡啶,MW: 2000,试剂用途说明
  3. 注册表单校验 js java,JavaScript表单验证完美代码
  4. 倒计时,离开页面时停止,进入时恢复
  5. vmware虚拟机桥接模式连不上网的罕见原因
  6. React+ Dva + Atd入门知识(必读)——框架详解
  7. 网络安全通识全解|第14期 那些常见的网络安全“黑话”
  8. vue+elementui实现可编辑表格
  9. 密码学——RSA加密算法原理
  10. 鸿蒙990系统支持几g网络,华为P40真机曝光,麒麟990支持5G鸿蒙2.0即将到来?