1.通过sklearn.model_selection.KFold所提供的一个小例子来进行理解交叉验证及应用交叉验证

2.

from sklearn.model_selection import KFold
import numpy as npX = np.array(["a", "b", "c", "d", "e"])# print(X[0],X[1],X[2],X[3],X[4],X[5])# 设置其对折三次,这个变量至少为2
kf = KFold(n_splits=3)i = 1for train, test in kf.split(X):print(i,"训练集:",X[train]," 测试集:",X[test])i+=1

从输出可以看到,其每一次操作会从数组[a,b,c,d,e]中进行划分为两个集合,一个为训练集合,一个为测试集合,且进行三次折叠。得到这两个集合后,传入相关方法中进行训练和预测即可。

3.了解以上信息后,再看官方小例子便清晰了

import numpy as np
from sklearn.model_selection import KFold
X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([1, 2, 3, 4])
kf = KFold(n_splits=2)
kf.get_n_splits(X)print(kf)for train_index, test_index in kf.split(X):print("TRAIN:", train_index, "TEST:", test_index)X_train, X_test = X[train_index], X[test_index]y_train, y_test = y[train_index], y[test_index]

可以看到,训练集合测试集也被划分成成功了,且第一个训练集的数组下标为2和3,测试集的数组下标为0和1。之后通过划分到的下标,使用下标对应的数据来进行训练和预测即可。

交叉验证之KFold相关推荐

  1. 机器学习--K折交叉验证(K-fold cross validation)

    K 折交叉验证(K-flod cross validation) 当样本数据不充足时,为了选择更好的模型,可以采用交叉验证方法. 基本思想:把给定的数据进行划分,将划分得到的数据集组合为训练集与测试集 ...

  2. k折交叉验证(k-fold Cross-validation)

    一.基本概述               交叉验证是在机器学习建立模型和验证模型参数时常用的办法,一般被用于评估一个机器学习模型的表现.更多的情况下,我们也用交叉验证来进行模型选择(model sel ...

  3. k折交叉验证 k-fold cross-validation

    文章目录 k折交叉验证 k值的确定 实例 使用scikit-learn进行交叉验证 交叉验证是用来评估机器学习方法的有效性的统计学方法,可以使用有限的样本数量来评估模型对于验证集或测试集数据的效果. ...

  4. 深度盘点:详细介绍机器学习中的7种交叉验证方法!

    来源:机器学习社区 本文约3400字,建议阅读10分钟 本文与你分享7种最常用的交叉验证技术及其优缺点,提供了每种技术的代码片段. 在任何有监督机器学习项目的模型构建阶段,我们训练模型的目的是从标记的 ...

  5. 一文看懂 AI 训练集、验证集、测试集(附:分割方法+交叉验证)

    2019-12-20 20:01:00 数据在人工智能技术里是非常重要的!本篇文章将详细给大家介绍3种数据集:训练集.验证集.测试集. 同时还会介绍如何更合理的讲数据划分为3种数据集.最后给大家介绍一 ...

  6. 机器学习面试题集 - 详解四种交叉验证方法

    https://www.toutiao.com/a6701090733618627076/ 本文结构: 什么是交叉验证法? 为什么用交叉验证法? 主要有哪些方法?优缺点? 各方法应用举例? 什么是交叉 ...

  7. 【机器学习】深度盘点:详细介绍 Python 中的 7 种交叉验证方法!

    在任何有监督机器学习项目的模型构建阶段,我们训练模型的目的是从标记的示例中学习所有权重和偏差的最佳值. 如果我们使用相同的标记示例来测试我们的模型,那么这将是一个方法论错误,因为一个只会重复刚刚看到的 ...

  8. 【机器学习】图解机器学习中的 12 种交叉验证技术

    今天我给大家盘点下机器学习中所使用的交叉验证器都有哪些,用最直观的图解方式来帮助大家理解他们是如何工作的. 数据集说明 数据集来源于kaggle M5 Forecasting - Accuracy[1 ...

  9. 交叉验证python_交叉验证

    交叉验证python Cross validation may be any of various model validation techniques that are used to asses ...

最新文章

  1. 为什么尽量避免使用 CSS 表达式
  2. 微信sdk服务器支付文档,微信支付-普通下单开发者文档
  3. Java-IntelliJ IDEA【@Override is not allowed when implementing interface method 解决方法】
  4. 工作389-移动端控制
  5. 分布式架构中数据一致性常见的几个问题
  6. win7 ubuntu 双系统安装
  7. learning linux
  8. 日语输入法电脑版_攻略!教你如何用手机打日语
  9. F2FS 基础知识一
  10. STM32HAL库IIC驱动SH1108芯片OLED屏
  11. 一个基于ATMEGA128的直流电机抱死程序
  12. 腾达ap设置说明_腾达路由器怎么设置AP模式?
  13. 篮球队员5V5分组战力差最小
  14. Python GIS神器shapely 2.0新版本来了
  15. 编程之类的文案_精选50句文案,个个都是让你灵感喷涌的句子!
  16. 会计做什么副业好?分享几个适合会计的副业
  17. 局域网bs虚拟服务器怎么创建,搭建局域网地图服务器
  18. 安卓app单webview改为多webview加载网页
  19. win7 引导 ubuntu
  20. gif动图过大怎么处理?怎么压缩gif图片大小?

热门文章

  1. 2、将file1/file2/file3三个文件中内容合并到一个文件中命名为filetest.txt
  2. elasticsearch数据库搭建 linux版
  3. 必应搜索留痕外推霸屏
  4. cisco交换机常用命令
  5. 360公司董事长周鸿祎做客腾讯科技《新产品经理》系列访谈
  6. 区块链开发技术路线的思考(二)
  7. Java的Static关键字的作用
  8. mysql mha文档_mysql mha
  9. 苹果电脑 Macbook 装 Win7 双系统
  10. 开通CSDN博客的原因