开始的疑问是,如果考虑的问题是形如

的去噪问题,那么能用CV的方法来选择最优参数吗,假设取90%的数据作为训练集,在训练集上应该只能得到这90%的数据所对应的估计x,那要怎么得到测试集数据的估计?直觉是这样的模型是不能用CV选择参数的,但之前听说在图像恢复问题中是可以用GCV来选择参数的,所以一直对这个参数选择过程存在一些疑惑. 这次仔细看了下几篇文章,发现CV方法确实是不适用于上述问题的,但GCV貌似是可以的,不过仅从给出的公式来看并不能得到这个结论,所以GCV到底能不能用还得再仔细分析一下,以后有时间再看吧. 在图像恢复问题中,如果模糊算子H不是对角的,GCV和CV应该都是适用的.

普通交叉验证[1,2]:

考虑多元线性回归

 是响应变量, 已知, 是白噪声,考虑如下最小化问题:

则有  的估计

令  表示 是提出了第k 个数据后得到的估计结果,即

交叉验证的基本思想是,如果此时的 是一个好的参数,则  应该是 的一个好的估计,因此定义了如下的CV函数:

从而, 的最佳估计是  .

注意:如果X是对角矩阵,那么在剔除第k个元素后,是不能得到合理的 的,这个时候 是0,

所以最小化CV函数是得不到 的估计的. 特别地,如果X是单位矩阵,自然也不能用CV的方法来选择正则化参数。

广义交叉验证[2]

广义交叉验证是旋转不变的交叉验证(什么是旋转不变?)

仅从这个公式来看,GCV只是加权后的CV,不太明白为什么可以克服X是对角矩阵对CV的限制.

图像恢复问题中的正则化参数选择[3]

考虑图像模型

其中  是观测图像,是恢复图像,是已知的模糊矩阵, 是噪声. 图像恢复问题可以考虑求解下列最小化问题:

引入辅助变量u, 则利用变量分裂法可以将问题转化为:

从而,上述问题可以利用交替迭代来求解.

令 ,考虑下述问题中正则化参数的选择

,   注: v 是在计算u的过程中产生的(与我们关心的问题无关,所以没仔细看).

从而 的最佳估计是.

只看的表达式的话,如果H是单位矩阵应该也不行啊,奇奇怪怪.

  1. Allen, David M. The Relationship Between Variable Selection and Data Agumentation and a Method for Prediction. Technometrics, Vol. 16, No. 1 (February, 1974), pp. 125-127. https://doi.org/10.1080/00401706.1974.10489157
  2. Golub, G.H., Heath, M., Wahba, G.: Generalized cross-validation as a method for choosing a good ridge parameter. Technometrics 21(2), 215–223 (1979).  https://doi.org/10.1080/00401706.1979.10489751
  3. Haiyong Liao, Fang Li, and Michael K. Ng, Selection of regularization parameter in total variation image restoration, J. Opt. Soc. Am. A 26, 2311-2320 (2009). https://doi.org/10.1364/JOSAA.26.002311

【笔记】普通交叉验证 (CV) ,广义交叉验证(GCV),图像恢复正则化参数选择相关推荐

  1. ESL第七章 模型评估及选择 【期望】测试误差、模型偏差估计偏差、【平均】乐观、AIC、参数有效数、BIC、最小描述长度、VC/结构风险最小化、一标准误差准则/广义交叉验证、【留一】自助/.632估计

    目录 7.2 偏差.方差和模型复杂度 7.3 偏差-方差分解 7.3.1 例子:方差-偏差权衡 7.4 训练误差率的"乐观optimism" 7.5 样本内预测误差的估计.Cp和A ...

  2. R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数、交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能

    R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数.交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能 ...

  3. R语言构建xgboost模型:xgb.cv函数交叉验证确定模型的最优子树个数(可视化交叉验证对数损失函数与xgboost模型子树个数的关系)、交叉验证获取最优子树之后构建最优xgboost模型

    R语言构建xgboost模型:xgb.cv函数交叉验证确定模型的最优子树个数(可视化交叉验证对数损失函数与xgboost模型子树个数的关系).交叉验证获取最优子树之后构建最优xgboost模型 目录

  4. 文本分类 - 样本不平衡的解决思路与交叉验证CV的有效性

    现实情况中,很多机器学习训练集会遇到样本不均衡的情况,应对的方案也有很多种. 笔者把看到的一些内容进行简单罗列,此处还想分享的是交叉验证对不平衡数据训练极为重要. 文章目录 1 样本不平衡的解决思路 ...

  5. 【笔记】【机器学习基础】交叉验证

    (一)交叉验证 交叉验证(cross-validation)是一种评估泛化性能的统计学方法,它比单次划分训练集和测试集的方法更加稳定.全面.在交叉验证中,数据被多次划分,并且需要训练多个模型. 最常用 ...

  6. 广义交叉验证(GCV)

    广义交叉验证(Generalized Cross-Validation ,GCV) GCV=1N∑Nn=1[yn−f(Xn)]2[1−df/N]2=1NRSS[1−df/N]2GCV=1N∑n=1N[ ...

  7. 普通交叉验证(OCV)和广义交叉验证(GCV)

    普通交叉验证OCV OCV是由Allen(1974)在回归背景下提出的,之后Wahba和Wold(1975)在讨论 了确定多项式回归中多项式次数的背景,在光滑样条背景下提出OCV. Craven和Wa ...

  8. matlab gcv,广义交叉验证

    交叉验证,有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法.于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证. 一开始的子集被称为训练集.而其它的子集则被 ...

  9. 交叉验证方法汇总【附代码】(留一法、K折交叉验证、分层交叉验证、对抗验证、时间序列交叉验证)

    目录 交叉验证是什么? 留一验证(LOOCV,Leave one out cross validation ) LOOCC代码 验证集方法 验证集方法代码 K折交叉验证(k-fold cross va ...

最新文章

  1. 有 Bug 不会调试 ? 这篇文章很详细 !
  2. 纪念小柴昌俊 | 中微子天体物理学的诞生
  3. 百度集团副总裁吴甜:技术创新持续为产业发展注入新动能|MEET2022
  4. 图 深度优先遍历 广度优先遍历 非递归遍历 图解算法过程
  5. 如何使用simulink中的matlab function模块
  6. 批处理之字符串处理和数值计算
  7. Ubuntu下gcc多版本共存和版本切换
  8. spring容器_Spring容器文档阅读要点记录
  9. JZOJ_3928. 射击 (Standard IO)
  10. SBC在企业IP通信系统中的应用
  11. 计算机软考中级能评职称吗,软考中级是中级职称么?考此证后可以办理落户么?...
  12. 东南亚电商平台 | Shopee 虾皮 入驻流程全解析
  13. 静态时序分析—串扰延迟分析(Crosstalk Delay Analysis)
  14. 集度首台验证样车下线,智驾软件已跑通红绿灯识别等功能
  15. Ubuntu 16.04 可以ping通网络,但打开网页很慢
  16. DPDK 编译安装(meson ninja)
  17. 约瑟夫环(好人坏人)
  18. 计算机房在单位的作用,你们单位计算机房工作人员临时不在,单位人事部小陈,路过计算机房闻...
  19. c# 调用c++ lib静态库
  20. 关于Flash的一些随想(2021年)

热门文章

  1. 读书笔记-干法-得意时不忘形失意时不消沉
  2. c语言rand一个变量,c语言rand()
  3. 同志社交应用程序 Hornet 获得 800 万美元 A 轮融资,银泰资本领投
  4. uni-app 项目调试遇到的问题
  5. mysql 导入dmp_navicat如何导入dmp
  6. 【题目】灵能传输(贪婪算法,蓝桥杯)
  7. Keruskal 算法
  8. matlab光场成像,光场相机重聚焦原理③——Matlab光场工具包使用重聚焦及多视角效...
  9. k近邻算法_【白话机器学习】算法理论+实战之K近邻算法
  10. 来自一个程序员内心深处的心声