【笔记】普通交叉验证 (CV) ,广义交叉验证(GCV),图像恢复正则化参数选择
开始的疑问是,如果考虑的问题是形如
的去噪问题,那么能用CV的方法来选择最优参数吗,假设取90%的数据作为训练集,在训练集上应该只能得到这90%的数据所对应的估计x,那要怎么得到测试集数据的估计?直觉是这样的模型是不能用CV选择参数的,但之前听说在图像恢复问题中是可以用GCV来选择参数的,所以一直对这个参数选择过程存在一些疑惑. 这次仔细看了下几篇文章,发现CV方法确实是不适用于上述问题的,但GCV貌似是可以的,不过仅从给出的公式来看并不能得到这个结论,所以GCV到底能不能用还得再仔细分析一下,以后有时间再看吧. 在图像恢复问题中,如果模糊算子H不是对角的,GCV和CV应该都是适用的.
普通交叉验证[1,2]:
考虑多元线性回归
是响应变量,
已知,
是白噪声,考虑如下最小化问题:
则有 的估计
令 表示 是提出了第k 个数据后得到的估计结果,即
交叉验证的基本思想是,如果此时的 是一个好的参数,则
应该是
的一个好的估计,因此定义了如下的CV函数:
从而, 的最佳估计是
.
注意:如果X是对角矩阵,那么在剔除第k个元素后,是不能得到合理的 的,这个时候
是0,
所以最小化CV函数是得不到 的估计的. 特别地,如果X是单位矩阵,自然也不能用CV的方法来选择正则化参数。
广义交叉验证[2]
广义交叉验证是旋转不变的交叉验证(什么是旋转不变?)
仅从这个公式来看,GCV只是加权后的CV,不太明白为什么可以克服X是对角矩阵对CV的限制.
图像恢复问题中的正则化参数选择[3]
考虑图像模型
其中 是观测图像,
是恢复图像,
是已知的模糊矩阵,
是噪声. 图像恢复问题可以考虑求解下列最小化问题:
引入辅助变量u, 则利用变量分裂法可以将问题转化为:
从而,上述问题可以利用交替迭代来求解.
令 ,考虑下述问题中正则化参数的选择
, 注: v 是在计算u的过程中产生的(与我们关心的问题无关,所以没仔细看).
有
从而 的最佳估计是
.
只看的表达式的话,如果H是单位矩阵应该也不行啊,奇奇怪怪.
- Allen, David M. The Relationship Between Variable Selection and Data Agumentation and a Method for Prediction. Technometrics, Vol. 16, No. 1 (February, 1974), pp. 125-127. https://doi.org/10.1080/00401706.1974.10489157
- Golub, G.H., Heath, M., Wahba, G.: Generalized cross-validation as a method for choosing a good ridge parameter. Technometrics 21(2), 215–223 (1979). https://doi.org/10.1080/00401706.1979.10489751
- Haiyong Liao, Fang Li, and Michael K. Ng, Selection of regularization parameter in total variation image restoration, J. Opt. Soc. Am. A 26, 2311-2320 (2009). https://doi.org/10.1364/JOSAA.26.002311
【笔记】普通交叉验证 (CV) ,广义交叉验证(GCV),图像恢复正则化参数选择相关推荐
- ESL第七章 模型评估及选择 【期望】测试误差、模型偏差估计偏差、【平均】乐观、AIC、参数有效数、BIC、最小描述长度、VC/结构风险最小化、一标准误差准则/广义交叉验证、【留一】自助/.632估计
目录 7.2 偏差.方差和模型复杂度 7.3 偏差-方差分解 7.3.1 例子:方差-偏差权衡 7.4 训练误差率的"乐观optimism" 7.5 样本内预测误差的估计.Cp和A ...
- R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数、交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能
R语言构建xgboost文本分类模型(bag of words):xgb.cv函数交叉验证确定xgboost模型的最优子树个数.交叉验证获取最优子树之后构建最优xgboost模型并评估模型文本分类效能 ...
- R语言构建xgboost模型:xgb.cv函数交叉验证确定模型的最优子树个数(可视化交叉验证对数损失函数与xgboost模型子树个数的关系)、交叉验证获取最优子树之后构建最优xgboost模型
R语言构建xgboost模型:xgb.cv函数交叉验证确定模型的最优子树个数(可视化交叉验证对数损失函数与xgboost模型子树个数的关系).交叉验证获取最优子树之后构建最优xgboost模型 目录
- 文本分类 - 样本不平衡的解决思路与交叉验证CV的有效性
现实情况中,很多机器学习训练集会遇到样本不均衡的情况,应对的方案也有很多种. 笔者把看到的一些内容进行简单罗列,此处还想分享的是交叉验证对不平衡数据训练极为重要. 文章目录 1 样本不平衡的解决思路 ...
- 【笔记】【机器学习基础】交叉验证
(一)交叉验证 交叉验证(cross-validation)是一种评估泛化性能的统计学方法,它比单次划分训练集和测试集的方法更加稳定.全面.在交叉验证中,数据被多次划分,并且需要训练多个模型. 最常用 ...
- 广义交叉验证(GCV)
广义交叉验证(Generalized Cross-Validation ,GCV) GCV=1N∑Nn=1[yn−f(Xn)]2[1−df/N]2=1NRSS[1−df/N]2GCV=1N∑n=1N[ ...
- 普通交叉验证(OCV)和广义交叉验证(GCV)
普通交叉验证OCV OCV是由Allen(1974)在回归背景下提出的,之后Wahba和Wold(1975)在讨论 了确定多项式回归中多项式次数的背景,在光滑样条背景下提出OCV. Craven和Wa ...
- matlab gcv,广义交叉验证
交叉验证,有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法.于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证. 一开始的子集被称为训练集.而其它的子集则被 ...
- 交叉验证方法汇总【附代码】(留一法、K折交叉验证、分层交叉验证、对抗验证、时间序列交叉验证)
目录 交叉验证是什么? 留一验证(LOOCV,Leave one out cross validation ) LOOCC代码 验证集方法 验证集方法代码 K折交叉验证(k-fold cross va ...
最新文章
- 有 Bug 不会调试 ? 这篇文章很详细 !
- 纪念小柴昌俊 | 中微子天体物理学的诞生
- 百度集团副总裁吴甜:技术创新持续为产业发展注入新动能|MEET2022
- 图 深度优先遍历 广度优先遍历 非递归遍历 图解算法过程
- 如何使用simulink中的matlab function模块
- 批处理之字符串处理和数值计算
- Ubuntu下gcc多版本共存和版本切换
- spring容器_Spring容器文档阅读要点记录
- JZOJ_3928. 射击 (Standard IO)
- SBC在企业IP通信系统中的应用
- 计算机软考中级能评职称吗,软考中级是中级职称么?考此证后可以办理落户么?...
- 东南亚电商平台 | Shopee 虾皮 入驻流程全解析
- 静态时序分析—串扰延迟分析(Crosstalk Delay Analysis)
- 集度首台验证样车下线,智驾软件已跑通红绿灯识别等功能
- Ubuntu 16.04 可以ping通网络,但打开网页很慢
- DPDK 编译安装(meson ninja)
- 约瑟夫环(好人坏人)
- 计算机房在单位的作用,你们单位计算机房工作人员临时不在,单位人事部小陈,路过计算机房闻...
- c# 调用c++ lib静态库
- 关于Flash的一些随想(2021年)
热门文章
- 读书笔记-干法-得意时不忘形失意时不消沉
- c语言rand一个变量,c语言rand()
- 同志社交应用程序 Hornet 获得 800 万美元 A 轮融资,银泰资本领投
- uni-app 项目调试遇到的问题
- mysql 导入dmp_navicat如何导入dmp
- 【题目】灵能传输(贪婪算法,蓝桥杯)
- Keruskal 算法
- matlab光场成像,光场相机重聚焦原理③——Matlab光场工具包使用重聚焦及多视角效...
- k近邻算法_【白话机器学习】算法理论+实战之K近邻算法
- 来自一个程序员内心深处的心声