最小二乘法的无偏估计
最小二乘法的无偏估计
目前我已知的最小二乘估计法有两种,第一种是基本的最小二乘法,对于白噪声,这类方法可以得到无偏估计。但对于有色噪声,这类方法只能得到有偏估计。为了解决这个问题,就导致了第二类最小二乘法的产生。这类改进算法可以在有色噪声下也能得到无偏估计。
- 噪声视为白噪声的最小二乘法
- 一般最小二乘法
- 加权最小二乘法
- 递推最小二乘法(RLS)
- 渐消记忆RLS法
- 噪声视为有色噪声的最小二乘法
- 广义最小二乘法(GLS)
- 增广最小二乘法(RELS)
- 多级最小二乘法(MSLS)
这篇主要介绍改进后的最小二乘法。 在进入正题之前,先简要阐述白噪声和有色噪声的区别:
- 白噪声:不同时刻的噪声是不相关的,自相关函数为脉冲函数;
- 有色噪声:不同时刻的噪声之间存在相关性。在工程实践中,往往是这类噪声。
1.广义最小二乘法(GLS)
1.1.系统模型
系统模型如下所示:
A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=ξ(k)C(q−1)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k), \varepsilon(k)=\frac{\xi(k)}{C(q^{-1})} \tag 1 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)(1)
上式中,ξ(k)\xi(k)ξ(k)为白噪声,ε(k)\varepsilon(k)ε(k)为有色噪声序列。三个多项式形式如下所示:
A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)\begin{aligned} A(q^{-1})=1+a_1q^{-1}+...+a_{n_a}q^{-{n_a}} \tag 2\\ B(q^{-1})=b_0+b_1q^{-1}+...+b_{n_b}q^{-{n_b}} \\ C(q^{-1})=1+c_1q^{-1}+...+c_{n_c}q^{-{n_c}} \end{aligned} A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)
设系统的输入为白噪声ξ(k)\xi(k)ξ(k),输出为有色噪声ε(k)\varepsilon(k)ε(k),这种线性系统通常称为形成滤波器,如式(1)。
把式(1)进行等效变换后,可以得到式(3):
A(q−1)C(q−1)y(k)=B(q−1)C(q−1)u(k)+ξ(k)(3)A(q^{-1})C(q^{-1})y(k)=B(q^{-1})C(q^{-1})u(k)+\xi(k) \tag 3 A(q−1)C(q−1)y(k)=B(q−1)C(q−1)u(k)+ξ(k)(3)
我们再把上式简化一下,令{yˉ(k)=C(q−1)y(k)uˉ(k)=C(q−1)u(k)\begin{cases} \bar{y}(k)=C(q^{-1})y(k) \\ \bar{u}(k)=C(q^{-1})u(k) \end{cases}{yˉ(k)=C(q−1)y(k)uˉ(k)=C(q−1)u(k),就可以得到式(4):
A(q−1)yˉ(k)=B(q−1)uˉ(k)+ξ(k)(4)A(q^{-1})\bar{y}(k)=B(q^{-1})\bar{u}(k)+\xi(k) \tag 4 A(q−1)yˉ(k)=B(q−1)uˉ(k)+ξ(k)(4)
此时的噪声ξ(k)\xi(k)ξ(k)已经是白噪声,可以直接使用LS法对系统参数进行无偏估计。
1.2.噪声模型
式(4)就是GLS的关键公式。但为了获得这个公式,我们必然先得到C(q−1)C(q^{-1})C(q−1),这就需要我们对噪声模型进行估计。
根据系统模型表达式(1),可以得到关于噪声的差分方程描述:
ε(k)=1C(q−1)ξ(k)⟹C(q−1)ε(k)=ξ(k)⟹ε(k)=−c1ε(k−1)−...cncε(k−nc)+ξ(k)\begin{aligned} \varepsilon(k)=\frac{1}{C(q^{-1})}\xi(k) &\Longrightarrow C(q^{-1})\varepsilon(k)=\xi(k) \\ &\Longrightarrow \varepsilon(k)=-c_1\varepsilon(k-1)-...c_{n_c}\varepsilon(k-n_c)+\xi(k) \end{aligned} ε(k)=C(q−1)1ξ(k)⟹C(q−1)ε(k)=ξ(k)⟹ε(k)=−c1ε(k−1)−...cncε(k−nc)+ξ(k)
由上式得到NNN个方程,将其写成矩阵形式如下:
ε=Ωf+ξ\varepsilon=\Omega f + \xi ε=Ωf+ξ
根据最小二乘法,我们可以得到C(q−1)C(q^{-1})C(q−1)的估计值fff:
f=(ΩTΩ)−1ΩTεf=(\Omega^T \Omega)^{-1}\Omega^T\varepsilon f=(ΩTΩ)−1ΩTε
但这里存在一个问题:我们无法对噪声进行直接测量。也就是说,我们无法得到Ω,ε\Omega,\varepsilonΩ,ε。
一种方法是对误差进行估计,用残差e(k)e(k)e(k)代替噪声ε(k)\varepsilon(k)ε(k):
e(k)=A^(q−1)y(k)−B^(q−1)u(k)(5)e(k)=\hat{A}(q^{-1})y(k)-\hat{B}(q^{-1})u(k) \tag 5 e(k)=A^(q−1)y(k)−B^(q−1)u(k)(5)
以上公式(3)、(4)、(5)就是推导GLS的主要公式了。
1.3.主要步骤
广义最小二乘法的基本思想:
- 先不考虑有色噪声,用一般LS法估计系统参数ai,bia_i,b_iai,bi,得到有偏估计a^i(1),b^i(1)\hat{a}^{(1)}_i,\hat{b}^{(1)}_ia^i(1),b^i(1);
- 再用有偏估计a^i(1),b^i(1)\hat{a}^{(1)}_i,\hat{b}^{(1)}_ia^i(1),b^i(1)去估计噪声模型cic_ici;
- 已知噪声模型后,根据等式(4)再去估计系统参数a^i(2),b^i(2)\hat{a}^{(2)}_i,\hat{b}^{(2)}_ia^i(2),b^i(2);
以上反复迭代后即可得到系统参数的无偏估计。
(1)用一般LS法得到系统参数的有偏估计
在GLS一开始,我们先不考虑噪声是白噪声还是有色噪声,直接当作白噪声用LS法进行估计,当然这次的估计值不会很准确,因为是一个有偏估计。但作为参数估计的初始值已经可以了,后面会再进行修正。
A(q−1)y(k)=B(q−1)u(k)+ε(k)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k) A(q−1)y(k)=B(q−1)u(k)+ε(k)
第一次参数估计的结果为
θ^(1)=(ΦTΦ)−1ΦTy\hat{\theta}^{(1)}=(\Phi^T\Phi)^{-1}\Phi^Ty θ^(1)=(ΦTΦ)−1ΦTy
(2)用估计值θ^\hat{\theta}θ^估计噪声模型参数fff
在已有系统参数估计值的情况下,通过式(5),就可以得到噪声ε(k)\varepsilon(k)ε(k)的估计值e(k)e(k)e(k)。根据NNN个等式(5),我们可以得到
- Ω\OmegaΩ:N×ncN \times n_cN×nc;
- eee:N×1N \times 1N×1;
然后使用LS法对噪声参数进行估计,结果为
f^(1)=(ΩTΩ)−1ΩTe\hat{f}^{(1)}=(\Omega^T \Omega)^{-1}\Omega^Te f^(1)=(ΩTΩ)−1ΩTe
(3)用噪声估计参数f^\hat{f}f^对系统估计参数θ^\hat{\theta}θ^进行修正
得到噪声模型后,我们就可以得到yˉ(k),uˉ(k)\bar{y}(k),\bar{u}(k)yˉ(k),uˉ(k),然后应用式(4),通过最小二乘法对系统参数进行修正:
θ^(2)=(ΦˉTΦˉ)−1ΦˉTyˉ(k)\hat{\theta}^{(2)}=(\bar{\Phi}^T\bar{\Phi})^{-1}\bar{\Phi}^T\bar{y}(k) θ^(2)=(ΦˉTΦˉ)−1ΦˉTyˉ(k)
最后,重复步骤(2)~(3),直到估计值θ^(i)\hat{\theta}^{(i)}θ^(i)收敛。
2.增广矩阵法(RELS)
2.1.系统模型与公式推导
考虑这样的一个系统(注意GLS和RELS的系统模型的差别):
A(q−1)y(k)=B(q−1)u(k)+C(q−1)ξ(k)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+C(q^{-1})\xi(k) \tag 1 A(q−1)y(k)=B(q−1)u(k)+C(q−1)ξ(k)(1)
上式中,ξ(k)\xi(k)ξ(k)是新息序列,具有白噪声特征。三个多项式形式如下所示:
A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)\begin{aligned} A(q^{-1})=1+a_1q^{-1}+...+a_{n_a}q^{-{n_a}} \tag 2\\ B(q^{-1})=b_0+b_1q^{-1}+...+b_{n_b}q^{-{n_b}} \\ C(q^{-1})=1+c_1q^{-1}+...+c_{n_c}q^{-{n_c}} \end{aligned} A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)
增广矩阵法的特点是把噪声模型参数也加入到了估计参数中,相当于扩充被估计参数的维数,然后再用最小二乘法同时估计系统参数和噪声参数。
θ=[a1...anab0...bnbc1...cnc]T\theta=\begin{bmatrix} a_1 & ... & a_{n_a} & b_0 & ... & b_{n_b} & c_1 & ... & c_{n_c} \end{bmatrix}^T θ=[a1...anab0...bnbc1...cnc]T
根据式(1),我们可以得到以下形式:
y(k)=ΨkTθ+ξ(k),k=n+1,...,n+N(3)y(k)= \Psi_k^T \theta + \xi(k), \; k=n+1,...,n+N \tag 3 y(k)=ΨkTθ+ξ(k),k=n+1,...,n+N(3)
Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ(k−1)...ξ(k−nc)]T\Psi_k = \begin{bmatrix} -y(k-1) & ... & -y(k-n_a) & u(k) & ... & u(k-n_b) & \xi(k-1) & ... & \xi(k-n_c) \end{bmatrix}^T Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ(k−1)...ξ(k−nc)]T
把上式扩展为NNN个方程,就是一个标准的最小二乘法形式。但与广义最小二乘法遇到的问题一样,我们无法直接测量噪声数据,因此需要对ξ(k)\xi(k)ξ(k)进行估计。 方法也与GLS一样,用残差e(k)e(k)e(k)来估计噪声ξ(k)\xi(k)ξ(k)。
Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ^(k−1)...ξ^(k−nc)]T\Psi_k = \begin{bmatrix} -y(k-1) & ... & -y(k-n_a) & u(k) & ... & u(k-n_b) & \hat{\xi}(k-1) & ... & \hat{\xi}(k-n_c) \end{bmatrix}^T Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ^(k−1)...ξ^(k−nc)]T
根据式(3),可以得到噪声的估计ξ^(k)\hat{\xi}(k)ξ^(k)表示为:
ξ^(k)=y(k)−ΨkTθ^(4)\hat{\xi}(k)=y(k)-\Psi_k^T \hat{\theta} \tag 4 ξ^(k)=y(k)−ΨkTθ^(4)
根据递推最小二乘法的方式,我们可以得到增广矩阵法的递推方程:
KN+1=PNΨ^N+1(1+Ψ^N+1TPNΨ^N+1)−1PN+1=PN−KN+1Ψ^N+1TPNθ^N+1=θ^N+KN+1(yN+1−Ψ^N+1Tθ^N)(5)\begin{aligned} K_{N+1}&=P_N \hat{\Psi}_{N+1}(1+\hat{\Psi}_{N+1}^TP_N\hat{\Psi}_{N+1})^{-1} \tag 5 \\ P_{N+1}&=P_N-K_{N+1}\hat{\Psi}_{N+1}^TP_N \\ \hat{\theta}_{N+1}&=\hat{\theta}_{N}+K_{N+1}(y_{N+1}-\hat{\Psi}_{N+1}^T \hat{\theta}_N) \end{aligned} KN+1PN+1θ^N+1=PNΨ^N+1(1+Ψ^N+1TPNΨ^N+1)−1=PN−KN+1Ψ^N+1TPN=θ^N+KN+1(yN+1−Ψ^N+1Tθ^N)(5)
3.GLS vs RELS
由上面可知,GLS和RELS对于有色噪声的处理方式是不同的,下式(1)与(2)分别是GLS和RELS对有色噪声的处理方法,ξ(k)\xi(k)ξ(k)为白噪声。
A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=1D(q−1)ξ(k)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k),\varepsilon(k)=\frac{1}{D(q^{-1})}\xi(k) \tag 1 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=D(q−1)1ξ(k)(1)
A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)(2)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k),\varepsilon(k)=C(q^{-1})\xi(k) \tag 2 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)(2)
虽然两者对噪声的表示形式不同,但这并不会影响最后的参数估计结果。 在进行参数辨识时,系统参数的估计值应该是一致的,区别在于对噪声模型的估计会不一样。
下面对一组数据分别用GLS、RELS进行参数辨识。
系统模型如下所示,参数真值为a1=−1.5,a2=0.7,b0=0,b1=1,b2=0.5a_1=-1.5,a_2=0.7,b_0=0,b_1=1,b_2=0.5a1=−1.5,a2=0.7,b0=0,b1=1,b2=0.5:
y(k)+a1y(k−1)+a2y(k−2)=b0u(k)+b1u(k−1)+b2u(k−2)+ε(k)y(k)+a_1y(k-1)+a_2y(k-2)=b_0u(k)+b_1u(k-1)+b_2u(k-2)+\varepsilon(k) y(k)+a1y(k−1)+a2y(k−2)=b0u(k)+b1u(k−1)+b2u(k−2)+ε(k)
ε(k)=ξ(k)+c1ξ(k−1)+c2ξ(k−2)\varepsilon(k)=\xi(k)+c_1\xi(k-1)+c_2\xi(k-2) ε(k)=ξ(k)+c1ξ(k−1)+c2ξ(k−2)
上式的噪声表示形式与RELS的表示形式相同,可以直接用RELS进行参数辨识。RELS的辨识结果为
θ^=[−1.50710.7006−0.03721.04100.4801]T,J=40.6337\hat{\theta}=\begin{bmatrix} -1.5071 & 0.7006 & -0.0372 & 1.0410 & 0.4801 \end{bmatrix}^T,J=40.6337 θ^=[−1.50710.7006−0.03721.04100.4801]T,J=40.6337
对于GLS,噪声ε(k)\varepsilon(k)ε(k)可以设为另外一种形式,即
ε(k)+f1ε(k−1)+f2ε(k−2)=ξ(k)⟹ε(k)=11+f1q−1+f2q−2ξ(k)\varepsilon(k)+f_1\varepsilon(k-1)+f_2\varepsilon(k-2)=\xi(k) \Longrightarrow \varepsilon(k)=\frac{1}{1+f_1q^{-1}+f_2q^{-2}}\xi(k) ε(k)+f1ε(k−1)+f2ε(k−2)=ξ(k)⟹ε(k)=1+f1q−1+f2q−21ξ(k)
GLS的辨识结果为
θ^=[−1.51700.7115−0.02201.04410.4572]T,J=40.7475\hat{\theta}=\begin{bmatrix} -1.5170 & 0.7115 & -0.0220 & 1.0441 & 0.4572 \end{bmatrix}^T,J=40.7475 θ^=[−1.51700.7115−0.02201.04410.4572]T,J=40.7475
由上可见,虽然两种方式对噪声的表示方式不同,但它们最终得到的系统参数的估计结果是相近,最终都收敛到了真实值。
最小二乘法的无偏估计相关推荐
- 【干货】郭朝晖:工业大数据的特征、方法与价值创造
嘉宾介绍: 郭朝晖,现为宝钢中央研究院首席研究员.教授级高工.分别于1990.1994.1997年在浙江大学应用数学.化学工程和自动化专业获得学士.硕士和博士学位.1997年加盟宝钢,2005年晋升教 ...
- 从统计看机器学习(二) 多重共线性的一些思考
从一个生活中的现象说起:我们在装机时,不会安装一款以上的解压软件,也不希望被莫名其妙地安装额外的管家.与此相反,我们会安装多款播放器.那么,这是为什么呢?当然,也可以思考这样一个问题,好评的软件那么多 ...
- 真题解析 | 2021国赛B题:乙醇偶合制备 C4 烯烃
1.准备工作 1.1 题目背景 C4 烯烃广泛应用于化工产品及医药的生产,乙醇是生产制备 C4 烯烃的原料. 在制备过程中,催化剂组合(即:Co 负载量.Co/SiO2 和 HAP 装料比.乙醇浓度 ...
- 加权最小二乘法的理解
文章目录 那什么什么是加权最小二乘法? 异方差的修正 在需要人为地改变观测量的权重的应用场合中,都会涉及到加权最小二乘法的应用. 那什么什么是加权最小二乘法? 加权最小二乘法的概念: 加权最小二乘是对 ...
- 从最小二乘法到卡尔曼滤波
© 作者 | 李承蒙 学校 | 桂林电子科技大学 研究方向 | 计算机视觉 本文旨在梳理总结学习到的一些知识.由于笔者水平有限,文中难免存在一些不严谨和错误之处,诚请各位批评指正. 最近看了一篇文章, ...
- 监督学习—最小二乘法
原文作者:马同学 原文地址:最小二乘法的本质是什么? 最小平方法是十九世纪统计学的主题曲.从许多方面来看,它之于统计学就相当于十八世纪的微积分之于数学. ---史蒂芬-史蒂格勒<The Hist ...
- 系统辨识(六):最小二乘法的修正算法
最小二乘法的修正算法主要包括: 广义最小二乘法(Generalized Least Squares Method,简称GLS) 辅助变量法(Instrumental Variable Method,简 ...
- 递归最小二乘法、增广最小二乘法、带遗忘因子的递归增广最小二乘法
一.递归最小二乘法 递推最小二乘法:当矩阵维数增加时,矩阵求逆运算计算量过大,而且不适合在线辨识.为了减少计算量,并且可以实时地辨识出动态系统的特性,可以将最小二乘法转换成参数递推的估计. 取前N组数 ...
- 统计学习方法——最小二乘法及其具体实现
1. 引言 最小二乘法作为线性拟合常用的一种方法,勒让德( A. M. Legendre)于1805年在其著作<计算慧星轨道的新方法>中提出的,被广泛应用于各种数据拟合的方法中.曾经在某软 ...
最新文章
- 台式电脑不拉网线上网_用“隐形网线”让台式机快速稳定上网?强迫症有救了...
- Spring Cloud Netflix Zuul中的速率限制
- tomcat报错: Error parsing HTTP request header
- 前端学习(1770):前端调试之如何参照站点的manifest
- Jsoup 数据修改
- python列表生成式内必须定义匿名函数_Python基础-----基础概念总结
- 八、spring生命周期之BeanPostProcessor
- 数据库备份的几种方法
- VMware 下安装centos7,无法进入图形化界面
- xp系统snmp安装包_一款纯净的PE系统
- Kepware助力数据中心对接楼宇自动化系统
- [读书笔录]解析卷积神经网络(魏秀参)——第一章
- 关于ACM竞赛的题型分析
- UA OPTI570 量子力学 角动量 公式与结论总结
- 连接共享打印机时,弹出无法安装打印机,打印处理器不存在!!
- 【FinE】债券久期和凸性
- WORD打印时显示错误,未定义标签?
- 怎么制作电脑动态壁纸 桌面高清动态图怎么做
- Android Studio下拉菜单
- html怎么给图片加鼠标滑过效果,jquery给图片添加鼠标经过时的边框效果