最小二乘法的无偏估计

目前我已知的最小二乘估计法有两种,第一种是基本的最小二乘法,对于白噪声,这类方法可以得到无偏估计。但对于有色噪声,这类方法只能得到有偏估计。为了解决这个问题,就导致了第二类最小二乘法的产生。这类改进算法可以在有色噪声下也能得到无偏估计。

  1. 噪声视为白噪声的最小二乘法

    • 一般最小二乘法
    • 加权最小二乘法
    • 递推最小二乘法(RLS)
    • 渐消记忆RLS法
  2. 噪声视为有色噪声的最小二乘法
    • 广义最小二乘法(GLS)
    • 增广最小二乘法(RELS)
    • 多级最小二乘法(MSLS)

这篇主要介绍改进后的最小二乘法。 在进入正题之前,先简要阐述白噪声和有色噪声的区别:

  • 白噪声:不同时刻的噪声是不相关的,自相关函数为脉冲函数;
  • 有色噪声:不同时刻的噪声之间存在相关性。在工程实践中,往往是这类噪声。

1.广义最小二乘法(GLS)

1.1.系统模型

系统模型如下所示:
A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=ξ(k)C(q−1)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k), \varepsilon(k)=\frac{\xi(k)}{C(q^{-1})} \tag 1 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)​(1)
上式中,ξ(k)\xi(k)ξ(k)为白噪声,ε(k)\varepsilon(k)ε(k)为有色噪声序列。三个多项式形式如下所示:
A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)\begin{aligned} A(q^{-1})=1+a_1q^{-1}+...+a_{n_a}q^{-{n_a}} \tag 2\\ B(q^{-1})=b_0+b_1q^{-1}+...+b_{n_b}q^{-{n_b}} \\ C(q^{-1})=1+c_1q^{-1}+...+c_{n_c}q^{-{n_c}} \end{aligned} A(q−1)=1+a1​q−1+...+ana​​q−na​B(q−1)=b0​+b1​q−1+...+bnb​​q−nb​C(q−1)=1+c1​q−1+...+cnc​​q−nc​​(2)
设系统的输入为白噪声ξ(k)\xi(k)ξ(k),输出为有色噪声ε(k)\varepsilon(k)ε(k),这种线性系统通常称为形成滤波器,如式(1)。

把式(1)进行等效变换后,可以得到式(3):
A(q−1)C(q−1)y(k)=B(q−1)C(q−1)u(k)+ξ(k)(3)A(q^{-1})C(q^{-1})y(k)=B(q^{-1})C(q^{-1})u(k)+\xi(k) \tag 3 A(q−1)C(q−1)y(k)=B(q−1)C(q−1)u(k)+ξ(k)(3)
我们再把上式简化一下,令{yˉ(k)=C(q−1)y(k)uˉ(k)=C(q−1)u(k)\begin{cases} \bar{y}(k)=C(q^{-1})y(k) \\ \bar{u}(k)=C(q^{-1})u(k) \end{cases}{yˉ​(k)=C(q−1)y(k)uˉ(k)=C(q−1)u(k)​,就可以得到式(4):
A(q−1)yˉ(k)=B(q−1)uˉ(k)+ξ(k)(4)A(q^{-1})\bar{y}(k)=B(q^{-1})\bar{u}(k)+\xi(k) \tag 4 A(q−1)yˉ​(k)=B(q−1)uˉ(k)+ξ(k)(4)

此时的噪声ξ(k)\xi(k)ξ(k)已经是白噪声,可以直接使用LS法对系统参数进行无偏估计。

1.2.噪声模型

式(4)就是GLS的关键公式。但为了获得这个公式,我们必然先得到C(q−1)C(q^{-1})C(q−1),这就需要我们对噪声模型进行估计。

根据系统模型表达式(1),可以得到关于噪声的差分方程描述:
ε(k)=1C(q−1)ξ(k)⟹C(q−1)ε(k)=ξ(k)⟹ε(k)=−c1ε(k−1)−...cncε(k−nc)+ξ(k)\begin{aligned} \varepsilon(k)=\frac{1}{C(q^{-1})}\xi(k) &\Longrightarrow C(q^{-1})\varepsilon(k)=\xi(k) \\ &\Longrightarrow \varepsilon(k)=-c_1\varepsilon(k-1)-...c_{n_c}\varepsilon(k-n_c)+\xi(k) \end{aligned} ε(k)=C(q−1)1​ξ(k)​⟹C(q−1)ε(k)=ξ(k)⟹ε(k)=−c1​ε(k−1)−...cnc​​ε(k−nc​)+ξ(k)​
由上式得到NNN个方程,将其写成矩阵形式如下:
ε=Ωf+ξ\varepsilon=\Omega f + \xi ε=Ωf+ξ
根据最小二乘法,我们可以得到C(q−1)C(q^{-1})C(q−1)的估计值fff:
f=(ΩTΩ)−1ΩTεf=(\Omega^T \Omega)^{-1}\Omega^T\varepsilon f=(ΩTΩ)−1ΩTε
但这里存在一个问题:我们无法对噪声进行直接测量。也就是说,我们无法得到Ω,ε\Omega,\varepsilonΩ,ε。

一种方法是对误差进行估计,用残差e(k)e(k)e(k)代替噪声ε(k)\varepsilon(k)ε(k):
e(k)=A^(q−1)y(k)−B^(q−1)u(k)(5)e(k)=\hat{A}(q^{-1})y(k)-\hat{B}(q^{-1})u(k) \tag 5 e(k)=A^(q−1)y(k)−B^(q−1)u(k)(5)
以上公式(3)、(4)、(5)就是推导GLS的主要公式了。

1.3.主要步骤

广义最小二乘法的基本思想:

  • 先不考虑有色噪声,用一般LS法估计系统参数ai,bia_i,b_iai​,bi​,得到有偏估计a^i(1),b^i(1)\hat{a}^{(1)}_i,\hat{b}^{(1)}_ia^i(1)​,b^i(1)​;
  • 再用有偏估计a^i(1),b^i(1)\hat{a}^{(1)}_i,\hat{b}^{(1)}_ia^i(1)​,b^i(1)​去估计噪声模型cic_ici​;
  • 已知噪声模型后,根据等式(4)再去估计系统参数a^i(2),b^i(2)\hat{a}^{(2)}_i,\hat{b}^{(2)}_ia^i(2)​,b^i(2)​;

以上反复迭代后即可得到系统参数的无偏估计。

(1)用一般LS法得到系统参数的有偏估计

在GLS一开始,我们先不考虑噪声是白噪声还是有色噪声,直接当作白噪声用LS法进行估计,当然这次的估计值不会很准确,因为是一个有偏估计。但作为参数估计的初始值已经可以了,后面会再进行修正。
A(q−1)y(k)=B(q−1)u(k)+ε(k)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k) A(q−1)y(k)=B(q−1)u(k)+ε(k)
第一次参数估计的结果为
θ^(1)=(ΦTΦ)−1ΦTy\hat{\theta}^{(1)}=(\Phi^T\Phi)^{-1}\Phi^Ty θ^(1)=(ΦTΦ)−1ΦTy

(2)用估计值θ^\hat{\theta}θ^估计噪声模型参数fff

在已有系统参数估计值的情况下,通过式(5),就可以得到噪声ε(k)\varepsilon(k)ε(k)的估计值e(k)e(k)e(k)。根据NNN个等式(5),我们可以得到

  • Ω\OmegaΩ:N×ncN \times n_cN×nc​;
  • eee:N×1N \times 1N×1;

然后使用LS法对噪声参数进行估计,结果为
f^(1)=(ΩTΩ)−1ΩTe\hat{f}^{(1)}=(\Omega^T \Omega)^{-1}\Omega^Te f^​(1)=(ΩTΩ)−1ΩTe

(3)用噪声估计参数f^\hat{f}f^​对系统估计参数θ^\hat{\theta}θ^进行修正

得到噪声模型后,我们就可以得到yˉ(k),uˉ(k)\bar{y}(k),\bar{u}(k)yˉ​(k),uˉ(k),然后应用式(4),通过最小二乘法对系统参数进行修正:
θ^(2)=(ΦˉTΦˉ)−1ΦˉTyˉ(k)\hat{\theta}^{(2)}=(\bar{\Phi}^T\bar{\Phi})^{-1}\bar{\Phi}^T\bar{y}(k) θ^(2)=(ΦˉTΦˉ)−1ΦˉTyˉ​(k)
最后,重复步骤(2)~(3),直到估计值θ^(i)\hat{\theta}^{(i)}θ^(i)收敛。

2.增广矩阵法(RELS)

2.1.系统模型与公式推导

考虑这样的一个系统(注意GLS和RELS的系统模型的差别):
A(q−1)y(k)=B(q−1)u(k)+C(q−1)ξ(k)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+C(q^{-1})\xi(k) \tag 1 A(q−1)y(k)=B(q−1)u(k)+C(q−1)ξ(k)(1)
上式中,ξ(k)\xi(k)ξ(k)是新息序列,具有白噪声特征。三个多项式形式如下所示:
A(q−1)=1+a1q−1+...+anaq−naB(q−1)=b0+b1q−1+...+bnbq−nbC(q−1)=1+c1q−1+...+cncq−nc(2)\begin{aligned} A(q^{-1})=1+a_1q^{-1}+...+a_{n_a}q^{-{n_a}} \tag 2\\ B(q^{-1})=b_0+b_1q^{-1}+...+b_{n_b}q^{-{n_b}} \\ C(q^{-1})=1+c_1q^{-1}+...+c_{n_c}q^{-{n_c}} \end{aligned} A(q−1)=1+a1​q−1+...+ana​​q−na​B(q−1)=b0​+b1​q−1+...+bnb​​q−nb​C(q−1)=1+c1​q−1+...+cnc​​q−nc​​(2)
增广矩阵法的特点是把噪声模型参数也加入到了估计参数中,相当于扩充被估计参数的维数,然后再用最小二乘法同时估计系统参数和噪声参数。
θ=[a1...anab0...bnbc1...cnc]T\theta=\begin{bmatrix} a_1 & ... & a_{n_a} & b_0 & ... & b_{n_b} & c_1 & ... & c_{n_c} \end{bmatrix}^T θ=[a1​​...​ana​​​b0​​...​bnb​​​c1​​...​cnc​​​]T
根据式(1),我们可以得到以下形式:
y(k)=ΨkTθ+ξ(k),k=n+1,...,n+N(3)y(k)= \Psi_k^T \theta + \xi(k), \; k=n+1,...,n+N \tag 3 y(k)=ΨkT​θ+ξ(k),k=n+1,...,n+N(3)

Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ(k−1)...ξ(k−nc)]T\Psi_k = \begin{bmatrix} -y(k-1) & ... & -y(k-n_a) & u(k) & ... & u(k-n_b) & \xi(k-1) & ... & \xi(k-n_c) \end{bmatrix}^T Ψk​=[−y(k−1)​...​−y(k−na​)​u(k)​...​u(k−nb​)​ξ(k−1)​...​ξ(k−nc​)​]T

把上式扩展为NNN个方程,就是一个标准的最小二乘法形式。但与广义最小二乘法遇到的问题一样,我们无法直接测量噪声数据,因此需要对ξ(k)\xi(k)ξ(k)进行估计。 方法也与GLS一样,用残差e(k)e(k)e(k)来估计噪声ξ(k)\xi(k)ξ(k)。
Ψk=[−y(k−1)...−y(k−na)u(k)...u(k−nb)ξ^(k−1)...ξ^(k−nc)]T\Psi_k = \begin{bmatrix} -y(k-1) & ... & -y(k-n_a) & u(k) & ... & u(k-n_b) & \hat{\xi}(k-1) & ... & \hat{\xi}(k-n_c) \end{bmatrix}^T Ψk​=[−y(k−1)​...​−y(k−na​)​u(k)​...​u(k−nb​)​ξ^​(k−1)​...​ξ^​(k−nc​)​]T
根据式(3),可以得到噪声的估计ξ^(k)\hat{\xi}(k)ξ^​(k)表示为:
ξ^(k)=y(k)−ΨkTθ^(4)\hat{\xi}(k)=y(k)-\Psi_k^T \hat{\theta} \tag 4 ξ^​(k)=y(k)−ΨkT​θ^(4)
根据递推最小二乘法的方式,我们可以得到增广矩阵法的递推方程:
KN+1=PNΨ^N+1(1+Ψ^N+1TPNΨ^N+1)−1PN+1=PN−KN+1Ψ^N+1TPNθ^N+1=θ^N+KN+1(yN+1−Ψ^N+1Tθ^N)(5)\begin{aligned} K_{N+1}&=P_N \hat{\Psi}_{N+1}(1+\hat{\Psi}_{N+1}^TP_N\hat{\Psi}_{N+1})^{-1} \tag 5 \\ P_{N+1}&=P_N-K_{N+1}\hat{\Psi}_{N+1}^TP_N \\ \hat{\theta}_{N+1}&=\hat{\theta}_{N}+K_{N+1}(y_{N+1}-\hat{\Psi}_{N+1}^T \hat{\theta}_N) \end{aligned} KN+1​PN+1​θ^N+1​​=PN​Ψ^N+1​(1+Ψ^N+1T​PN​Ψ^N+1​)−1=PN​−KN+1​Ψ^N+1T​PN​=θ^N​+KN+1​(yN+1​−Ψ^N+1T​θ^N​)​(5)

3.GLS vs RELS

由上面可知,GLS和RELS对于有色噪声的处理方式是不同的,下式(1)与(2)分别是GLS和RELS对有色噪声的处理方法,ξ(k)\xi(k)ξ(k)为白噪声。
A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=1D(q−1)ξ(k)(1)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k),\varepsilon(k)=\frac{1}{D(q^{-1})}\xi(k) \tag 1 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=D(q−1)1​ξ(k)(1)

A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)(2)A(q^{-1})y(k)=B(q^{-1})u(k)+\varepsilon(k),\varepsilon(k)=C(q^{-1})\xi(k) \tag 2 A(q−1)y(k)=B(q−1)u(k)+ε(k),ε(k)=C(q−1)ξ(k)(2)

虽然两者对噪声的表示形式不同,但这并不会影响最后的参数估计结果。 在进行参数辨识时,系统参数的估计值应该是一致的,区别在于对噪声模型的估计会不一样。

下面对一组数据分别用GLS、RELS进行参数辨识。

系统模型如下所示,参数真值为a1=−1.5,a2=0.7,b0=0,b1=1,b2=0.5a_1=-1.5,a_2=0.7,b_0=0,b_1=1,b_2=0.5a1​=−1.5,a2​=0.7,b0​=0,b1​=1,b2​=0.5:
y(k)+a1y(k−1)+a2y(k−2)=b0u(k)+b1u(k−1)+b2u(k−2)+ε(k)y(k)+a_1y(k-1)+a_2y(k-2)=b_0u(k)+b_1u(k-1)+b_2u(k-2)+\varepsilon(k) y(k)+a1​y(k−1)+a2​y(k−2)=b0​u(k)+b1​u(k−1)+b2​u(k−2)+ε(k)

ε(k)=ξ(k)+c1ξ(k−1)+c2ξ(k−2)\varepsilon(k)=\xi(k)+c_1\xi(k-1)+c_2\xi(k-2) ε(k)=ξ(k)+c1​ξ(k−1)+c2​ξ(k−2)

上式的噪声表示形式与RELS的表示形式相同,可以直接用RELS进行参数辨识。RELS的辨识结果为
θ^=[−1.50710.7006−0.03721.04100.4801]T,J=40.6337\hat{\theta}=\begin{bmatrix} -1.5071 & 0.7006 & -0.0372 & 1.0410 & 0.4801 \end{bmatrix}^T,J=40.6337 θ^=[−1.5071​0.7006​−0.0372​1.0410​0.4801​]T,J=40.6337

对于GLS,噪声ε(k)\varepsilon(k)ε(k)可以设为另外一种形式,即
ε(k)+f1ε(k−1)+f2ε(k−2)=ξ(k)⟹ε(k)=11+f1q−1+f2q−2ξ(k)\varepsilon(k)+f_1\varepsilon(k-1)+f_2\varepsilon(k-2)=\xi(k) \Longrightarrow \varepsilon(k)=\frac{1}{1+f_1q^{-1}+f_2q^{-2}}\xi(k) ε(k)+f1​ε(k−1)+f2​ε(k−2)=ξ(k)⟹ε(k)=1+f1​q−1+f2​q−21​ξ(k)
GLS的辨识结果为
θ^=[−1.51700.7115−0.02201.04410.4572]T,J=40.7475\hat{\theta}=\begin{bmatrix} -1.5170 & 0.7115 & -0.0220 & 1.0441 & 0.4572 \end{bmatrix}^T,J=40.7475 θ^=[−1.5170​0.7115​−0.0220​1.0441​0.4572​]T,J=40.7475

由上可见,虽然两种方式对噪声的表示方式不同,但它们最终得到的系统参数的估计结果是相近,最终都收敛到了真实值。

最小二乘法的无偏估计相关推荐

  1. 【干货】郭朝晖:工业大数据的特征、方法与价值创造

    嘉宾介绍: 郭朝晖,现为宝钢中央研究院首席研究员.教授级高工.分别于1990.1994.1997年在浙江大学应用数学.化学工程和自动化专业获得学士.硕士和博士学位.1997年加盟宝钢,2005年晋升教 ...

  2. 从统计看机器学习(二) 多重共线性的一些思考

    从一个生活中的现象说起:我们在装机时,不会安装一款以上的解压软件,也不希望被莫名其妙地安装额外的管家.与此相反,我们会安装多款播放器.那么,这是为什么呢?当然,也可以思考这样一个问题,好评的软件那么多 ...

  3. 真题解析 | 2021国赛B题:乙醇偶合制备 C4 烯烃

    1.准备工作 1.1 题目背景 C4 烯烃广泛应用于化工产品及医药的生产,乙醇是生产制备 C4 烯烃的原料. 在制备过程中,催化剂组合(即:Co 负载量.Co/SiO2 和 HAP 装料比.乙醇浓度 ...

  4. 加权最小二乘法的理解

    文章目录 那什么什么是加权最小二乘法? 异方差的修正 在需要人为地改变观测量的权重的应用场合中,都会涉及到加权最小二乘法的应用. 那什么什么是加权最小二乘法? 加权最小二乘法的概念: 加权最小二乘是对 ...

  5. 从最小二乘法到卡尔曼滤波

    © 作者 | 李承蒙 学校 | 桂林电子科技大学 研究方向 | 计算机视觉 本文旨在梳理总结学习到的一些知识.由于笔者水平有限,文中难免存在一些不严谨和错误之处,诚请各位批评指正. 最近看了一篇文章, ...

  6. 监督学习—最小二乘法

    原文作者:马同学 原文地址:最小二乘法的本质是什么? 最小平方法是十九世纪统计学的主题曲.从许多方面来看,它之于统计学就相当于十八世纪的微积分之于数学. ---史蒂芬-史蒂格勒<The Hist ...

  7. 系统辨识(六):最小二乘法的修正算法

    最小二乘法的修正算法主要包括: 广义最小二乘法(Generalized Least Squares Method,简称GLS) 辅助变量法(Instrumental Variable Method,简 ...

  8. 递归最小二乘法、增广最小二乘法、带遗忘因子的递归增广最小二乘法

    一.递归最小二乘法 递推最小二乘法:当矩阵维数增加时,矩阵求逆运算计算量过大,而且不适合在线辨识.为了减少计算量,并且可以实时地辨识出动态系统的特性,可以将最小二乘法转换成参数递推的估计. 取前N组数 ...

  9. 统计学习方法——最小二乘法及其具体实现

    1. 引言 最小二乘法作为线性拟合常用的一种方法,勒让德( A. M. Legendre)于1805年在其著作<计算慧星轨道的新方法>中提出的,被广泛应用于各种数据拟合的方法中.曾经在某软 ...

最新文章

  1. 台式电脑不拉网线上网_用“隐形网线”让台式机快速稳定上网?强迫症有救了...
  2. Spring Cloud Netflix Zuul中的速率限制
  3. tomcat报错: Error parsing HTTP request header
  4. 前端学习(1770):前端调试之如何参照站点的manifest
  5. Jsoup 数据修改
  6. python列表生成式内必须定义匿名函数_Python基础-----基础概念总结
  7. 八、spring生命周期之BeanPostProcessor
  8. 数据库备份的几种方法
  9. VMware 下安装centos7,无法进入图形化界面
  10. xp系统snmp安装包_一款纯净的PE系统
  11. Kepware助力数据中心对接楼宇自动化系统
  12. [读书笔录]解析卷积神经网络(魏秀参)——第一章
  13. 关于ACM竞赛的题型分析
  14. UA OPTI570 量子力学 角动量 公式与结论总结
  15. 连接共享打印机时,弹出无法安装打印机,打印处理器不存在!!
  16. 【FinE】债券久期和凸性
  17. WORD打印时显示错误,未定义标签?
  18. 怎么制作电脑动态壁纸 桌面高清动态图怎么做
  19. Android Studio下拉菜单
  20. html怎么给图片加鼠标滑过效果,jquery给图片添加鼠标经过时的边框效果

热门文章

  1. JavaScript设计模式-工厂模式
  2. 需求分析方法论—Kano模型
  3. 操作系统 页面置换算法模拟
  4. 《AlgoPlus使用手册》之看穿式监管认证
  5. 如何选择一个合适的B2B2C商城系统,并能支持灵活的二次开发?
  6. 会员电商直播+供应链+云平台吸引客户购买解决销售困难
  7. 全球最高摩天轮落户北京 高208米直径193米(图)
  8. 阿里-中间件团队博客
  9. VC5-高级音频函数
  10. 三分钟带你解决MySQL安装到最后一步未响应问题