概率论知识回顾(十八)

重点:协方差和相关系数

知识回顾用于巩固知识和查漏补缺。知识回顾步骤:

  1. 查看知识回顾中的问题,尝试自己解答
  2. 自己解答不出来的可以查看下面的知识解答巩固知识。
  3. 对知识解答有疑问的,说明有关这一点的知识或者公式没有理解透彻或者没有记住,要重新翻看书籍。

知识回顾

  1. 协方差的公式定义是什么?协方差是用来衡量什么的?
  2. 当两个随机变量相互独立的时候,协方差的值是什么?简要证明并尝试列举和方差的关系。
  3. 简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。
  4. 相关系数的公式定义是什么?它又是用来衡量什么的?为什么要是用相关系数?
  5. 给出随机变量 X , Y X,Y X,Y 不相关的几条等价表示。
  6. 给出相关系数 ρ X Y \rho_{XY} ρXY​ 两条性质的证明。

知识解答

  1. 协方差的公式定义是什么?协方差是用来衡量什么的?

    • 公式定义 C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] Cov(X, Y) = E[(X-EX)(Y-EY)] Cov(X,Y)=E[(X−EX)(Y−EY)]
    • 协方差用来衡量随机变量之间的相关关系的,如果 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0, 就可以说两个随机变量之间不相关。
    • 由于独立的要求比相关更严格,即:独立一定不相关,但不相关不一定独立。那么我们就可以进行断行
      • 如果两个随机变量具有某种相关关系,那么他们一定不相互独立。
      • 如果两个随机变量相互独立,那么他们就一定相关。
  2. 当两个随机变量相互独立的时候,协方差的值是什么?简要证明并尝试列举和方差的关系。

    • 在第一个问题中已经得到了解答,当两个随机变量相互独立的时候,一定是不相关的,那么 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0.

    证明:首先,我们分解 C o v ( X , Y ) Cov(X, Y) Cov(X,Y) 就有:

    C o v ( X , Y ) = E ( X Y ) − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} Cov(X, Y) &= E(XY) - XE(Y) - YE(X) + E(X)E(Y) \\&= E(XY) - 2E(X)E(Y) + E(X)E(Y) \\&= E(XY) - E(X)E(Y) \end{aligned} Cov(X,Y)​=E(XY)−XE(Y)−YE(X)+E(X)E(Y)=E(XY)−2E(X)E(Y)+E(X)E(Y)=E(XY)−E(X)E(Y)​

    同时,如果 X , Y X,Y X,Y 相互独立的话,有 E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y) , 因此就可知 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0

    • 另外,从协方差的定义中可以看到 , 当 X = Y X=Y X=Y 的时候, C o v ( X , Y ) = D ( X ) Cov(X, Y) = D(X) Cov(X,Y)=D(X)
    • D ( X + Y ) = D ( X ) + D ( Y ) + 2 C o v ( X , Y ) D(X + Y) = D(X) + D(Y) + 2Cov(X, Y) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

    证明: (从一般情况得到两个随机变量的情况)

    由于有 D ( X ) = C o v ( X , X ) D(X) = Cov(X, X) D(X)=Cov(X,X) 因此可知 D ( ∑ i = 1 n X i ) = C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) D(\sum_{i=1}^nX_i) = Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) D(∑i=1n​Xi​)=Cov(∑i=1n​Xi​,∑j=1n​Xj​)

    上面的公式是把 ∑ i = 1 n X i \sum_{i=1}^nX_i ∑i=1n​Xi​ 看做一个随机变量,这时候 ∑ i = 1 n X i \sum_{i=1}^nX_i ∑i=1n​Xi​ 和 ∑ i = j n X j \sum_{i=j}^nX_j ∑i=jn​Xj​ 是相等的。

    同时,根据协方差的性质, C o v ( ∑ i = 1 n a i X i , ∑ j = 1 m b j Y j ) = ∑ i = 1 n ∑ j = 1 m a i b j C o v ( X i , Y j ) Cov(\sum_{i=1}^na_iX_i, \sum_{j=1}^mb_jY_j) = \sum_{i=1}^n\sum_{j=1}^ma_ib_jCov(X_i, Y_j) Cov(∑i=1n​ai​Xi​,∑j=1m​bj​Yj​)=∑i=1n​∑j=1m​ai​bj​Cov(Xi​,Yj​)

    就有:
    C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) = ∑ i = 1 n ∑ j = 1 n C o v ( X i , X j ) = ∑ i = 1 n C o v ( X i , X i ) + ∑ ∑ i ≠ j C o v ( X i , X j ) = ∑ i = 1 n D ( X i ) + 2 ∑ ∑ 1 ≤ i &lt; j ≤ n C o v ( X i , X j ) \begin{aligned}Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) &amp;= \sum_{i=1}^n\sum_{j=1}^nCov(X_i, X_j) \\&amp;=\sum_{i=1}^nCov(X_i, X_i) + {\sum\sum}_{i\neq j}Cov(X_i, X_j) \\&amp;= \sum_{i=1}^nD(X_i) + 2{\sum\sum}_{ 1\le i &lt; j \le n}Cov(X_i, X_j) \end{aligned} Cov(i=1∑n​Xi​,j=1∑n​Xj​)​=i=1∑n​j=1∑n​Cov(Xi​,Xj​)=i=1∑n​Cov(Xi​,Xi​)+∑∑i̸​=j​Cov(Xi​,Xj​)=i=1∑n​D(Xi​)+2∑∑1≤i<j≤n​Cov(Xi​,Xj​)​

    从上面的一般式就可以得出 n = 2 的情况。

  3. 简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。

    • 对任意的随机变量 X , Y X, Y X,Y, 若 E ( X 2 ) &lt; + ∞ , E ( Y 2 ) &lt; + ∞ E(X^2) &lt; + \infty, E(Y^2) &lt; +\infty E(X2)<+∞,E(Y2)<+∞, 则有 [ E ( X Y ) ] 2 ≤ E ( X 2 ) ⋅ E ( Y 2 ) [E(XY)]^2 \le E(X^2)·E(Y^2) [E(XY)]2≤E(X2)⋅E(Y2), 当且仅当 P { Y = t 0 X } = 1 P\{Y = t_0X\} = 1 P{Y=t0​X}=1 时等号成立,其中 t 0 t_0 t0​ 为某常数。

      证明:令 u ( t ) = E ( t X − Y ) 2 = t 2 E ( X 2 ) − 2 t E ( X Y ) + E ( Y 2 ) u(t) = E(tX - Y)^2 = t^2E(X^2) - 2tE(XY) + E(Y^2) u(t)=E(tX−Y)2=t2E(X2)−2tE(XY)+E(Y2) 可以知道 u ( t ) u(t) u(t) 没有实根或者只有一个重根。因此就有 Δ = [ 2 E ( X Y ) ] 2 − 4 E ( X 2 ) E ( Y 2 ) ≤ 0 ↔ [ E ( X Y ) ] 2 ≤ E ( X 2 ) ⋅ E ( Y 2 ) \Delta = [2E(XY)]^2 - 4E(X^2)E(Y^2) \le 0 \leftrightarrow [E(XY)]^2 \le E(X^2)·E(Y^2) Δ=[2E(XY)]2−4E(X2)E(Y2)≤0↔[E(XY)]2≤E(X2)⋅E(Y2)

      如果 Δ = 0 \Delta = 0 Δ=0, 就有 存在一个 t 0 t_0 t0​ 使得 E ( t X − Y ) 2 = 0 E(tX-Y)^2=0 E(tX−Y)2=0

      同时,有 0 ≤ D ( t 0 X − Y ) = E ( t 0 X − Y ) 2 − [ E ( t 0 X − Y ) ] 2 = − [ E ( t 0 X − Y ) ] 2 ≤ 0 0 \le D(t_0X-Y) = E(t_0X-Y)^2 - [E(t_0X-Y)]^2 = -[E(t_0X-Y)]^2 \le 0 0≤D(t0​X−Y)=E(t0​X−Y)2−[E(t0​X−Y)]2=−[E(t0​X−Y)]2≤0

      因此可知 D ( t 0 X − Y ) = 0 , E ( t 0 X − Y ) = 0 D(t_0X-Y) = 0, E(t_0X-Y)=0 D(t0​X−Y)=0,E(t0​X−Y)=0

      根据方差的性质有: D ( X ) = 0 D(X)=0 D(X)=0的充要条件是存在常数C使得 P { X = C } = 1 P\{X=C\}=1 P{X=C}=1, 其中 C = E ( X ) C = E(X) C=E(X)

      这里,我们使 Z = t 0 X − Y Z = t_0X-Y Z=t0​X−Y 有 D ( Z ) = 0 , E ( Z ) = 0 D(Z) = 0, E(Z) = 0 D(Z)=0,E(Z)=0 因此有 P { Z = 0 } = 1 ↔ P { t 0 X − Y = 0 } = 1 ↔ P { t 0 X = Y } = 1 P\{Z=0\}=1 \leftrightarrow P\{t_0X-Y=0\} = 1 \leftrightarrow P\{t_0X=Y\}=1 P{Z=0}=1↔P{t0​X−Y=0}=1↔P{t0​X=Y}=1

    • 将上面的公式里面的 X X X 替换成 X − E ( X ) X-E(X) X−E(X), Y Y Y 替换成 Y − E ( Y ) Y - E(Y) Y−E(Y) 就有 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2≤D(X)D(Y)

  4. 相关系数的公式定义是什么?它又是用来衡量什么的?为什么要是用相关系数?

    • ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) = C o v ( X − E ( X ) D ( X ) , Y − E ( Y ) D ( Y ) ) = C o v ( X ∗ , Y ∗ ) \rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}} = Cov(\frac{X-E(X)}{\sqrt{D(X)}},\frac{Y-E(Y)}{\sqrt{D(Y)}}) = Cov(X^*, Y^*) ρXY​=D(X) ​D(Y) ​Cov(X,Y)​=Cov(D(X) ​X−E(X)​,D(Y) ​Y−E(Y)​)=Cov(X∗,Y∗)
    • 相关系数和协方差的关系就类似于变异系数和方差的关系一样,它是协方差的标准化表示,也是表示随机变量之间相关关系的表示,于协方差不同的是,协方差容易受随机变量本身数值大小的影响,由于相关系数是进行标准化后的度量,因此可以更好的度量相关关系。
  5. 给出随机变量 X , Y X,Y X,Y 不相关的几条等价表示。

    • C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0
    • ρ X Y = 0 \rho_{XY} = 0 ρXY​=0
    • D ( X ± Y ) = D ( X ) + D ( Y ) D(X \pm Y) = D(X) + D(Y) D(X±Y)=D(X)+D(Y)
    • E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y)
  6. 给出相关系数 ρ X Y \rho_{XY} ρXY​ 两条性质的证明。

    • ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ∣ρXY​∣≤1

      证明:令 X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) X^* = \frac{X-E(X)}{\sqrt{D(X)}},Y^* = \frac{Y-E(Y)}{\sqrt{D(Y)}} X∗=D(X) ​X−E(X)​,Y∗=D(Y) ​Y−E(Y)​。 有 D ( X ∗ ) = 1 , D ( Y ∗ ) = 1 D(X^*) = 1, D(Y^*)=1 D(X∗)=1,D(Y∗)=1

      同时,根据第三问中的结论 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2≤D(X)D(Y) 可知 ρ X Y 2 ≤ D ( X ∗ ) D ( Y ∗ ) = 1 \rho_{XY}^2 \le D(X^*)D(Y^*) = 1 ρXY2​≤D(X∗)D(Y∗)=1

      因此可知 ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ∣ρXY​∣≤1

    • ∣ ρ X Y ∣ = 1 |\rho_{XY}| = 1 ∣ρXY​∣=1 的充要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 和 b 使得 P { Y = a X + b } = 1 P\{Y = aX + b\} = 1 P{Y=aX+b}=1。即

      • ρ X Y = 1 \rho_{XY} = 1 ρXY​=1 当且仅当 P { Y − E ( Y ) D ( Y ) = X − E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = \frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y) ​Y−E(Y)​=D(X) ​X−E(X)​}=1
      • ρ X Y = − 1 \rho_{XY} = -1 ρXY​=−1 当且仅当 P { Y − E ( Y ) D ( Y ) = − X − E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = -\frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y) ​Y−E(Y)​=−D(X) ​X−E(X)​}=1

      证明:

      ∣ ρ X Y ∣ = 1 ↔ ρ X Y 2 = 1 ↔ [ E ( X ∗ Y ∗ ) − E ( X ∗ ) E ( Y ∗ ) ] 2 = 1 |\rho_{XY}| = 1 \leftrightarrow \rho_{XY}^2 = 1 \leftrightarrow [E(X^*Y^*) - E(X^*)E(Y^*)]^2=1 ∣ρXY​∣=1↔ρXY2​=1↔[E(X∗Y∗)−E(X∗)E(Y∗)]2=1

      同时,由于 E ( X ∗ ) = E ( Y ∗ ) = 0 , E ( X ∗ ) 2 = E ( Y ∗ ) 2 = 1 E(X^*) = E(Y^*)=0, E(X^*)^2 = E(Y^*)^2=1 E(X∗)=E(Y∗)=0,E(X∗)2=E(Y∗)2=1

      可以知道

      [ E ( X ∗ Y ∗ ) − E ( X ∗ ) E ( Y ∗ ) ] 2 = [ E ( X ∗ Y ∗ ) ] 2 = 1 = E ( X ∗ ) 2 E ( Y ∗ ) 2 [E(X^*Y^*) - E(X^*)E(Y^*)]^2 = [E(X^*Y^*)]^2 = 1 = E(X^*)^2E(Y^*)^2 [E(X∗Y∗)−E(X∗)E(Y∗)]2=[E(X∗Y∗)]2=1=E(X∗)2E(Y∗)2

      根据 柯西–许瓦兹不等式我们知道,满足上面等式的当且仅当存在 t 0 t_0 t0​ 使得 P { Y ∗ = C X ∗ } = 1 P\{Y^* = CX^*\} =1 P{Y∗=CX∗}=1

      因此有

      P { Y − E ( Y ) D ( Y ) = C X − E ( X ) D ( X ) } ↔ P { Y = C D ( Y ) D ( X ) X + ( E ( Y ) − C E ( X ) D ( Y ) D ( X ) ) } P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = C\frac{X-E(X)}{\sqrt{D(X)}}\} \leftrightarrow P\{Y = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}X + (E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}})\} P{D(Y) ​Y−E(Y)​=CD(X) ​X−E(X)​}↔P{Y=CD(X) ​D(Y) ​​X+(E(Y)−CE(X)D(X) ​D(Y) ​​)}

      根据上面的公式,很明显,令 a = C D ( Y ) D ( X ) , b = E ( Y ) − C E ( X ) D ( Y ) D ( X ) a = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}, b= E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}} a=CD(X) ​D(Y) ​​,b=E(Y)−CE(X)D(X) ​D(Y) ​​ 就能得到 Y = a X + b Y = aX+b Y=aX+b

      同理,根据 ρ X Y = 1 \rho_{XY} = 1 ρXY​=1 有 Y ∗ = C X ∗ Y^* = CX^* Y∗=CX∗

      就有 C o v ( X ∗ , Y ∗ ) = C o v ( X ∗ , C X ∗ ) = C D ( X ∗ ) = C = 1 Cov(X^*, Y^*) = Cov(X^*, CX^*) = CD(X*) = C = 1 Cov(X∗,Y∗)=Cov(X∗,CX∗)=CD(X∗)=C=1, 证毕。

      同理当 ρ X Y = − 1 \rho_{XY} = -1 ρXY​=−1 也可证明。

概率论知识回顾(十八):协方差和相关系数相关推荐

  1. 概率论知识回顾(二十):随机变量序列收敛性

    概率论知识回顾(二十) 重点:随机变量序列收敛性 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. 对知识解答有疑问 ...

  2. 概率论知识回顾(十五):变量函数的期望,期望的性质

    概率论知识回顾(十五) 重点:变量函数的期望,期望的性质 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. 对知识解 ...

  3. 概率论知识回顾(二):古典概型,几何概型

    概率论知识回顾(二) 关键词:古典概型,几何概型 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. 对知识解答有疑问 ...

  4. 概率论知识回顾(四):事件独立性、贝努利概型

    概率论知识回顾(四) 重点:事件独立性.贝努利概型 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. 对知识解答有疑 ...

  5. 概率论知识回顾(三):事件域,条件概率,全概率,贝叶斯概率

    概率论知识回顾(三) 关键点:事件域,条件概率,全概率,贝叶斯概率 知识回顾用于巩固知识和查漏补缺.知识回顾步骤: 查看知识回顾中的问题,尝试自己解答 自己解答不出来的可以查看下面的知识解答巩固知识. ...

  6. Simulink 环境基础知识(十八)--确定信号维度

    目录 确定信号维度 支持多维信号的 Simulink 模块 确定源模块的输出维度 确定非源模块的输出维度 信号和参数维度规则 输入信号和参数的标量扩展 确定信号维度 Simulink® 模块可以输出一 ...

  7. 机器学习中涉及的概率论知识回顾(一)

     目录 1.条件概率    2.独立性   3.全概率公式   4.贝叶斯公式   5.伯努利模型   6.随机变量的分布   7.分布函数     1.条件概率 2.独立性 3.全概率公式 4.贝叶 ...

  8. Android初级基础知识复习(十八) —— 自定义通知栏

    通知推送Notification 在手机屏幕的顶端下拉会弹出通知栏,里面存放的是App即时提醒用户的消息,消息内容由Notification 产生并推送.每条消息通知基本都有图标.标题.内容.时间等元 ...

  9. 中医知识分享之《养生十八伤》

    中医知识分享之<养生十八伤> 一.[久视伤精] 目得血能视,精由血化,故伤精. 二.[久听伤神] 神滋于肾,肾通窍于耳,故伤神. 三.[久卧伤气] 卧时张口散气,合口壅气,故伤气.< ...

最新文章

  1. GPT-3和AlphaFold 2震撼2020,2021年AI最大看点在哪儿?
  2. python在中小学教学中的应用-小学信息技术教学中进行Python 编程语言教学的策略...
  3. CentOS Linux解决Device eth0 does not seem to be present及设置固定ip
  4. 【TypeScript系列教程05】保留关键字
  5. php中什么是函数函数的意义是什么,php中arsort函数的功能起什么作用呢?
  6. 用idea新建springboot项目遇到的@Restcontroller不能导入的问题
  7. linux pe大小,lvm中的pe默认是4M 最大能支持多大 1T?2T
  8. matlab7.0 run,新手求救啊!!!matlab7.0在win7启动后命令窗口出现大段代码!
  9. 使用监听器:定时清除map缓存的key value .
  10. C++库研究笔记——Linux下是否需要使用memory pool?
  11. Android的JNI【实战教程】4⃣️--C调用Java代码
  12. 17.电话号码的字母组合(力扣leetcode) 博主可答疑该问题
  13. 树莓派自启动配置端口映射及启动jar
  14. 《自己动手写操作系统 》第九章 一 简易硬盘驱动的实现
  15. UIControl 纠错
  16. 搭建属于自己的家庭私有云盘
  17. E680I使用上的常见问题小结
  18. 保护板测试仪上位机软件,蓄电池性能测试仪放电部分与上位机软件设计
  19. 数据结构之一元多项式相加
  20. 四月Google份额继续上升 微软收购雅虎势在必行

热门文章

  1. Python可视化:绘制折线图、设置线条形状和marker样式
  2. c语言scanf返回值错误,c语言scanf返回值
  3. babel 7.0.0-0_我们即将接近7.0 Babel版本。 这是我们一直在做的所有很酷的事情。...
  4. 【概率论与数理统计】猴博士 笔记 p1-p2 古典概型、几何概型
  5. Laravel5.1框架关键技术解析(读书笔记)
  6. mysql筛选班级排名_mysql实现分组查询每个班级的前三名
  7. 问题 C: 世界那么大,我想去看看
  8. 不容错过的BT-474细胞传代实验心得分享
  9. 在网页上通过JS实现文本的语音朗读
  10. 用脑过度了头痛了两天