在一般的回归教材中,都不会提到经典的方差分析,而在数理统计教材中,方差分析又往往作为独立于回归分析的章节存在。所以我们一般不会去思考方差分析与回归分析之间的关系。而事实上,方差分析就是一种特殊的回归分析,oneway-anova和一元线性回归时完全等价的!

oneway-anova

举个栗子,一个因子A下有三个水平 A1,A2,A3A_1,A_2,A_3A1​,A2​,A3​,我们要比较这三个水平间是否有显著的差异, 每一个AiA_iAi​的观测都是 yi1,yi2,...,yiniy_{i1},y_{i2},...,y_{in_i}yi1​,yi2​,...,yini​​,各水平均值记为 μi{\mu}_iμi​, 总体均值记为μ\muμ, 水平效应 ai=μ−μia_i=\mu-\mu_iai​=μ−μi​, 总观测数为 n=n1+n2+n3n=n_1+n_2+n_3n=n1​+n2​+n3​。
H0:a1=a2=a3=0H_0:a_1=a_2=a_3=0H0​:a1​=a2​=a3​=0
F=SA/fASe/fe∼F(fA,fe)=F(2,n−3)F=\frac{S_A/f_A}{S_e/f_e} \sim F(f_A,f_e) =F(2,n-3)F=Se​/fe​SA​/fA​​∼F(fA​,fe​)=F(2,n−3)
其中,SAS_ASA​ 是组间偏差平方和,SeS_eSe​ 是组内偏差平方和。

一元线性回归

上述方差分析的目的在于检验3个水平间是否有差距,放在线性回归里,检验3个水平是否有差距的方法就是把三个水平上的观测值作为因变量,把水平的类别作为自变量,然后检验回归系数的显著性。
可以通过设置哑变量,实现将水平类别作为自变量。因为有3个水平,所以可设置2个哑变量x1,x2x_1,x_2x1​,x2​, 则3个水平对应的 (x1,x2)(x_1,x_2)(x1​,x2​) 取值分别为 (0,0), (1,0), (0,1)。再考虑上截距项,设计矩阵为:
XXX = (100......110......101......)n∗3\left( \begin{array}{ccc} 1&0&0\\..&..&..\\1&1&0\\..&..&..\\1&0&1\\..&..&.. \end{array} \right)_{n*3}⎝⎜⎜⎜⎜⎜⎜⎛​1..1..1..​0..1..0..​0..0..1..​⎠⎟⎟⎟⎟⎟⎟⎞​n∗3​

回归方程为:Y=Xβ+ϵY = X\beta +\epsilonY=Xβ+ϵ
因变量取值为:y=(y11,...,y1n1,y21,...,y2n2,y31,...,y3n3)Ty = (y_{11},...,y_{1n_1},y_{21},...,y_{2n_2},y_{31},...,y_{3n_3})^Ty=(y11​,...,y1n1​​,y21​,...,y2n2​​,y31​,...,y3n3​​)T

使用最小二乘法解得:β^=(X′X)−1X′y=(μ1,−μ1+μ2,−μ1+μ3)T\hat{\beta} = (X'X)^{-1}X'y=(\mu_1,-\mu_1+\mu_2, -\mu_1+\mu_3)^Tβ^​=(X′X)−1X′y=(μ1​,−μ1​+μ2​,−μ1​+μ3​)T
H0:β1=β2=β3=0H_0:\beta_1=\beta_2=\beta_3=0H0​:β1​=β2​=β3​=0
F=SSR/pSSE/n−p−1∼F(p,n−p−1)=F(2,n−3)F=\frac{SSR/p}{SSE/n-p-1}\sim F(p,n-p-1)=F(2,n-3)F=SSE/n−p−1SSR/p​∼F(p,n−p−1)=F(2,n−3)

anova vs. 一元线性回归

上面可以看出,两个统计量服从的是一模一样的分布 F(2,n−3)F(2,n-3)F(2,n−3)。那么从其他的角度看呢?

数值的关系
事实上,根据 SA,Se,SSR,SSES_A,S_e,SSR,SSESA​,Se​,SSR,SSE 的定义,以及上面求出的 β^=(μ1,−μ1+μ2,−μ1+μ3)T\hat{\beta} =(\mu_1,-\mu_1+\mu_2, -\mu_1+\mu_3)^Tβ^​=(μ1​,−μ1​+μ2​,−μ1​+μ3​)T, 我们可以得出数值上的关系:SA=SSRS_A=SSRSA​=SSR,Se=SSES_e=SSESe​=SSE.

原假设的关系
对于anova的原假设 H0:a1=a2=a3=0H_0:a_1=a_2=a_3=0H0​:a1​=a2​=a3​=0 和线性回归的原假设H0:β1=β2=β3=0H_0:\beta_1=\beta_2=\beta_3=0H0​:β1​=β2​=β3​=0而言,都可以写为H0:μ1=μ2=μ3=0H_0:\mu_ 1=\mu_2=\mu_3=0H0​:μ1​=μ2​=μ3​=0.

参考文献

《概率论与数理统计》,茆诗松,P423-432
《应用回归分析》,何晓群,P71

方差分析与一元线性回归相关推荐

  1. UA MATH571A 一元线性回归III 方差分析与相关性分析

    UA MATH571A 一元线性回归III 方差分析与相关性分析 ANOVA Table F检验 回归系数的F检验 F检验与t检验等价 广义线性检验方法 R2R^2R2 数值例子:女性肌肉量与年龄的关 ...

  2. 【计量经济学】SPSS——一元线性回归【方差分析、残差分析】

    基于中国居民总量消费支出与收入资料作一元线性回归分析 数据可关注公众号:321红绿灯 回复一元线性回归获得 一.实验目的 随着社会经济发展的步伐加快,人民生活水平得到明显的提高.中国居民消费与收入的关 ...

  3. UA MATH 571B 回归 QE练习题 一元线性回归理论

    UA MATH 571B 回归 QE练习题 一元线性回归理论 2015/1/5 2015/5/5 2016/5/6 2017/1/5 2017/5/6 这是2015年1月第五题,2015年5月第五题, ...

  4. Python数据分析之一元线性回归

    问题 制作一元材积表,不懂林学的可能不知道,如图,也就是构造材积和胸径间的关系,这里采用了python的一元线性回归方法(本人用spss做了幂函数非线性回归,效果最好). Python方差分析 导入库 ...

  5. R语言——一元线性回归

    高尔顿被誉为现代回归的创始人,"回归效应"的发现源于高尔顿的豌豆遗传试验.在这个试验中,高尔顿发现,并非尺寸大的豌豆,其后代尺寸也大,尺寸小的豌豆,其后代尺寸也小.而是具有一种不同 ...

  6. R语言之一元线性回归xt2.15

    源代码&数据集下载地址:https://download.csdn.net/download/princessyang/12940938 第2章 一元线性回归 xt2.15 一家保险公司十分关 ...

  7. 统计学 一元线性回归

    统计学 一元线性回归 回归(Regression):假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,利用该模型根据给定的自变量来预测因变量 线性回归:因变量和自变量之间是线性关 ...

  8. python一元线性回归的优点_Python数据分析之一元线性回归

    问题 制作一元材积表,不懂林学的可能不知道,如图,也就是构造材积和胸径间的关系,这里采用了python的一元线性回归方法(本人用spss做了幂函数非线性回归,效果最好). Python方差分析导入库和 ...

  9. 一元线性回归模型(保姆级)

    提示:本文是基于最小二乘法对数据进行拟合. 目录 一.模型建立的流程 二.模型原理 1.模型 2.参数​编辑 和​编辑的估计 三.回归方程的显著性检验 1.t检验 2.F检验 3.相关系数的显著检验 ...

最新文章

  1. 开发工具之Android Studio快捷键
  2. 多家IT企业通过CNNIC“可信网站”验证
  3. python中怎么比较两个列表-Python两个列表元素比较
  4. php 发送delete请求,PHP中使用CURL实现GET、POST、PUT、DELETE请求
  5. Android开发笔记(七十二)数据加密算法
  6. LeetCode:Add Binary
  7. 《Android Jetpack》— Android 书籍
  8. 20155209 林虹宇 Exp3 免杀原理与实践
  9. 电子电路仿真软件中文版_软件分享|几款你从未见过的电子电路仿真软件
  10. linux C语言 SOCKET 服务器断开导致客户端SEND崩溃问题解决办法
  11. 稀疏编码中的正交匹配追踪(OMP)与代码
  12. 手机打电话的通讯原理
  13. 奇谈 2020.11.24日记
  14. 三运放差分放大电路分析_三运放组成的差分放大器电路图及特点
  15. 【C语言编程】简单密码
  16. Hive启动报错:java.net.URISyntaxException: Relative path in absolute URI: ${system:user.name%7D
  17. FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask. ORC split
  18. 关于Ember的一些小技巧总结
  19. linux常用命令(61):ps命令
  20. 仓储委外加工/周转加工

热门文章

  1. phpqrcode生成二维码
  2. java jframe_java中的JFrame | 学步园
  3. 【图形学】30 前向渲染多光照场景代码理解
  4. 本地项目提交代码到git仓库详细教程包含错误解决办法!!!
  5. 软件测试基础知识(思维导图)
  6. 100天精通Python(数据分析篇)——第72天:Pandas文本数据处理方法之判断类型、去除空白字符、拆分和连接
  7. chatgpt系列文章-23.2.15(主要还在发现chatgpt的不足,偏探索,像报告)
  8. Jupyter notebook爬取猫眼top100电影信息(Xpath)
  9. python drf_drf,_Python教程 | 登博教程
  10. It's not QA - From Google