方差分析与一元线性回归
在一般的回归教材中,都不会提到经典的方差分析,而在数理统计教材中,方差分析又往往作为独立于回归分析的章节存在。所以我们一般不会去思考方差分析与回归分析之间的关系。而事实上,方差分析就是一种特殊的回归分析,oneway-anova和一元线性回归时完全等价的!
oneway-anova
举个栗子,一个因子A下有三个水平 A1,A2,A3A_1,A_2,A_3A1,A2,A3,我们要比较这三个水平间是否有显著的差异, 每一个AiA_iAi的观测都是 yi1,yi2,...,yiniy_{i1},y_{i2},...,y_{in_i}yi1,yi2,...,yini,各水平均值记为 μi{\mu}_iμi, 总体均值记为μ\muμ, 水平效应 ai=μ−μia_i=\mu-\mu_iai=μ−μi, 总观测数为 n=n1+n2+n3n=n_1+n_2+n_3n=n1+n2+n3。
H0:a1=a2=a3=0H_0:a_1=a_2=a_3=0H0:a1=a2=a3=0
F=SA/fASe/fe∼F(fA,fe)=F(2,n−3)F=\frac{S_A/f_A}{S_e/f_e} \sim F(f_A,f_e) =F(2,n-3)F=Se/feSA/fA∼F(fA,fe)=F(2,n−3)
其中,SAS_ASA 是组间偏差平方和,SeS_eSe 是组内偏差平方和。
一元线性回归
上述方差分析的目的在于检验3个水平间是否有差距,放在线性回归里,检验3个水平是否有差距的方法就是把三个水平上的观测值作为因变量,把水平的类别作为自变量,然后检验回归系数的显著性。
可以通过设置哑变量,实现将水平类别作为自变量。因为有3个水平,所以可设置2个哑变量x1,x2x_1,x_2x1,x2, 则3个水平对应的 (x1,x2)(x_1,x_2)(x1,x2) 取值分别为 (0,0), (1,0), (0,1)。再考虑上截距项,设计矩阵为:
XXX = (100......110......101......)n∗3\left( \begin{array}{ccc} 1&0&0\\..&..&..\\1&1&0\\..&..&..\\1&0&1\\..&..&.. \end{array} \right)_{n*3}⎝⎜⎜⎜⎜⎜⎜⎛1..1..1..0..1..0..0..0..1..⎠⎟⎟⎟⎟⎟⎟⎞n∗3
回归方程为:Y=Xβ+ϵY = X\beta +\epsilonY=Xβ+ϵ
因变量取值为:y=(y11,...,y1n1,y21,...,y2n2,y31,...,y3n3)Ty = (y_{11},...,y_{1n_1},y_{21},...,y_{2n_2},y_{31},...,y_{3n_3})^Ty=(y11,...,y1n1,y21,...,y2n2,y31,...,y3n3)T
使用最小二乘法解得:β^=(X′X)−1X′y=(μ1,−μ1+μ2,−μ1+μ3)T\hat{\beta} = (X'X)^{-1}X'y=(\mu_1,-\mu_1+\mu_2, -\mu_1+\mu_3)^Tβ^=(X′X)−1X′y=(μ1,−μ1+μ2,−μ1+μ3)T
H0:β1=β2=β3=0H_0:\beta_1=\beta_2=\beta_3=0H0:β1=β2=β3=0
F=SSR/pSSE/n−p−1∼F(p,n−p−1)=F(2,n−3)F=\frac{SSR/p}{SSE/n-p-1}\sim F(p,n-p-1)=F(2,n-3)F=SSE/n−p−1SSR/p∼F(p,n−p−1)=F(2,n−3)
anova vs. 一元线性回归
上面可以看出,两个统计量服从的是一模一样的分布 F(2,n−3)F(2,n-3)F(2,n−3)。那么从其他的角度看呢?
数值的关系
事实上,根据 SA,Se,SSR,SSES_A,S_e,SSR,SSESA,Se,SSR,SSE 的定义,以及上面求出的 β^=(μ1,−μ1+μ2,−μ1+μ3)T\hat{\beta} =(\mu_1,-\mu_1+\mu_2, -\mu_1+\mu_3)^Tβ^=(μ1,−μ1+μ2,−μ1+μ3)T, 我们可以得出数值上的关系:SA=SSRS_A=SSRSA=SSR,Se=SSES_e=SSESe=SSE.
原假设的关系
对于anova的原假设 H0:a1=a2=a3=0H_0:a_1=a_2=a_3=0H0:a1=a2=a3=0 和线性回归的原假设H0:β1=β2=β3=0H_0:\beta_1=\beta_2=\beta_3=0H0:β1=β2=β3=0而言,都可以写为H0:μ1=μ2=μ3=0H_0:\mu_ 1=\mu_2=\mu_3=0H0:μ1=μ2=μ3=0.
参考文献
《概率论与数理统计》,茆诗松,P423-432
《应用回归分析》,何晓群,P71
方差分析与一元线性回归相关推荐
- UA MATH571A 一元线性回归III 方差分析与相关性分析
UA MATH571A 一元线性回归III 方差分析与相关性分析 ANOVA Table F检验 回归系数的F检验 F检验与t检验等价 广义线性检验方法 R2R^2R2 数值例子:女性肌肉量与年龄的关 ...
- 【计量经济学】SPSS——一元线性回归【方差分析、残差分析】
基于中国居民总量消费支出与收入资料作一元线性回归分析 数据可关注公众号:321红绿灯 回复一元线性回归获得 一.实验目的 随着社会经济发展的步伐加快,人民生活水平得到明显的提高.中国居民消费与收入的关 ...
- UA MATH 571B 回归 QE练习题 一元线性回归理论
UA MATH 571B 回归 QE练习题 一元线性回归理论 2015/1/5 2015/5/5 2016/5/6 2017/1/5 2017/5/6 这是2015年1月第五题,2015年5月第五题, ...
- Python数据分析之一元线性回归
问题 制作一元材积表,不懂林学的可能不知道,如图,也就是构造材积和胸径间的关系,这里采用了python的一元线性回归方法(本人用spss做了幂函数非线性回归,效果最好). Python方差分析 导入库 ...
- R语言——一元线性回归
高尔顿被誉为现代回归的创始人,"回归效应"的发现源于高尔顿的豌豆遗传试验.在这个试验中,高尔顿发现,并非尺寸大的豌豆,其后代尺寸也大,尺寸小的豌豆,其后代尺寸也小.而是具有一种不同 ...
- R语言之一元线性回归xt2.15
源代码&数据集下载地址:https://download.csdn.net/download/princessyang/12940938 第2章 一元线性回归 xt2.15 一家保险公司十分关 ...
- 统计学 一元线性回归
统计学 一元线性回归 回归(Regression):假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,利用该模型根据给定的自变量来预测因变量 线性回归:因变量和自变量之间是线性关 ...
- python一元线性回归的优点_Python数据分析之一元线性回归
问题 制作一元材积表,不懂林学的可能不知道,如图,也就是构造材积和胸径间的关系,这里采用了python的一元线性回归方法(本人用spss做了幂函数非线性回归,效果最好). Python方差分析导入库和 ...
- 一元线性回归模型(保姆级)
提示:本文是基于最小二乘法对数据进行拟合. 目录 一.模型建立的流程 二.模型原理 1.模型 2.参数编辑 和编辑的估计 三.回归方程的显著性检验 1.t检验 2.F检验 3.相关系数的显著检验 ...
最新文章
- 开发工具之Android Studio快捷键
- 多家IT企业通过CNNIC“可信网站”验证
- python中怎么比较两个列表-Python两个列表元素比较
- php 发送delete请求,PHP中使用CURL实现GET、POST、PUT、DELETE请求
- Android开发笔记(七十二)数据加密算法
- LeetCode:Add Binary
- 《Android Jetpack》— Android 书籍
- 20155209 林虹宇 Exp3 免杀原理与实践
- 电子电路仿真软件中文版_软件分享|几款你从未见过的电子电路仿真软件
- linux C语言 SOCKET 服务器断开导致客户端SEND崩溃问题解决办法
- 稀疏编码中的正交匹配追踪(OMP)与代码
- 手机打电话的通讯原理
- 奇谈 2020.11.24日记
- 三运放差分放大电路分析_三运放组成的差分放大器电路图及特点
- 【C语言编程】简单密码
- Hive启动报错:java.net.URISyntaxException: Relative path in absolute URI: ${system:user.name%7D
- FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask. ORC split
- 关于Ember的一些小技巧总结
- linux常用命令(61):ps命令
- 仓储委外加工/周转加工
热门文章
- phpqrcode生成二维码
- java jframe_java中的JFrame | 学步园
- 【图形学】30 前向渲染多光照场景代码理解
- 本地项目提交代码到git仓库详细教程包含错误解决办法!!!
- 软件测试基础知识(思维导图)
- 100天精通Python(数据分析篇)——第72天:Pandas文本数据处理方法之判断类型、去除空白字符、拆分和连接
- chatgpt系列文章-23.2.15(主要还在发现chatgpt的不足,偏探索,像报告)
- Jupyter notebook爬取猫眼top100电影信息(Xpath)
- python drf_drf,_Python教程 | 登博教程
- It's not QA - From Google