TO 藤井树

回归是什么
如何在SPSS中操作
关于结果的解读和分析

札 记

  • TO 藤井树
  • 写在前面
  • 正餐开始
    • ① 回归是什么?
    • ② 在SPSS中如何操作?
    • ③ 关于结果的解读?
    • ④ 回归分析的诊断?
  • 总结

写在前面

最近看Xu 工作室的论文,涉及到一个多元线性回归的的内容,正好 “回归” 这一块一直都是不太懂的(当然自身对于这个名词也比较抵触),那就趁着这个机会好好学习一下下吧!

正餐开始

① 回归是什么?

回归就是通过变量的观测值(如年龄、BMI等)来建立与其他变量之间的因果关系(如心率)

比如上面这个栗子,我想研究一下年龄和BMI(自变量)与心率(因变量)之间的关系,就可以使用回归分析。

像我们这个栗子,因变量是连续数值型的(能取到坐标轴上一个一个点的),对于这种类型,我们就需要选择线性回归来进行分析(所不同的是若是一个变量则是一元线性回归,若是两个及以上变量则为多元线性回归)。

Note:确定用什么回归只看因变量,如果因变量是连续数值型的直接选择多元线性回归

② 在SPSS中如何操作?



将自变量、因变量放在正确的位置,然后将共线性诊断和德宾-沃森给点选上,接着点击“下一步”

在图中,将 ZRESID(标准化残差) 和 ZPRED(标准化预测值) 给点选上,同时将两个残差图显示出来,点击“继续”

由此可以得到回归分析的结果
我们只需要分析两张表:模型摘要和系数即可

③ 关于结果的解读?


首先看R方=0.114,意味着自变量BMI和年龄能够解释心率变化情况的11.4%(即心率变化只有11.4%是由BMI和年龄影响的

一般来讲,统计学中要求这个值为30%以上,但是实际结果中若大于10%即认为可以接受

其次看年龄和BMI能不能影响心率,若显著性<0.05,我们就认为是能够显著影响的

同时年龄部分的未标准化系数为-0.184,表明年龄和心率呈负相关关系(即年龄越高心率越低
同理可解释BMI与心率的关系。

同时还可以得到一个回归方程,即:
心率 = -0.184 × 年龄 + 0.744 × BMI + 65.788

④ 回归分析的诊断?

截止到这里,回归分析已经完成了,但是我们还需要对刚才的结果做一个诊断(如年龄对心率负向影响,BMI对心率正向影响),这个结果到底是不是正确的。

这就涉及到回归分析最初始的话题。回归分析要求变量之间是相互独立的,例如一个自变量是BMI,一个变量是体重就不行(因为BMI是由体重变化得出,这两个变量之间有非常强的共线关系);又比如受调者在一个空间下高度集中,如同样的环境下成长,则其心率、身体也会较为相似,也同样不满足相互独立的准则。

具体指标看VIF,VIF小于5则说明不存在多重共线性
同时, “容差” 即为 “Tolerance ”

第二个需要考察的就是样本的残差的正态性问题

用一个简单的例子说明一下下:
回归模型就类似于一件衣服,我们搜集到的变量就是我们的人,其实我们是想为我们这个人量身定制一个衣服来反映这个人的情况(相当于是为BMI何年龄量身定制一个模型,通过这个模型来表达变量之间的关系)如果这个衣服穿在身上完全合身的话,我们就说这个衣服做成功了。也就是说我们为我们的数据量身匹配了一个非常好的模型,那么他们之间就不存在多少残余(即不能匹配的位置)如果这个残余随机散乱分布的,则说明没有问题,意思是我们穿衣服多多少少有一些不合适(偶发性的),我们觉得这可以接受;但是如果这个衣服的某一个袖子特别短或者特别长,这个就是人工的问题了

所以出现偶发性的不合适,我们称为 “残差正态分布”,但是我们可以观测到我们的柱形比正态分布曲线高很多,所以这是不符合残差正态分布的

但是这也可以解释,毕竟我们的自变量只有11.%能被两个因变量解释。

总结

以上就是多元线性回归的内容,接下来还是继续啃文献⑧~

# 研究杂感 × 多元线性回归相关推荐

  1. 基于R语言的多元线性回归--我国经济增长的定量研究

    基于R语言的多元线性回归--我国经济增长的定量研究 一.实验介绍 1.1 实验内容 经济增长一直以来都是我国宏观经济政策的目标之一,研究影响经济增长的因素对促进我国经济快速发展有着重要意义.本实验运用 ...

  2. 南航数据分析与挖掘课设1(上)——基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测(R语言)

    基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测 摘要 在国民经济发展的过程中,国内生产总值(GDP)是指按国家市场价格计算的一个国家(或地区)所有常驻单位在一定时期内生产活动的 ...

  3. Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读

    Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读 #仿真数据集(预测股票指数) 这里的目标是根据两个宏观经济变量 ...

  4. R语言构建多元线性回归模型

    R语言构建多元线性回归模型 对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法.多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数 ...

  5. UA MATH571A 多元线性回归II 变量选择

    UA MATH571A 多元线性回归II 变量选择 多项式回归与交互项回归 阶数的确定 含质量型变量的回归 含质量型变量的交互项 二值变量与二值变量的交互项 二值变量与数量型变量的交互项 变量选择的准 ...

  6. python 多元线性回归_Python机器学习,多元线性回归分析问题

    @Author:润森,Runsen,公众号:润森笔记 什么是多元线性回归 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归.**事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组 ...

  7. R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

    在这篇文章中,我将对多元线性回归做同样的事情.我将得出阻塞的Gibbs采样器所需的条件后验分布.然后我将对采样器进行编码并使用模拟数据对其进行测试. 一个贝叶斯模型 假设我们有一个样本大小的​科目.我 ...

  8. android 揭示动画_遗传编程揭示具有相互作用的多元线性回归

    android 揭示动画 We all had some sort of experience with linear regression. It's one of the most used re ...

  9. 多元线性回归中多重共线性_多重共线性如何在线性回归中成为问题。

    多元线性回归中多重共线性 Linear Regression is one of the simplest and most widely used algorithms for Supervised ...

最新文章

  1. 大型数据库设计原则与技巧
  2. 17-Translation (XLAT) Tables Library
  3. Mybatis-Plus入门之通用CRUD+基本配置介绍
  4. linux卸载pci驱动,linux的PCI驱动固件问题
  5. CSS3 -webkit-transition(属性渐变)
  6. SQLServer数据库文件组相关知识笔记
  7. 显示桌面,原来这么简单的
  8. 如何用数学方法估算一个女生前男友的数量?
  9. node aws 内存溢出_在AWS Elastic Beanstalk上运行生产Node应用程序的现实
  10. java跑批任务_【spring配置】——spring整合Quartz定时器
  11. 工作分流是什么意思_【嘉陵特装要闻】重庆嘉陵召开持续推进职工分流安置工作布置会...
  12. https://sysdig.com/
  13. 网站安全配置---挂载路由导航
  14. 循环队列 - 顺序存储结构
  15. 数据赋能变现时代,应用有哪些有效的变现方式?
  16. java浮点数转二进制_浮点数转换成二进制
  17. 平面图判连通 蓝桥杯模拟赛题
  18. 怎么用imp命令把dmp文件从本地导入到远处的数据库服务器,用imp命令导入dmp文件后,数据库什么也没有...
  19. 红米开发版刷机教程_红米K20开发版刷机包(官方系统最新完整固件升级包V20.1.9MIUI开发版)...
  20. 21. 查询表sc——查询平均成绩大于等于90分的学生学号和平均成绩

热门文章

  1. 脚本 -- 如何在脚本中自动跳过(Y/N)确认
  2. (远翔新料)FP5207B DFN-10L(EP) 大功率升压恒压芯片
  3. Mac九大修图神器你值得拥有,分分钟打造时尚设计大片!
  4. 大数据揭晓:复联4上映4天破20亿,万达影院2018年140.88亿居榜首
  5. 检查echo服务(TCP),quote服务(qotd)正在运行漏洞解决方案
  6. 当你对未来迷茫的时候,请打开这个锦
  7. 利来英超体育预测:萨卡不可阻挡,助力阿森纳向冠军冲锋
  8. 基于php_thinphp_vue养生馆保健品购物商城网站
  9. Linux类似迅雷的下载利器uGet
  10. 比较全的工资待遇搜集