目录

确定研究目的以及确定因变量和自变量

数据预处理

缺失值处理

异常值处理

估计回归模型参数,建立模型

判断数据是否满足多重线性回归假设条件

(1)、线性

(2)、独立性

(3)、正态性

(4)、方差齐性

(5)、消除异方差

对模型进行回归检验

预测


确定研究目的以及确定因变量和自变量

研究目的:建立多元线性回归模型,预测汽车的耗油效率 MPG。本次实验的 basic 数据集包含 1 个因变量(mpg)和 5 个自变量(cylinders, displacement, horsepower, weight, acceleration)。其变量名称含义如下

数据预处理

缺失值处理

发现存在两个缺失值,并且定位缺失值位置,因缺失值较少,用对应序列平均值填充

异常值处理

通过箱型图发现存在异常值,因为数据较为集中,不能直接删除异常值,通过盖帽法对异常数据替换。

输出异常值

查询是否还有异常值,发现acceleration列还存在异常值,再次盖帽,发现无法盖帽替换异常值,最终通过删除异常值解决

估计回归模型参数,建立模型

将所有的参数代入建立模型,得到系数矩阵,仅有horsepower以及weight通过t检验,故只保留这两参数。

仅保留horsepower和weight建立模型,horsepower和weight均通过t检验最终得到的模型为Y=39.94+-0.023X1+-0.005X2(X1为horsepower,X2为weight)

判断数据是否满足多重线性回归假设条件

(1)、线性

观察horsepower与mpg的线性回归关系,相关程度为-8.03呈现强负相关关系

观察weight与mpg的线性回归关系,相关程度为-0.889呈现强负相关关系

(2)、独立性

两个观察值之间相互独立,通过【德宾-沃森】进行分析,一般来说 Durbin

Waston 检验值分布在 0-4 之间,越接近 2,观察值相互独立的可能性越大。DW值为1.0393接近于2并且p值<0.01,有理由认为观察值相互独立

(3)、正态性

结果展示,可以得知近似正态性,标准化残差的正态概率图,近似 一条直线,符合正态分布。

(4)、方差齐性

出来结果如下,由于 P 值<0.05,所以拒绝零假设,误差方差为异方差

(5)、消除异方差

稳健估计方法

NeweyWest()函数可以进行异方差和自相关稳健性Newey—West估计

稳健估计的结果

加权最小二乘方法

加权线性回归

方差齐性

结果分析,由于 P 值>0.05,所以选择零假设,误差方差不变,没有异方差的

存在

对模型进行回归检验

(1)模型拟合效果

自变量对因变量的解释程度可用 R^2(决定系数)来衡量。决定系数取值在 0-1

之间,R^2 越大模型拟合程度越高。本模型中 R^2=0.7815,即解释程度很高。

(2)回归模型显著性检验

对回归模型进行假设检验一般使用方差分析法(F 检验)

方差分析结果:F=577.7,p 值<0.05。所以模型具有统计学意义。

(3)回归系数显著性检验

对回归系数进行假设检验一般使用 t 检验方法。

t 检验结果:截距项和 x 因素的 p 值小于 0.05,具有统计学意义

预测

总结

新人博主,有什么不对的地方还望指正,谢谢大家

R语言构建多元线性回归模型预测汽车的耗油效率相关推荐

  1. R语言构建多元线性回归模型

    R语言构建多元线性回归模型 对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法.多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数 ...

  2. R语言实现多线性回归模型预测时间序列数据 MLR models in R

    <!-- #此文主要针对统计基础比较薄弱(比如博主)利用多个模型言针对时间序列数据做预测用之MLR/多线性回归模型: --> <!--定义:人话就是给定一组数据集data={(x1, ...

  3. R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化

    R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录

  4. R语言构建文本分类模型:文本数据预处理、构建词袋模型(bag of words)、构建xgboost文本分类模型、xgboost模型预测推理并使用混淆矩阵评估模型、可视化模型预测的概率分布

    R语言构建文本分类模型:文本数据预处理.构建词袋模型(bag of words).构建xgboost文本分类模型.xgboost模型预测推理并使用混淆矩阵评估模型.可视化模型预测的概率分布 目录

  5. R语言构建logistic回归模型并评估模型:模型预测结果抽样、可视化模型分类预测的概率分布情况、使用WVPlots包绘制ROC曲线并计算AUC值

    R语言构建logistic回归模型并评估模型:模型预测结果抽样.可视化模型分类预测的概率分布情况.使用WVPlots包绘制ROC曲线并计算AUC值 目录

  6. Python基于statsmodels包构建多元线性回归模型:模型构建、模型解析、模型推理预测

    Python基于statsmodels包构建多元线性回归模型:模型构建.模型解析.模型推理预测 目录

  7. 【定量分析、量化金融与统计学】R语言:多元线性回归实例

    今天来做一个R语言的多元线性回归的实例: 题目是这样的: 练习:度假村排名 旅游胜地,专门介绍高级度假和住宿的杂志<Spas>在"读者选择"评选的世界20家独立海滨精品 ...

  8. 基于R语言的多元线性回归--我国经济增长的定量研究

    基于R语言的多元线性回归--我国经济增长的定量研究 一.实验介绍 1.1 实验内容 经济增长一直以来都是我国宏观经济政策的目标之一,研究影响经济增长的因素对促进我国经济快速发展有着重要意义.本实验运用 ...

  9. Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读

    Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读 #仿真数据集(预测股票指数) 这里的目标是根据两个宏观经济变量 ...

最新文章

  1. 数据系列:如何在Windows Azure虚拟机上设置SQL Server
  2. Android源码下载总结
  3. Linux的10个游戏
  4. Spring Cloud Contract 契约测试实践
  5. 【Linux】安装配置Tomcat7
  6. 怎样理解阻抗匹配?---非常好
  7. 【转】Linux入门命令篇(简训)
  8. RAC+单实例DATAGUARD 配置
  9. Windows2003ServerEnterprise+Oracle11g+VMWorkstation7.1:在虚拟机下Windows系统
  10. Java中proc是什么意思,在java里头读取/proc/net/dev
  11. bzoj4636: 蒟蒻的数列
  12. 【译】x86程序员手册37-第10章 初始化
  13. Linux引导流程(第二版)
  14. 蓝桥杯 ALGO-31算法训练 开心的金明(01背包,动态规划)
  15. dom4j 中文api
  16. 链队列约瑟夫环c++代码_数据结构之约瑟夫环C语言实现
  17. Leetcode力扣 MySQL数据库 1384 按年度列出销售总额
  18. KETTLE将本地图片抽取到oracle库
  19. android文件恢复功能,安卓手机误删文件恢复?快速恢复办法
  20. 苹果手机打电话没有声音怎么回事_网页看视频没有声音怎么回事?

热门文章

  1. php 乱码 amp 26472,9月轿车销量TOP10:卡罗拉反超雷凌,新宝来大涨102.6%
  2. 计算机二级Python真题(一)
  3. 网络通信基础 - 多路复用技术(频分多路复用、时分多路复用、波分多路复用)
  4. 计算机考试修改照片系统,怎么把照片变成10K的?
  5. PHP 写的旅游景点系统
  6. 云e办前端学习笔记(十一)员工基本资料管理
  7. 深圳市气象局华为云AI:无畏气象变幻,乘风踏浪而行
  8. nginx通过IP实现限流
  9. Tensorflow高阶内容(五)- Deep Learning
  10. 基于单片机温湿度光照自动晾衣架系统设计-毕设资料