R语言构建多元线性回归模型预测汽车的耗油效率
目录
确定研究目的以及确定因变量和自变量
数据预处理
缺失值处理
异常值处理
估计回归模型参数,建立模型
判断数据是否满足多重线性回归假设条件
(1)、线性
(2)、独立性
(3)、正态性
(4)、方差齐性
(5)、消除异方差
对模型进行回归检验
预测
确定研究目的以及确定因变量和自变量
研究目的:建立多元线性回归模型,预测汽车的耗油效率 MPG。本次实验的 basic 数据集包含 1 个因变量(mpg)和 5 个自变量(cylinders, displacement, horsepower, weight, acceleration)。其变量名称含义如下
数据预处理
缺失值处理
发现存在两个缺失值,并且定位缺失值位置,因缺失值较少,用对应序列平均值填充
异常值处理
通过箱型图发现存在异常值,因为数据较为集中,不能直接删除异常值,通过盖帽法对异常数据替换。
输出异常值
查询是否还有异常值,发现acceleration列还存在异常值,再次盖帽,发现无法盖帽替换异常值,最终通过删除异常值解决
估计回归模型参数,建立模型
将所有的参数代入建立模型,得到系数矩阵,仅有horsepower以及weight通过t检验,故只保留这两参数。
仅保留horsepower和weight建立模型,horsepower和weight均通过t检验最终得到的模型为Y=39.94+-0.023X1+-0.005X2(X1为horsepower,X2为weight)
判断数据是否满足多重线性回归假设条件
(1)、线性
观察horsepower与mpg的线性回归关系,相关程度为-8.03呈现强负相关关系
观察weight与mpg的线性回归关系,相关程度为-0.889呈现强负相关关系
(2)、独立性
两个观察值之间相互独立,通过【德宾-沃森】进行分析,一般来说 Durbin
Waston 检验值分布在 0-4 之间,越接近 2,观察值相互独立的可能性越大。DW值为1.0393接近于2并且p值<0.01,有理由认为观察值相互独立
(3)、正态性
结果展示,可以得知近似正态性,标准化残差的正态概率图,近似 一条直线,符合正态分布。
(4)、方差齐性
出来结果如下,由于 P 值<0.05,所以拒绝零假设,误差方差为异方差
(5)、消除异方差
稳健估计方法
NeweyWest()函数可以进行异方差和自相关稳健性Newey—West估计
稳健估计的结果
加权最小二乘方法
加权线性回归
方差齐性
结果分析,由于 P 值>0.05,所以选择零假设,误差方差不变,没有异方差的
存在
对模型进行回归检验
(1)模型拟合效果
自变量对因变量的解释程度可用 R^2(决定系数)来衡量。决定系数取值在 0-1
之间,R^2 越大模型拟合程度越高。本模型中 R^2=0.7815,即解释程度很高。
(2)回归模型显著性检验
对回归模型进行假设检验一般使用方差分析法(F 检验)
方差分析结果:F=577.7,p 值<0.05。所以模型具有统计学意义。
(3)回归系数显著性检验
对回归系数进行假设检验一般使用 t 检验方法。
t 检验结果:截距项和 x 因素的 p 值小于 0.05,具有统计学意义
预测
总结
新人博主,有什么不对的地方还望指正,谢谢大家
R语言构建多元线性回归模型预测汽车的耗油效率相关推荐
- R语言构建多元线性回归模型
R语言构建多元线性回归模型 对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法.多元线性回归的基本的分析方法与一元线性回归方法是类似的,我们首先需要对选取多元数据集并定义数 ...
- R语言实现多线性回归模型预测时间序列数据 MLR models in R
<!-- #此文主要针对统计基础比较薄弱(比如博主)利用多个模型言针对时间序列数据做预测用之MLR/多线性回归模型: --> <!--定义:人话就是给定一组数据集data={(x1, ...
- R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化
R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录
- R语言构建文本分类模型:文本数据预处理、构建词袋模型(bag of words)、构建xgboost文本分类模型、xgboost模型预测推理并使用混淆矩阵评估模型、可视化模型预测的概率分布
R语言构建文本分类模型:文本数据预处理.构建词袋模型(bag of words).构建xgboost文本分类模型.xgboost模型预测推理并使用混淆矩阵评估模型.可视化模型预测的概率分布 目录
- R语言构建logistic回归模型并评估模型:模型预测结果抽样、可视化模型分类预测的概率分布情况、使用WVPlots包绘制ROC曲线并计算AUC值
R语言构建logistic回归模型并评估模型:模型预测结果抽样.可视化模型分类预测的概率分布情况.使用WVPlots包绘制ROC曲线并计算AUC值 目录
- Python基于statsmodels包构建多元线性回归模型:模型构建、模型解析、模型推理预测
Python基于statsmodels包构建多元线性回归模型:模型构建.模型解析.模型推理预测 目录
- 【定量分析、量化金融与统计学】R语言:多元线性回归实例
今天来做一个R语言的多元线性回归的实例: 题目是这样的: 练习:度假村排名 旅游胜地,专门介绍高级度假和住宿的杂志<Spas>在"读者选择"评选的世界20家独立海滨精品 ...
- 基于R语言的多元线性回归--我国经济增长的定量研究
基于R语言的多元线性回归--我国经济增长的定量研究 一.实验介绍 1.1 实验内容 经济增长一直以来都是我国宏观经济政策的目标之一,研究影响经济增长的因素对促进我国经济快速发展有着重要意义.本实验运用 ...
- Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读
Python使用sklearn和statsmodels构建多元线性回归模型(Multiple Linear Regression)并解读 #仿真数据集(预测股票指数) 这里的目标是根据两个宏观经济变量 ...
最新文章
- 数据系列:如何在Windows Azure虚拟机上设置SQL Server
- Android源码下载总结
- Linux的10个游戏
- Spring Cloud Contract 契约测试实践
- 【Linux】安装配置Tomcat7
- 怎样理解阻抗匹配?---非常好
- 【转】Linux入门命令篇(简训)
- RAC+单实例DATAGUARD 配置
- Windows2003ServerEnterprise+Oracle11g+VMWorkstation7.1:在虚拟机下Windows系统
- Java中proc是什么意思,在java里头读取/proc/net/dev
- bzoj4636: 蒟蒻的数列
- 【译】x86程序员手册37-第10章 初始化
- Linux引导流程(第二版)
- 蓝桥杯 ALGO-31算法训练 开心的金明(01背包,动态规划)
- dom4j 中文api
- 链队列约瑟夫环c++代码_数据结构之约瑟夫环C语言实现
- Leetcode力扣 MySQL数据库 1384 按年度列出销售总额
- KETTLE将本地图片抽取到oracle库
- android文件恢复功能,安卓手机误删文件恢复?快速恢复办法
- 苹果手机打电话没有声音怎么回事_网页看视频没有声音怎么回事?