全文链接:http://tecdat.cn/?p=18550

我根据泊松Poisson回归、GAM样条曲线模型对一个十字路口的骑自行车者的数量进行预测点击文末“阅读原文”获取完整代码数据)。

str(base)
'data.frame': 214 obs. $ 日期    : chr  "1-Apr" "2-Apr" "3-Apr7" "4-Apr" ...$ 最高温度  : num  46 62.1 63 51.1 63 48.9 48 55.9 66 73.9 ...$ 最低温度   : num  37 41 50 46 46 41 43 39.9 45 55 ...$ 降雨量  : num  0 0 0.03 1.18 0 0.73 0.01 0 0 0 ...$ 数量: int  606 2021 2470 723 2807 461 1222 1674 2375 3324 ...$ 温差  : num  9 21.1 13 5.1 17 7.9 5 16 21 18.9 ......

相关视频

使用Poisson回归预测周日、周一有多少骑自行车的人,天气情况是温度85F-70F没有下雨。我们创建一个预测数据框。

newbase = data.frame(DAY=as.factor(最高温度=c(85,85),最低温度=c(70,70,降雨量=c(0,0))

让我们创建一个包含所有解释变量的模型。

我们还添加一个虚拟变量来指示不下雨的日子,

summary(reg)
Coefficients:Estimate Std. Error z value Pr(|z|)
(Intercept)         6.8844970  0.0110463 623.241   2e-16 ***
最高温度              0.0210950  0.0003133  67.328   2e-16 ***
最低温度              -0.0114006  0.0003351 -34.024   2e-16 ***
降雨量            -0.6570450  0.0071899 -91.384   2e-16 ***
I(降雨量 == 0)TRUE  0.1303908  0.0033283  39.176   2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)Null deviance: 70021  on 213  degrees of freedom
Residual deviance: 26493  on 203  degrees of freedom
AIC: 28580
Number of Fisher Scoring iterations: 4

所以变量似乎都显著。如果我们要检查非线性效应,可以将样条曲线放在所有连续变量上

gam(数量~bs(最高温度)+bs(最低温度)+bs(降雨量)+I(降雨量==0),poisson


点击标题查阅往期内容

R语言淮河流域水库水质数据相关性分析、地理可视化、广义相加模型GAM调查报告

左右滑动查看更多

01

02

03

04

最高温度或最低温度

以及下面的降雨量曲线,最大观测值(3)与之前观测值(1.8)之间的线性平滑

我们还可以回归最小温度,以及最大和最小温度之间的温差(在线性模型中,模型是等效的,但是通过非线性变换,可以更简单地给出差异)

现在,我们可以比较这四个模型及其预测。例如,对于线性模型(虚拟变量表示没有下雨),

predict(reg,newdata=newbase,type="response se.fit=TRUE

对于星期一,我们获得λ的95%置信区间

P$fit[1]+c(-2,2)*P$se.fit[1]
[1] 3349.842 3401.395

对于星期日,95%置信区间为

[1] 2987.497 3033.861

我们可以可视化四个模型的置信区间

而周日,我们有

换句话说,通过更改模型,我们对预测的置信区间进行了更改(有时区间完全不相交)。


点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量》。

点击标题查阅往期内容

R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响

【视频】广义相加模型(GAM)在电力负荷预测中的应用

分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

实现广义相加模型GAM和普通最小二乘(OLS)回归

R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归

R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图

R语言广义相加(加性)模型(GAMs)与光滑函数可视化

R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类

R语言ISLR工资数据进行多项式回归和样条回归分析

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

R语言中的多项式回归、B样条曲线(B-spline Curves)回归

R语言广义相加模型 (GAMs)分析预测CO2时间序列数据

R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

Python用广义加性模型GAM进行时间序列分析

R语言广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者

R语言中的广义线性模型(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口

R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量相关推荐

  1. R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值(threshold)下的曲线

    R语言plotly可视化:使用plotly可视化模型预测真阳性率(True positive)TPR和假阳性率(False positive)FPR在不同阈值下的曲线(TPR and FPR at e ...

  2. R语言与数据分析练习:使用ARIMA模型预测网站访问量

    R语言与数据分析练习:使用ARIMA模型预测网站访问量 使用ARIMA模型预测网站访问量 一.实验背景: 随着流量的增大,某网站的数据信息量也在以一定的幅度增长 基于该网站2016年9月~2017年2 ...

  3. R-GIS: 如何用R语言实现GIS地理空间分析及模型预测

    前言:随着地理信息系统(GIS)和大尺度研究的发展,空间数据的管理.统计与制图变得越来越重要.R语言在数据分析.挖掘和可视化中发挥着重要的作用,其中在空间分析方面扮演着重要角色,与空间相关的包的数量也 ...

  4. R语言地理空间分析、可视化及模型预测

    随着地理信息系统(GIS)和大尺度研究的发展,空间数据的管理.统计与制图变得越来越重要.R语言在数据分析.挖掘和可视化中发挥着重要的作用,其中在空间分析方面扮演着重要角色,与空间相关的包的数量也达到1 ...

  5. R语言泊松Poisson回归模型分析案例

    这个问题涉及马蹄蟹研究的数据.研究中的每只雌性马蹄蟹都有一只雄性螃蟹贴在她的巢穴中.这项研究调查了影响雌蟹是否有其他男性居住在她附近的因素.被认为影响这一点的解释变量包括雌蟹的颜色(C),脊椎状况(S ...

  6. R语言使用mgcv包的gam函数拟合广义加性模型回归模型:使用predict函数和训练好的模型进行预测推理、使用ggplot2可视化预测值和实际值的曲线进行对比分析

    R语言使用mgcv包的gam函数拟合广义加性模型回归模型:使用predict函数和训练好的模型进行预测推理.使用ggplot2可视化预测值和实际值的曲线进行对比分析 目录

  7. R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择分类心肌梗塞数据模型案例...

    全文下载链接:http://tecdat.cn/?p=21444 在本文中,逻辑logistic回归是研究中常用的方法,可以进行影响因素筛选.概率预测.分类等,例如医学研究中高通里测序技术得到的数据给 ...

  8. R语言使用caret包构建遗传算法树模型(Tree Models from Genetic Algorithms )构建回归模型、通过method参数指定算法名称

    R语言使用caret包构建遗传算法树模型(Tree Models from Genetic Algorithms  )构建回归模型.通过method参数指定算法名称.通过trainControl函数控 ...

  9. R语言使用caret包构建随机森林模型(random forest)构建回归模型、通过method参数指定算法名称、通过ntree参数指定随机森林中树的个数

    R语言使用caret包构建随机森林模型(random forest)构建回归模型.通过method参数指定算法名称.通过ntree参数指定随机森林中树的个数 目录

最新文章

  1. 【百战GAN】二次元宅们,给自己做一个专属动漫头像可好!
  2. 微创社001期:从0开始创作第一本技术书
  3. JAVA的方法的定义和调用
  4. php 安装phalcon,安装phalcon
  5. 壳体花纹怎么设计_换热器设计大全
  6. MVP详细解析以及使用方法
  7. mysql 存储过程 out list_MySQL存储过程中的IN,OUT,INOUT类型 用法
  8. 食品安全事件曝光严重,SPC软件的应用刻不容缓
  9. win10 如何做到 C盘 的绝对干净,所有软件都安装到D盘,C盘只用来存操作系统。
  10. 解决 | 点击任务栏没有反应
  11. 标准差 php,标准偏差怎么算
  12. 从随机生成九宫格至随机生成数独游戏再至用回溯法实现数独的解
  13. Android 12 WiFi 架构
  14. win10 切换用户、注销、睡眠等
  15. 《途客圈创业记:不疯魔,不成活》一一2.11 途客圈旅行助手
  16. 25款很好看的液晶数字字体下载
  17. 问财爬虫Python第三方包,仅供学习使用
  18. 5个流水灯c语言程序,五种编程方式实现流水灯的单片机C程序
  19. 互联网迟到的80后:为什么中国出不了扎克伯格
  20. tansig与tanh激活函数

热门文章

  1. 【无标题】健身卡杀寇决山卡卡
  2. 印第安人的捕梦网 Dreamcatcher 与音乐——排箫
  3. 仿QQ空间图片放缩查看
  4. Android:三种Adapter的使用方法
  5. ARM Cortex-M 系列 MCU 芯片选型
  6. 正义之心读书笔记:第7章 自由和保守主义的本质——5大道德基础
  7. R语言入门1---R语言介绍以及学前注意事项
  8. 基于SpringBoot旅游信息管理系统网站
  9. 阿里技术专家甘盘:浅谈双十一背后的支付宝LDC架构和其CAP分析
  10. 天池龙珠训练营广东工业-林莉子学习笔记-Task1