作者 | 结实来源 | DATA江湖

理论

Logistic回归适用于二值响应变量(0,1)。模 型假 设Y服从二项分布,线性模型的拟合形式为:

其中,π= μ(Y)是Y的条件均值(即给定一系列X的值时Y =1的概率),(π/1-π)为Y=1时的优势比,log(π/1-π)为对数优势比。

案例

我们用婚外情数据即著名的“Fair’s Affairs”,取自于1969年《今日心理》所做的一个非常有代表性的调查,该数据从601个参与者身上收集了9个变量,包括一年来婚外私通的频率以及参与者性别、年龄、婚龄、是否有小孩、宗教信仰程度(5分制,1分表示反对,5分表示非常信仰)、学历、职业(排序后),还有对婚姻的自我评分( 1表示非常不幸福,5表示非常幸福)。

变量说明:

序号 1 2 3 4 5
变量 affairs gender age yearsmarried children
释义 一年内外遇次数 性别 年龄 婚龄 孩(N/Y)
序号 6 7 8 9
变量 religiousness education occupation rating
释义 宗教信仰程度 学历 职业 婚姻自我评分

首先做描述性分析


    可以看出,52%的调查对象是女性,72%的人有孩子,样本年龄的中位数为32岁。对于响应变量,72%的调查对象表示过去一年中没有婚外情(451/601),而婚外偷腥的最多次数为12(占了6%)。

做变量转换(外遇转换为二值变量

逻辑回归

从回归系数的p值(最后一栏)可以看到,性别、是否有孩子、学历和职业对方程的贡献都不显著。去除这些变量重新拟合模型。
新模型的每个回归系数都非常显著(p<0.05)。对两个模型进行比较。

结果的卡方值不显著(p=0.21),表明四个预测变量的新模型与九个完整预测变量的模型拟合程度一样。

解释参数

可以看到婚龄增加一年,婚外情的优势比将乘以1.11(保持年龄、宗教信仰和婚姻评定不变);相反,年龄增加一岁,婚外情的的优势比则乘以0.97。因此,随着婚龄的增加和年龄、宗教信仰与婚姻评分的降低,婚外情优势比将上升。因为预测变量不能等于0,截距项在此处没有什么特定含义。

——————————————

往期精彩:

  • 今天,我改名了!

  • 为什么是华为?关于华为被封锁的5个切面

  • 粉丝专属优惠:当当年中大促,购书低至4折,快来薅死他

用R演示逻辑回归过程-值得收藏相关推荐

  1. R以逻辑回归为例介绍制作列线图(nomogram)的过程

    R以逻辑回归为例介绍制作列线图(nomogram)的过程 目录 R以逻辑回归为例介绍制作列线图(nomogram)的过程 列线图

  2. R语言逻辑回归Logistic回归分析预测股票涨跌

    最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出. 视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠心病风 ...

  3. R语言逻辑回归logistic regression对付费用户进行预测

    对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率. 最近我们被客户要求撰写关于付费预测的研究报告,包括一些图形和统计输 ...

  4. R语言逻辑回归、方差分析 、伪R平方分析

    目录 怎么做测试 假设条件 并非所有比例或计数都适用于逻辑回归分析 过度分散 伪R平方 测试p值 Logistic回归示例 模型拟合 系数和指数系数 方差分析 伪R平方 模型的整体p值 标准化残差图 ...

  5. R语言逻辑回归 logistic regression

    R语言逻辑回归代码示例 rm(list=ls()) require(kernlab) data(spam) data <- spam n <- nrow(spam) id <- sa ...

  6. R语言逻辑回归详细代码:预测双十一顾客是否使用天猫优惠券

    R语言逻辑回归详细代码:预测双十一顾客是否使用天猫优惠券 #[1,] "age" 年龄 #[2,] "job" 工作 #[3,] "marital&q ...

  7. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  8. 数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC...

    全文链接:http://tecdat.cn/?p=27384 在本文中,数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息(点击文末"阅读原文"获取完整代 ...

  9. R语言逻辑回归的预测概率怎么算

    在R语言直接通过predict 计算 概率 手动计算可能不会, 我的逻辑回归模型如上所示, 预测就是 predict(fit.logit,newdata = data.frame(Pregnancie ...

  10. R语言逻辑回归logistic regression对用户收入进行预测

    逻辑回归对用户收入进行预测 ​ 对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率. 对于付费用户预测,主要是思考收入由 ...

最新文章

  1. 红外线可程序化?遥控器Motedem控制自家居住环境
  2. [汇编语言]-第十章 ret,retf,call指令
  3. java中的正则表达式捕获组与引用的概念
  4. java安全编码指南之:Number操作
  5. python 点击按钮采集图片_python多线程采集图片
  6. MAC启动redis的目录
  7. 块裁剪后的矩形边界如何去掉_手持拍摄画面太抖?这节课教你如何快速稳定抖动的画面...
  8. 周鸿祎:不得不说的话
  9. SpringSocial业务系统与社交网站的绑定与解绑
  10. .net framework 4.0 0xc8000247错误解决
  11. 织梦采集插件-简单好用织梦采集插件
  12. 【大数据面试宝典】 第一篇 Hadoop 面试题
  13. C语言火车订票系统开发
  14. CentOS7常用软件安装配置说明
  15. Java中的UTF-8、UTF-16编码字符所占字节数
  16. 超详细的【区块链】技术介绍整理(七千余字+九大板块)
  17. html 两个时间戳相减,表格里两列时间点如何相减
  18. 【洛谷】P1067 多项式输出【模拟】
  19. oracle pga的作用,ORACLE PGA 的调整
  20. Python基础之集合set操作

热门文章

  1. CleanMyMac X 4.9 for Mac电脑清理软件 中文语言免费版
  2. 2021 年 7 月程序员工资统计,最赚钱的岗位出炉。。
  3. 线程池是如何重复利用空闲线程的?
  4. Cglib 如何实现多重代理?
  5. 80%的Oracle JDK用户正在寻找免费的替代品!!!
  6. 来感受一下别人的密码
  7. 推荐一些学习方面的公众号
  8. Linux服务之cobbler批量部署篇
  9. 计算机二级-C语言-对标志位的巧妙使用。对二维数组数据进行处理。对文件进行数据输入。...
  10. es6 属性及常用新属性汇总