用R演示逻辑回归过程-值得收藏
理论
Logistic回归适用于二值响应变量(0,1)。模 型假 设Y服从二项分布,线性模型的拟合形式为:
其中,π= μ(Y)是Y的条件均值(即给定一系列X的值时Y =1的概率),(π/1-π)为Y=1时的优势比,log(π/1-π)为对数优势比。
案例
我们用婚外情数据即著名的“Fair’s Affairs”,取自于1969年《今日心理》所做的一个非常有代表性的调查,该数据从601个参与者身上收集了9个变量,包括一年来婚外私通的频率以及参与者性别、年龄、婚龄、是否有小孩、宗教信仰程度(5分制,1分表示反对,5分表示非常信仰)、学历、职业(排序后),还有对婚姻的自我评分( 1表示非常不幸福,5表示非常幸福)。
变量说明:
序号 | 1 | 2 | 3 | 4 | 5 |
变量 | affairs | gender | age | yearsmarried | children |
释义 | 一年内外遇次数 | 性别 | 年龄 | 婚龄 | 孩(N/Y) |
序号 | 6 | 7 | 8 | 9 | |
变量 | religiousness | education | occupation | rating | |
释义 | 宗教信仰程度 | 学历 | 职业 | 婚姻自我评分 |
首先做描述性分析
可以看出,52%的调查对象是女性,72%的人有孩子,样本年龄的中位数为32岁。对于响应变量,72%的调查对象表示过去一年中没有婚外情(451/601),而婚外偷腥的最多次数为12(占了6%)。
做变量转换(外遇转换为二值变量)
逻辑回归
从回归系数的p值(最后一栏)可以看到,性别、是否有孩子、学历和职业对方程的贡献都不显著。去除这些变量重新拟合模型。
新模型的每个回归系数都非常显著(p<0.05)。对两个模型进行比较。
结果的卡方值不显著(p=0.21),表明四个预测变量的新模型与九个完整预测变量的模型拟合程度一样。
解释参数
可以看到婚龄增加一年,婚外情的优势比将乘以1.11(保持年龄、宗教信仰和婚姻评定不变);相反,年龄增加一岁,婚外情的的优势比则乘以0.97。因此,随着婚龄的增加和年龄、宗教信仰与婚姻评分的降低,婚外情优势比将上升。因为预测变量不能等于0,截距项在此处没有什么特定含义。
——————————————
往期精彩:
今天,我改名了!
为什么是华为?关于华为被封锁的5个切面
粉丝专属优惠:当当年中大促,购书低至4折,快来薅死他
用R演示逻辑回归过程-值得收藏相关推荐
- R以逻辑回归为例介绍制作列线图(nomogram)的过程
R以逻辑回归为例介绍制作列线图(nomogram)的过程 目录 R以逻辑回归为例介绍制作列线图(nomogram)的过程 列线图
- R语言逻辑回归Logistic回归分析预测股票涨跌
最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出. 视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠心病风 ...
- R语言逻辑回归logistic regression对付费用户进行预测
对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率. 最近我们被客户要求撰写关于付费预测的研究报告,包括一些图形和统计输 ...
- R语言逻辑回归、方差分析 、伪R平方分析
目录 怎么做测试 假设条件 并非所有比例或计数都适用于逻辑回归分析 过度分散 伪R平方 测试p值 Logistic回归示例 模型拟合 系数和指数系数 方差分析 伪R平方 模型的整体p值 标准化残差图 ...
- R语言逻辑回归 logistic regression
R语言逻辑回归代码示例 rm(list=ls()) require(kernlab) data(spam) data <- spam n <- nrow(spam) id <- sa ...
- R语言逻辑回归详细代码:预测双十一顾客是否使用天猫优惠券
R语言逻辑回归详细代码:预测双十一顾客是否使用天猫优惠券 #[1,] "age" 年龄 #[2,] "job" 工作 #[3,] "marital&q ...
- 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...
- 数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC...
全文链接:http://tecdat.cn/?p=27384 在本文中,数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息(点击文末"阅读原文"获取完整代 ...
- R语言逻辑回归的预测概率怎么算
在R语言直接通过predict 计算 概率 手动计算可能不会, 我的逻辑回归模型如上所示, 预测就是 predict(fit.logit,newdata = data.frame(Pregnancie ...
- R语言逻辑回归logistic regression对用户收入进行预测
逻辑回归对用户收入进行预测 对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率. 对于付费用户预测,主要是思考收入由 ...
最新文章
- 红外线可程序化?遥控器Motedem控制自家居住环境
- [汇编语言]-第十章 ret,retf,call指令
- java中的正则表达式捕获组与引用的概念
- java安全编码指南之:Number操作
- python 点击按钮采集图片_python多线程采集图片
- MAC启动redis的目录
- 块裁剪后的矩形边界如何去掉_手持拍摄画面太抖?这节课教你如何快速稳定抖动的画面...
- 周鸿祎:不得不说的话
- SpringSocial业务系统与社交网站的绑定与解绑
- .net framework 4.0 0xc8000247错误解决
- 织梦采集插件-简单好用织梦采集插件
- 【大数据面试宝典】 第一篇 Hadoop 面试题
- C语言火车订票系统开发
- CentOS7常用软件安装配置说明
- Java中的UTF-8、UTF-16编码字符所占字节数
- 超详细的【区块链】技术介绍整理(七千余字+九大板块)
- html 两个时间戳相减,表格里两列时间点如何相减
- 【洛谷】P1067 多项式输出【模拟】
- oracle pga的作用,ORACLE PGA 的调整
- Python基础之集合set操作