拓端tecdat|Matlab广义线性模型glm泊松回归的lasso、弹性网络正则化分类预测考试成绩数据和交叉验证可视化
原文链接:http://tecdat.cn/?p=24777
原文出处:拓端数据部落公众号
使用冗余预测变量构建数据集并使用lasso和 glm
识别这些预测变量 。
使用lasso
正则化去除冗余预测变量
创建一个X
包含 100 个观测值和 10 个预测变量的随机矩阵 。y
仅使用四个预测变量和少量噪声创建正态分布因变量 。
默认值
randn ;X*权重 + randn*0.1; % 小的附加噪音
执行lasso
正则化。
lasso
求第 75 个Lambda
值 的系数向量 B
。
lassoglm
识别并删除冗余预测变量。
相关 视频:Lasso回归、岭回归等正则化回归数学原理及R语言实例
Lasso回归、岭回归等正则化回归数学原理及R语言实例
广义线性模型的交叉验证lasso
正则化
从泊松模型构建数据,并使用lasso
确定重要的预测变量 。
创建具有 20 个预测变量的数据。仅使用三个预测变量加上一个常数来创建泊松因变量。
rng % 用于重现性randnexp(X)*weights + 1
构建数据的泊松回归模型的交叉验证lasso
正则化。
检查交叉验证图以查看Lambda
正则化参数的效果 。
Plot('CV');
legend
绿色圆圈和虚线定位 Lambda
交叉验证误差最小的位置。蓝色圆圈和虚线定位具有最小交叉验证误差加一个标准偏差的点。
找到对应于两个识别点的非零模型系数。
FitInf
find(B
FitInf
min1fnd(B)
来自最小加一标准误差点的系数正是用于创建数据的那些系数。
使用lasso
正则化预测值
加载 学生考试成绩数据集。将上次考试成绩转换为逻辑向量,其中 1
代表80以上0
的成绩, 代表80以下的成绩。
ynm = (y>=80);
将数据划分为训练集和测试集。
rng default % 设置可重复性的种子
Xi = X(iTain,:);
yran = yBinom
yTe = yBinom
对训练数据进行 3 折交叉验证,对广义线性模型回归执行lasso
正则化。假设 中的值 y
是二项分布的。选择对应于Lambda
最小预期偏差的模型系数 。
lasso(Trn,Tain,'binomial','CV',3);
ince = FitIiance;
FitIept
使用在上一步中找到的模型系数预测测试数据的考试成绩。使用 指定二项式因变量的链接函数 'logit'
。将预测值转换为逻辑向量。
使用混淆矩阵确定预测的准确性。
confuhart
该函数可以正确预测 31 个考试成绩。然而,该函数错误地预测了1名学生获得B或以上的成绩,4名学生获得B以下的成绩。
最受欢迎的见解
1.R语言多元Logistic逻辑回归 应用案例
2.面板平滑转移回归(PSTR)分析案例实现
3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
4.R语言泊松Poisson回归模型分析案例
5.R语言混合效应逻辑回归Logistic模型分析肺癌
6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现
7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病
8.python用线性回归预测股票价格
9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
拓端tecdat|Matlab广义线性模型glm泊松回归的lasso、弹性网络正则化分类预测考试成绩数据和交叉验证可视化相关推荐
- Python使用sklearn构建广义线性模型:泊松回归(Poisson regression)实战
Python使用sklearn构建广义线性模型:泊松回归(Poisson regression)实战 目录 Python使用sklearn构建广义线性模型:泊松回归(Poisson regressio ...
- 广义线性模型、Logistic、sigmoid、softmax、多分类、与大数据、优缺点
广义线性模型.广义线性模型的数学形式.Logistic回归.sigmoid函数.softmax函数.Logistic多分类.Logistic与大数据.Logistic回归优缺点总结 目录
- c++ error函数_R语言中广义线性模型(GLM)中的分布和连接函数分析
原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...
- 广义线性模型GLM、GLMM、LMM、MLM、GMM、GEE、广义线性模型GLM和广义线性混合模型的GLMM区别
R语言广义线性模型GLM.GLMM.LMM.MLM.GMM.GEE.广义线性模型GLM和广义线性混合模型的GLMM区别 目录
- 拓端tecdat荣获掘金社区入驻新人奖
2021年7月,由掘金发起了"入驻成长礼"颁奖活动.本次活动邀请到知名开发者.服务机构代表等业界人士. 据了解,掘金社区"新入驻创作者礼"主要对已经积累了一定历 ...
- 拓端tecdat荣获2022年度51CTO博主之星
相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生 ...
- Python使用sklearn构建广义线性模型:gamma回归(Gamma regression)实战
Python使用sklearn构建广义线性模型:gamma回归(Gamma regression)实战 目录 Python使用sklearn构建广义线性模型:gamma回归(Gamma regress ...
- Python使用sklearn构建广义线性模型:Tweedie回归(Tweedie regression)实战
Python使用sklearn构建广义线性模型:Tweedie回归(Tweedie regression)实战 目录 Python使用sklearn构建广义线性模型:Tweedie回归(Tweedie ...
- R语言惩罚逻辑回归、线性判别分析LDA、广义加性模型GAM、多元自适应回归样条MARS、KNN、二次判别分析QDA、决策树、随机森林、支持向量机SVM分类优质劣质葡萄酒十折交叉验证和ROC可视化
最近我们被客户要求撰写关于葡萄酒的研究报告,包括一些图形和统计输出. 介绍 数据包含有关葡萄牙"Vinho Verde"葡萄酒的信息.该数据集有1599个观测值和12个变量,分别是 ...
- 广义线性模型(逻辑回归、泊松回归)
线性回归模型也并不适用于所有情况,有些结果可能包含而元数据(比如正面与反面)或者计数数据,广义线性模型可用于解释这类数据,使用的仍然是自变量的线性组合. 目录 逻辑回归 使用statsmodels 使 ...
最新文章
- Padding Oracle Attack填充提示攻击-渗透测试
- windows phone开发第一步:搭建软件开发环境
- (转)搞定DC/DC电源转换方案设计,必看金律十一条
- git 本地推送本地仓库到远程
- 20181127-1 附加作业 软件工程原则的应用实例分析
- vmware虚拟化服务器cpu超线程,VMware vSphere的配置方法最佳方案从而提高性能
- 程序员为教师妻子开发专属应用;2020 最佳开源项目出炉;中国构建全星地量子通信网|开发者周刊
- js 去空格 和 获得字节数
- 从mp4,flv文件中解析出h264和aac,送解码器解码失败
- miracast和乐播投屏_【当贝市场】Windows 10 Mircast投屏到电视教程
- 洞察药监局数据,挖掘万亿价值
- numpy.dot()和x.dot(y)函数介绍和示例
- vue结合elmentui实现前端分页
- 【雅思】【大作文】【审题作业】关于同不同意的审题作业(重点)
- html 半个字符,半角字符什么意思
- PyTorch深度学习(B站刘二大爷)第九讲 多分类问题
- 用来在计算机各功能部件之间,广义相对论确认光在太阳附近会弯曲,引力透镜,水星进动等实验支持广义相对论。()...
- Better to follow, follow to be better(2019 ICCV)
- 【控制理论】状态空间模型、传递函数、差分方程的相互转换
- 苏州大学文正学院计算机组成期末,2020年苏州大学文正学院 五年一贯制高职 专转本机械电子工程...