岭回归实现鲍鱼年龄预测 MATLAB实现
最近在研究正则化方法,发现吉洪诺夫正则化就是统计里的岭回归,正好之前上课的时候遇到过鲍鱼年龄预测的问题,那就再跑跑代码吧
鲍鱼的年龄可以通过鲍鱼壳的“环数”来判断,但是获取这个“环数”是十分耗时的,需要锯开壳,然后在显微镜下观察得到。
可以通过鲍鱼的其他特征比如性别、长度、直径、高度、整体重量、去壳后重量、脏器重量、壳的重量等,通过机器学习的方法来预测其环数,从而得到年龄,具有很大的应用价值。
现有一份鲍鱼的数据集abalone.csv,该数据集有4177个数据样本,每个样本有9个特征,具体信息如下:
属性 数据类型 单位 内容描述
性别(Sex) 标称 M, F,I(infant)
长度(Length) 连续 毫米
直径(Diameter) 连续 毫米
高度(Height) 连续 毫米
整体重量(Whole weight) 连续 克
去壳后重量(Shucked weight) 连续 克
脏器重量(Viscera weight) 连续 克
壳的重量(Shell weight) 连续 克
环数(Rings) 连续
利用Matlab平台实现鲍鱼年龄的预测,主要分为数据导入、预处理、回归等步骤,直接上代码吧:
clear;%导入数据
data = importdata('abalone.txt');
[m,n] = size(data.data);dataX = data.data;%特征
dataY = data.textdata;%标签
dataY = cell2mat(dataY);%标准化
yMeans = mean(dataY);
for i = 1:myMat(i,:) = dataY(i,:)-yMeans;
endxMeans = mean(dataX);
xVars = var(dataX);
for i = 1:mxMat(i,:) = (dataX(i,:) - xMeans)./xVars;
end% 运算30次
testNum = 30;
weights = zeros(testNum, n);
for i = 1:testNumw = ridgeRegression(xMat, yMat, exp(i-10));weights(i,:) = w';
end% 画出随着参数lam
hold on
axis([-9 20 -0.5 0.5]);
xlabel log(lam);
ylabel weights;
for i = 1:nx = -9:20;y(1,:) = weights(:,i)';plot(x,y);
end
所需的函数ridgeRegression详见链接:
岭回归函数
数据集链接:
https://download.csdn.net/download/qq_38994076/47363926?spm=1001.2014.3001.5501
岭回归实现鲍鱼年龄预测 MATLAB实现相关推荐
- 线性回归实战---Abalone鲍鱼年龄预测
线性回归实现Abalone鲍鱼年龄预测 文章目录 线性回归实现Abalone鲍鱼年龄预测 一.环境准备 数据集简介 二.线性回归基础知识 什么是线性回归? "最小二乘法" 求解线性 ...
- 预测算法-线性回归(鲍鱼年龄预测)
预测算法-线性回归 面对可逆矩阵 线性回归(模型,策略,算法) 模型: h(x)=WTx+b h ( x ) = W T x + b h(x) = W^T x + b 损失函数: J(θ)=∑i=1N ...
- ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值年龄预测)问题的思路框架
ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值年龄预测)问题的思路框架 目录 1.总体思路架构图 2.各个步骤详细图 1.总体思路架构图 2.各个步骤详细图
- 【数学建模】MATLAB应用实战系列(九十三)-岭回归应用案例(附MATLAB和Python代码)
前言 岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息.降低精度为代价获得回归系数更为符合实际.更可靠的回归方法,对病态 ...
- 实战三十九:鲍鱼年龄预测热力图相关性分析
首先是数据: Sex,Length,Diameter,Height,Whole,Shucked,Viscera,Shell,Rings M,0.455,0.365,0.095,0.514,0.2245 ...
- 案例 | 基于JMP Pro的Lasso及岭回归在水稻全基因组预测中的应用
全基因组选择是21世纪动植物育种的一种重要的选择策略,其核心就是全基因组预测,即基于分布在整个基因组上的多样性分子标记来对育种值进行预测,为个体的选择提供依据.但目前提出的大多数全基因组预测方法都涉及 ...
- 基于PaddlePaddle框架的BP神经网络的鲍鱼年龄的预测
# 经典的线性回归模型主要用来预测一些存在着线性关系的数据集.回归模型可以理解为:存在一个点集,用一条曲线去拟合它分布的过程.如果拟合曲线是一条直线,则称为线性回归.如果是一条二次曲线,则被称为二次回 ...
- 【sklearn】线性回归、最小二乘法、岭回归、Lasso回归
文章目录 机器学习的sklearn库 一.回归分析 <1.1>线性回归 1.1.1.Python实现线性回归 <1.2>最小二乘法 1.2.1.MATLAB实现最小二乘法 1. ...
- 机器学习-分类算法-线性回归、梯度下降,过拟合欠拟合,岭回归11
梯度下降重点 正规方程去进行房价预测 from sklearn.datasets import load_boston from sklearn.linear_model import LinearR ...
最新文章
- mysql (master/slave)复制原理及配置
- 基于consul实现微服务的服务发现和负载均衡
- mysql order by基于时间的盲注
- WM的Image格式分析
- jvm堆空间的常用参数设置
- int?id与id??1 的意思
- 20169210《Linux内核原理与分析》课程总结
- maven中如何打jar包
- 世界杯正在成为鸡肋!球迷越来越像傻瓜!
- VFP 常用 OCX 控件 注册
- 关于字符串的长度和大小的定义
- 自动登录163邮箱发送邮件(Python+Selenium)
- CSAPP实验记录(三):Attack lab
- class与subclass分析
- 仿造网易云音乐轮播图
- 如何关闭win10自带杀毒?
- Java并发编程:park线程
- hdu 多校赛 第二场
- 计算机四级信息安全工程师 题纲
- 验证哥德巴赫猜想:任何一个偶数(大于2)都可以由两个素数组成,要求输出两个素数差值最小的素数对
热门文章
- 统计建模--学习笔记1
- echarts地图设置legend_echarts中关于自定义legend图例文字
- 华为手机有线共享网络_华为怎么共享热点网络连接(图文)
- 程序员的10大境界,计算科学的10层楼,比尔盖茨看了会自卑,牛顿看了会落泪!
- 西工大机考《房地产法》大作业网考
- 教程篇(7.0) 06. FortiGate安全 日志记录和监控 ❀ Fortinet 网络安全专家 NSE 4
- odroidxu4linux,2019年值得期待的5个树莓派替代品
- 日本麻将记点器APP
- java生僻字输出为问号_csv导出姓名生僻字变问号
- 最大化参数 火车头_火车头采集(LocoySpider)设置技巧