最近在研究正则化方法,发现吉洪诺夫正则化就是统计里的岭回归,正好之前上课的时候遇到过鲍鱼年龄预测的问题,那就再跑跑代码吧
鲍鱼的年龄可以通过鲍鱼壳的“环数”来判断,但是获取这个“环数”是十分耗时的,需要锯开壳,然后在显微镜下观察得到。
可以通过鲍鱼的其他特征比如性别、长度、直径、高度、整体重量、去壳后重量、脏器重量、壳的重量等,通过机器学习的方法来预测其环数,从而得到年龄,具有很大的应用价值。
现有一份鲍鱼的数据集abalone.csv,该数据集有4177个数据样本,每个样本有9个特征,具体信息如下:
属性 数据类型 单位 内容描述
性别(Sex) 标称 M, F,I(infant)
长度(Length) 连续 毫米
直径(Diameter) 连续 毫米
高度(Height) 连续 毫米
整体重量(Whole weight) 连续 克
去壳后重量(Shucked weight) 连续 克
脏器重量(Viscera weight) 连续 克
壳的重量(Shell weight) 连续 克
环数(Rings) 连续

利用Matlab平台实现鲍鱼年龄的预测,主要分为数据导入、预处理、回归等步骤,直接上代码吧:

clear;%导入数据
data = importdata('abalone.txt');
[m,n] = size(data.data);dataX = data.data;%特征
dataY = data.textdata;%标签
dataY = cell2mat(dataY);%标准化
yMeans = mean(dataY);
for i = 1:myMat(i,:) = dataY(i,:)-yMeans;
endxMeans = mean(dataX);
xVars = var(dataX);
for i = 1:mxMat(i,:) = (dataX(i,:) - xMeans)./xVars;
end% 运算30次
testNum = 30;
weights = zeros(testNum, n);
for i = 1:testNumw = ridgeRegression(xMat, yMat, exp(i-10));weights(i,:) = w';
end% 画出随着参数lam
hold on
axis([-9 20 -0.5 0.5]);
xlabel log(lam);
ylabel weights;
for i = 1:nx = -9:20;y(1,:) = weights(:,i)';plot(x,y);
end

所需的函数ridgeRegression详见链接:
岭回归函数
数据集链接:
https://download.csdn.net/download/qq_38994076/47363926?spm=1001.2014.3001.5501

岭回归实现鲍鱼年龄预测 MATLAB实现相关推荐

  1. 线性回归实战---Abalone鲍鱼年龄预测

    线性回归实现Abalone鲍鱼年龄预测 文章目录 线性回归实现Abalone鲍鱼年龄预测 一.环境准备 数据集简介 二.线性回归基础知识 什么是线性回归? "最小二乘法" 求解线性 ...

  2. 预测算法-线性回归(鲍鱼年龄预测)

    预测算法-线性回归 面对可逆矩阵 线性回归(模型,策略,算法) 模型: h(x)=WTx+b h ( x ) = W T x + b h(x) = W^T x + b 损失函数: J(θ)=∑i=1N ...

  3. ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值年龄预测)问题的思路框架

    ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值年龄预测)问题的思路框架 目录 1.总体思路架构图 2.各个步骤详细图 1.总体思路架构图 2.各个步骤详细图

  4. 【数学建模】MATLAB应用实战系列(九十三)-岭回归应用案例(附MATLAB和Python代码)

    前言 岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息.降低精度为代价获得回归系数更为符合实际.更可靠的回归方法,对病态 ...

  5. 实战三十九:鲍鱼年龄预测热力图相关性分析

    首先是数据: Sex,Length,Diameter,Height,Whole,Shucked,Viscera,Shell,Rings M,0.455,0.365,0.095,0.514,0.2245 ...

  6. 案例 | 基于JMP Pro的Lasso及岭回归在水稻全基因组预测中的应用

    全基因组选择是21世纪动植物育种的一种重要的选择策略,其核心就是全基因组预测,即基于分布在整个基因组上的多样性分子标记来对育种值进行预测,为个体的选择提供依据.但目前提出的大多数全基因组预测方法都涉及 ...

  7. 基于PaddlePaddle框架的BP神经网络的鲍鱼年龄的预测

    # 经典的线性回归模型主要用来预测一些存在着线性关系的数据集.回归模型可以理解为:存在一个点集,用一条曲线去拟合它分布的过程.如果拟合曲线是一条直线,则称为线性回归.如果是一条二次曲线,则被称为二次回 ...

  8. 【sklearn】线性回归、最小二乘法、岭回归、Lasso回归

    文章目录 机器学习的sklearn库 一.回归分析 <1.1>线性回归 1.1.1.Python实现线性回归 <1.2>最小二乘法 1.2.1.MATLAB实现最小二乘法 1. ...

  9. 机器学习-分类算法-线性回归、梯度下降,过拟合欠拟合,岭回归11

    梯度下降重点 正规方程去进行房价预测 from sklearn.datasets import load_boston from sklearn.linear_model import LinearR ...

最新文章

  1. mysql (master/slave)复制原理及配置
  2. 基于consul实现微服务的服务发现和负载均衡
  3. mysql order by基于时间的盲注
  4. WM的Image格式分析
  5. jvm堆空间的常用参数设置
  6. int?id与id??1 的意思
  7. 20169210《Linux内核原理与分析》课程总结
  8. maven中如何打jar包
  9. 世界杯正在成为鸡肋!球迷越来越像傻瓜!
  10. VFP 常用 OCX 控件 注册
  11. 关于字符串的长度和大小的定义
  12. 自动登录163邮箱发送邮件(Python+Selenium)
  13. CSAPP实验记录(三):Attack lab
  14. class与subclass分析
  15. 仿造网易云音乐轮播图
  16. 如何关闭win10自带杀毒?
  17. Java并发编程:park线程
  18. hdu 多校赛 第二场
  19. 计算机四级信息安全工程师 题纲
  20. 验证哥德巴赫猜想:任何一个偶数(大于2)都可以由两个素数组成,要求输出两个素数差值最小的素数对

热门文章

  1. 统计建模--学习笔记1
  2. echarts地图设置legend_echarts中关于自定义legend图例文字
  3. 华为手机有线共享网络_华为怎么共享热点网络连接(图文)
  4. 程序员的10大境界,计算科学的10层楼,比尔盖茨看了会自卑,牛顿看了会落泪!
  5. 西工大机考《房地产法》大作业网考
  6. 教程篇(7.0) 06. FortiGate安全 日志记录和监控 ❀ Fortinet 网络安全专家 NSE 4
  7. odroidxu4linux,2019年值得期待的5个树莓派替代品
  8. 日本麻将记点器APP
  9. java生僻字输出为问号_csv导出姓名生僻字变问号
  10. 最大化参数 火车头_火车头采集(LocoySpider)设置技巧