转自大神Jack王
https://www.cnblogs.com/blogwww/p/9498343.html

3.1 原始数据分析

1)测试数据为:wine data set,储存在chapter_WineClass.mat。classnumer = 3;wine,记录了178个样本的13个属性;wine_labels.178×1,记录了178个样本的各自类别标签。

2)数据的可视化:13个指标的属性值即数据的箱式图;数据的分维可视化图。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

% 画出测试数据的分维可视化图

figure

subplot(3,5,1);

hold on

for run = 1:178

    plot(run,wine_labels(run),'*');

end

xlabel('样本','FontSize',10);

ylabel('类别标签','FontSize',10);

title('class','FontSize',10);

for run = 2:14

    subplot(3,5,run);

    hold on;

    str = ['attrib ',num2str(run-1)];

    for i = 1:178

        plot(i,wine(i,run-1),'*');

    end

    xlabel('样本','FontSize',10);

    ylabel('属性值','FontSize',10);

    title(str,'FontSize',10);

end

3.2 模型建立及其实现

3.2.1 模型建立

  首先从原始数据中把训练集和测试集提取出来,然后进行预处理,之后用训练集对SVM进行训练,最后用得到的模型来预测测试集的分类标签,算法流程如图:

选定训练集和测试集 → 数据预处理 → 训练SVM → 分类准确率 → 预测(测试集)

3.2.2 MATLAB 实现

1) 选定测试集和训练集

该数据一共有三类,现将每个类别分为两组,重新组合数据,一部分为训练集(train_wine),一部分为测试集(test_wine)。

1

2

3

4

5

6

7

8

9

% 选定训练集和测试集

% 将第一类的1-30,第二类的60-95,第三类的131-153做为训练集

train_wine = [wine(1:30,:);wine(60:95,:);wine(131:153,:)];

% 相应的训练集的标签也要分离出来

train_wine_labels = [wine_labels(1:30);wine_labels(60:95);wine_labels(131:153)];

% 将第一类的31-59,第二类的96-130,第三类的154-178做为测试集

test_wine = [wine(31:59,:);wine(96:130,:);wine(154:178,:)];

% 相应的测试集的标签也要分离出来

test_wine_labels = [wine_labels(31:59);wine_labels(96:130);wine_labels(154:178)];

2) 数据预处理——归一化

   [0,1]区间归一化:y=(x-xmin)/(xmax-xmin);

   [-1,1]区间归一化:2*(x-xmin)/(xmax-xmin)-1;

  mapminmax 函数实现:y=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin,其中ymin和ymax是映射范围参数,可调节,默认值是-1和1。函数接口如下:

1

2

3

[y,ps] = mapminmax(x)

[y,ps] = mapminmax(x,ymin,ymax)

[x,ps] = mapminmax('reverse',y,ps)    %反归一化

  新的映射函数对x进行重新归一化方法:

1

2

3

4

[y,ps] = mapminmax(x);

ps.ymin = 0;

ps.ymax = 1;

[ynew,ps] = mapminmax(x,ps);

  wine 数据的归一化实现:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

%% 数据预处理

% 数据预处理,将训练集和测试集归一化到[0,1]区间

[mtrain,ntrain] = size(train_wine);

[mtest,ntest] = size(test_wine);

dataset = [train_wine;test_wine];

% mapminmax为MATLAB自带的归一化函数

[dataset_scale,ps] = mapminmax(dataset',0,1);

dataset_scale = dataset_scale';

train_wine = dataset_scale(1:mtrain,:);

test_wine = dataset_scale( (mtrain+1):(mtrain+mtest),: );

3) 分类及预测

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

%% SVM网络训练

model = svmtrain(train_wine_labels, train_wine, '-c 2 -g 1');

%% SVM网络预测

[predict_label, accuracy,dec_values] = svmpredict(test_wine_labels, test_wine, model);

%% 结果分析

% 测试集的实际分类和预测分类图

% 通过图可以看出只有一个测试样本是被错分的

figure;

hold on;

plot(test_wine_labels,'o');

plot(predict_label,'r*');

xlabel('测试集样本','FontSize',12);

ylabel('类别标签','FontSize',12);

legend('实际测试集分类','预测测试集分类');

title('测试集的实际分类和预测分类图','FontSize',12);

grid on;

3.3 案例扩展——归一化方式及核函数对准确了的影响

1)采用不同归一化方式的对比

a.不进行归一化处理

?

1

Accuracy = 39.3258% (35/89) (classification)

b.[-1,1]归一化

?

1

2

3

[dataset_scale,ps] = mapminmax(dataset',-1,1);

Accuracy = 97.7528% (87/89) (classification)

c.[0,1]归一化

?

1

2

3

[dataset_scale,ps] = mapminmax(dataset',0,1);

Accuracy = 98.8764% (88/89) (classification)

  不同的归一化对最后的准确率会有一定的影响。并不是任何问题都必须事先把原始数据进行归一化,要具体问题具体看待,测试表明有时候归一化后的测试准确率比没有归一化的准确率会低很多。

2) 采用不同核函数的对比

a.linear

'-c 2 -g 1 -t 0'

Accuracy = 97.7528% (87/89) (classification)

b.polynomial

'-c 2 -g 1 -t 1'

Accuracy = 98.8764% (88/89) (classification)

c.radial basis function

'-c 2 -g 1 -t 2'

Accuracy = 98.8764% (88/89) (classification)

d.sigmoid

'-c 2 -g 1 -t 3'

Accuracy = 52.809% (47/89) (classification)

LIBSVM (三) 葡萄酒种类识别相关推荐

  1. LIBSVM 多分类问题- 葡萄酒种类识别

    3.1 原始数据分析 1)测试数据为:wine data set,储存在chapter_WineClass.mat.classnumer = 3;wine,记录了178个样本的13个属性:wine_l ...

  2. 基于SVM的数据分类预测——意大利葡萄酒种类识别

    SVM的基础概念 SVM的主要思想是:建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化.SVM也是结构风险最小化方法的近似实现. SVM的分类和预测在现实生活中作用特别大,例如说今年的 ...

  3. 【深度学习】Keras自建神经网络模型实现133种狗的种类识别(记录笔记)

    〇.内容说明 主体部分资料来源于: 1.[深度学习图像识别课程]毕业项目:狗狗种类识别(2)代码实现 2.项目:实现一个狗品种识别算法App 3.Kaggle相关比赛:Dog Breed Identi ...

  4. 基于pytorch搭建神经网络的花朵种类识别(深度学习)

    基于pytorch搭建神经网络的花朵种类识别(深度学习) 文章目录 基于pytorch搭建神经网络的花朵种类识别(深度学习) 一.知识点 1.特征提取.神经元逐层判断 2.中间层(隐藏层) 3.学习权 ...

  5. 基于Python机器视觉的远程害虫种类识别和数量检测系统 报告+项目源码及数据

    摘 要 农业与民生和经济发展息息相关,对农业发展科学化的关注既是民生需求, 也是经济稳步发展的迫切需求.病虫害是影响农作物生长的重要因素,对农作物的产量和品质都能造成无法估计的损害. 针对目前广大农业 ...

  6. HighNewTech:支付宝全球首发5G手机,四大逆天功能(防骗三折叠气味识别自由飞)!

    High&NewTech:支付宝全球首发5G手机,四大逆天功能(防骗&三折叠&气味识别&自由飞)! 导读       2019年4月1日,支付宝,今天重磅发布!旗下首款 ...

  7. MAT之GRNN/PNN:基于GRNN、PNN两神经网络实现并比较鸢尾花(iris数据集)种类识别正确率、各个模型运行时间对比

    MAT之GRNN/PNN:基于GRNN.PNN两神经网络实现并比较鸢尾花(iris数据集)种类识别正确率.各个模型运行时间对比 目录 输出结果 实现代码 输出结果 实现代码 load iris_dat ...

  8. 神经网络实现猫的种类识别

    神经网络实现猫的种类识别 代码地址:https://github.com/yeLer/cat_kind 实现的主要部分有 简单的网络结构在猫的种类识别上的应用,测试准确率0.832 使用resNet5 ...

  9. 百度BML飞桨训练营(五)商品种类识别

    百度BML&飞桨训练营(五)商品种类识别 文章相关内容资料已经取得百度BML允许,仅用与交流学习,请不要用于商业传播. 这一期继续来手把手教学如何进行视觉上对商品饮料分类. 下载商品识别模板( ...

最新文章

  1. Java 编程语言中很少被人了解的特性-statement label
  2. 各个级别镜像之间的跳转模型
  3. 20165234 [第二届构建之法论坛] 预培训文档(Java版) 学习总结
  4. ios html gif 显示,显示gif时出现巨大的内存使用Swift iOS
  5. python idle 常规命令_Python的3种运行方式:命令行窗口、Python解释器、IDLE的实现
  6. spring cloud Eureka server 问题 Spring Cloud java.lang.TypeNotPresentException
  7. 终极算法【4】——联结学派
  8. Ubuntu 18.04 安装驱动
  9. VM296:1 Uncaught SyntaxError: Unexpected token u in JSON at position 0 at JSON.parse (anonymous)
  10. Unity 旋转角度计算
  11. 冒泡排序与快速排序比较
  12. 电脑控制手机,无需Root、无线连接,免费开源跨平台的scrcpy比其他收费软件还好用!
  13. PTMs-GPT,GPT2
  14. 计算机开机出现ROM,电脑无法开机并显示EXITING INTEL PXE ROM如何解决
  15. 商务智能-第六章 数据挖掘
  16. 小熊派移植 TencentOS-tiny+EC20+SAL框架对接 TCP/UDP 服务器
  17. 建“数字风洞”,永信至诚开启安全测试评估专业赛道
  18. 在vue中使用 百度地图
  19. 新浪押宝微博拖累利润 开支增长近2730万美元
  20. Mathematica导出数据

热门文章

  1. Swift编程十二(方法)
  2. 一起做RGB-D SLAM(4)
  3. 如何把位图转成矢量图
  4. 使用matlab深度学习工具箱实现CNN卷积神经网络训练仿真
  5. 微信团队分享:微信直播聊天室单房间1500万在线的消息架构演进之路
  6. c++中赋值运算符重载
  7. python进程process类返回值_Python 中的进程
  8. 检测国内大型网游戏交易站
  9. 让Firefox像vim一样操作
  10. php是什么电荷,分子中电荷变化种种 - 量子化学 - 小木虫 - 学术 科研 互动社区...