1.SVM作用

对于给定的训练样本集D={(x1,y1), (x2,y2),… (xn,yn)},yi属于{-1,+1},希望能找出一个超平面,把不同类别的数据集分开,对于线性可分的数据集来说,这样的超平面有无穷多个,而最优的超平面即是分隔间距最大的中间那个超平面

2.硬间隔最大化



对于以上的KKT条件可以看出,对于任意的训练样本总有ai=0或者yif(xi) - 1=0即yif(xi) = 1
1)当ai=0时,代入最终的模型可得:f(x)=b,即所有的样本对模型没有贡献
2)当ai>=0,则必有yif(xi) = 1,注意这个表达式,代表的是所对应的样本刚好位于最大间隔边界上,是一个支持向量,这就引出一个SVM的重要性质:训练完成后,大部分的训练样本都不需要保留,最终的模型仅与支持向量有关。

关于对偶问题

  • 转化为对偶问题,具体就是把所有的约束条件,分别乘上拉格朗日乘子ai>=0,添加到需要优化的目标函数里,形成一个待优化的表达式
  • 为什么原问题能求解,却要转化为对偶问题?
    1)带约束的原问题求解比较困难,变成对偶问题可以把约束条件和待优化的目标融合在一个表达式里面
    2)拉格朗日对偶问题一般是凹函数(求最大值),即使原问题是非凸的,变成对偶问题更容易优化求解
    3)对偶问题能自然的引入核技巧,方便后续用来解决低维线性不可分的问题

3.软间隔最大化

前面我们是假定所有的训练样本在样本空间或特征空间中是严格线性可分的,即存在一个超平面能把不同类的样本完全分开,然鹅现实任务中很难确定这样的超平面(不管是线性超平面还是经过核变换到高维空间的超平面),所以引入松弛变量,允许一些样本出错,但我们希望出错的样本越少越好,所以松弛变量也有限制(注:公式中的松弛变量不是单单一个数,每个样本都有对应的松弛变量)。引入松弛变量的间隔问题成为软间隔


4.核函数

前面我们都是假设样本是线性可分的,虽然软间隔不完全可分,但大部分还是可分的。而现实任务中很可能遇到这样的情况,即不存在一个能够正确划分两个类别样本的超平面,对这样的问题,可以将样本从原始空间映射到一个更高维的特征空间中,使得样本在这个特征空间中线性可分。数学上可以证明,如果原始空间是有限维,即属性数有限,则一定存在一个高维特征空间使样本可分。

参考文章:《机器学习》——周志华

手撕SVM公式——硬间隔、软间隔、核技巧相关推荐

  1. 机器学习入门学习笔记:(4.2)SVM的核函数和软间隔

    前言 之前讲了有关基本的SVM的数学模型(机器学习入门学习笔记:(4.1)SVM算法).这次主要介绍介绍svm的核函数.软间隔等概念,并进行详细的数学推导.这里仅将自己的笔记记录下来,以便以后复习查看 ...

  2. 支持向量机SVM(三)软间隔与松弛变量的替代损失函数

    前两篇关于SVM的讨论中,我们只讨论了样本在原始空间和特征空间中线性可分的情况,但是,现实不可能这么完美,就算真的被找到了,但是世上没有免费的午餐,最后的结果很可能过拟合了. 所以要来讨论一下,怎么付 ...

  3. SVM支持向量机——核函数、软间隔

    支持向量机的目的是寻找一个能讲两类样本正确分类的超平面,很多时候这些样本并不是线性分布的. 由此,可以将原始特征空间映射到更高维的特征空间,使其线性可分.而且,如果原始空间是有限维,即属性数量有限, ...

  4. SVM原理篇之手撕SVM

    转载自:https://blog.csdn.net/c406495762/article/details/78072313 转载请注明作者和出处: https://zhuanlan.zhihu.com ...

  5. SVM之线性不可分与核技巧

    跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面两篇文章中,笔者通过两个角度来介绍了什么是支持向量机.不过说一千道一万,还是不如动手来做做.在本篇文章中,笔者将首先介绍如何 ...

  6. SVM详解(三)支持向量机使用核技巧

    文章目录 1. 数据升维处理非线性可分问题 2. CoverCoverCover 定理 3. 核函数 4. 常用核函数 5. 非线性支持向量机学习算法 1. 数据升维处理非线性可分问题 通过前面的学习 ...

  7. 【机器学习系列】之SVM硬间隔和软间隔

    作者:張張張張 github地址:https://github.com/zhanghekai [转载请注明出处,谢谢!] [机器学习系列]之SVM硬间隔和软间隔 [机器学习系列]之SVM核函数和SMO ...

  8. 机器学习-SVM硬间隔与软间隔:重要参数C

    SVM在软间隔数据上的推广 到这里,我们已经了解了线性SVC的基本原理,以及SVM如何被推广到非线性情况下,还了解了核函数的选择和应用.但实际上,我们依然没有完全了解SVM用于二分类的全貌.我们之前在 ...

  9. 支持向量机(SVM):超平面及最大间隔化、支持向量机的数学模型、软间隔与硬间隔、线性可分支持向量机、线性支持向量机、非线性支持向量机、核函数、核函数选择、SMO算法、SVM vs LR、优缺点

    支持向量机(SVM):超平面及最大间隔化.支持向量机的数学模型.软间隔与硬间隔.线性可分支持向量机.线性支持向量机.非线性支持向量机.核函数.核函数选择.SMO算法.SVM vs LR.优缺点 目录

最新文章

  1. Kubernetes学习笔记二:Namespace,Cgroups 的隔离与应用
  2. sap 成本中心下的po_SAP学习基础篇(23):CO模块-成本中心费用费率计划
  3. php如何对几G的文本数据去重,Linux下导出数据库文件进行统计+去重
  4. 点按钮ajax get方法修改0或1状态封装成函数
  5. step5 . day1 网络编程基础知识
  6. 「Luogu1552」[APIO2012]派遣
  7. html %3ca id=%3e,a.markdown
  8. matlab meshgrid
  9. 视差滚动(Parallax Scrolling)插件补充
  10. c++ STL 工程实践的15条建议
  11. 一文读懂生成对抗网络(GANs)
  12. 不容错过 DOCKERCON SF 2019 大会的 5 个理由
  13. 20191231每日一句
  14. Linux命令——timeout
  15. Android编译报 Removing unused resources requires unused code shrinking to be turned on
  16. HDRP高清渲染管线-学习资料汇总
  17. 尚德机构季报图解:净利1.79亿 实现连续四个季度盈利
  18. 1、异常值(outliers)检测综述:定义、检测方法、影响、修正
  19. 中美自动驾驶最新融资情况:千万级与十亿级美元的距离
  20. Source code license

热门文章

  1. android ios安裝,麻花影视最全安装途径 — 支持Android和iOS
  2. java.util.zip.ZipFile解压后被java占用问题。
  3. echarts geo 地图文字重叠(北京城区文字重叠优化)
  4. 草图大师SU导入Unity和虚幻UE4对比
  5. STM32和百度云-天工最新物联网开发板,B-L475E-IOT01A探索套件操作说明
  6. Replacing JNI Crashes by Exceptions on Android【转】
  7. Visual stuido 2010  sp1 微软官方下载地址
  8. 软件工程师的出路在哪里?
  9. 记录CARLA生成路径储存waypoint信息为txt文件
  10. TCL学习--语法置换(第一篇)