线性、非线性分类器&数据的线性、非线性

一、线性分类器:

有无数个可划分这两个线性可分类的超平面

在二维空间里面,一个线性分类器是一条线。图14.8展示了五个分类例子。这些线有一个函数形式w1x1­+wx2=b。线性分类器的分类规则是:如果w1x1­+wx2>b,就把一个文档归类为,如果w1x1­+wx2<=b,就把它归类为。在这里,(x1,x2)T是文档的二维向量表示,(w1,w2)是参数向量,和b一起决定决策边界。此外,在图 15.7中给出了线性分类器的另一种几何解释。

正如我们之前在公式 140中处理的那样,我们可以通过定义一个超平面将一个二维线性分类器映射到更高维空间,这里我重复一下之前的公式,即公式 144:

然后,分类标准更改为:如果WtX>b,就归类为一类,如果WtX<b,就归类为另一类。我们把使用的超平面作为一个线性分类器的决策超平面。

图14.9 线性分类算法

图 14.9展示的是在M维空间中对应的线性分类算法。首先,从给出的这个简化算法表述来看,线性分类似乎是很简单的。然而,困难的是线性分类器的训练,也就是基于数据集来确定参数和b。我们用于评估学习算法性能的标准是通过比较经过学习得到的线性分类器在新数据上的表现效果来确定的,通常会有一些学习算法最后会计算出优于其它算法的参数。

二、非线性分类器:

图14.11 非线性问题

非线性分类器的一个典型例子就是kNN。从图 14.6这个例子可以看出,kNN的非线性是直观清晰的。kNN的决策边界(如14.6的 两条线 )是局部线性划分,但通常有一个复杂的形状,并不等同于二维空间中的一条线或是更高维空间中的一条超平面。图 14.11是另一个非线性问题的例子:在 分布和 分布中没有一条很好的线性分割线,因为在图的左上角还有一个环形包围的“区域”。线性分类器会误分圆形内部的部分,所以在处理这种类型的问题时,如果训练集足够大的话,像kNN这样的非线性分类器反而会表现得更加精确。

如果一个问题是非线性问题并且它的类边界不能够用线性超平面估计得很好,那么非线性分类器通常会比线性分类器表现得更精准。如果一个问题是线性的,那么最好使用简单的线性分类器来处理。或者将需把数据映射到一个更高维的核空间,使数据呈线性分布,实现非线性数据到线性数据的转换,从而对非线性数据进行分类。

三、线性数据和非线性数据

简单讲,线性指量与量之间按比例、成直线的关系,在空间和时间上代表规则和光滑的运动;而非线性则指不按比例、不成直线的关系,代表不规则的运动和突变。我们说,线性关系是互不相干的独立关系,非线性则是相互作用,而正是这种相互作用,使得整体不再是简单地等于部分之和,而可能出现不同于"线性叠加"的增益或亏损。如问:两个眼睛的视敏度是一个眼睛的几倍?很容易想到的是两倍,可实际是 6-10倍!这就是非线性:1+1不等于2。再比如,激光的生成就是非线性的!当外加电压较小时,激光器犹如普通电灯,光向四面八方散射;而当外加电压达到某 一定值时,会突然出现一种全新现象:受激原子好像听到“向右看齐”的命令,发射出相位和方向都一致的单色光,就是激光。 
       具体从相互关联的两个角度来看,线性满足了两点,其一:叠加原理成立;其二:物理变量间的函数关系是直线,变量间的变化率是恒量。相应地非线性概念就可以界定为:

其二,作为等价的另—种表述,我们可以从另一个角度来理解非线性:在用于描述—个系统的一套确定的物理变量中,一个系统的—个变量最初的变化所造成的此变量或其它变量的相应变化是不成比例的,换言之,变量间的变化率不是恒量,函数的斜率在其定义域中有不存在或不相等的地方,概括地说,就是物理变量间的一级增量关系在变量的定义域内是不对称的。可以说,这种对称破缺是非线性关系的最基本的体现,也是非线性系统复杂性的根源。对非线性概念的这两种表述实际上是等价的,其叠加原理不成立必将导致其二物理变量关系不对称;反之,如果物理变量关系不对称,那么叠加原理将不成立。之所以采用了两种表述,是因为在不同的场合,对于不同的对象,两种表述有各自的方便之处,如前者对于考察系统中整体与部分的关系、微分方程的性质是方便的,后者对于考察特定的变量间的关系(包括变量的时间行为)将是方便的。 
      当然,对于线性规划问题,我们已有通用解法,而非线性规划的各种算法大多有自己特定的适用范围,都有一定的局限性,到目前为止还没有适合于各种非线性规划问题的一般算法。这正是需要人们进一步研究的课题。

线性和非线性对于函数:

1. 线性linear,指量与量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数;
   非线性non-linear则指不按比例、不成直线的关系,一阶导数不为常数。
2. 线性的可以认为是1次曲线,比如y=ax+b ,即成一条直线
   非线性的可以认为是2次以上的曲线,比如y=ax^2+bx+c,(x^2是x的2次方),即不为直线的即可
3. 两个变量之间的关系是一次函数关系的——图象是直线,这样的两个变量之间的关系就是“线性关系”;
   如果不是一次函数关系的——图象不是直线,就是“非线性关系
4. “线性”与“非线性”,常用于区别函数y = f (x)对自变量x的依赖关系。线性函数即一次函数,其图像为一条直线。其它函数则为非线性函数,其图像不是直线。
  线性,指量与量之间按比例、成直线的关系,在空间和时间上代表规则和光滑的运动;而非线性则指不按比例、不成直线的关系,代表不规则的运动和突变。 
  比如,普通的电阻是线性元件,电阻R两端的电压U,与流过的电流I,呈线性关系,即R=U/I,R是一个定数。二极管的正向特性,就是一个典型的非线性关系,二极管两端的电压u,与流过的电流i不是一个固定的比值,即二极管的正向电阻值,是随不同的工作点(u、i)而不同的。
5. 在数学上,线性关系是指自变量x与因变量yo之间可以表示成y=ax+b ,(a,b为常数),即说x与y之间成线性关系。
   不能表示成y=ax+b ,(a,b为常数),即非线性关系,非线性关系可以是二次,三次等函数关系,也可能是没有关系。

线性和非线性对于向量:

线性表示定义:给定向量组A:α1、α2、……、αm和向量β,如果存在一组数λ1、λ2、……、λm使β=λ1α1+λ2α2+……+λmαm,则向量β是向量组A的线性组合,这时称向量β能由向量组A线性表示

1、向量组B=(β1,β2,……,βm)能由向量组A(α1,α2,……,αm)线性表示的必要条件是矩阵A=(α1,α2,……,αm)的秩等于矩阵B=(α1,α2,……,αm,B)的秩,而非充要条件,因为两个矩阵的秩相同,并不代表它们之间可以互相线性表示。

注意,此处向量组R(B)指的是R(A,B)

2.向量组B能由向量组A线性表示,则向量组B的秩不大于向量A的秩。反之不一定成立。

3.① 一个向量可由向量组中其余向量线性表示,前提是这个向量组线性相关。

②但线性相关的向量组中并不是任一向量都可由其余向量线性表示。

③但当其余向量线性无关时,这个向量必可由其余向量线性表示。

4.零向量可由任一组向量线性表示。

5.向量组α1,α2,α3,……,αm中每个向量都可由向量组本身线性表示。

6.任一n唯向量α=(α1,α2,……,αm)都可由n唯单位向量组线性表示。

7.设α1,α2,α3,……,αm线性无关,而α1,α2,……,αm,β线性相关,则β可由α1,α2,α3,……,αm线性表示,且表示是唯一的。

因此,维数越高的数据越难线性表示。高光谱数据属于高维数据,因此很难线性表示,属于非线性数据,一般的线性分类器不能有效地分类,多用非线性分类器。

线性、非线性分类器数据的线性、非线性相关推荐

  1. 线性分类器与非线性分类器的区别是什么?有哪些优劣特性?

    线性分类器与非线性分类器的区别是什么?有哪些优劣特性? 线性分类器 线性分类器就是用一个"超平面"将两个样本隔离开,如:   (1)二维平面上的两个样本用一条直线来进行分类:    ...

  2. 线性分类器与非线性分类器

    线性分类器和非线性分类器是我们经常说的词汇,然而我却并不知道他的真正含义,上网搜索了一下,材料也是很少.整理如下: 对于二类的情形: 线性分类:是用一个超平面能将正负样本区分开,表达式为y=wx,这里 ...

  3. Matlab最小二乘法:线性最小二乘、加权线性最小二乘、稳健最小二乘、非线性最小二乘与剔除异常值效果比较

    最近我们被客户要求撰写关于最小二乘法的研究报告,包括一些图形和统计输出.matlab软件在拟合数据时使用最小二乘法.拟合需要一个参数模型,该模型将因变量数据与具有一个或多个系数的预测数据相关联.拟合过 ...

  4. OpenCV之ml 模块. 机器学习:支持向量机(SVM)介绍 支持向量机对线性不可分数据的处理

    支持向量机(SVM)介绍 目标 本文档尝试解答如下问题: 如何使用OpenCV函数 CvSVM::train 训练一个SVM分类器, 以及用 CvSVM::predict 测试训练结果. 什么是支持向 ...

  5. OpenCV支持向量机SVM用于非线性可分离数据

    OpenCV支持向量机SVM用于非线性可分离数据 支持向量机SVM用于非线性可分离数据 目标 动机Motivation 优化问题的扩展 源代码 解释 设置训练数据 设置SVM的参数 训练SVM 显示决 ...

  6. 为什么梯度下降法对于非线性可分数据有效

    前言 晚上逛微博看到的,顺便拿过来翻译一下,做做笔记 国际惯例,来个原文链接: 原文地址:Why is gradient descent robust to non-linearly separabl ...

  7. [模式识别].(希腊)西奥多里蒂斯第四版笔记4之__非线性分类器

    1,Exclusive OR(XOR)Booleanfunction问题 布尔量AND和OR是线性可分的 2,两层感知器 对Figure4.1中A类和B类,首先能想到的是画两条直线.如图Figure4 ...

  8. OpenCV支持向量机SVM对线性不可分数据的处理

    支持向量机对线性不可分数据的处理 目标 本文档尝试解答如下问题: 在训练数据线性不可分时,如何定义此情形下支持向量机的最优化问题. 如何设置 CvSVMParams 中的参数来解决此类问题. 动机 为 ...

  9. 斯坦福大学公开课机器学习:Neural Networks,representation: non-linear hypotheses(为什么需要做非线性分类器)...

    如上图所示,如果用逻辑回归来解决这个问题,首先需要构造一个包含很多非线性项的逻辑回归函数g(x).这里g仍是s型函数(即 ).我们能让函数包含很多像这的多项式,当多项式足够多时,那么你也许能够得到可以 ...

最新文章

  1. 【.Net MF网络开发板研究-04】Socket编程之服务端
  2. 函数声明和变量声明提升
  3. python爬取网易云音乐问题陈述_python 网易云音乐 评论爬取问题
  4. bigdecimal 保留两位小数_Python的保留小数及对齐
  5. SLAM 论文阅读和分类整理
  6. PostgreSQL SELECT INTO和INSERT INTO SELECT 两种表复制语句
  7. Codeforces 301A. Yaroslav
  8. PostgreSQL 9.6 IO Hang问题浅析与优化
  9. 《转》常用的正则表达式
  10. c++中istream类型到bool类型的隐式转换
  11. eclipse下的mybatis插件:MyBatipse
  12. 第一章 Shell基础知识
  13. 三菱gx works2安装教程(详细超安装方法步骤)
  14. 基于VxWorks的VxBus字符设备驱动
  15. 「干货分享」50人+团队常用的一套PRD模板
  16. 用puttygen转换腾讯云密匙找不到文件
  17. win7网络不显示共享计算机,win7查找不到网络计算机怎么办_win7看不到网络计算机怎么解决-win7之家...
  18. 分享 编写子程序代码(把伪代码转换为真正的代码)
  19. 私有云服务器和公有云服务器有什么区别
  20. oracle修改mem为手动管理,PSV内存修改金手指插件GoHANmem v2.00下载和使用教程

热门文章

  1. 2023年全国最新保安员精选真题及答案24
  2. 职场如戏,全靠表情!我们天搜科技人人都是行走的表情包
  3. Entity Framework 学习
  4. Visual Studio 2019 秘钥
  5. 解决ubuntu 64位无法运行steam的问题
  6. 军警岗哨巡逻管理系统
  7. Android Studio同步远程Git代码到本地
  8. 得力助手 消防员的 消防机器人_消防机器人市场如今的发展现状,是否能成为消防员的得力助手...
  9. 求二叉树上结点的路径
  10. Cyclone DDS(1)初识