降维的目的

减少冗余信息造成的误差,提高数据信息的精度。

PCA 主成分分析

Principal Component Analysis(PCA)主成分分析,是最常用的线性降维方法,无监督的,它通过某种线性映射,将高维的向量转化为低维空间表示,并且希望在所投影的低维空间上数据方差尽可能的大(实际表现为数据点尽可能的分散,而不是聚作一团)

通俗的理解,如果把所有的点都映射到一起,那么几乎所有的信息(如点和点之间的距离关系)都丢失了,而如果映射后方差尽可能的大,那么数据点则会分散开来,以此来保留更多的信息。可以证明,PCA是丢失原始数据信息最少的一种线性降维方式。(实际上就是最接近原始数据,但是PCA并不试图去探索数 据内在结构)
PCA达到的目的: 使用较少的数据维度,保留尽可能多的原数据的信息。

PCA追求的是在降维之后能够最大化保持数据的内在信息,并通过衡量在投影方向上的数据方差的大小来衡量该方向的重要性。但是这样投影以后对数据 的区分作用并不大,反而可能使得数据点揉杂在一起无法区分。这也是PCA存在的最大一个问题,这导致使用PCA在很多情况下的分类效果并不好。具体可以看 下图所示,若使用PCA将数据点投影至一维空间上时,PCA会选择2轴,这使得原本很容易区分的两簇点被揉杂在一起变得无法区分;而这时若选择1轴将会得 到很好的区分结果。

LDA线性判别分析

Linear Discriminant Analysis(也有叫做Fisher Linear Discriminant)是一种有监督的(supervised)线性降维算法。与PCA保持数据信息不同,LDA是为了使得降维后的数据点尽可能地容易被区分
LDA达到的目的: 减少数据维度,尽可能使数据被区分。

还是这张图,如果是PCA方法的话,会映射到 2轴,但是如果是LDA方法那么,会使数据尽可能的区分开来,所以会映射到1轴。

LDA最后也是转化成为一个求矩阵特征向量的问题,和PCA很像,事实上很多其他的算法也是归结于这一类,一般称之为谱(spectral)方法。

PCA and LDA 区别

首先,PCA与LDA的监督方式不同。

第二,他们的目的也不同。PCA是为了去除原始数据中冗余的维度,让投影子空间的各维度的方差尽可能的大,即熵尽可能的大。LDA是通过数据降维找到那些具有判别性的维度,使得原始数据在这些维度上投影,不同类别尽可能的分隔开。

【深度学习】数据降维方法总结

降维方法之PCA,LDA相关推荐

  1. pca 累积方差贡献率公式_机器学习数据降维方法:PCA主成分分析

    PCA在机器学习中很常用,是一种无参数的数据降维方法.PCA步骤: 将原始数据按列组成n行m列矩阵X 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 求出协方差矩阵 求出协方差矩阵的 ...

  2. 大数据(线性/非线性)降维方法(PCA,LDA,MDS,ISOMAP,LLE)

    文章目录 数据块划分 特征分布 特征提取 PCA LDA MDS Isomap LLE 数据块划分 对于给定的数据集Magic(19020个样本,10个属性),我们首先将其划分为RSP数据块,然后再分 ...

  3. 降维算法(PCA/LDA/LLE/LEP/FA)总结

    目录 1 PCA/LDA 2 Factor Analysis 3 LLE 4 LEP Reference 1 PCA/LDA 参考我的这篇博文 主成分分析(PCA)/线性判别分析(LDA)总结 2 F ...

  4. 在线作图丨数据降维方法①——主成分分析PCA

    PCA是什么? 主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度, ...

  5. 常见的降维方法(PCA,SVD)

    1.PCA降维(主成分分析) PCA降维就是去除线性相关,使得最后剩余的属性维度全都线性无关. 其实:PCA降维不仅是去除先线性无关,还可以过滤掉小特征值对应的特征向量.因为特征值变化小,对应的特征向 ...

  6. python怎么降维_【Python算法】常用降维方法-常用降维方法的目的

    常用降维方法-常用降维方法的目的 正所谓每一个结果的出现都是一系列的原因导致的,当构建机器学习模型时候,有时候数据特征异常复杂,这就需要经常用到数据降维技术,下面主要介绍一些降维的主要原理. 1. 降 ...

  7. 【数据降维】数据降维方法分类

    数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示. 数据降维工具箱drtoolbox中众多算法,这里简单做个分类. 因为很多并没有仔细 ...

  8. python降维方法_使用Python进行数据降维|线性降维

    ========== 欢迎关注文章首发公众号:早起python 本文为早起的统计工具箱第二期 ========== 前言 为什么要进行数据降维?直观地好处是维度降低了,便于计算和可视化,其深层次的意义 ...

  9. 详解机器学习高维数据降维方法

    当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低维度也是必不可少的. 常见的降维方法除了以上提到的基于 L1 惩罚项的模型以外,另外还有主成分分 ...

最新文章

  1. win10配置java环境变量,解决javac不是内部或外部命令等问题
  2. C++brent method布伦特方法找extrema极值的算法(附完整源码)
  3. MapReduce执行WordCount操作
  4. python 字符串截取_Python 字符串操作实现代码(截取/替换/查找/分割)
  5. oracle1461,Oracle 10.2.0.3的ORA-1461错误
  6. odd raio值 是什麼_NBA2K20球员能力值又一次更新!
  7. 在vue项目中定义全局变量和全局函数
  8. 第一节:用Cube学32之简单IO口操作(点灯及按键)
  9. pyton-虚拟环境以及django的初步使用记录信息
  10. 第三篇:DAMA数据管理知识体系
  11. 计算机同步增长率公式,行测资料分析增长率的计算技巧
  12. python笔记2—day2
  13. 阻塞队列(三):DelayQueue
  14. bpy(python)无法安装 pipconda都无法install linux系统(pip install bpy)
  15. 壁挂炉开启采暖模式后,水泵24小时运转,安装联动线(联控线)后完美解决
  16. JavaScript-IIFE
  17. 图片路径转码与解码(学习)
  18. 网络文件夹目前是以其他用户名和密码进行映射的 解决方案
  19. python象限判断_玩数据之数据方法篇—四象限分析法—附EXCEL+Python案例
  20. 智博会期间,我在重庆跟出租车司机聊了聊

热门文章

  1. thinkphp5.1中间件是什么,有什么用
  2. 如何用python计算年龄_python如何对年龄分段_利用python把年龄分段 - CSDN
  3. 基于虚拟帐号的邮件系统
  4. 数字通信第四章——波形解调与最佳检测接收
  5. 【4.0】 数学建模中拟合算法详解|内附清晰图片和详细代码实现
  6. pyhton如何导入包的每一个文件_如何开始第一个 Python 编程实践项目?
  7. 【k哥爬虫普法】简历大数据公司被查封,个人隐私是红线!
  8. 怎么在cmd切换python版本_cmd 切换python版本
  9. 收银系统服务器有哪些,收银系统有哪些,国产收银系统十大排名
  10. 一些转换器的用法和注意事项(四)——颜色设置相关的转换器