很多人都了解PCA算法,但是总很难直观上去想象和理解整个过程,特别是为什么特征向量可以作为一个PCA特征空间变换后的一个基?特征向量和特征值到底怎么理解?
也许很多人查了很多文章和书籍,但是它们几乎没有直面回答。就连解释特征向量和特征值也都是搬特征值分解公式:(XX^T)w=lambda*w。这种解释是苍白无力的,我们依然不能直观理解特征向量和特征值。也有文章将XX^T当做变换矩阵,并从特征向量w的缩放上试图说明,然而依然不能解释透彻(就我而言),更难回答第一个问题“为什么特征向量可以作为一个PCA特征空间变换后的一个基?”
下面的解释过程不是很严谨,反过来却适合直观上去找找感觉。首先我先列个思路:
1.协方差矩阵表示什么?
2.特征向量为什么能表示协方差矩阵特性?特点?
3.扣住常识的特征值分解公式,把故事说圆
4.特征向量为什么能作为PCA变换后特征空间的一个基?
5.特征值部分扣住第四点
=================================
直观理解协方差矩阵
首先将X表示样本特征矩阵R^{d*n}, XX^T 表示为协方差矩阵(注意X已中心化),元素  (XX^T)_ij  的值反映在特征 i 维度和特征 j 维度上对应样本分布一致性程度(其实XX^T反映了两两特征在样本空间间的距离,再深入一点,就反映这里的样本分布一致性)。比如 a、b和c 三个样本,在特征 i 维度和特征 j 维度上投影的值分别为 a_i、b_i和c_i(假设特征 i 维度 上三个样本的分布情况为 a_i>b_i>c_i ,且a_i-b_i>b_i -c_i ),a_j、b_j和c_j,如果  (XX^T)_ij  比较大,那么在特征 j 维度 上三个样本的分布情况也大致符合为a_j>b_j>c_j,且a_j-b_j>b_j -c_j。
=================================
直观理解特征向量
这里要强调的是我们全文讲的特征向量是特指协方差矩阵的特征向量(当然也可拓展到其他矩阵)。如果现在存在特征 k ,使得:对于大多特征 i (特征 i 属于特征集合),(XX^T)_ik 都很大。这说明特征k有以下特性:
  1. 有代表性,能代表大多特征维度上的样本分布。(这或许是很多资料没有强调的)
  2. 样本普遍在特征k维度上投影的值差异相对其他特征比较大(一定程度反映方差大)。为什么差异比较大?直观上的理解比价简单,比如假设有 k、k1和k2 三个特征,它们上面的样本分布比较一致,但是 (XX^T)_k1 和 (XX^T)_k2k 还是大于(XX^T)_k1k2,那就说明特征k维度上样本投影的值(再次强调已中心化)除了和 k1、k2 比较一致外,而且幅值比较大。
好了,那怎么理解特征向量,很多地方只会列出那个特征分解的公式来定义,但在我看来甚至对很多人来讲并不能解渴。现在有某个向量 w,若在对应的第 k 个分量值比较大,那么 (XX^T)w  得到的向量的各个分量的值普遍比较大,我们用 lambda*w 来表示(约束),其中的lambda比较大。这样的w 向量我们就把它当做特征向量,因为它反映了 XX^T 中样本分布的特性(通过强调特征k,而特征k有代表性)。我们可以用特征向量作为PCA变换后特征空间的一个基,因为把它作为变换向量能使样本投影的方差大,满足最大可分性(通过强调特征k,而特征k上样本方差大) 。
至此直观解释了:
特征向量到底怎么理解
为什么特征向量可以作为一个PCA变换后特征空间的一个基
=================================
直观理解特征值
前一部分的lambda就是特征值,w 的lambda越大,w越能反映XX^T中样本的分布特性。这恰说明w上样本投影值得方差比较大,信息比较明确,该w上的样本投影可以作为一个特征维度用于分类等任务。
=================================
上面的解释过程不是很严谨,反过来却适合直观上去找找感觉。希望对大家有帮助,欢迎留言交流

直观上理解PCA中特征值和特征向量相关推荐

  1. 主成分分析PCA以及特征值和特征向量的意义

    定义: 主成分分析(Principal Component Analysis,PCA), 是一种统计方法.通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分.P ...

  2. 深入理解矩阵的特征值和特征向量

    原 [数学基础]矩阵的特征向量.特征值及其含义 2018年08月31日 11:37:08 zhaosarsa 阅读数 4693 更多 分类专栏: 数学 版权声明:本文为博主原创文章,遵循 CC 4.0 ...

  3. 高斯过程是什么?从视觉上理解机器学习中的高斯过程——Gaussian Process

    --如何将一组小型构建块转变为解决回归问题的灵活的工具. 目录 Introduction 简介 Multivariate Gaussian distributions 多元高斯分布 Marginali ...

  4. 用图直观上理解梯度算子(一阶)与拉普拉斯算子(二阶)的区别,线检测与边缘检测的区别

    梯度算子(一阶)与拉普拉斯算子(二阶)的区别 下面都是针对上图进行处理 取90度方向的梯度算子和拉普拉斯算子,以下为在空间域中的核 拉普拉斯算子(二阶) [−12−1−12−1−12−1]\left[ ...

  5. SVD奇异值分解 中特征值与奇异值的数学理解与意义

    前言 之前的博客中SVD推荐算法写得不是很严谨,r̂ ui=∑Ff=1PufQfi+μ+bu+bir^ui=∑f=1FPufQfi+μ+bu+bi\hat{r}_{ui}=\sum_{f=1}^{F} ...

  6. 利用特征值与特征向量求解弹性力学中的主应力与主平面问题

    利用特征值与特征向量求解弹性力学中的主应力与主平面问题 前言 一.二向应力状态 1. 莫尔圆图解法 2. 特征值与特征向量解法 二.三向应力状态 前言 已知物体在任意一点的六个应力分量(σx,σy,σ ...

  7. 特征值与特征向量的意义

    转载地址:http://blog.csdn.net/sunshine_in_moon/article/details/45749691 从定义出发,Ax=cx:A为矩阵,c为特征值,x为特征向量.  ...

  8. 简单易懂的特征值与特征向量

    特征值与特征向量是线性代数中一个很基础的知识,但是很多人对这两个概念没有一个直观的概念,从直觉上,很难理解这两个东西,只知道公式,但是不知道它代表的意义.当年上现代课的时候,老师根本不会去讲这些东西, ...

  9. 特征值和特征向量概述-面试必问3(含特征值、向量意义)

    特征值和特征向量(Eigenvalues and eigenvectors) 在线性代数中,一个线性变换的特征向量(eigenvector 或者 characteristic vector)是一个非零 ...

最新文章

  1. a元素生成多个a的问题,元素标签结尾影响
  2. 根据文件路径检测文件大小并检测是否正在被占用
  3. 【单词】常见单词含义的辨异(emulator/simulator、hardware/firmware)
  4. oracle 天转换成月函数_oracle 日期转换格式 函数
  5. SQL Server-聚焦LEFT JOIN...IS NULL AND NOT EXISTS性能分析(十七)
  6. 编译OpenJDK8:CreateJars.gmk/BuildJdk.gmk/Main.gmk/错误
  7. matlab中给图像加几个矩形框_如何用 matlab 在图片上绘制矩形框 和 添加文字 ?...
  8. 网站无脑搭建,自己可以建个站玩一玩儿
  9. Linux shell中21的含义解释 (全网最全,看完就懂)
  10. Permission is only granted to system apps解决方法
  11. 中国历代大大小小的皇帝(2)
  12. FANUC机器人外部电缆连接示意图(一)
  13. 微信小程序登录获取手机号获取不到偶发性问题
  14. html 超链接打开Excel,excel超链接打不开解决方法
  15. 糖友秦女士反映时刻注意自己的饮食太痛苦了
  16. 如何在CAD中加载卫星地图并作街道与建筑绘制
  17. Day14 Date 包装类 Character
  18. VideoPose3d:环境搭建+制作自己的视频
  19. PCIE-5565PIORC GE 光纤网络节点卡
  20. python输入字符串并反序result_python字符串反转的四种方法详解

热门文章

  1. vs2013配置OpenGL+简单案例分析
  2. 学习笔记2018-10-26 读论文A single algorithm to retrieve turbidity from remotely-sensed data in all coastal
  3. CVPR 2016 摘要阅读
  4. 完美高仿精仿京东商城手机客户端android版源码
  5. 钉钉isv应用开发(钉钉isv应用开发注意事项)
  6. SSL 域名证书 安装指引
  7. 备案需要域名证书吗?如何下载域名证书?
  8. 大话 Python:python 操作 excel 系列 -- 数据的提取与筛选
  9. 【中亦安图】Systemstate Dump分析经典案例(7)
  10. No matching provisioning profiles found 真机测试问题