PCA(principal component analysis )即主成分分析,是一种常用的降维方法。
假设我们用降维操作处理一个二维的数据集(二维压缩成一维):



在这个数据集上,我们可以计算出两个方向,我们称为主方向u1和次方向u2,其中u1的值是数据集协方差矩阵的最大特征值对应的特征向量,u2是次大特征值对应的特征向量。数据集的协方差矩阵(这个符号很像求和但不是):


我们现在用U=[u1 u2]处理x,由矩阵变换可知这相当于一个旋转变换:


上图中x轴为u1,y轴为u2
为了降维,我们只选择一个维度,比如u1,那么


这里就有一个问题了,我们怎么选择去掉的维度呢?这就要引入维度重要性的判断标准了:


PCA(主成分分析)是常见的降维方法,通过计算数据集的协方差矩阵找到最大特征值对应的主要方向。在降维过程中,特征值的大小决定了维度的重要性。Whitening是对特征的预处理,目标是使特征间相关性降低,各特征的协方差为一。了解PCA与Whitening有助于理解数据降维和预处理。
1143

被折叠的 条评论
为什么被折叠?



