文章目录
前言
这里介绍三种降维算法,先介绍一下各自的特点。主成分分析主要是吧多个指标进行降维,只保留几个指标;因子分析要优于主成分分析,那为什么这么说呢?因为因子分析比主成分分析好解释,主成分分析使用后不好解释,因子分析作用与主成分分析相同;典型相关性分析的作用感觉有些局限(相比于以上两种算法),典型相关分析是研究两组变量之间相关关系的一种多元统计方法,它能够揭示出两组变量之间的内在联系,就是说在分别包含多个指标的两组数据中分别挑选出一个指标来代替自己那一组的数据,以此来进行分析两组数据的联系。
数据降维的作用
- 降维是将高维度的数据(指标太多)保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。
- 在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。
降维具有如下一些优点:
- 使得数据集更易使用;
- 降低算法的计算开销;
- 去除噪声;
- 使得结果容易理解。

一、主成分分析(PCA)
1.介绍
主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。

4万+

被折叠的 条评论
为什么被折叠?



