Machine Learning ——降维方法：t-SNE

最新推荐文章于 2026-04-17 09:23:12 发布

原创

最新推荐文章于 2026-04-17 09:23:12 发布 · 5k 阅读

标签

#人工智能 #降维 #t-sne #SNE

本文介绍了t-SNE算法，作为机器学习中的降维方法，它改进了SNE的优化问题和拥挤问题。t-SNE在高维空间使用高斯分布，低维空间采用t分布，旨在保持数据的局部结构。实验表明t-SNE在图像数据处理上有良好表现，但对文本处理效果有限。

本篇博客是本人初学t-SNE算法的总结，可能有些理解不够完善，希望不足之处大家可以指正。

参考文献：

Geoffrey Hinton P K. Visualizing Data using t-SNE Laurens van der Maaten MICC-IKAT[J]. 2014.

一、介绍

t-SNE算法是学习机器学习比较好入门的一种算法，t-SNE是一种降维算法，降维在机器学习中是比较常见的问题，降维就是将高维空间的数据在低维空间进行展示，我们在实验中通常使用的数据都是高维数据，例如，与乳腺癌相关的细胞核由大约30个变量描述，而用于表示图像的像素强度向量或用于表示文档的字数向量通常有数千个维度，我们在处理这些数据时就需要用到降维技术。降维的目的是在低维图中尽可能保留高维数据的重要结构。降维分为线性降维和非线性降维两个部分，线性降维的代表方法有PCA和MDS等，线性降维主要关注低维空间中的点的不相似性，使低维空间中的不相似的点之间的距离较大；t-SNE是一种非线性的降维方法，非线性降维算法通常更重视保持相似性，使低维空间中的相似的点之间的距离较小。

二、SNE（Stochastic Neighbor Embedding）

SNE也是一种降维的算法，t-SNE就是对SNE算法的一种改进，我们在这里先对SNE算法进行介绍。SNE是通过构建一个高维对象之间的概率分布Pi|j，使得相似的对象有更高的概率被选择，而不相似的对象有较低的概率被选择；在低维空间里再构造这些点的概率分布Qi|j，使得Pi|j与Qi|j分布之间尽可能相似。SNE是先将欧几里得距离转换为条件概率来表达点与点之间的相似度。SNE中我们不论是低维空间还是高维空间，我们计算的相似度均为概率相似（我们将高维空间中的点记为X={x1,x2,...,xi,xj,...,xn},低维空间中的点记为Y={y1,y2,...,yi,yj,...,yn}）

在高维空间中，点xi与xj的相似度记为Pi|j ，对于相近的点Pij的值相对会大一些，Pij遵循高斯分布，通过数学公式进行展示为：