机器学习之:LLE (locally linear embedding) 局部线性嵌入降维算法

LLE是一种非线性降维算法,能较好保持原有流形结构。该文详细介绍了LLE算法原理,包括如何找到近邻点,求解线性关系权重,及如何利用奇异值分解进行优化。

LLE

1. LLE 是什么

Locally linear embedding(LLE)[1] 是一种非线性降维算法,它能够使降维后的数据较好地保持原有 流形结构 。LLE可以说是流形学习方法最经典的工作之一。很多后续的流形学习、降维方法都与LLE有密切联系

一个形象的流形降维过程如下图。我们有一块卷起来的布,我们希望将其展开到一个二维平面,我们希望展开后的布能够在局部保持布结构的特征,其实也就是将其展开的过程,就想两个人将其拉开一样
在这里插入图片描述

2. LLE 的主要思想

LLE首先假设数据在较小的局部是线性的,也就是说,某一个数据可以由它邻域中的几个样本来线性表示

  • 比如我们有一个样本 x 1 x_1 x1,我们在它的原始高维邻域里用 K-近邻思想 找到和它最近的三个样本 x 2 x_2 x2, x 3 x_3 x3, x 4 x_4 x4. 然后我们假设 x 1 x_1 x1 可以由 x 2 x_2 x2, x 3 x_3 x3, x 4 x_4 x4 线性表示,即:

    在这里插入图片描述

    • 其中, w 12 w_{12} w12 w 13 w_{13} w13 w 14 w_{14} w14 为权重系数。
      在这里插入图片描述
  • 在我们通过LLE降维后,我们希望 x 1 x_1 x1 在低维空间对应的投影 x 1 ′ x^′_1 x1 x 2 x_2 x2, x 3 x_3 x3, x 4 x_4 x4 对应的投影 x 2 ′ x^′_2 x2, x 3 ′ x^′_3 x3, x 4 ′ x^′_4 x4 也尽量保持同样的线性关系,即:
    在这里插入图片描述

  • 也就是说,投影前后线性关系的权重系数 w 12 w_{12} w12 w 13 w_{13} w13 w 14 w_{14} w14 是尽量不变或者最小改变的。

  • 从上面可以看出,线性关系只在样本的附近起作用,离样本远的样本对局部的线性关系没有影响,因此降维的复杂度降低了很多。这句话的意思是: 如果表示原来高维空间中的点(假设高维空间中一共有 D D D 个点),他们和每一个其他的点之间(其他 D − 1 D-1 D1 个点)都存在 w i j w_{ij} wij 的表示关系,通过 LLE 降维的方法之后,使每个点只与周围的最近的 k k k 个点之间存在线性表示关系,只能被周围的 k k k 个点通过 w i j w_{ij} wij 来表示,这样的话,相当于计算量和维度都减少了很多。

3. LLE 算法推导过程

3.1 如何找到 k 个近邻

假设空间中一共有 D D D 个点,现有一个点 x i x_i xi,对于整个空间中其他所有的点( D − 1 D-1 D1个)都进行距离运算;这里使用的距离是欧氏距离。然后,我们将这 D − 1 D-1 D1 个点与 x i x_i xi 距离最小的 k k k 个点选出来,这就是 k k k 近邻的思想

3.2 找 x i x_i xi 与这 k 个近邻的线性关系

在前面我们说到了,我们如何将原来的高维数据降维到低维空间?或者说,“维度” 这个概念,指的到底是什么?

维度在这里就是由 w i j w_{ij} wij 的权重矩阵决定的,如果什么处理也不做,这个时候,一个 x i x_i xi 就和整个空间中所有的点有关,要通过其他的每一个点来决定这个 x i x_i xi 但是,假设我们只用最近的 k k k 个点,就相当于我们只计算 k k k w i j w_{ij} wij,然后利用求得的权重矩阵来对新的维度的数据进行生成,由于权重矩阵减小了,所以新的数据的维度也减小了。


现在来实际的推导步骤:

  • 假设我们有 m m m n n n 维样本 X = { x 1 , x 2 , . . . , x m } X=\{x_1,x_2,...,x_m\} X={ x1,x2,...,xm}(每个样本都有 n n n 行),代表了整个高维空间中所有的样本点。
  • 我们要找到 x i x_i xi k k k 个近邻之间的线性关系,这显然是个回归问题,所以我们用回归问题常用的 均方误差 来作为损失函数 :
    在这里插入图片描述
    • 其中, Q ( i ) Q(i) Q(i) 表示i的 k k k 个近邻样本集合
    • 一般我们也会对权重系数 w i j w_{ij} wij 做归一化的限制,即权重系数需要满足所有系数相加为 1 1 1
      在这里插入图片描述
    • 根据上面说的,我们只用最近 k k k 个点来描述 x i x_i xi,即:所有不属于 Q ( i ) Q(i) Q(i) 的点的 w i j = 0 w_{ij}=0
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暖仔会飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值