费舍尔线性分辩分析(Fisher‘s Linear Discriminant Analysis, FLDA)

最新推荐文章于 2023-09-26 23:13:24 发布

原创

最新推荐文章于 2023-09-26 23:13:24 发布 · 1.4k 阅读

·

0

·

标签

#线性分辩分析 #模式识别 #机器学习 #线性代数

费舍尔线性判别分析（FLDA）是一种用于分类和特征降维的方法，其目标是最大化类别间方差与类别内方差之比，以找到最佳投影方向。在二分类情况下，FLDA寻找投影矩阵W，使得类间方差最大化而类内方差最小化。多分类时，FLDA涉及最大特征值的计算。通过计算类内和类间散度矩阵，可以找到投影矩阵W。代码示例展示了如何在MNIST数据集上应用FLDA进行二分类和多分类任务。

费舍尔线性分辩分析(Fisher’s Linear Discriminant Analysis, FLDA)

目录

费舍尔线性分辩分析(Fisher's Linear Discriminant Analysis, FLDA)

1. 问题描述

为解决两个或多个类别的分类问题，大多数机器学习（ML）算法的工作方式相同。

通常，它们采用某种形式的转换来对输入数据进行处理，以降低原始输入维度到一个新的（更小）维度。其目的是将数据投影到新的空间中。然后，在投影后，它们尝试通过找到线性分离来对数据点进行分类。例如，我们有如下数据，
在这里插入图片描述

对数据直接进行线性分类显然不是最佳的方法，但是如果我们将数据投影到一维空间，我们可以找到一个线性分类器，将数据分为两个类别。这就是费舍尔线性判别分析（FLDA）的基本思想。我们将数据做如下操作：

$y=x_{0}^2+x_{1}^2$

其中， $x_{0}$ 和 $x_{1}$ 是原始数据的两个特征。我们可以看到，通过这种方式，我们将数据投影到了一维空间，然后我们可以找到一个线性分类器，将数据分为两个类别。投影后的数据如下图所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uSabBiva-1690806540681)(image-1.png)]

通常，我们要探寻一种将数据从高维向低维度转换的方式，这被称为表征学习（Representation Learning）。深度学习也是表征学习的一种，但在深度学习中，我们不需要猜测哪种转换会导致数据的最佳表示，算法会自行解决。

但是，请记住，无论是表示学习还是手工特征，模式都是相同的。我们需要以某种方式改变数据，使其更加适用于分类任务。

2. 二分类情况

假设我们有 $C_1$ ， $C_2$ 两个类别的样本，每个样本维度为 $D$ ，样本数为 $n_1$ 和 $n_2$ 。我们的目标是找到一个投影矩阵 $W$ ，将数据投影到一维空间：

$\hat{x}=W^{\top}x$

设新样本 $\hat{x}$ 的维度为1，则 $W$ 的维度为 $\times 1$ 。

那么，我们该如何寻找 $W$ 呢？换句话说，我们寻找的 $W$ 应该符合什么条件呢？

这就是费舍尔线性判别（Fisher’s Linear Discriminant, FLD）发挥作用的地方。

费舍尔提出的想法是最大化一个函数，该函数将在投影后的类均值之间产生大的分离，同时在每个类内部给出小的方差，从而最小化类之间的重叠。

换句话说，FLD选择最大化类别间分离的投影方法。为此，它最大化类别间方差与类别内方差之比。

简而言之，为了将数据投影到更小的维度并避免类别重叠，FLD保持了两个属性：

数据集类别间具有很大的方差。
数据集每个类别内部具有较小的方差。

请注意，较大的类别间方差意味着投影后的类别平均值应该尽可能远离彼此。相反，较小的类别内方差会使投影后的数据点更加接近。

计算每个类别的均值，我们可以得到：

$\mu_{1}=\frac{1}{n_{1}} \sum_{x \in C_{1}} x, \quad \mu_{2}=\frac{1}{n_{2}} \sum_{x \in C_{2}} x$

其中， $m_1$ 和 $m_2$ 分别是 $C_1$ 和 $C_2$ 类的均值。经过投影后，

$\hat{\mu}_{1}=W^{\top} \mu_{1}, \quad \hat{\mu}_{2}=W^{\top} \mu_{2}$

其中， $\hat{\mu}_{1}$ 和 $\hat{\mu}_{2}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ace2NoU 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。