深度学习【43】BEGAN

最新推荐文章于 2024-05-25 09:35:27 发布

原创最新推荐文章于 2024-05-25 09:35:27 发布 · 9.3k 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

深度学习专栏收录该内容

65 篇文章

订阅专栏

BEGAN解决了GAN训练的稳定性问题，实现了D和G网络的平衡，以及生成多样性与质量的控制。它利用了自编码器的重构误差作为损失函数，并通过Jensen不等式优化Wasserstein距离的下界。实验结果显示，BEGAN能生成高质量且多样性的图像。

GAN有不少未解决的问题：1、虽然在DCGAN和improveGAN中提出了不少训练GAN的tricks，但是GAN还是很难训练。2、很难控制G网络的多样性。3、D网络和G网络之间的平衡性很难控制，大部分情况下D网络在训练之初能力会更强。
而BEGAN提出了能够使得训练过程快又稳定的方法；解决了D网络和G网络能力平衡问题；有能力控制生成图片的多样性和质量平衡问题以及衡量收敛性的近似方法。

BEGAN

这里写图片描述
上图是BEGAN在mnist数据上设计的一个模型，借助了EBGAN的encoder-decoder作为D网络结构的思想。一共有三个网络，分别是G网络，以及D网络中的encoder和decoder。其中G网络和decoder的网络结构是一样的，这两个网络旁边灰色部分是可选的优化结构（跳跃连接和加入h0信息）。

看完模型结构例子，我们在看看began的损失函数：
这里写图片描述

其中 $\mathcal L$ 表示重构误差：
$\mathcal L(x) = L1\_loss(采样而来的真实图片y-y经过D网络重构出来的图片)$
$\mathcal L(G(z_G)) =L1_loss(随机向量z_G经过decoder生成的图片-G网络生成的图片经过D网络重构出来的图片)$

$\gamma\in [0,1]$ 是一个超参数。值越低表示生成的样本的多样性越低。 $\lambda_k$ 是 $k_{t+1}$ 的更新步长。

另外论文还提出了衡量模型训练收敛性的公式：
这里写图片描述

其实到这边BEGAN的内容就差不多了。但由于论文的大部分内容都是在讲损失函数是怎么来的，所以我们接着看看上面的损失函数的由来。

BEGAN损失函数的由来

由上面的介绍我们知道 $\mathcal L$ 是一个自编码器的重构误差函数。现在我们假设自编码有两个重构误差的分布函数分别是 $\mu_1,\mu_2$ ，并用
$\Gamma(\mu_1,\mu_2)$ 表示 $\mu_1,\mu_2$ 的所有可能集合， $m_{1,2}$ 为 $\mu_1,\mu_2$ 的期望。这样我可以将Wasserstein 距离定义为：
这里写图片描述
其中， $x_1,x_2$ 分别为从 $\gamma=(\mu_1 ,\mu_2)$ 采样出来的两个损失函数值。