BEGAN: Boundary Equilibrium Generative Adversarial Networks的理解

最新推荐文章于 2024-05-25 09:35:27 发布

原创

最新推荐文章于 2024-05-25 09:35:27 发布 · 1.9k 阅读

标签

#GAN

本文深入解析了Boundary Equilibrium Generative Adversarial Networks (BEGAN)的工作原理，介绍了其通过auto-encoder实现判别器的独特之处，并探讨了如何使用Wasserstein Distance来评估真实与生成数据之间的分布差异。

BEGAN: Boundary Equilibrium Generative Adversarial Networks的理解

这是一篇2017年5月上传到arXiv上的文章，作者是David Berthelot，来自Google。Boundary Equilibrium译作“边界均衡”，文章创新的地方主要有以下几个地方：

应用auto-encoder实现Discriminator
Discriminator的Loss_D由输入原图（input_img）与Decoder恢复的输出图(recover_img)之间的逐点error构成
$ (v) = | v - D (v) | (1)$ $\mathcal{L}(\mathcal{v})=\vert \mathcal{v}-D(\mathcal{v})\vert\qquad(1)$
因而将产生两个Loss_D，分别为真图判别损失Loss_D_real，以及伪图判别损失Loss_D_fake。
Loss_D可看成是随机的分布，由real_img所形成的Loss_D_Real分布与由Generator生成的假图（fake_img）所形成的Loss_D_Fake分布，出现了两个分布，用Wasserstein Distance（简称WD）来衡量这两个分布的距离。Discriminator的目标是尽量拉开这两个分布的距离，而Generator的目标是缩小这两个分布的距离——GAN的基本思想。
引入了一个均衡的概念来调节Discriminator训练时的两个目标的比重：目标1，是提高auto-encoder的重构能力，即auto-encoder恢复输入input_img的能力；目标2，提高D的分辨真伪的能力。该均衡控制量是可以变动的，就像是电路中的反馈环，构成了反馈比例控制（Proportional Control）迭代机制。

本文是以WD的出发点来解释和构造GAN的，以下是Wasserstein Distance的定义：

W (u 1, u 2) = inf γ \in Γ (u 1, u 2) E (x 1, x 2) \sim γ [| x 1 - x 2 |] (2)

$W\left(u_1,u_2\right)=\inf_{\gamma \in \Gamma\left(u_1,u_2\right)} E_{\left(x_1,x_2\right)\sim\gamma}\left[\vert x_1-x_2\vert\right] \qquad(2)$
WD本来就是用来衡量两个分布的距离的，知乎上有一篇文章讲得很详细： https://www.zhihu.com/question/39872326?sort=created
在BEGAN中，

u1 u 1 $u_1$ 和

u2 u 2 $u_2$ 是两个分布，

u1 u 1 $u_1$ 代表由real_img在Discriminator上生成的Loss_D，即Loss_D_real，而

u2 u 2 $u_2$ 代表fake_img在Discriminator上生成的Loss_D，即Loss_D_fake。