BEGAN: Boundary Equilibrium Generative Adversarial Networks的理解
这是一篇2017年5月上传到arXiv上的文章,作者是David Berthelot,来自Google。Boundary Equilibrium译作“边界均衡”,文章创新的地方主要有以下几个地方:
- 应用auto-encoder实现Discriminator
- Discriminator的Loss_D由输入原图(input_img)与Decoder恢复的输出图(recover_img)之间的逐点error构成
(v)=|v−D(v)|(1) L ( v ) = | v − D ( v ) | ( 1 )
因而将产生两个Loss_D,分别为真图判别损失Loss_D_real,以及伪图判别损失Loss_D_fake。 - Loss_D可看成是随机的分布,由real_img所形成的Loss_D_Real分布与由Generator生成的假图(fake_img)所形成的Loss_D_Fake分布,出现了两个分布,用Wasserstein Distance(简称WD)来衡量这两个分布的距离。Discriminator的目标是尽量拉开这两个分布的距离,而Generator的目标是缩小这两个分布的距离——GAN的基本思想。
- 引入了一个均衡的概念来调节Discriminator训练时的两个目标的比重:目标1,是提高auto-encoder的重构能力,即auto-encoder恢复输入input_img的能力;目标2,提高D的分辨真伪的能力。该均衡控制量是可以变动的,就像是电路中的反馈环,构成了反馈比例控制(Proportional Control)迭代机制。
本文是以WD的出发点来解释和构造GAN的,以下是Wasserstein Distance的定义:
W(u1,u2)=infγ∈Γ(u1,u2)E(x1,x2)∼γ[|x1−x2|](2) W ( u 1 , u 2 ) = inf γ ∈ Γ ( u 1 , u 2 ) E ( x 1 , x 2 ) ∼ γ [ | x 1 − x 2 | ] ( 2 )
WD本来就是用来衡量两个分布的距离的,知乎上有一篇文章讲得很详细: https://www.zhihu.com/question/39872326?sort=created
在BEGAN中, u1 u 1 和 u2 u 2 是两个分布, u1 u 1 代表由real_img在Discriminator上生成的Loss_D,即Loss_D_real,而 u2 u 2 代表fake_img在Discriminator上生成的Loss_D,即Loss_D_fake。 W(u1,u2) W ( u 1 , u 2 ) 便是衡量这两个分布的距离。
(2)式右边是求1次范数均值的下确界。 x1 x 1 是服从 u1 u 1 的随机样本,同理, x

本文深入解析了Boundary Equilibrium Generative Adversarial Networks (BEGAN)的工作原理,介绍了其通过auto-encoder实现判别器的独特之处,并探讨了如何使用Wasserstein Distance来评估真实与生成数据之间的分布差异。
622

被折叠的 条评论
为什么被折叠?



