从熵的角度解析Inception Score:如何量化生成图像的多样性与清晰度
在生成对抗网络(GAN)的研究与应用中,如何客观评估生成图像的质量一直是个核心挑战。传统的人工评估方法不仅耗时耗力,还难以避免主观偏差。本文将深入解析Inception Score(IS)这一经典评估指标,从信息论中的熵和KL散度切入,揭示其背后的数学原理与工程实践。
1. Inception Score的核心思想
Inception Score由Tim Salimans等人在2016年提出,已成为评估GAN生成质量的基准指标之一。其核心思想基于两个关键维度:
- 图像质量:单张生成图像应具有清晰的语义内容,使得分类器能明确判断其类别
- 多样性:生成图像集合应覆盖尽可能多的类别,避免模式坍塌
这两个维度通过信息论中的条件熵和边缘熵来量化。具体而言:
- 条件熵 $H(y|x)$ 衡量单张图像分类结果的不确定性。高质量图像应使分类器输出"尖锐"的概率分布(低熵)
- 边缘熵 $H(y)$ 衡量所有生成图像的类别分布。多样性好的生成器应使类别分布均匀(高熵)
# 条件熵计算示例
def conditional_entropy(prob_dist):
return -np.sum(prob_dist * np.log(prob_dist + 1e-10), axis=1)
2. 数学推导:从熵到KL散度
IS的数学表达源自KL散度(Kullback-Leibler divergence),它衡量两个概率分布的差异:
$$ IS = \exp(\mathbb{E}_x[KL(p(y|x)||p(y))]) $$
其中:

989

被折叠的 条评论
为什么被折叠?



