Consistency Models- 理解

pdf:https://arxiv.org/pdf/2303.01469.pdf
github:https://github.com/openai/consistency_models
问题定义
图像编辑等
研究动机
扩散模型依赖于迭代生成过程,导致采样速度较慢,实时应用有限。
本文中心论点
- 给定一个概率流(PF) ODE,它能平滑地将数据转换为噪声。作者学习将ODE轨迹上的任何点(例如, x t , x t ′ x_t, x'_t xt,xt′)映射到它的原点(例如, x 0 x_0 x0),用于生成建模。
- 这些映射的模型称为一致性模型,因为对于同一轨迹上的点,他们的输出被训练为的一致的。
相关工作和进展
扩散模型受限于时间。
Consistency Models创新点
- 一致性模型在设计上支持快速的一步生成,同时仍然允许少步采样以换取样本质量的计算。
- 一种新的生成模型家族,可以在没有对抗性训练的情况下实现高样本质量
- 支持zero-shot数据编辑,如图像修补、着色和超分辨率,而不需要对这些任务进行明确的训练。
- 一致性模型既可以作为提取预训练扩散模型的一种方式训练,也可以作为独立的生成模型训练。
review扩散模型
将扩散理解为一个在时间上连续的变换过程(引入SDE形式来描述扩散模型的本质好处是“将理论分析和代码实现分离开来”,借助连续性SDE的数学工具做分析,实践的时候,则只需要用任意适当的离散化方案对SDE进行数值计算)
用随机微分方程(Stochastic Differential Equation,SDE)来描述扩散模型:

可以理解为下式(离散化):
![]()
在以前的论文中推导出上述SDE存在一个ODE形式的解轨迹(Probability Flow ODE)

![]()
SDE设计为让 p T ( x ) p_T(x) pT(x) 接近于易处理的高斯分布。采用别人论文中的设置,带入到(2)中
![]()
首先训练一个得分模型 s ϕ ( x , t ) ≈ ▽ l o g p t ( x ) s_\phi (\mathbf{x},t) \approx\bigtriangledown logp_t(\mathbf{x}) sϕ(x,t)≈▽logpt(x),(2)转化为。称为empirical PF ODE

采样 x ^ ∼ π = N ( 0 , T 2 I ) \widehat{\mathbf{x}} \sim \pi = N (0,T^2 I) x
∼π=N(0,T

3175

被折叠的 条评论
为什么被折叠?



