Consistency Models

在这里插入图片描述

pdf:https://arxiv.org/pdf/2303.01469.pdf
github:https://github.com/openai/consistency_models

问题定义

图像编辑等

研究动机

扩散模型依赖于迭代生成过程,导致采样速度较慢,实时应用有限。

本文中心论点
  • 给定一个概率流(PF) ODE,它能平滑地将数据转换为噪声。作者学习将ODE轨迹上的任何点(例如, x t , x t ′ x_t, x'_t xt,xt)映射到它的原点(例如, x 0 x_0 x0),用于生成建模。
  • 这些映射的模型称为一致性模型,因为对于同一轨迹上的点,他们的输出被训练为的一致的。

相关工作和进展

扩散模型受限于时间。

Consistency Models创新点
  • 一致性模型在设计上支持快速的一步生成,同时仍然允许少步采样以换取样本质量的计算。
  • 一种新的生成模型家族,可以在没有对抗性训练的情况下实现高样本质量
  • 支持zero-shot数据编辑,如图像修补、着色和超分辨率,而不需要对这些任务进行明确的训练。
  • 一致性模型既可以作为提取预训练扩散模型的一种方式训练,也可以作为独立的生成模型训练。
review扩散模型

将扩散理解为一个在时间上连续的变换过程(引入SDE形式来描述扩散模型的本质好处是“将理论分析和代码实现分离开来”,借助连续性SDE的数学工具做分析,实践的时候,则只需要用任意适当的离散化方案对SDE进行数值计算)
用随机微分方程(Stochastic Differential Equation,SDE)来描述扩散模型:
在这里插入图片描述
可以理解为下式(离散化):
在这里插入图片描述
在以前的论文中推导出上述SDE存在一个ODE形式的解轨迹(Probability Flow ODE)
在这里插入图片描述
在这里插入图片描述
SDE设计为让 p T ( x ) p_T(x) pT(x) 接近于易处理的高斯分布。采用别人论文中的设置,带入到(2)中
在这里插入图片描述

首先训练一个得分模型 s ϕ ( x , t ) ≈ ▽ l o g p t ( x ) s_\phi (\mathbf{x},t) \approx\bigtriangledown logp_t(\mathbf{x}) sϕ(x,t)logpt(x),(2)转化为。称为empirical PF ODE
在这里插入图片描述
采样 x ^ ∼ π = N ( 0 , T 2 I ) \widehat{\mathbf{x}} \sim \pi = N (0,T^2 I) x π=N(0,T

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值