Consistency Models

最新推荐文章于 2026-06-15 07:56:41 发布

原创

最新推荐文章于 2026-06-15 07:56:41 发布 · 1.8k 阅读

·

1

·

标签

#人工智能 #机器学习 #深度学习

Consistency Models- 理解

在这里插入图片描述

pdf：https://arxiv.org/pdf/2303.01469.pdf
github：https://github.com/openai/consistency_models

问题定义

图像编辑等

研究动机

扩散模型依赖于迭代生成过程，导致采样速度较慢，实时应用有限。

本文中心论点

给定一个概率流(PF) ODE，它能平滑地将数据转换为噪声。作者学习将ODE轨迹上的任何点(例如， $x_t, x'_t$ )映射到它的原点(例如， $x_0$ )，用于生成建模。
这些映射的模型称为一致性模型，因为对于同一轨迹上的点，他们的输出被训练为的一致的。

相关工作和进展

扩散模型受限于时间。

Consistency Models创新点

一致性模型在设计上支持快速的一步生成，同时仍然允许少步采样以换取样本质量的计算。
一种新的生成模型家族，可以在没有对抗性训练的情况下实现高样本质量
支持zero-shot数据编辑，如图像修补、着色和超分辨率，而不需要对这些任务进行明确的训练。
一致性模型既可以作为提取预训练扩散模型的一种方式训练，也可以作为独立的生成模型训练。

review扩散模型

将扩散理解为一个在时间上连续的变换过程（引入SDE形式来描述扩散模型的本质好处是“将理论分析和代码实现分离开来”，借助连续性SDE的数学工具做分析，实践的时候，则只需要用任意适当的离散化方案对SDE进行数值计算）
用随机微分方程（Stochastic Differential Equation，SDE）来描述扩散模型：
在这里插入图片描述
可以理解为下式（离散化）：

在以前的论文中推导出上述SDE存在一个ODE形式的解轨迹（Probability Flow ODE）

SDE设计为让 $p_T(x)$ 接近于易处理的高斯分布。采用别人论文中的设置，带入到（2）中

首先训练一个得分模型 $s_\phi (\mathbf{x},t) \approx\bigtriangledown logp_t(\mathbf{x})$ ，(2)转化为。称为empirical PF ODE
在这里插入图片描述
采样 $\widehat{\mathbf{x}} \sim \pi = N (0,T^2 I)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。