DDPM与DDIM图像编辑入门概念和知识

原创已于 2024-11-29 21:51:50 修改 · 839 阅读

·

4

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#人工智能

于 2024-11-21 00:13:21 首次发布

Diffusion 专栏收录该内容

38 篇文章

订阅专栏

目录

1. DDPM（Denoising Diffusion Probabilistic Models）与DDIM（Denoising Diffusion Implicit Models）

2. ControlNet：Adding Conditional Control to Text-to-Image Diffusion Models

1. DDPM（Denoising Diffusion Probabilistic Models）与DDIM（Denoising Diffusion Implicit Models）

DDPM是开山之作，DDIM是基于DDPM的。

DDPM是一个特殊的VAE。它的编码器是 $T$ 步固定的加噪操作，解码器是 $T$ 步可学习的去噪操作。模型的学习目标是让每一步去噪操作尽可能抵消掉对应的加噪操作。

参考：https://zhuanlan.zhihu.com/p/666552214

(上面知乎这篇讲的非常好)

Null-Text Inversion论文可视化了DDIM Inversion（加噪）不同CFG权重w对重构性和编辑性的影响：w越小，DDIM Inversion得到的ZT越服从高斯分布，编辑性越强（接近Diffusion的latent space，便于利用模型本身生成能力实现编辑）

参考：扩散模型Inversion7篇工作汇总 - 知乎

2. ControlNet：Adding Conditional Control to Text-to-Image Diffusion Models

目的：

（1）让预训练好的大型DDPM模型支持额外的输入条件（如Canny edges、Hough lines、user scribbles、segmentation maps、human key points、shape normals、depths等）

（2）不同于image-to-image translation致力于学习不同domain之间的映射，ContrlNet旨在用task-specific condition来控制扩散模型

方法：

参考： [ControlNet] Adding Conditional Control to Text-to-Image Diffusion Models_controlnet: adding conditional control to text-to--CSDN博客

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。