[SIGIR23]生成式推荐论文Diffusion Recommender Model算法/理论简介

原创

已于 2024-05-27 10:52:06 修改 · 6.3k 阅读

标签

#推荐算法 #神经网络 #python

于 2023-04-18 18:35:39 首次发布

DiffRec是一种新的推荐系统模型，它利用扩散模型处理用户交互中的噪声，通过正向破坏和反向恢复过程来建模复杂的用户行为。文章对比了基于GAN和VAE的传统生成式推荐模型，指出它们的局限性，并提出DiffRec、L-DiffRec和T-DiffRec来改善性能和资源效率。实验显示，这些模型在推荐任务中表现出色，尤其是在应对噪声数据时具有较好的鲁棒性。

Diffusion Recommender Model

论文链接：https://arxiv.org/abs/2304.04971

本文涉及大量贝叶斯概率、变分推理（VI）和扩散模型的应用，为了更好地理解本文，可以先阅读以下文章：

https://arxiv.org/abs/1312.6114 （VAE的开山之作）

Variational Autoencoders for Collaborative Filtering | Proceedings of the 2018 World Wide Web Conference（VAE在推荐中的经典应用）

https://arxiv.org/abs/2208.11970 （扩散模型数学原理的详细讲解）

背景/动机

以生成对抗网络（Generative Adversarial Network，GAN）和变分自编码器（Variational Auto-Encoder，VAE）为代表的生成模型已经被广泛地应用于对用户交互的生成过程进行建模。然而，它们存在固有的限制，例如GAN的不稳定性，和VAE的有限表达能力。这些限制阻碍了复杂的用户交互行为的生成过程，例如由于各种原因产生的噪声交互。

一般地，生成式推荐模型学习生成过程来推断所有无交互物品的用户交互概率。这种生成过程通常假设用户与物品的交互行为（例如点击）是由一些潜在因素（即用户偏好）决定的。由于与现实世界的交互生成过程保持一致，生成式推荐模型取得了重大成功。不失一般性，生成式推荐模型可以分为以下两类：

基于GAN的模型利用生成器来估计用户的交互概率，并利用对抗训练来优化参数。然而，对抗训练通常不稳定，因此表现并不理想。经典的基于GAN的推荐模型参见：

IRGAN | Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval

基于VAE的模型使用编码器来近似潜在因子的后验分布，并最大化观察到的交互的似然。虽然VAE在推荐方面通常由于GAN，但VAE中较为简单的编码器可能无法很好地捕捉不同用户的偏好分布，而复杂编码器的后验分布通常可能难以处理。经典的基于VAE的推荐模型参见：

Variational Autoencoders for Collaborative Filtering | Proceedings of the 2018 World Wide Web Conference

扩散模型（diffusion model，DM）在计算机视觉领域取得了巨大成功，通过在正向过程中逐渐破坏图像并迭代地学习反向重构来实现权衡。

如上图所示，DM向前逐步向输入 $x_0$ 加入随机噪声以破坏，随后从 $x_T$ 逐步恢复至 $x_0$ 。这种正向过程产生易处理的后验，也为在反向生成过程中通过灵活的神经网络迭代建模复杂分布提供了机会。推荐模型的目标域DM保持着一致性，因为推荐模型本质上是基于损坏的历史交互来推断位置的交互概率，其中损坏（corruption）代表假阳性（false-positive，用户交互过，但实际上用户不喜欢）和假阴性（false-negative，用户没有交互过，但实际上用户喜欢）物品，这表明已观测到的交互充斥着噪声。关于假阴性样本和假阳性样本的更多介绍，可以参见：

Denoising Implicit Feedback for Recommendation | Proceedings of the 14th ACM International Conference on Web Search and Data Mining

虽然传统的生成式推荐模型已经取得了巨大成功，但很少的工作考虑到交互中的噪声问题，而探索DM在推荐系统中的应用则具有强大潜力。

前置知识

扩散模型包含两个部分，即正向（forward）和反向（reverse）过程。

正向过程

给定输入样本 $x_0 \sim q(x_0)$ ，在随后的 $T$ 步中逐渐增加高斯噪声构造隐向量 $x_{1:T}$ 。具体来说，DM定义正向迁移 $x_{t-1}\rightarrow x_t$ 为 $q(x_t|x_{t-1})=\mathcal N(x_t;\sqrt{1-\beta_t}x_{t-1},\beta_t\mathbf I)$ ，其中 $t\in\{1, ..., T\}$ 表示扩散步骤（diffusion step）， $\beta_t \in (0,1)$ 控制增加至第 $t$ 步的噪声规模。

反向过程

DM学习从 $x_t$ 中移除增加的噪声，并尝试恢复 $x_{t-1}$ ，旨在捕获复杂生成过程中的微小变化。形式上，以 $x_T$ 为初始状态，DM通过下式迭代地学习降噪过程 $x_t\rightarrow x_{t-1}$ ：

最低0.47元/天解锁文章