推荐系统之 AutoRec和Deep Crossing

最新推荐文章于 2026-06-07 15:02:52 发布

原创最新推荐文章于 2026-06-07 15:02:52 发布 · 374 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

推荐系统

本文介绍了如何将深度学习应用于推荐系统，重点讲解了AutoRec（结合AE与协同过滤）和DeepCrossing（特征交叉与多层网络优化）模型的工作原理、结构与应用。通过实例解析了AE的降维和预测能力在AutoRec中的作用，以及DeepCrossing如何处理稀疏数据和特征组合。

与之前的GBDT+LR，协同过滤以及其变种，这些都是一些机器学习的模型，下面我们要将神经网络引入推荐领域了

与传统的机器学习模型相比，深度学习模型的表达能力更强，能够挖掘出数据里更多的潜在的隐藏信息，并且深度学习的模型结构非常的灵活，可以根据业务场景和数据特点做出调整。

上面是路线进化图，暂时没有这么一本书可以从如此大局观地去引导读者学习，这书确实不错，之前分析过AE到VAE的文章，现在正好结合上推荐一起分析AutoRec了，然后后面是Deep Crossing，这里面图提到了ResNet，也可以一块看了。真不错！

1. AutoRec（自编码器推荐）

它将自动编码器（AutoEncoder）和协同过滤结合在一起了，利用AE的单层网络结构，来实现推荐的目的。

其实原理非常简单，首先回顾一下AE到底干嘛了，流程就是，将样本变成输入向量，然后经过特征处理，将数据降维到一个向量M，通常向量M的维度都比输入向量的维度要小得多，截止到这里，就代表编码完成了。然后我们用这个压缩后的特征向量去反编码成和原来输入向量维度一样的输出向量。

所以我们可以看出，编码器就相当于做了数据的压缩和降维，并且AE的Loss函数是：

$Loss= argmin(\sum^N_{i=1}(Y_i-AE(I_i,\theta))^2)$

也就是一个不断去修改我们的编码能力，从而找到比较好的value去表达出我们的样本。经过AE的输出向量，由于经过了AE的学习和泛化，不会完全等同于输入向量的。所以因此也具备了一定的确实维度的预测能力，这也是AE能用于推荐系统的原因了。

下面讲AutoRec：

我们的训练样本就是一个协同过滤的共现矩阵，然后我们现在就是用AutoRec去学习这个共现矩阵，使得编码器自己输出的评分向量与原评分向量的平方残差和最小。

得到编码器后，我们要怎样才获得推荐列表呢？，这是两个重要的问题，一个是怎么学，一个是怎么获得推荐列表

其中V是输入层到隐藏层的参数矩阵，Wji是隐藏层到输出层的参数矩阵，而k代表隐藏层的神经元个数，通常k是远小于输入层向量的维度的。

我们把经过AR的输出向量给表示出来：

$h(r;\theta)=f(W*g(V*r+\mu)+b)$

为了防止过拟合，我们加上L2的正则化项：

$min_\theta \sum_N_{i=1}(r_i - h(r_i;\theta))^2 + \frac{\lambda}{2}(|W|^2 + |V|^2)$

然后我们用梯度下降去更新两个变量，W和V，也就是两个矩阵的vlaue

这就讲完了AutoRec了，后面讲第二个问题，他是怎么做推荐的。

我们不是要给用户推荐商品嘛，然后也就是我们要给所有的商品做一个排序，于是我们先把一个商品的评分向量（所有用户对这个商品i的评分向量）给输入进去，然后我们就会得到一个由AE预测出来所有用户对商品i的评分预测，那么其中第u维就是用户u对物品i的预测了，接着遍历输入物品向量就可以得到用户u对所有物品的评分预测了，进而根据评分预测排序的到推荐列表。

同理，因为我们现在的输入是一个商品的得分向量（Item based AutoRec），假如我们输入变成用户的评分向量，就直接出来当前用户对所有商品的评分了，也就是我只进一次模型就可以做一个预测（这个算法也称为User based AutoRec）相比Item based AutoRe，我们进模型N（商品数）才可以得到预测列表，这个只需进一次即可。但是用户向量的稀疏姓会影响模型的效果。

2. Deep Crossing

Deep Crossing 模型能够完整地解决从特征工程，稀疏向量稠密化，多层神经网络进行优化目标你和的那个一些列深度学习在推荐系统中的应用问题。

首先我们先将数据处理三种类型：