1. 会话推荐系统的个性化困境与破局思路
在电商、流媒体等场景中,会话推荐系统(Session-Based Recommendation System, SBRS)通过分析用户短期内的点击、浏览序列来预测兴趣偏好,是应对用户匿名访问的经典方案。但传统方法存在一个根本性矛盾:将每个会话视为独立单元,导致跨会话的长期偏好信息丢失。这就好比仅凭顾客最近5分钟的购物车记录来推荐商品,而忽略了他过去3个月累计购买的50本悬疑小说和15部科幻电影。
这种匿名会话假设带来三个典型问题:
- 冷启动敏感 :新用户或低频用户的有限交互数据难以形成有效推荐
- 偏好漂移误判 :将用户多元兴趣(如工作日看职场书籍、周末看漫画)误认为兴趣变化
- 长尾失效 :难以通过稀疏交互发现用户潜在但尚未表达的细分兴趣
当前主流解决方案呈现两极分化:
- 序列建模派 :如GRU4Rec、SASRec等模型,专注会话内序列模式挖掘,但像"近视眼"只看得见眼前几步
- LLM语义派 :利用大语言模型解析物品文本特征,但用户侧表示受限于行为数据稀疏性,且计算成本高昂
我们团队在Amazon数据集上的实验显示,单纯依赖会话序列的模型在HR@100指标上比人工策略仅提高12%,而纯LLM方案推理延迟高达300ms/请求。这促使我们思考:能否找到兼顾短期意图捕获与长期偏好理解的"第三路径"?
2. 知识图谱与大语言模型的协同架构
2.1 整体框架设计
我们的解决方案核心是构建**异构知识图谱(Heterogeneous Knowledge Graph)**作为连接LLM与序列模型的桥梁。如图1所示,系统采用两阶段架构:
[用户实时会话序列] →
[阶段1:个性化信息抽取]
├─ 知识图谱构建
├─ LLM物品嵌入初始化
└─ HDGI用户画像学习
→
[阶段2:个性化信息利用]
├─ 候选集生成(结合画像+物品嵌入)
└─ SASRec重排序(专注会话上下文)
这种设计有三大创新点:
- 时空信息分离 :KG整合时间无关的用户-物品交互(表征稳定偏好),会话模型处理实时序列(捕捉临时意图)
- 表示学习分工 :LLM专注物品语义理解,图神经网络负责用户画像挖掘
- 计算效率平衡 :LLM仅在前置特征工程阶段调用,线上推理仍保持轻量
2.2 知识图谱的异构构建
以Amazon Movies数据集为例,我们构建的KG包含9类节点和21种关系,形成多维语义网络:
| 节点类型 | 示例 | 关系类型 | 说明 |
|---|---|---|---|
| User | 匿名用户ID | rated | 评分行为 |
| Movie | "盗梦空间" | directed_by | 导演关联 |
| Person | 克里斯托弗·诺兰 | also_viewed | 协同浏览 |
| Genre | 科幻 | literaryGenre_is | 文学流派 |
| Award | 奥斯卡最佳视觉效果 | starring | 主演关系 |
特别地,我们引入DBpedia的外部知识实现 跨域关联 。例如通过"inspired_by"关系将电影《银翼杀手》与菲利普·K·迪克的小说连接,这种隐含的文学偏好可能影响用户对同类影片的接受度。
2.3 双通道特征初始化
物品节点初始化 : 采用Qwen-3-8B模型对标题、描述文本生成嵌入。关键技巧包括:
- 描述增强:对"星际穿越"不仅编码标题,还组合"涉及虫洞旅行、父女情感的硬科幻电影"等人工摘要
- 属性分权:导演、主演等字段用[SEP]分隔,在后续图卷积中分配不同注意力权重
用户节点初始化 : 不同于传统随机初始化,我们采用 行为轮廓编码 :
- 提取用户历史交互物品的LLM嵌入均值
- 叠加品类分布向量(如科幻:0.7, 爱情:0.2)
- 通过高斯噪声注入防止过平滑
这种初始化方式在冷启动用户测试集上使HR@10提升19%,证明即使稀疏数据也能捕获粗略偏好倾向。
3. 异构图表征学习实战
3.1 HDGI算法详解
Heterogeneous Deep Graph Infomax (HDGI) 是我们的核心创新,其工作流程如下:
-
多关系邻域聚合 : 对每种关系类型r,设计特定的消息传递规则。例如"also_viewed"关系采用均值聚合,而"directed_by"则用注意力加权:
h_v^r = σ(∑_{u∈N_r(v)} α_{vu} W_r h_u) α_{vu} = softmax(MLP([h_v||h_u||e_r])) -
元路径语义融合 : 定义"User-rated-Movie-genre"等元路径,通过层次注意力机制组合不同路径表征:
h_v^meta = ∑_{p∈P} β_p · h_v^p β_p = softmax(q^T tanh(W_p h_v^p)) -
对比学习目标 : 通过破坏性负采样(边删除+特征扰动),构建全局-局部互信息最大化目标:
# 正样本:真实节点表征h_v与全局图摘要s # 负样本:破坏后的节点h̃_v与相同s loss = -∑[log D(h_v,s) + log(1-D(h̃_v,s))]
在Amazon Books数据集上,HDGI相比传统GCN在用户聚类纯度指标上提升27%,证明其更好捕获了潜在兴趣社群。
3.2 关键实现细节
-
负采样策略 :
- 结构破坏:随机删除30%的边,保留核心连接
- 特征噪声:对文本嵌入添加η~U(-0.2,0.2)的扰动
- 跨用户负例:混合其他用户的子图片段
-
多任务优化 :
- 主任务:对比损失L_HDGI
- 辅助任务:物品类别预测(增强语义一致性)
- 正则项:用户嵌入的方差约束(防止过度极化)
-
计算加速 :
- 使用Faiss进行近似最近邻搜索,加速负例筛选
- 对稳定用户(交互>20次)冻结其嵌入更新
实践发现:当用户节点度小于5时,关闭对比学习中的特征扰动能提升稳定性。这可能因为稀疏连接下原始特征已足够脆弱。
4. 混合推荐管线实现
4.1 候选生成阶段
将学习到的用户画像u_persona与LLM物品嵌入e_item结合,构建双塔检索模型:
class RetrievalTower(nn.Module):
def __init__(self, dim=768):
super().__init__()
self.user_net = nn.Sequential(
nn.Linear(dim, dim//2),
nn.GELU()
)
self.item_net = copy.deepcopy(self.user_net)
def forward(self, u, v):
u_proj = self.user_net(u_persona) # 用户侧投影
v_proj = self.item_net(e_item) # 物品侧投影
return torch.matmul(u_proj, v_proj.T) # 相似度矩阵
采用 温度调节的负采样交叉熵 作为损失函数,重点关注难负例(语义相近但不匹配的物品):
loss = -log(exp(s_pos/τ) / (exp(s_pos/τ) + ∑_{k=1}^K exp(s_neg^k/τ)))
其中温度系数τ=0.1时,在Movies数据集上比标准softmax提升NDCG@10达3.2%。
4.2 重排序阶段
使用SASRec作为基础序列模型,但做了两处改进:
-
注意力掩码增强 : 除常规的因果掩码外,添加基于物品类别的过滤:
if item_j not in user_preferred_categories: attention_mask[i,j] = -np.inf -
残差画像注入 : 在Transformer最后一层加入用户画像作为偏置项:
h_final = h_seq + λ·W_u·u_persona
实验表明,当λ=0.3时能在保留会话动态的同时有效融合长期偏好。
5. 实战效果与调优指南
5.1 性能对比
在Amazon Movies & TV数据集上的关键指标:
| 方法 | HR@10 | NDCG@10 | 推理延迟 |
|---|---|---|---|
| SASRec (基线) | 0.130 | 0.075 | 28ms |
| Pure LLM | 0.117 | 0.065 | 312ms |
| KG+LLM (本文) | 0.133 | 0.076 | 35ms |
| +重排序 | 0.133 | 0.078 | 41ms |
关键发现:
- 在HR@100指标上提升最显著(+3.2%),说明KG有效扩展了候选池质量
- 推理延迟仅增加25%,远低于纯LLM方案
- 冷启动用户(交互<5次)的NDCG提升达41%
5.2 超参调优经验
基于网格搜索得出的关键参数影响:
-
LLM嵌入维度 :
- 维度<512时语义捕获不充分
-
1024时图卷积计算量激增
- 最佳折中:768维
-
HDGI负例比例 :
- 推荐负例数=5×正例数
- 过多负例会导致训练不稳定
-
重排序权重λ :
-
随用户交互次数增加而递减:
λ = 0.4 * exp(-n_interactions/20)
-
随用户交互次数增加而递减:
5.3 常见故障排查
问题1 :新物品加入后推荐质量下降
- 检查项:是否及时更新了LLM嵌入
- 解决方案:建立物品特征变更监听机制
问题2 :用户画像出现性别/年龄偏见
- 检查项:KG中demographic相关属性的隔离
- 解决方案:在HDGI损失中添加去偏正则项
问题3 :实时会话响应超时
- 检查项:Faiss索引是否采用HNSW算法
- 解决方案:将用户画像预加载到Redis
6. 扩展应用与未来方向
当前架构已成功应用于在线教育课程推荐场景,通过构建"用户-课程-知识点-教师"的异构KG,使完课率提升22%。以下是三个有价值的扩展方向:
- 动态画像更新 :目前用户画像每周全量更新,未来可探索增量学习机制
- 多模态KG :引入物品封面图像、视频预告片等视觉特征
- 可解释性增强 :基于元路径的推荐理由生成,如"推荐《三体》因为您喜欢《基地》系列且关注雨果奖作品"
这个框架的核心价值在于 平衡了语义理解与关系推理 。就像一位经验丰富的书店店员,既了解每本书的内容(LLM的作用),又记得老顾客的阅读习惯(KG的价值),还能根据顾客当下的浏览动态调整推荐(序列模型的能力)。这种混合智能或是下一代推荐系统的演进方向。
1065

被折叠的 条评论
为什么被折叠?



