会话推荐系统：知识图谱与大语言模型协同优化

原创于 2026-06-22 16:34:01 发布 · 589 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#会话推荐系统 #知识图谱 #大语言模型

javascript 专栏收录该内容

104 篇文章

订阅专栏

AI助手已提取文章相关产品：

1. 会话推荐系统的个性化困境与破局思路

在电商、流媒体等场景中，会话推荐系统（Session-Based Recommendation System, SBRS）通过分析用户短期内的点击、浏览序列来预测兴趣偏好，是应对用户匿名访问的经典方案。但传统方法存在一个根本性矛盾：将每个会话视为独立单元，导致跨会话的长期偏好信息丢失。这就好比仅凭顾客最近5分钟的购物车记录来推荐商品，而忽略了他过去3个月累计购买的50本悬疑小说和15部科幻电影。

这种匿名会话假设带来三个典型问题：

冷启动敏感 ：新用户或低频用户的有限交互数据难以形成有效推荐
偏好漂移误判 ：将用户多元兴趣（如工作日看职场书籍、周末看漫画）误认为兴趣变化
长尾失效 ：难以通过稀疏交互发现用户潜在但尚未表达的细分兴趣

当前主流解决方案呈现两极分化：

序列建模派 ：如GRU4Rec、SASRec等模型，专注会话内序列模式挖掘，但像"近视眼"只看得见眼前几步
LLM语义派 ：利用大语言模型解析物品文本特征，但用户侧表示受限于行为数据稀疏性，且计算成本高昂

我们团队在Amazon数据集上的实验显示，单纯依赖会话序列的模型在HR@100指标上比人工策略仅提高12%，而纯LLM方案推理延迟高达300ms/请求。这促使我们思考：能否找到兼顾短期意图捕获与长期偏好理解的"第三路径"？

2. 知识图谱与大语言模型的协同架构

2.1 整体框架设计

我们的解决方案核心是构建**异构知识图谱（Heterogeneous Knowledge Graph）**作为连接LLM与序列模型的桥梁。如图1所示，系统采用两阶段架构：

[用户实时会话序列] → 
[阶段1：个性化信息抽取]
    ├─ 知识图谱构建
    ├─ LLM物品嵌入初始化  
    └─ HDGI用户画像学习
→ 
[阶段2：个性化信息利用]
    ├─ 候选集生成（结合画像+物品嵌入）
    └─ SASRec重排序（专注会话上下文）

这种设计有三大创新点：

时空信息分离 ：KG整合时间无关的用户-物品交互（表征稳定偏好），会话模型处理实时序列（捕捉临时意图）
表示学习分工 ：LLM专注物品语义理解，图神经网络负责用户画像挖掘
计算效率平衡 ：LLM仅在前置特征工程阶段调用，线上推理仍保持轻量

2.2 知识图谱的异构构建

以Amazon Movies数据集为例，我们构建的KG包含9类节点和21种关系，形成多维语义网络：

节点类型	示例	关系类型	说明
User	匿名用户ID	rated	评分行为
Movie	"盗梦空间"	directed_by	导演关联
Person	克里斯托弗·诺兰	also_viewed	协同浏览
Genre	科幻	literaryGenre_is	文学流派
Award	奥斯卡最佳视觉效果	starring	主演关系

特别地，我们引入DBpedia的外部知识实现 跨域关联 。例如通过"inspired_by"关系将电影《银翼杀手》与菲利普·K·迪克的小说连接，这种隐含的文学偏好可能影响用户对同类影片的接受度。

2.3 双通道特征初始化

物品节点初始化 ：采用Qwen-3-8B模型对标题、描述文本生成嵌入。关键技巧包括：

描述增强：对"星际穿越"不仅编码标题，还组合"涉及虫洞旅行、父女情感的硬科幻电影"等人工摘要
属性分权：导演、主演等字段用[SEP]分隔，在后续图卷积中分配不同注意力权重

用户节点初始化 ：不同于传统随机初始化，我们采用 行为轮廓编码 ：

提取用户历史交互物品的LLM嵌入均值
叠加品类分布向量（如科幻:0.7, 爱情:0.2）
通过高斯噪声注入防止过平滑

这种初始化方式在冷启动用户测试集上使HR@10提升19%，证明即使稀疏数据也能捕获粗略偏好倾向。

3. 异构图表征学习实战

3.1 HDGI算法详解

Heterogeneous Deep Graph Infomax (HDGI) 是我们的核心创新，其工作流程如下：

多关系邻域聚合 ：对每种关系类型r，设计特定的消息传递规则。例如"also_viewed"关系采用均值聚合，而"directed_by"则用注意力加权：
```
h_v^r = σ(∑_{u∈N_r(v)} α_{vu} W_r h_u)
α_{vu} = softmax(MLP([h_v||h_u||e_r]))
```
元路径语义融合 ：定义"User-rated-Movie-genre"等元路径，通过层次注意力机制组合不同路径表征：
```
h_v^meta = ∑_{p∈P} β_p · h_v^p
β_p = softmax(q^T tanh(W_p h_v^p))
```

对比学习目标 ：通过破坏性负采样（边删除+特征扰动），构建全局-局部互信息最大化目标：

# 正样本：真实节点表征h_v与全局图摘要s
# 负样本：破坏后的节点h̃_v与相同s
loss = -∑[log D(h_v,s) + log(1-D(h̃_v,s))]

在Amazon Books数据集上，HDGI相比传统GCN在用户聚类纯度指标上提升27%，证明其更好捕获了潜在兴趣社群。

3.2 关键实现细节

负采样策略 ：
- 结构破坏：随机删除30%的边，保留核心连接
- 特征噪声：对文本嵌入添加η~U(-0.2,0.2)的扰动
- 跨用户负例：混合其他用户的子图片段
多任务优化 ：
- 主任务：对比损失L_HDGI
- 辅助任务：物品类别预测（增强语义一致性）
- 正则项：用户嵌入的方差约束（防止过度极化）
计算加速 ：
- 使用Faiss进行近似最近邻搜索，加速负例筛选
- 对稳定用户（交互>20次）冻结其嵌入更新

实践发现：当用户节点度小于5时，关闭对比学习中的特征扰动能提升稳定性。这可能因为稀疏连接下原始特征已足够脆弱。

4. 混合推荐管线实现

4.1 候选生成阶段

将学习到的用户画像u_persona与LLM物品嵌入e_item结合，构建双塔检索模型：

class RetrievalTower(nn.Module):
    def __init__(self, dim=768):
        super().__init__()
        self.user_net = nn.Sequential(
            nn.Linear(dim, dim//2),
            nn.GELU()
        )
        self.item_net = copy.deepcopy(self.user_net)
        
    def forward(self, u, v):
        u_proj = self.user_net(u_persona)  # 用户侧投影
        v_proj = self.item_net(e_item)     # 物品侧投影
        return torch.matmul(u_proj, v_proj.T)  # 相似度矩阵

采用 温度调节的负采样交叉熵 作为损失函数，重点关注难负例（语义相近但不匹配的物品）：

loss = -log(exp(s_pos/τ) / (exp(s_pos/τ) + ∑_{k=1}^K exp(s_neg^k/τ)))

其中温度系数τ=0.1时，在Movies数据集上比标准softmax提升NDCG@10达3.2%。

4.2 重排序阶段

使用SASRec作为基础序列模型，但做了两处改进：

注意力掩码增强 ：除常规的因果掩码外，添加基于物品类别的过滤：
```
if item_j not in user_preferred_categories:
    attention_mask[i,j] = -np.inf
```
残差画像注入 ：在Transformer最后一层加入用户画像作为偏置项：
```
h_final = h_seq + λ·W_u·u_persona
```

实验表明，当λ=0.3时能在保留会话动态的同时有效融合长期偏好。