风险感知推荐系统与高中排课问题的研究进展
风险感知推荐系统
在推荐系统领域,风险感知是一个重要的研究方向。相关算法在临界情况感知与探索方面有着独特的策略。
当推断上下文敏感(CS)中的最优探索时,算法通过选择Dy中点击率(CTR)最高的文档进行安全探索,其中Dy是与当前情况St最相似的情况Sy(Sy ∉ CS)下推荐的文档集,通过特定公式计算得出。同时,为避免CS中文档选择的次优性,随机探索也是必不可少的。
具体来说,当当前用户情况处于临界状态时,系统进行低且安全的探索;否则,进行高探索。探索程度会随情况风险水平的增加而降低。为验证当前情况St是否临界,需计算风险阈值thR,其计算公式如下:
[
thR =
\begin{cases}
\theta & \text{if } CS = \varnothing, CV \neq \varnothing \
B & \text{if } CS \neq \varnothing, CV = \varnothing \
\frac{1}{2} \times (\eta\theta + \zeta B) & \text{if } CS \neq \varnothing, CV \neq \varnothing
\end{cases}
]
下面是R - UCB算法的具体步骤:
Algorithm 1. The R - UCB algorithm
1: Input: St, Dp, Dy, RD = ∅, B, N, ϵmin, ϵma
超级会员免费看
订阅专栏 解锁全文
1119

被折叠的 条评论
为什么被折叠?



