原文链接:https://blog.csdn.net/jinping_shi/article/details/78334362
以商品的点击率预测为例:
CTR的值等于点击量除以曝光量,公式如下:
r
=
c
l
i
c
k
s
h
o
w
r = \frac {click} {show}
r=showclick
但在实际应用中会碰到两个问题:
- 新商品点击率的预测与计算
对于新上线的商品,其曝光为0,点击量也为0,此时这件商品的CTR应该设为0还是赋一个初始值? - 不同商品点击率之间的比较
有两件商品A和B,其点击率分别为 r A = 5 / 10 r_A=5/10 rA=5/10和 r B = 50 / 100 r_B=50/100 rB=50/100, r A = r B r_A = r_B rA=rB,但商品A的曝光只有10次,商品B的曝光有100次,这样比较是否合理?
第一个问题,初始值设0是可以的,但不太合理。当CTR作为特征使用时,表示这个商品完全没有点击,不太符合日常推断,通常是赋一个大于0的初始值。第二个问题,不合理。
解决以上两个问题可以使用平滑的技术解决。最简单的方法是在计算CTR的公式中分子分母同时加上一个数,加上之后可避免这两个问题。
r
=
c
l
i
c
k
+
a
s
h
o
w
+
b
r = \frac {click+a} {show+b}
r=show+bclick+a
原文中讲到,可以用贝叶斯平滑的手段来计算。
更简单的方法是,可以计算出所有商品在当天的平均点击数,和平均曝光数,分别作为
a
a
a 和
b
b
b, 来做平滑。
本文探讨了商品点击率(CTR)预测中的两个问题:新商品的CTR计算和不同商品间的比较。指出初始CTR设为0不合理,并提出通过平滑技术解决,如在CTR公式中加入平滑项。贝叶斯平滑和使用当天平均点击数与曝光数作为平滑参数是两种可能的方法。
1128

被折叠的 条评论
为什么被折叠?



