点击率(CTR)平滑手段

本文探讨了商品点击率(CTR)预测中的两个问题:新商品的CTR计算和不同商品间的比较。指出初始CTR设为0不合理,并提出通过平滑技术解决,如在CTR公式中加入平滑项。贝叶斯平滑和使用当天平均点击数与曝光数作为平滑参数是两种可能的方法。

原文链接:https://blog.csdn.net/jinping_shi/article/details/78334362

以商品的点击率预测为例:
CTR的值等于点击量除以曝光量,公式如下:
r = c l i c k s h o w r = \frac {click} {show} r=showclick
但在实际应用中会碰到两个问题:

  • 新商品点击率的预测与计算
    对于新上线的商品,其曝光为0,点击量也为0,此时这件商品的CTR应该设为0还是赋一个初始值?
  • 不同商品点击率之间的比较
    有两件商品A和B,其点击率分别为 r A = 5 / 10 r_A=5/10 rA=5/10 r B = 50 / 100 r_B=50/100 rB=50/100 r A = r B r_A = r_B rA=rB,但商品A的曝光只有10次,商品B的曝光有100次,这样比较是否合理?
    第一个问题,初始值设0是可以的,但不太合理。当CTR作为特征使用时,表示这个商品完全没有点击,不太符合日常推断,通常是赋一个大于0的初始值。第二个问题,不合理。

解决以上两个问题可以使用平滑的技术解决。最简单的方法是在计算CTR的公式中分子分母同时加上一个数,加上之后可避免这两个问题。
r = c l i c k + a s h o w + b r = \frac {click+a} {show+b} r=show+bclick+a
原文中讲到,可以用贝叶斯平滑的手段来计算。
更简单的方法是,可以计算出所有商品在当天的平均点击数,和平均曝光数,分别作为 a a a b b b, 来做平滑。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值