论文标题:《Delayed Feedback Modeling for the Entire Space Conversion Rate Prediction》

论文链接

欢迎关注我的公众号,了解算法岗面经、深圳教师招聘备考指南、程序猿的技术之旅与浪漫生活~

1 总述

本文提出了一种全空间建模的方法(ESDF),同时解决了CVR预估中的3大难题:

  • 数据稀疏问题。即便对于很大数量的曝光样本,点击样本的占比往往较小,其中转化数量更小,ESDF对全空间建模,让所有样本都参与训练,并且CVR与CTR共用向量表示,使得转化样本极少的物品向量也能够在曝光的记录中被训练到。
  • 样本选择偏差问题。一些CVR模型仅对曝光样本进行训练,而在全样本空间上进行预测,使用的数据分布不同影响模型效果。ESDF使用全空间样本,解决了这一问题。
  • 延迟反馈问题。训练时数据中可能存在很多会在未来转化的样本,但被标记为阴性,即假阴性标签。

2 符号介绍

X:用户及物品的特征

Y:01变量,是否发生点击

Z:01变量,是否已经发生转化

C:01变量,是否最终发生转化

D:点击和转化之间的时间延迟

E:点击发生距现在的时间间隔

物品经历的流程为:impression—>click->pay,Y表示impression后是否click,C表示click后是否会pay,而Z表示click后是否已经发生pay,若Z=1则必有C=1,但反之不一定。

3 模型介绍

模型框架图:

模型共由三个“塔”组成,第一个预估点击率,第二个预估点击转化率,第三个为延迟反馈模型。

3.1 转化模型

最终想要预测的是点击转化率:
pCVR=P(C=1∣Y=1,X=x,E=e)pCVR=P(C=1|Y=1,X=x,E=e)pCVR=P(C=1∣Y=1,X=x,E=e)
假设最终是否发生转化与E无关,将其拆解为:
P(C=1∣Y=1,X)=P(C=1,Y=1∣X)P(Y=1∣X)P(C=1|Y=1,X)=\frac{P(C=1,Y=1|X)}{P(Y=1|X)}P(C=1∣Y=1,X)=P(Y=1∣X)P(C=1,Y=1∣X)​
将分子、分母分别记做pCTR(预估转化率)和pCTCVR(点击且转化率)。
满足:pCTCVR=pCTR∗pCVRpCTCVR=pCTR*pCVRpCTCVR=pCTR∗pCVR
框架图中的前两个“塔”分别用来预测pCTR和pCVR,其中pCVR是转化模型的终极目标,其他部分只是用来辅助这一模块进行全空间建模。

这两个模型共用参数,这一做法有以下几点优势:

  • 很多物品可能几乎没有被点击过,如果仅仅使用点击样本来训练CVR模型(即仅保留第二个塔),这些物品的向量很难被训练到,但通过两个塔共享参数可以使曝光未点击的样本向量在CTR模型中被更新。
  • CTR与CTCVR模型均为全空间建模,因此不存在数据选择偏差。
  • 如果两个模型不在一起训练,很有可能因为pCTR数值过小而导致分子与分子的比值大于1,因此联合训练能够缓解数值不稳定的问题。

3.2 延迟模型

为了使得模型具有更广泛的使用场景,不再假设延迟时间服从给定分布。

以天为单位,将延迟时间分箱为T+2个:[0,T+1][0, T+1][0,T+1],若点击后延迟时间在0到T则将样本分入第0到T的对应分箱中;若延迟时间大于等于T+1天,则全部分进T+1分箱,这种做法是合理的,因为T足够大时,T+1之后的数量很少,可以看做噪声。

第三个“塔”用以预测延迟日期,实际上是预测样本延迟日期属于每个分箱中的概率,通过softmax函数输出概率值。

P(D=t∣C=1,Y=1,E=e,x)=F(g(x,e),t)P(D=t|C=1,Y=1,E=e,x)=F(g(x,e),t)P(D=t∣C=1,Y=1,E=e,x)=F(g(x,e),t)
其中g(x,e)是经过softmax函数后输出的T+2维向量,表示预测属于每个分箱的概率,而F(α,t)F(\alpha, t)F(α,t)只是表示取向量α\alphaα的第t个分量,后续将简记f(x, t, e)。

3.3 联合模型

使用上述两个模型计算Z与Y的联合概率,从而得到样本分布的似然函数。

Y与Z的取值有三种情况,可将样本下标分为三个集合:
I1,1={i∣zi=1&yi=1,i=1,2,...,N}I_{1,1}=\left\{i|z_i=1 \& y_i=1,i=1,2,...,N\right\}I1,1​={i∣zi​=1&yi​=1,i=1,2,...,N}
I0,1={i∣zi=0&yi=1,i=1,2,...,N}I_{0,1}=\left\{i|z_i=0 \& y_i=1,i=1,2,...,N\right\}I0,1​={i∣zi​=0&yi​=1,i=1,2,...,N}
I0,0={i∣zi=0&yi=0,i=1,2,...,N}I_{0,0}=\left\{i|z_i=0 \& y_i=0,i=1,2,...,N\right\}I0,0​={i∣zi​=0&yi​=0,i=1,2,...,N}
使用到的参数分别来自三个“塔”:Θ={θctr,θctcvr,θdelay}\Theta =\left\{\theta_{ctr},\theta_{ctcvr},\theta_{delay}\right\}Θ={θctr​,θctcvr​,θdelay​}。
似然函数:
P(D;Θ)=∏i∈I1,1P(zi=1,yi=1∣xi,ei)×∏i∈I0,1P(zi=0,yi=1∣xi,ei)×∏i∈I0,0P(zi=0,yi=0∣xi,ei)\begin{aligned} P(\mathcal{D} ; \Theta) &=\prod_{i \in I_{1,1}} P\left(z_{i}=1, y_{i}=1 \mid x_{i}, e_{i}\right) \\ & \times \prod_{i \in I_{0,1}} P\left(z_{i}=0, y_{i}=1 \mid x_{i}, e_{i}\right) \\ & \times \prod_{i \in I_{0,0}} P\left(z_{i}=0, y_{i}=0 \mid x_{i}, e_{i}\right) \end{aligned} P(D;Θ)​=i∈I1,1​∏​P(zi​=1,yi​=1∣xi​,ei​)×i∈I0,1​∏​P(zi​=0,yi​=1∣xi​,ei​)×i∈I0,0​∏​P(zi​=0,yi​=0∣xi​,ei​)​

分别使用p和q表示点击率与点击且转化率:
pi=P(yi=1∣xi)p_i=P(y_i=1|x_i)pi​=P(yi​=1∣xi​)
qi=P(ci=1,yi=1∣xi)q_i=P(c_i=1,y_i=1|x_i)qi​=P(ci​=1,yi​=1∣xi​)

接下来计算三种情况下的联合概率:

点击且已转化:z=1, y=1

已知转化,因此知道其延迟日期,可计算该日期对应的概率。
P(zi=1,yi=1∣xi,ei)=P(ci=1,D=di,yi=1∣xi,ei)=P(ci=1,yi=1∣xi,ei)P(D=di∣ci=1,yi=1,xi,ei)=P(ci=1,yi=1∣xi)P(D=di∣ci=1,yi=1,xi,ei)=qif(di,xi,ei)\begin{aligned} & P\left(z_{i}=1, y_{i}=1 \mid x_{i}, e_{i}\right) \\ =& P\left(c_{i}=1, D=d_{i}, y_{i}=1 \mid x_{i}, e_{i}\right) \\ =& P\left(c_{i}=1, y_{i}=1 \mid x_{i}, e_{i}\right) P\left(D=d_{i} \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \\ =& P\left(c_{i}=1, y_{i}=1 \mid x_{i}\right) P\left(D=d_{i} \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \\ =& q_{i} f\left(d_{i}, x_{i}, e_{i}\right) \end{aligned} ====​P(zi​=1,yi​=1∣xi​,ei​)P(ci​=1,D=di​,yi​=1∣xi​,ei​)P(ci​=1,yi​=1∣xi​,ei​)P(D=di​∣ci​=1,yi​=1,xi​,ei​)P(ci​=1,yi​=1∣xi​)P(D=di​∣ci​=1,yi​=1,xi​,ei​)qi​f(di​,xi​,ei​)​

点击但未转化:z=0, y=1

这种情况包含两种可能:(1)最终不会发生转化。(2)未来会发生转化。
P(zi=0,yi=1∣xi,ei)=P(zi=0,ci=0,yi=1∣xi,ei)+P(zi=0,ci=1,yi=1∣xi,ei)=P(ci=0,yi=1∣xi)+P(zi=0,ci=1,yi=1∣xi,ei)=P(yi=1∣xi)−P(ci=1,yi=1∣xi)+P(ci=1,yi=1∣xi)P(zi=0∣ci=1,yi=1,xi,ei)=pi−qi+qiP(zi=0∣ci=1,yi=1,xi,ei)\begin{aligned} &P\left(z_{i}=0, y_{i}=1 \mid x_{i}, e_{i}\right) \\ &=P\left(z_{i}=0, c_{i}=0, y_{i}=1 \mid x_{i}, e_{i}\right) \\ &+P\left(z_{i}=0, c_{i}=1, y_{i}=1 \mid x_{i}, e_{i}\right) \\ &=P\left(c_{i}=0, y_{i}=1 \mid x_{i}\right) \\ &+P\left(z_{i}=0, c_{i}=1, y_{i}=1 \mid x_{i}, e_{i}\right) \\ &=P\left(y_{i}=1 \mid x_{i}\right)-P\left(c_{i}=1, y_{i}=1 \mid x_{i}\right) \\ &+P\left(c_{i}=1, y_{i}=1 \mid x_{i}\right) P\left(z_{i}=0 \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \\ &=p_i-q_{i}+q_{i} P\left(z_{i}=0 \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \end{aligned} ​P(zi​=0,yi​=1∣xi​,ei​)=P(zi​=0,ci​=0,yi​=1∣xi​,ei​)+P(zi​=0,ci​=1,yi​=1∣xi​,ei​)=P(ci​=0,yi​=1∣xi​)+P(zi​=0,ci​=1,yi​=1∣xi​,ei​)=P(yi​=1∣xi​)−P(ci​=1,yi​=1∣xi​)+P(ci​=1,yi​=1∣xi​)P(zi​=0∣ci​=1,yi​=1,xi​,ei​)=pi​−qi​+qi​P(zi​=0∣ci​=1,yi​=1,xi​,ei​)​

其中会发生转化但未被观察到的概率可以计算为延迟时间落在之后时间箱内的概率之和,即:
P(zi=0∣ci=1,yi=1,xi,ei)=P(D>ei∣ci=1,yi=1,xi,ei)=∑t=ei+1T+1f(t,xi,ei)\begin{aligned} & P\left(z_{i}=0 \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \\ =& P\left(D>e_{i} \mid c_{i}=1, y_{i}=1, x_{i}, e_{i}\right) \\ =& \sum_{t=e_{i}+1}^{T+1} f\left(t, x_{i}, e_{i}\right) \end{aligned} ==​P(zi​=0∣ci​=1,yi​=1,xi​,ei​)P(D>ei​∣ci​=1,yi​=1,xi​,ei​)t=ei​+1∑T+1​f(t,xi​,ei​)​

未点击:z=0, y=0

P(zi=0,yi=0∣xi,ei)=P(yi=0∣xi)P(zi=0∣yi=0,xi)=1−pi\begin{aligned} & P\left(z_{i}=0, y_{i}=0 \mid x_{i}, e_{i}\right) \\ =& P\left(y_{i}=0 \mid x_{i}\right) P\left(z_{i}=0 \mid y_{i}=0, x_{i}\right) \\ =& 1-p_i \end{aligned} ==​P(zi​=0,yi​=0∣xi​,ei​)P(yi​=0∣xi​)P(zi​=0∣yi​=0,xi​)1−pi​​

结合三部分讨论,得到似然函数:
P(D;Θ)=∏i∈I1,1qif(di,xi,ei)×∏i∈I0,1[pi−qi+qi∑t=ei+1T+1f(t,xi,ei)]×∏i∈I0,0(1−pi)\begin{aligned} P(\mathcal{D} ; \Theta) &=\prod_{i \in I_{1,1}} q_{i} f\left(d_{i}, x_{i}, e_{i}\right) \\ & \times \prod_{i \in I_{0,1}}\left[p_{i}-q_{i}+q_{i} \sum_{t=e_{i}+1}^{T+1} f\left(t, x_{i}, e_{i}\right)\right] \\ & \times \prod_{i \in I_{0,0}}\left(1-p_{i}\right) \end{aligned} P(D;Θ)​=i∈I1,1​∏​qi​f(di​,xi​,ei​)×i∈I0,1​∏​[pi​−qi​+qi​t=ei​+1∑T+1​f(t,xi​,ei​)]×i∈I0,0​∏​(1−pi​)​

4 求解

使用EM算法进行求解。

CVR预估论文阅读笔记:一次性解决三大难题相关推荐

  1. 【CV论文阅读笔记】使用DRN网络(双重回归网络)解决SR问题

    [CV论文阅读笔记]使用DRN网络(双重回归网络)解决SR问题 本篇笔记来自CVPR2020年论文:Closed-loop Matters: Dual Regression Networks for ...

  2. 解决参考图像分割中的随机性问题:MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记

    解决参考图像分割中的随机性问题:MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记 一.Abstract 二.引言 三. ...

  3. [论文阅读笔记53]2021深度神经方法的关系三元组抽取综述

    1. 题目 Deep Neural Approaches to Relation Triplets Extraction: A Comprehensive Survey Tapas Nayak†, N ...

  4. Density Map Guided Object Detection in Aerial Images (论文阅读笔记)

    Density Map Guided Object Detection in Aerial Images 论文阅读笔记 出处:CVPR2020 一.介绍 文章主要研究的是基于高分辨率航拍图像的目标检测 ...

  5. 《Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting》论文阅读笔记

    论文阅读笔记 去年在ECCV上发表的<Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spott ...

  6. 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation

    论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...

  7. DnCNN论文阅读笔记【MATLAB】

    DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...

  8. Learning Multiview 3D point Cloud Registration论文阅读笔记

    Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...

  9. FCGF论文阅读笔记

    FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...

  10. DCP(Deep Closest Point)论文阅读笔记以及详析

    DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...

最新文章

  1. thymeleaf : input/select/radio回显
  2. spring boot 邮件端口_不会吧,SpringBoot还能发送邮件发送邮件?快来看看如何操作吧
  3. Disassembly3:variable
  4. 架构设计杂谈004——架构师
  5. 牛客网【每日一题】3月27日 数学考试
  6. 容器编排技术 -- Kubernetes kubectl scale 命令详解
  7. 数据图表与分析图_史上最全最实用的数据可视化分析图表制作工具汇总
  8. win10 x64下安装oracle 12c出现[INS-30131]报错的解决方案
  9. redis--服务器与客户端
  10. 灾难恢复! 关于做过快照的AVHD文件合并成VHD .
  11. android 颜色测试,颜色 大师 (Color Sense Master) - 颜色测试
  12. ubuntu16.04安装caffe教程(仅cpu)
  13. html 字体图标大小,CSS ICONFONT 基线和大小问题
  14. 服务器2008系统提权工具,提权教程:winserver2008R2溢出提权
  15. 2021年12月中国A股钢铁行业上市企业市值排行榜:行业总市值较11月增长1.18%,金洲管道增幅最大(附月榜TOP44详单)
  16. 简单聊聊利用DNS服务器提供单一入口
  17. ‘C:\Users\Administrator\Desktop\gitSpace\dj-2\dj\vue-manager-dj\node_modules\node-sass\vendor‘
  18. Android高级面试题精选
  19. 开源社 2023年度理事会成员官宣
  20. matlab n维插值,简单调研多维插值方法

热门文章

  1. 文件加密器 java_文件加密器: 使用Java Swing编写的文件加密工具,可批量加密电脑中的文件。兼容Windows和Linux。...
  2. FreeBSD+gnome3详细安装指南
  3. 苏嘉杭高速公路收费站升级改造(苏州地区)配电室综合监控系统的设计与应用
  4. 冰墩墩向你投来了一份花里胡哨的CSS知识手册,快来签收
  5. SQL创建数据库与写入数据的全过程
  6. NOIP2017提高组广东省成绩
  7. 3.25万颗!真正前装上车的激光雷达供应商有哪几家?
  8. Katana如何渲染序列
  9. 使用 vue-waterfall2插件 vue 瀑布流
  10. cloudera 卸载