新的CVR预估模型——ESMM,有效解决了真实场景中CVR预估面临的数据稀疏以及样本选择偏差这两个关键问题。

CVR (Conversion Rate): 转化率。 一个衡量CPA广告效果的指标,简言之就是用户点击广告到成为一个有效激活或者注册甚至付费用户的转化率。 CVR (Conversion Rate): 转化率。 一个衡量CPA广告效果的指标,CVR=(转化量/点击量)*100%。

一、Motivation

不同于CTR预估问题,CVR预估面临两个关键问题:

  1. Sample Selection Bias (SSB,样本选择偏差) 转化是在点击之后才“有可能”发生的动作,传统CVR模型通常以点击数据为训练集,其中点击未转化为负例,点击并转化为正例。但是训练好的模型实际使用时,则是对整个空间的样本进行预估,而非只对点击样本进行预估。即是说,训练数据与实际要预测的数据来自不同分布,这个偏差对模型的泛化能力构成了很大挑战。
  2. Data Sparsity (DS) 作为CVR训练数据的点击样本远小于CTR预估训练使用的曝光样本。

一些策略可以缓解这两个问题,例如从曝光集中对unclicked样本抽样做负例缓解SSB(样本选择偏差),对转化样本过采样缓解DS数据稀疏等。但无论哪种方法,都没有很elegant地从实质上解决上面任一个问题。

可以看到:点击—>转化,本身是两个强相关的连续行为,作者希望在模型结构中显示考虑这种“行为链关系”,从而可以在整个空间上进行训练及预测。这涉及到CTR与CVR两个任务,因此使用多任务学习(MTL)是一个自然的选择,论文的关键亮点正在于“如何搭建”这个MTL。

CVR:CVR=(转化量/点击量)*100%相关推荐

  1. wp/wordpress文章页面添加阅读量/点击量,后台并显示阅读量

    我们知道wp主题默认的是不带阅读量这个字段的,所以要想在前端文章页面显示阅读量以及后台文章列表显示阅读量,就需要我们修改functions.php这个文件,接下来分享一下我整理的wp添加阅读量的代码. ...

  2. 数据采集-数据抓取-java-php-go-Python-爬虫-全自动-微信公众号文章阅读量点击量-多个公众号-实时更新

    数据采集-微信公众号文章 今天是个值得纪念的日子 优点 现有网络流传采集方法 具体实现 使用软件 实现流程 思路 使用流程 请求分析 关键字段 踩过的坑 实现代码 总结 今天是个值得纪念的日子 今天开 ...

  3. 曝光量 点击量 反馈量 具体意思是什么

    曝光量 点击量 反馈量 具体意思是什么? 当买家在阿里巴巴中文站上找到您的供求信息以及公司介绍后,您的信息被展示在页面上,都会被计算入曝光量.常见的有: 1)买家通过关键词搜索,您的信息展示在搜索结果 ...

  4. php实现展现量cookie,[转载]展现量、点击量、点击率;访客数、访问次数、浏览量的区别与作用...

    1. 什么是展现量.点击量.点击率 在百度推广后台可以看到消费.平均价格.点击.展现.点击率.千次展现费用等数据,这些数据是你全面评估推广效果.深入开展推广优化的基础. 在网民搜索查询时,如果您账户内 ...

  5. 点击量、点击率、访客数、的区别与作用

    1. 什么是展现量.点击量.点击率 在百度推广后台可以看到消费.平均价格.点击.展现.点击率.千次展现费用等数据,这些数据是你全面评估推广效果.深入开展推广优化的基础. 在网民搜索查询时,如果您账户内 ...

  6. PMcaff-干货| 内容营销可不仅仅是点击量而已

    从两篇文章开始说起 在去年,我写了两篇在互联网上获得极高人气的文章. 第一篇花了我将近 15 个小时的时间来调研.写作.排版以及发布.这些时间其实就是为了解答一个简单的问题:到底音乐界怎么了?作为作曲 ...

  7. 29Python时间序列分析(美国消费者信心指数及维基百科点击量EDA,含实例数据)

    唐宇迪<python数据分析与机器学习实战>学习笔记 29Python时间序列分析 一.pandas生成时间序列 常见的时间序列:时间戳(timestamp):具体时间点2020.4.6的 ...

  8. 真正阅读量php,科学网—博客70万阅读量与研究网8万点击量感言 - 陈安的博文

    ??前天,我的题为"崇尚智慧和人生改变的人请来这里"天涯博客(http://change1970.tianyablog.com)超过了70万的阅读量,这个博客现在有点沦为科学网博客 ...

  9. 关键词有排名,百度只有展现量没有点击量是什么原因

    关键词排名优化原理:我们在使用一些流量工具刷关键词排名,是通过大量真实的IP流量去搜索关键词,并找到排名前10页的目标网站进行真实点击,从而来优化搜索排名.通过流量工具优化的数据可以通过站长工具中查看 ...

  10. 每隔5分钟输出最近一小时内点击量最多的前N个商品(flink+kafka)

    需求 每隔5分钟输出最近一小时内点击量最多的前N个商品. 样例数据,分别代表(用户id,商品id,类别id,行为,时间戳): 543462,1715,1464116,pv,1511658000 实现 ...

最新文章

  1. 创建SM30表维护时权限组NC是什么用途?
  2. Linux CentOS 6.x 关闭图形化界面的方法
  3. 关于如何安装less
  4. 系统架构师学习笔记-操作系统(一)
  5. c语言字符笛卡尔积,JavaScript笛卡尔积超简单实现算法示例
  6. 【人脸识别】LFW数据集介绍
  7. list大数据转换对象_EXCEL比分列强大百倍的数据转换功能
  8. 复杂场景下,如何用AI技术做地图?
  9. Word 2007翻译里一个诡异的问题——微软的疏忽还是一个Joke?
  10. 金融行业文档管理系统的八大创新
  11. Python多行字符串
  12. 一片新的ATmega328芯片如何烧录?
  13. java 工作流框架_java工作流是什么?哪些工作流框架比较好?
  14. Python实现照片更换背景色
  15. php 忽略 deprecated,php Deprecated 解决办法
  16. linux 双显示器 异常,终于搞定双显示器了
  17. 百度地图经纬度距离计算
  18. 图像分割之(四)OpenCV的GrabCut函数使用和源码解读
  19. JAVA基于JSP的疫情学生宿舍管理系统【数据库设计、论文、源码、开题报告】
  20. 英语语音篇 - 自然拼读

热门文章

  1. 动易百度快照劫持,百度快照被劫持了怎么办?
  2. 分布式计算,网格计算和云计算的异同
  3. 思科路由器如何导出配置文件_备份cisco路由器配置文件
  4. 红帽子linux转中文后乱码,安装redhat时中文显示乱码(小方框)解决方法
  5. Benzoic acid,4-(((diphenylamino)carbonyl)oxy)-3-nitro,2-硝基-4-羧基苯基-N,N-氨基甲酸二苯酯,2-Ncdc
  6. 工业产品常用的长度单位有哪些?
  7. 大数据和人工智能属于什么专业 - 学大数据和人工智能出来做什么
  8. 面试时说上一家公司的离职原因
  9. 批量修改文件名.bat
  10. md5验证文件完整性