1. 简介

CTR预估模型主要用于搜索,推荐,计算广告等领域,传统CTR模型包括逻辑回归LR模型,因子分解机FM模型,梯度提升树GBDT模型等。
优点是可解释性强,训练和部署方便,便于在线学习。

搜索广告的场景中,query 和document使用不同的单词,同一个单词不同形态来表达同一个概念,需要通过文本的单词匹配来计算query和document的相似性。

2. DSSM 模型

思想:
将query 和document降维到公共的低维空间, 在低维空间,query 和document的相似性通过两者的距离来衡量。
和 LSA(latent semantic model)的区别:
(1)LSA的低维空间通过无监督学习,利用单词的共现规律来训练;
(2)DSSM的低维空间通过有监督学习,利用(query,document)pair对的点击规律来训练。

模型训练阶段
(1)计算给定query下每个document的后验概率。
前向传播:


γ\gammaγ是平滑因子。
最小化损失函数:

模型预测阶段:
DSSM模型将原始的文本特征映射到低维的语义空间。
(1)将query 和document表示为词频向量,向量由每个单词出现的词频组成。

将 q 和 d 映射到降维语义空间,得到 query的语义向量 yqy_qyq​ 和document的语义向量 ydy_dyd​.

(2)计算 yqy_qyq​ 和 ydy_dyd​ 的相似度:

R(q,d)=cos(yd,yq)=yq⋅yq∣∣yq∣∣⋅∣∣yd∣∣R(q,d) = cos(y_d, y_q) = \frac{y_q \cdot y_q}{|| y_q || \cdot || y_d ||} R(q,d)=cos(yd​,yq​)=∣∣yq​∣∣⋅∣∣yd​∣∣yq​⋅yq​​

(3)对于给定的query, 计算所有的document 和他的相似度, 并截取 top K 个document即可得到排序结果:

3. 模型实现细节

word hashing:
目的:减少 bag-of-words的维度。比如,词库有50万,用one-hot的方式来表示单词的话,每个单词的向量维度就是50万,会导致输入的参数很多。
方法: word hash。
给定单词,如 word, 增加开始和结束的mask,比如#word#. 然后,把单词用n-grams来表示, 比如 3-grams: #wo, wor, ord. 最后 char-level n-grams单词的向量来表示。

但目前存在一个问题:冲突。不同的单词可以有相同的 n-grams 向量表示,以下统计了冲突的比例:

可以看到 letter-trigram的冲突比例是可以接受的。

优点:缓解 out-of-vacabulary.

实验设置
模型结构: 四层
第一层 word hash: word映射到char-level 3-gram, 映射规则固定。
第二层,第三层输出为300 维;
最后一层为输出层, 输出128维向量。

权重初始化:

fanin, fanout 是输入单元数量,输出单元数量。

假如模型原始词汇表是50万, word hash后只有3万。

实验效果


参考:

  1. Learning Deep Structured Semantic Models for Web Search using Clickthrough Data;
  2. CTR 预估模型:神经网络模型

CTR预估模型DSSM相关推荐

  1. 前深度学习时代CTR预估模型的演化之路:从LR到FFM\n

    本文是王喆在 AI 前线 开设的原创技术专栏"深度学习 CTR 预估模型实践"的第二篇文章(以下"深度学习 CTR 预估模型实践"简称"深度 CTR ...

  2. 深度CTR预估模型的演化之路2019最新进展

    作者 | 锅逗逗 来源 | 深度传送门(ID: deep_deliver) 导读:本文主要介绍深度CTR经典预估模型的演化之路以及在2019工业界的最新进展. 介绍 在计算广告和推荐系统中,点击率(C ...

  3. SIGIR阿里论文 | 可视化理解深度神经网络CTR预估模型

    小叽导读:尽管业界对于图像处理和自然语言处理领域,在算法可解释性方向上已经取得了一些进展,但对于电商与广告领域,目前还是空白.另一方面,深度学习技术已经开始被大规模应用到广告业务中.广告是很多互联网现 ...

  4. 深度学习CTR预估模型凭什么成为互联网增长的关键?

    本文是王喆在InfoQ开设的原创技术专栏"深度学习CTR预估模型实践"的第一篇文章(以下"深度学习CTR预估模型实践"简称"深度CTR模型" ...

  5. 前深度学习时代CTR预估模型的演化之路 [王喆观点]

    毕业于清华大学计算机系的王喆学长梳理从传统机器学习时代到深度学习时代所有经典CTR(click through rate)模型的演化关系和模型特点.内容来源:https://zhuanlan.zhih ...

  6. 深度长文 | 从FM推演各深度CTR预估模型(附开源代码)

    作者丨龙心尘 & 寒小阳 研究方向丨机器学习,数据挖掘 题记:多年以后,当资深算法专家们看着无缝对接用户需求的广告收入节节攀升时,他们可能会想起自己之前痛苦推导 FM 与深度学习公式的某个夜晚 ...

  7. Facebook经典CTR预估模型

    这里是「王喆的机器学习笔记」的第九篇文章,今天我们重读一篇经典的CTR预估领域的论文,Facebook在2014发表的"Practical Lessons from Predicting C ...

  8. 从FM推演各深度学习CTR预估模型

    本文的PDF版本.代码实现和数据可以在我的github取到. 1.引言 点击率(click-through rate, CTR)是互联网公司进行流量分配的核心依据之一.比如互联网广告平台,为了精细化权 ...

  9. CIKM 2021 | 多场景下的星型CTR预估模型STAR

    ▐ 摘要 阿里妈妈展示广告需要为大量的场景提供广告排序能力,在业务场景数急剧膨胀的背景下,我们开始研究多场景联合建模.本篇文章主要介绍,我们在多场景建模下遇到的挑战.挑战背后的思考以及算法工程 co- ...

最新文章

  1. BGR图像与HSV图像互相转换(opencv)
  2. 全新开源,《Pytorch常用函数函数手册》开放下载!内含200余个函数!
  3. Web 数据存储总结
  4. XML 文档(0, 0)中有错误。缺少根元素。
  5. 3.1 普通型生成函数
  6. 用c实现跨平台异常捕获机制 1
  7. NumPy 百题大冲关,冲鸭!
  8. ps、top 、free查看用户资源信息
  9. 全球互联网领域第一人!马云获福布斯终身成就奖
  10. .ssh文件夹在哪里_【TOOLS】本地利用ssh远程连接服务器并启用远程服务器的jupyter lab并配置好anaconda的环境...
  11. xulrunner弹出窗口不显示解决方法
  12. 《YOLO系列原理实战笔记》高清.pdf
  13. 性能工具之ab压力测试工具及ab命令详解
  14. mimo雷达虚拟阵列matlab,基于Matlab的雷达阵列天线信号的波达方向估计
  15. java毕业设计社区食堂供餐源码+lw文档+mybatis+系统+mysql数据库+调试
  16. 云计算IaaS-Pssa-Saas(云计算的基本架构)
  17. 【密码学】七、密钥管理
  18. java高校选课系统博客,学生选课系统
  19. CryEngine5 Shader调试
  20. 图像处理——人脸情绪识别(python卷积神经网络)

热门文章

  1. 【解决思路】源服务器未能找到目标资源的表示或者是不愿公开一个已经存在的资源表示
  2. c语言让随机数相加,【分享代码】弥补c语言随机数不足
  3. Excel 透视表 - 添加计算字段
  4. python如何计算运行时间以及运行内存
  5. 用p5.js制作烟花特效
  6. validationEngine 使用
  7. 字节软件测试学习,软件测试中http_load和Glimpse工具的学习
  8. mvc如何应用nuget包_第五周NuGet软件包-使用Glimpse调试ASP.NET MVC应用程序
  9. linux 分区不够,linux磁盘分区空间不够解决办法
  10. Transfer Learning from Speaker Verification toMultispeaker Text-To-Speech Synthesis复制他的声音MockingBird