本文是一篇多任务学习的文章, 里面的设计思路非常值得借鉴,也较为符合我们的直观理解,实践中也确实带来了不错的效果。

大多数现有的推荐系统仅利用一种类型的用户行为数据,例如电子商务中与转化率的业务关键绩效指标(KPI)直接相关的购买行为。除了关键的行为数据外,作者认为其他形式的用户行为也提供了有价值的信号,如浏览、点击、向购物车添加产品等。为了向用户提供质量建议,应适当考虑它们。

为了充分利用多种行为数据中的信号,作者在多任务学习框架的基础上进行了联合优化,将对一种行为的优化视为一项任务。

在两个真实数据集上进行的大量实验表明,NMTR显著超出了根据单行为数据和多行为数据设计的艺术推荐系统的状态。进一步的分析表明,对多个行为进行建模对于为很少交互的稀疏用户提供推荐特别有用。

背景

大多数现有的推荐系统只会用到用户单一类型的行为数据,例如在电子商务中的我们可能只会使用到用户购买的行为数据。但是我们认为其他类型的用户行为数据也可以提供非常有价值的信号,例如单击,加购等。本文对此提出了一种新的解决方案NMTR(Neural Multi-Task Recommendation)来学习用户的多行为数据。

在现有的诸多模型中, 大家都尝试挖掘用户的其他行为数据,例如ESMM等,用到了用户的点击行为来辅助我们CVR等任务的学习; 本文所述的方法在很多实践中也都有所验证,例如Zohar Komarovsky的博客中也谈到了类似的实践经验。

本文的核心思想就是:

  • 采用MTL的方式从用户的多行为数据中进行建模;

  • 为了捕捉用户的行为关系,采用级联(Cascaded way)的方式进行构建;

问题定义

输入:目标行为的用户商品交互数据; 其他行为的交互数据;

输出:预估用户和商品的交互概率;

模型框架

模型的核心框架如下:

1. Embedding共享层

很诸多问题一样,此处我们共享Embedding层, 我们令和分别表示用户和商品的one-hot特征向量,于是我们的embedding层就是:

2. 分开的交互函数

我们用表示第个行为的交互函数, 用户和商品在第个行为上的交互为:

3. 级联预测

用户的多个行为之间是存在顺序的联系的,并非是独立的, 为了将这种序列关系刻画到目前的模型中,我们将不同的行为的预测级联起来得到:

其中表示商品在第个行为的bias; 表示第个行为的交互函数。

4. 目标函数

我们最终优化的目标函数如下:

实验

实验部分主要回答下面三个问题:

  1. NMTR和推荐系统目前最流行的方法比是否可以获得更好的效果?

  2. 这些辅助行为如何影响NMTR的效果?

  3. NMTR是否可以帮助我们解决数据稀疏的问题(即:提升对于交互信息较少的用户的推荐效果)?

NMTR的实验效

从上面的图上,我们发现NMTR在HR@K和NDCG@K的效果是最好的,NMTR-GMF和NMTR-NeuMF比NMTR-MLP要更好。

和最佳的单行为的baseline NeuMF,NMTR的效果在Beibei数据集上的效果在HR上要好了9.01%,在NDCG的数据集上要好了6.72%。

辅助行为的影响

一种直觉的做法是:一个直观的实验是随机抽样我们使用的数据集中的辅助行为,同时保持目标行为(即购买)的完整性。

从上面的结果来看,我们发现:

  • 增加view的数据可以获得比carts更好的结果; (carts中带有非常多和购买相似的信息)

  • 只使用50%的cart和view的交互,我们发现性能比前两个实验差。具体地,(购买,50%购物)的性能比只使用购买要差,而(购买,50%观看)比只使用购买要好。主要有两个原因。一方面,视图是反映用户偏好的最弱信号,视图的总数非常大,使得部分视图数据的缺失是可以接受的。因此,一些视图记录的缺失不会对结果造成太大的影响。另一方面,车辆记录的随机缺失会带来一些噪音。

数据稀疏性的影响

  • 当用户购买的数据变得越加稀疏,NMTR-NeuMF推荐的效果相较于其他的模型下降更慢;

  • NMTR可以缓解数据稀疏的问题

小结

本文阐述了对多个用户行为建模的一种方法,目前这种级联的方式在很多公司CTR/CVR相关的Cotrain模型上也都取得了不错的效果。这种将相关任务的输出作为下一个任务的输入的方式在很多搜索推荐的博客中也有提及,是非常不错的一种建模方式。

2019-TKDE-Learning to Recommend With Multiple Cascading Behaviors | 精读相关推荐

  1. MGN:Learning Discriminative Features with Multiple Granularities for Person Re-Identification阅读笔记

    Learning Discriminative Features with Multiple Granularities for Person Re-Identification Guanshuo W ...

  2. Learning Discriminative Features with Multiple Granularities for Person Re-Identification(MGN)

    Learning Discriminative Features with Multiple Granularities for Person Re-Identification(MGN) 论文:Le ...

  3. [ICCV 2019] Few-Shot Learning with Global Class Representations

    简单描述一下方法的流程,虽然我觉得论文摘要说得还挺清楚的: 首先利用base类和novel类的样本初始化所有类的均值.以5-way 1-shot问题为例,meta-train的阶段,每一个episod ...

  4. 云从MGN《Learning Discriminative Features with Multiple Granularities for Person Re-Identification》论文阅读

    这是云从大佬在CVPR上的一篇paper.基本思想就是通过对global feature进行多粒度的切分,提取更局部的细节特征.当时在Market-1501,CUHK03,DukeMTMC-reID三 ...

  5. 《Learning Discriminative Features with Multiple Granularities for Person Re-Identification》论文阅读之MGN

    刷新三数据集纪录的跨镜追踪(行人再识别-ReID)技术 云从科技在跨镜追踪(行人再识别)技术(ReID)上获取重大突破.同时在Market-1501,CUHK03,DukeMTMC-reID三个数据集 ...

  6. 论文MGN笔记《Learning Discriminative Features with Multiple Granularities for Person Re-Identification》

    MGN的核心思想是利用global feature+fine grain feature做特征融合然后分类,做part-based的branch取得很简单就是等分,但是为了让模型能收敛,用了多个pat ...

  7. 2019 IET之ReID:HPILN: a feature learning framework for cross-modality person re-identification

    HPILN: a feature learning framework for cross-modality person re-identification 当前的问题及概述: 提出了一种新的特征学 ...

  8. 深度 | 香港中文大学(深圳)张大鹏教授:生物特征识别的新进展 | CCF-GAIR 2019

    https://www.toutiao.com/i6713840784291922445/ 2019-07-15 18:51:11 不止干货,张教授演讲中还夹杂了诸多宝贵的史料 文 | 黄善清 AI ...

  9. CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章

    CV:翻译并解读2019<A Survey of the Recent Architectures of Deep Convolutional Neural Networks>第一章~第三 ...

最新文章

  1. 哈希--直接定值法和除留取余法
  2. xdebug模块输出文件名的配置说明
  3. Android 4.1最终版SDK和ADT Plugin全线发布
  4. 我的Go语言学习之旅四:各种变量的声明
  5. vmware安装minimal centos报错/etc/rc5.d/s99local : line
  6. 查看端口是否被占用,以及端口的应用名称
  7. C#通用权限管理-程序安全检查,这些你一定要考虑到位
  8. java 文件上传 大小_java 上传文件大小转换为 GB/MB/KB/B
  9. ArcGIS水文分析实战教程(14)提取水库湖泊等面状水系
  10. python和java哪个好学-java和python哪个的前途更好?
  11. python 更新pip报错 解决方法大全
  12. ncl 添加点shp文件_NCL绘制中国地图
  13. 什么是绿色计算(Green Computing)?
  14. 智云通CRM:大客户销售流程,新手也能快速入门
  15. Horizon client PcoIP连接桌面后黑屏断开,报:与远程计算机的连接终止
  16. Java用户注册服务器发送短信验证码功能实现
  17. 网站服务器主要是pcu还是内存,PCU占用一直跑的很高的真正元凶
  18. Piggy-Bank HDU - 1114(多重背包)
  19. SCI论文解读复现【NO.2】基于注意机制的YOLOv5改进算法在行星图像中的应用(代码已复现)
  20. 跨平台的桌面应用开发,技术框架选择

热门文章

  1. Spring+vue国际化实现
  2. 汉字编码新尝试:字理组字编码方案v0.0
  3. 西交利物浦计算机分数,考多少分才能上西交利物浦大学 录取分数是多少
  4. 免疫学课件软件测试,免疫学实验2-----免疫荧光技术.ppt
  5. rstudio python_【干货分享】R语言与数据分析系列之R与Rstudio的安装
  6. Mongodb整合Spring示例
  7. tesseract-ocr 实现图片识别功能
  8. Spring+IBatis SQL执行报错UncategorizedSQLException
  9. 从词向量衡量标准到全局向量的词嵌入模型GloVe再到一词多义的解决方式
  10. 魔众一物一码溯源防伪系统 v1.2.0 增加二维码显示页面,后台升级