YoutubeDNN召回的一些问题
列出十个文中解决的非常有价值的问题:
- 文中把推荐问题转换成多分类问题,在next watch的场景下,每一个备选video都会是一个分类,因此总共的分类有数百万之巨,这在使用softmax训练时无疑是低效的,这个问题Youtube是如何解决的?
- 在candidate generation model的serving过程中,Youtube为什么不直接采用训练时的model进行预测,而是采用了一种最近邻搜索的方法?
- Youtube的用户对新视频有偏好,那么在模型构建的过程中如何引入这个feature?
- 在对训练集的预处理过程中,Youtube没有采用原始的用户日志,而是对每个用户提取等数量的训练样本,这是为什么?
- Youtube为什么不采取类似RNN的Sequence model,而是完全摒弃了用户观看历史的时序特征,把用户最近的浏览历史等同看待,这不会损失有效信息吗?
- 在处理测试集的时候,Youtube为什么不采用经典的随机留一法(random holdout),而是一定要把用户最近的一次观看行为作为测试集?
- 在确定优化目标的时候,Youtube为什么不采用经典的CTR,或者播放率(Play Rate),而是采用了每次曝光预期播放时间(expected watch time per impression)作为优化目标?
- 在进行video embedding的时候,为什么要直接把大量长尾的video直接用0向量代替?
- 针对某些特征,比如#previous impressions,为什么要进行开方和平方处理后,当作三个特征输入模型?
- 为什么ranking model不采用经典的logistic regression当作输出层,而是采用了weighted logistic regression?
YoutubeDNN召回的一些问题相关推荐
- 【推荐系统】YoutubeDNN召回
主要是按照以下3篇介绍+评论的脉络来整理(讲的真的超级好!),再加上我自己在实际运用过程中产生的问题.其实模型大概内容都能看懂.有困扰的地方主要在于user embedding和video embed ...
- 推荐算法之召回模型:DSSM、YoutubeDNN
1. DSSM 1.1 DSSM模型原理 DSSM(Deep Structured Semantic Model),由微软研究院提出,利用深度神经网络将文本表示为低维度的向量,应用于文本相似度匹配场景 ...
- Task03 召回模型:YoutubeDNN、DSSM
Task03 召回模型:YoutubeDNN.DSSM 一.DSSM(双塔模型----召回模型) DSSM-Learning Deep Structured Semantic Models for W ...
- 天池-新闻推荐-多路召回
前言读取数据 此次比赛是新闻推荐场景下的用户行为预测挑战赛, 是Datawhale与天池联合举办,该赛题是以新闻APP中的新闻推荐为背景, 目的是要求我们根据用户历史浏览点击新闻文章的数据信息预测用户 ...
- YouTubeDNN
这个youTubeDNN主要是工程导向,对于推荐方向的业界人士真的是必须读的一篇文章.它从召回到排序整个流程都做了描述,真正是在工业界应用的经典介绍. 作者首先说了在工业上YouTube视频推荐系统主 ...
- AI上推荐 之 YouTubeDNN模型(工业界推荐系统的灯火阑珊)
1. 写在前面 这个系列很久没有更新了, 主要是前段时间经历了一波秋招, 后面的方向可能稍微偏数据挖掘和cv多一些,所以向这两块又稍微延展了一下,没来得及看推荐相关的论文,这次借着和如意大佬整理fun ...
- 【datawhale202206】pyTorch推荐系统:召回模型 DSSMYoutubeDNN
小结 本次所涉及的模型用于推荐系统中的召回环节,该环节主要是一个embedding和筛选,本次所涉及的模型主要用于embedding过程. DSSM双塔模型是指,user和item的embedding ...
- 推荐系统从0到1_1
推荐系统从0到1_1,目录中的内容会在专栏中一一补充和详细介绍.请大家耐心等待 . 目录结构 引言 推荐系统的必要性 搭建推荐系统所需要的材料 推荐系统整体框架概览 推荐系统核心技术框架 数据预处理 ...
- 推荐系统系列之推荐系统概览(下)
在推荐系统概览的第一讲中,我们介绍了推荐系统的常见概念,常用的评价指标以及首页推荐场景的通用召回策略.本文我们将继续介绍推荐系统概览的其余内容,包括详情页推荐场景中的通用召回策略,排序阶段常用的排序模 ...
最新文章
- 再谈RPC--长长的手,抓住了离去的你
- 【Python之旅】第七篇(二):Redis使用基础
- SDUT_2122 数据结构实验之链表七:单链表中重复元素的删除
- Android之Badge显⽰
- 走近OSSIM传感器(Sensor)插件
- Data Poisoning Attacks to Deep Learning Based Recommender Systems论文解读
- mindi linux 使用教程,Linux使用入门教程之tuned
- 特斯拉 神经网络计算机,特斯拉即将推出神经网络计算机 或大幅提升Autopilot性能...
- JAVA IO系列----ObjectInputStream和ObjectOutputStream类
- 【BZOJ3530】数数(AC自动机,动态规划)
- 精伦盒子H1,插上USB,找不到对应的文件路径
- Spring注入方式及用到的注解 -----@Component,@Service,@Controller,@Repository
- 怎么用命令来查询自己的IP地址?
- Spring中三种编程式事务的使用
- vmware安装报错及注册时无权输入许可证密钥的解决办法及步骤
- Pygame实战:这种“欢乐打地鼠”小游戏让几亿人“上瘾“
- SCZ的3篇有关sam的文章
- 服务器安装docker和docker-compose,并开放2375端口
- Delphi历史版本介绍(二)从Delphi8到DelphiXE3
- STM32CubeMX快速生成STM32F407ZG芯片寄存器初始化