内容总结

  • 召回中,一般的训练方式分为三种:point-wise、pair-wise、list-wise。RecHub中用参数mode来指定训练方式,每一种不同的训练方式也对应不同的Loss。对应的三种训练方式可以参考下图,其中a表示user的embedding,b+表示正样本的embedding,b-表示负样本的embedding。

    • 前面两行是指pointwise即图例看待每个正负样本,使用二分类交叉熵
    • pairwise:每次选择一个正样本和一个负样本,使用Hinge loss或者BPR loss损失函数
    • listwise:每次选择一个正样本和多个负样本,使用softmax loss函数,其实就是多分类问题(如下图最下面的CrossEntropyLoss函数)
  • 召回中样本的选择:
    • 正样本:用户点击的物品
    • 负样本:没有被召回的;召回但是被排序淘汰的;曝光但是未点击的
  • 微软DSSM奠定的基本思想:
    • 离线使用cosine优化相似度
    • 在线使用ANN向量化召回
    • 首次提出随机负采样

【PyTorch基础教程30】DSSM双塔模型(线上召回 | 模型更新)相关推荐

  1. 【Pytorch基础教程33】算法模型部署(MLFlow/ONNX/tf serving)

    内容概况 服务器上训练好模型后,需要将模型部署到线上,接受请求.完成推理并且返回结果. 保存模型结构和参数最简单的是torch.save保存为checkpoint,但一般用于训练时记录过程,训练中断可 ...

  2. 深度学习之Pytorch基础教程!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤,Datawhale高校群成员,深圳大学 随着深度学习的发展 ...

  3. 【深度学习】深度学习之Pytorch基础教程!

    作者:李祖贤,Datawhale高校群成员,深圳大学 随着深度学习的发展,深度学习框架开始大量的出现.尤其是近两年,Google.Facebook.Microsoft等巨头都围绕深度学习重点投资了一系 ...

  4. Pytorch基础教程(1):人工智能与Pytorch简介

    Pytorch基础教程(1) :人工智能与Pytorch简介 1.人工智能简介 人工智能是新一轮科技革命和产业变革的重要驱动力量,其发挥作用的广度和深度堪比历次工业革命.蒸汽革命成就了英国,电气和信息 ...

  5. `web3d模型线上展厅(一)

    大家好,我是遂海枫林.最近呢又准备活跃起来了. 最近主要研究了下3D相机迅速搭建web线上模型的一个项目. 项目缺口 由于疫情,线上学习,线上工作,线上研究已经成为了大众接纳和处理事务最主要的方式,计 ...

  6. konfig:采用ConfigMap实现线上配置热更新

    前言 利用kubernetes部署应用越来越流行,而运行在kubernetes中的服务需要的各种各样的配置如何才能实现热更新?难道需要在kubernetes中再部署zookeeper或者etcd之类的 ...

  7. 【Pytorch基础教程31】YoutubeDNN模型解析

    学习总结 youtubeDNN即一个用softmax loss损失函数训练,且训练模式为list-wise sample的经典DSSM双塔模型. 在YouTubeDNN中可以发现召回是作为一个多分类任 ...

  8. 【PyTorch基础教程29】DIN模型

    学习总结 推荐系统排序部分中的损失函数大部分都是二分类的交叉熵损失函数,但是召回的模型很多都不是.召回模型那块常见的还有sampled softmax损失函数: 模型训练时,在seed设置固定时模型的 ...

  9. 【Pytorch基础教程36】基于Ernie预训练模型和Bert的新闻分类

    文章目录 一.新闻分类任务 1.1 中文数据集 1.2 数据特点 1.3 跑起代码 二. 预训练语言模型ERNIE 2.1 ERNIE模型结构 2.2 bert模型结构 三.项目代码 1. bert模 ...

最新文章

  1. 关于安徽赛区推广校赛的实施办法
  2. LVS集群-DR负载均衡集群
  3. 解析 this.initialize.apply(this, arguments)
  4. vscode如何搜索?ctrl+shift+p
  5. 作为本科大学生比较适合的水准比较好的,嵌入式软件系统的会议
  6. 问题 F: 序列操作Ⅱ(前缀最大公约数,后缀最大公约数)
  7. 关于车机互联方式的一点想法
  8. 前端学习(2262)vue造轮子框架搭建
  9. Web框架——Flask系列之请求上下文与应用上下文请求钩子Flask-Script扩展命令行(十七)
  10. int** 赋值_关于Java语言复合赋值运算符的两个问题,快来瞧瞧
  11. make、make是什么??
  12. crosstool-ng构建的一个错误的解决
  13. linux中安装pip镜像怎么设置_linux服务器怎么安装pip?
  14. httpinvoker
  15. 高通RFC适配RFFE-添加MIPI设备【转】
  16. android studio 登录与注册,Android Studio实现QQ的注册登录和好友列表跳转
  17. RXJS Operators
  18. 云览天下,一触即达——QQ 浏览器(android) 设计之路
  19. 大数据说婚恋--再不给女性减负,结婚率和出生率都升不回来了
  20. 毕业设计 基于JavaWeb的奖学金评定管理系统

热门文章

  1. windows程序设计(第2版 王艳平)学习记要:3.2 线程同步
  2. 滑坡泥石流的防御措施_滑坡泥石流防范措施
  3. 广西高等教育学会高校教育技术委员会莅临瑞云科技考察交流
  4. 一周信创舆情观察(7.13~7.19)
  5. Soon:自学成才,从不设限 - Mixin Network开发者访谈
  6. 当从 Java 进程查看时该主机的主机名称和规范名称不一致。
  7. sp导出法线_Substance Painter 烘焙法线贴图:使用Cage处理UV接缝
  8. 百度万象大会:AI深入移动生态,与创作者共谋信息和知识红利
  9. 儿童编程软件python征服_少儿编程Python项目实例_BMI指数计算器+GUI
  10. windows磁盘黑色未分配区域扩展到逻辑驱动器