学习总结

(1)深度推荐模型的前沿趋势,强化学习(Reinforcement Learning,又叫增强学习)与深度推荐模型的结合。强化学习的大体过程:通过训练一个智能体(它与环境交互,不断学习并强化自己的智力),从而指导自己的下一步行为,取得最大的预期收益。可见其优势——模型能够实时更新,用户行为快速反馈等。

(2)强化学习的落地不容易,工程量巨大(涉及到了模型训练、线上服务、数据收集、实时模型更新等几乎推荐系统的所有工程环节)。不像之前学过的深度学习模型,只要重新训练一下它,就可以改进一个模型结构。本次task学习微软的DRN模型:

  • 构建了双塔模型作为深度推荐模型,得出行动得分。
  • 更新方式:利用《微更新》实时学习用户的奖励反馈,更新推荐模型,再利用阶段性的《主更新》学习全量样本,更新模型。
  • 微更新方法:竞争梯度下降算法(添加随机扰动;组合推荐列表;实时收集用户反馈。),它通过比较原网络和探索网络的实时效果,来更新模型的参数。而主更新会对微更新的参数进行纠偏(实践中有延迟反馈、数据噪声等问题)。

(3)DRN最大的改进就是把模型推断、模型更新、推荐系统工程整个一体化了,让整个模型学习的过程变得更高效,能根据用户的实时奖励学到新知识,做出最实时的反馈。

【王喆-推荐系统】模型篇-(task9)强化学习推荐模型DRN相关推荐

  1. 微信看一看强化学习推荐模型的知识蒸馏探索之路丨CIKM 2021

    猜你喜欢 0.[免费下载]2021年11月热门报告盘点&下载1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器 ...

  2. 《强化学习周刊》第25期:DeepMind提出无模型风险敏感强化学习、谷歌发布 RLDS数据集生态系统...

    No.25 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

  3. NVIDIA GPUs上深度学习推荐模型的优化

    NVIDIA GPUs上深度学习推荐模型的优化 Optimizing the Deep Learning Recommendation Model on NVIDIA GPUs 推荐系统帮助人在成倍增 ...

  4. 深度学习推荐模型-DIN

    深度学习推荐模型-DIN 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecom ...

  5. 深度学习推荐模型-NFM

    深度学习推荐模型-NFM 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecom ...

  6. 深度学习推荐模型-DeepFM

    深度学习推荐模型-DeepFM 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRe ...

  7. 深度学习推荐模型-DeepCrossing

    深度学习推荐模型-DeepCrossing 本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/D ...

  8. 【最新重磅整理】82篇AAAI2021强化学习领域论文接收列表

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 作者:深度强化学习实验室&AMiner 编 ...

  9. 如何提高强化学习算法模型的泛化能力?

    深度强化学习实验室 官网:http://www.neurondance.com/ 来源:https://zhuanlan.zhihu.com/p/328287119 作者:网易伏羲实验室 编辑:Dee ...

最新文章

  1. springcloud demo---feign
  2. java list 删除 遍历_Java list利用遍历进行删除操作3种方法解析
  3. 测试软件测试赢在测试2:中国软件测试专家访谈录
  4. getRequestDispatcher()与sendRedirect()的区别
  5. tomcat 启动项目 页面文字乱码_项目通过tomcat部署到服务器,请求数据页面中文乱码问题...
  6. python全栈开发_day20_加密模块和excel操作模块以及xml
  7. php 转通达信数据格式,通达信数据格式
  8. 为什么说“不要教你的孩子学编程”?
  9. HNOI2019爆零记
  10. Ubuntu系统 -- 初始化配置与基础操作
  11. 全是宝!20款优质高效的在线协作工具任你挑,就是这么强大!
  12. 浏览器兼容性问题和解决方案
  13. iPhoneSE3变化却提高了价格,安卓手机获得了喘息的空间
  14. 【报错记录】MybatisPlus报Mapped Statements collection does not contain value for...
  15. 如何在word中的图片上画圈标注_怎么在word图片上画圈
  16. Windows10+YOLOv5训练自己的数据集
  17. Gamma Correction(伽马校正)
  18. 云从科技资深算法研究员:详解跨镜追踪(ReID)技术实现及难点 | 公开课笔记
  19. F280049C_CLA配置说明
  20. 基于js的网页计算器实现

热门文章

  1. 2.spring IOC(DI)
  2. win10查看对方计算机名,win10系统巧用nbtstat命令快速探测对方计算机名称的操作方法...
  3. 大一时为了恶搞同学写的“诗”
  4. 便签加密设置取消指纹解密
  5. 灵魂拷问!Android开发究竟该如何学习,跳槽薪资翻倍
  6. iOS-NSTimer的3种创建方式
  7. 福建学业水平考试计算机技能考网络设备配置思科篇
  8. 华为HCIE RS笔记-20RIP(Routing information Protocol)
  9. 阴阳师师徒系统不同服务器,阴阳师师徒系统详细解读 黑蛋获取途径新增
  10. 故障转移集群服务器 重装系统,安装故障转移群集前的准备工作