【王喆-推荐系统】模型篇-(task9)强化学习推荐模型DRN
学习总结
(1)深度推荐模型的前沿趋势,强化学习(Reinforcement Learning,又叫增强学习)与深度推荐模型的结合。强化学习的大体过程:通过训练一个智能体(它与环境交互,不断学习并强化自己的智力),从而指导自己的下一步行为,取得最大的预期收益。可见其优势——模型能够实时更新,用户行为快速反馈等。
(2)强化学习的落地不容易,工程量巨大(涉及到了模型训练、线上服务、数据收集、实时模型更新等几乎推荐系统的所有工程环节)。不像之前学过的深度学习模型,只要重新训练一下它,就可以改进一个模型结构。本次task学习微软的DRN模型:
- 构建了双塔模型作为深度推荐模型,得出行动得分。
- 更新方式:利用《微更新》实时学习用户的奖励反馈,更新推荐模型,再利用阶段性的《主更新》学习全量样本,更新模型。
- 微更新方法:竞争梯度下降算法(添加随机扰动;组合推荐列表;实时收集用户反馈。),它通过比较原网络和探索网络的实时效果,来更新模型的参数。而主更新会对微更新的参数进行纠偏(实践中有延迟反馈、数据噪声等问题)。
(3)DRN最大的改进就是把模型推断、模型更新、推荐系统工程整个一体化了,让整个模型学习的过程变得更高效,能根据用户的实时奖励学到新知识,做出最实时的反馈。
【王喆-推荐系统】模型篇-(task9)强化学习推荐模型DRN相关推荐
- 微信看一看强化学习推荐模型的知识蒸馏探索之路丨CIKM 2021
猜你喜欢 0.[免费下载]2021年11月热门报告盘点&下载1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器 ...
- 《强化学习周刊》第25期:DeepMind提出无模型风险敏感强化学习、谷歌发布 RLDS数据集生态系统...
No.25 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...
- NVIDIA GPUs上深度学习推荐模型的优化
NVIDIA GPUs上深度学习推荐模型的优化 Optimizing the Deep Learning Recommendation Model on NVIDIA GPUs 推荐系统帮助人在成倍增 ...
- 深度学习推荐模型-DIN
深度学习推荐模型-DIN 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecom ...
- 深度学习推荐模型-NFM
深度学习推荐模型-NFM 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecom ...
- 深度学习推荐模型-DeepFM
深度学习推荐模型-DeepFM 本文参考链接,仅供个人学习: https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRe ...
- 深度学习推荐模型-DeepCrossing
深度学习推荐模型-DeepCrossing 本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/D ...
- 【最新重磅整理】82篇AAAI2021强化学习领域论文接收列表
深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 作者:深度强化学习实验室&AMiner 编 ...
- 如何提高强化学习算法模型的泛化能力?
深度强化学习实验室 官网:http://www.neurondance.com/ 来源:https://zhuanlan.zhihu.com/p/328287119 作者:网易伏羲实验室 编辑:Dee ...
最新文章
- springcloud demo---feign
- java list 删除 遍历_Java list利用遍历进行删除操作3种方法解析
- 测试软件测试赢在测试2:中国软件测试专家访谈录
- getRequestDispatcher()与sendRedirect()的区别
- tomcat 启动项目 页面文字乱码_项目通过tomcat部署到服务器,请求数据页面中文乱码问题...
- python全栈开发_day20_加密模块和excel操作模块以及xml
- php 转通达信数据格式,通达信数据格式
- 为什么说“不要教你的孩子学编程”?
- HNOI2019爆零记
- Ubuntu系统 -- 初始化配置与基础操作
- 全是宝!20款优质高效的在线协作工具任你挑,就是这么强大!
- 浏览器兼容性问题和解决方案
- iPhoneSE3变化却提高了价格,安卓手机获得了喘息的空间
- 【报错记录】MybatisPlus报Mapped Statements collection does not contain value for...
- 如何在word中的图片上画圈标注_怎么在word图片上画圈
- Windows10+YOLOv5训练自己的数据集
- Gamma Correction(伽马校正)
- 云从科技资深算法研究员:详解跨镜追踪(ReID)技术实现及难点 | 公开课笔记
- F280049C_CLA配置说明
- 基于js的网页计算器实现
热门文章
- 2.spring IOC(DI)
- win10查看对方计算机名,win10系统巧用nbtstat命令快速探测对方计算机名称的操作方法...
- 大一时为了恶搞同学写的“诗”
- 便签加密设置取消指纹解密
- 灵魂拷问!Android开发究竟该如何学习,跳槽薪资翻倍
- iOS-NSTimer的3种创建方式
- 福建学业水平考试计算机技能考网络设备配置思科篇
- 华为HCIE RS笔记-20RIP(Routing information Protocol)
- 阴阳师师徒系统不同服务器,阴阳师师徒系统详细解读 黑蛋获取途径新增
- 故障转移集群服务器 重装系统,安装故障转移群集前的准备工作