”每周一起读“是由 PaperWeekly 发起的论文共读活动,我们结合自然语言处理、计算机视觉和机器学习等领域的顶会论文和前沿成果来指定每期论文,并且邀请论文作者来到现场,和大家展开更有价值的延伸讨论。

我们希望能为 PaperWeekly 的各位读者带来一种全新的论文阅读体验、一个认识同好、找到组织的契机、一次与国际顶会论文作者当面交流的机会。

6 月 23 日(周日)下午 2 点,“每周一起读”将邀请清华大学计算机系本科生高信龙一,和大家分享其发表于计算机领域顶级会议 WWW 2019 的最新文章。该论文研究电子商务环境下的多源搜索展示优化,提出将整个搜索页面设计建模成一个层次化序列决策过程,用以更好地捕捉用户的行为与意图。

01# 本 期 嘉 宾

  高信龙一  

清华大学计算机系本科生


高信龙一,清华大学计算机系本科生,从事自然语言处理方向研究,导师为黄民烈副教授。他预计于 2019 年在清华大学计算机系取得工学学士学位。他的研究兴趣主要在对话系统以及强化学习。他在人工智能国际会议 WWW, ACL, AAAI 等上发表了数篇论文。

02# 本 期 论 文

  WWW 2019  

Abstract: In this paper, we investigate the task of aggregating search results from heterogeneous sources in an E-commerce environment. First, unlike traditional aggregated web search that merely presents multi-sourced results in the first page, this new task may present aggregated results in all pages and has to dynamically decide which source should be presented in the current page. Second, as pointed out by many existing studies, it is not trivial to rank items from heterogeneous sources because the relevance scores from different source systems are not directly comparable. To address these two issues, we decompose the task into two subtasks in a hierarchical structure: a high-level task for source selection where we model the sequential patterns of user behaviors onto aggregated results in different pages so as to understand user intents and select the relevant sources properly; and a low-level task for item presentation where we formulate a slot filling process to sequentially present the items instead of giving each item a relevance score when deciding the presentation order of heterogeneous items. Since both subtasks can be naturally formulated as sequential decision problems and learn from the future user feedback on search results, we build our model with hierarchical reinforcement learning. Extensive experiments demonstrate that our model obtains remarkable improvements in search performance metrics, and achieves a higher user satisfaction.

03# 活 动 信 息

时间:6 月 23 日(周日) 14:00–16:00

地点:北京智源人工智能研究院102会议室

北京市海淀区中关村南大街1-1号

中关村领创空间(信息谷)

04# 如 何 报 名

长按识别二维码,即刻报名?

报名截止日期:6 月 22 日(周六)12:00

* 场地人数有限,报名成功的读者将收到包含电子门票二维码的短信通知,请留意查收。

注意事项:

* 如您无法按时到场参与活动,请于活动开始前 24 小时在 PaperWeekly 微信公众号后台留言告知,留言格式为放弃报名 + 报名电话;无故缺席者,将不再享有后续活动的报名资格。

05# 微 信 交 流 群

06# 往 期 回 顾

 1 / 扫码关注 

扫码关注 PaperWeekly?

 2 / 回复暗号 在后台回复“每周一起读即可查看往期实录
07# 主 办 单 位

PaperWeekly

清华大学计算机科学与技术系

北京智源人工智能研究院

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 立刻报名

每周一起读 × 招募 | WWW 2019:基于层次化强化学习的多源搜索展示优化相关推荐

  1. 每周一起读 × 招募 | ICML 2019:基于粒子的变分推断加速方法

    "每周一起读"是由 PaperWeekly 发起的论文共读活动,我们结合自然语言处理.计算机视觉和机器学习等领域的顶会论文和前沿成果来指定每期论文,并且邀请论文作者来到现场,和大家 ...

  2. 每周一起读 × 招募 | ACL 2019:基于知识增强的语言表示模型

    "每周一起读"是由 PaperWeekly 发起的论文共读活动,我们结合自然语言处理.计算机视觉和机器学习等领域的顶会论文和前沿成果来指定每期论文,并且邀请论文作者来到现场,和大家 ...

  3. 【ML4CO论文精读】基于深度强化学习的组合优化问题研究进展(李凯文, 2020)

    基于深度强化学习的组合优化研究进展 本人研究方向(博士期间):多目标组合优化与决策研究--致力于多约束多目标多任务组合优化算法和多目标决策系统的研究与开发,以及多目标优化技术在一些工程实践中的应用. ...

  4. 通过图注意力神经网络进行多智能体游戏抽象_[读论文] AttnPath: 将图注意力机制融入基于深度强化学习的知识图谱推理中...

    论文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcem ...

  5. ICCV 2019 | 旷视研究院推出基于深度强化学习的绘画智能体

    两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于当地时间 10 月 27 至 11 月 2 ...

  6. OnRL: 基于在线强化学习的移动视频传输优化

    从2019年开始,淘系技术部内容社交互动团队和北京邮电大学周安福教授一起着手研究更好的基于机器学习的智能拥塞控制算法.在实验室环境完成原型验证后在淘宝直播的生产环境做实际效果对比,从实际数据来看效果明 ...

  7. 谣言止于智者:基于深度强化学习的谣言早期检测模型

    「论文访谈间」是由 PaperWeekly 和中国中文信息学会社会媒体处理专委会(SMP)联合发起的论文报道栏目,旨在让国内优质论文得到更多关注和认可. 谣言一般是指未经核实的陈述或说明,它往往与某一 ...

  8. 基于深度强化学习的电子商务平台动态定价

    目录 1. 论文背景 2. 核心框架 3. 方法介绍 3.1 问题描述 3.2 定价动作模型 3.3 预训练 3.4 离线评估 4. 实验效果 1. 论文背景 Dynamic Pricing on E ...

  9. 商简智能学术成果|基于深度强化学习的联想电脑制造调度(Lenovo Schedules Laptop Manufacturing Using Deep Reinforcement Learning)

    获取更多资讯,赶快关注上面的公众号吧! 文章目录 摘要 背景介绍 传统方法无法解决现有挑战 解决方案 提升模型表达能力 针对复杂约束的掩码机制 快速模型训练 配置多目标调度优化 结论   本篇论文作为 ...

最新文章

  1. 人脸识别数据集精粹(下)
  2. linux一条命令添加用户并设置密码,linux中如何通过命令行来添加用户并设置密码...
  3. 深度学习为什么要resize_为什么要学习演讲与口才
  4. PHP-Zend引擎剖析之词法分析(一)
  5. 计算机硕士工资情况收集
  6. u盘复制不进去东西_确认过眼神,是电脑小白的福音!U启动U盘启动盘制作工具...
  7. Codeforces 140D - New Year Contest
  8. python实现合并链表_python:16.合并两个排序的链表
  9. 微信小程序获取用户唯一openid,包含java
  10. 各种Arduino外设的用法,生动形象,相当好看!
  11. 面对女人的喋喋不休时,男人内心的真实想法
  12. Oracle入门(十四F)之PL/SQL定义变量
  13. Centos7换yum源
  14. python-同步(互斥)锁、递归锁、同步条件(event)
  15. Sql2008中添加程序集(转)
  16. php memcached 加锁,用memcached实现的php锁机制
  17. Hibernate框架的入门级学习运用
  18. 个人自媒体技术分享博客网站模板
  19. 基于Python的招聘网站招聘信息分析
  20. 数据库设计3个泛式和经验谈

热门文章

  1. 误删oracle数据库文件,误删Oracle数据文件导致数据库无法打开
  2. linux操作系统原理_Linux内核分析-操作系统是如何工作的(二)
  3. PE文件格式--------------导出表
  4. javascript总结9:JavaScript三目运算符
  5. [HAOI2007]上升序列
  6. 关于手机的,发送验证码,正则
  7. 鲜为人知的编程真相(转载)
  8. 注册表编辑器厘米爱你找不到mysql,win7系统中安装mysql后找不到服务或出现找不到指定文件的解决方法...
  9. html 接收 图片流_Microsoft Flow 利用自动化工作流增强Power BI使用效率
  10. 软件工程导论 银行储蓄系统_独家:重庆农商行客户存款被盗刷 银行却责怪客户用卡不规范...