面向 open domain 的聊天机器人无论在学术界还是工业界都是个有挑战的课题,目前有两种典型的方法:一是基于检索的模型,二是基于 Seq2Seq 的生成式模型。前者回复答案可控但无法处理长尾问题,后者则难以保证一致性和合理性。

本期推荐的论文笔记来自 PaperWeekly 社区用户 @britin本文结合检索模型和生成模型各自的优势,提出了一种新的融合模型 — AliMe Chat。


阿里小蜜首先采用检索模型从 QA 知识库中找出候选答案集合,然后利用带注意力的 Seq2Seq 模型对候选答案进行排序,如果第一候选的得分超过某个阈值,则作为最终答案输出,否则利用生成模型生成答案。

关于作者:Britin,中科院物理学硕士,研究方向为自然语言处理和计算机视觉。

■ 论文 | AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine

■ 链接 | https://www.paperweekly.site/papers/1302

■ 作者 | britin

论文动机

目前商用的 Chatbot 正在大量兴起,这种可以自然语言对话的方式来帮助用户解答问题比传统死板的用户界面要更友好。通常 Chatbot 包括两个部分:IR 模块和生成模块。针对用户的问题,IR 模块从 QA 知识库中检索到对应的答案,生成模块再用预训练好的 Seq2Seq 模型生成最终的答案。

但是已有的系统面临的问题是,对于一些长问句或复杂问句往往无法在 QA 知识库中检索到匹配的条目,并且生成模块也经常生成不匹配或无意义的答案。

本文给出的方法将 IR 和生成模块聚合在一起,用一个 Seq2Seq 模型来对搜索结果做评估,从而达到优化的效果。

模型介绍


整个方案如图所示:


首先利用 IR 模型从知识库中检索到 k 个候选 QA 对,再利用 rerank 模型的打分机制计算出每个候选答案和问题的匹配程度。如果得分最高的那个大于预设好的阈值,就将其当作答案,如果小于阈值,就用生成模型生成答案。

整个系统是从单词层面上去分析的。

1. QA知识库 

本文从在线的真人用户服务 log 里提取问答对作为 QA 知识库。过滤掉不包含相关关键词的 QA,最后得到 9164834 个问答对。

2. IR模块 

利用倒排索引的方法将每个单词隐射到包含这个单词的一组问句中,并且对这些单词的同义词也做了索引,然后利用 BM25 算法来计算搜索到的问句和输入问句的相似度,取最相似问句的答案。

3. 生成模型

生成模型是一个 attentive seq2seq 的结构,如图所示:

采用了一个 GRU,由 question 生成 answer,计算生成单词的概率:

其中加了 context 向量,他是由图中的 α 求得的,α 表示的是当前步的输入单词,和上一步的生成单词之间的匹配度,用了一个 alignment 模型计算。

要注意,对于各个 QA 长度不等的情况,采用了 bucketing 和 padding 机制。另外用了 softmax 来随机采样词汇表中的单词,而不使用整个词汇表,从而加速了训练过程。还是用了 beam search decoder,每次维护 top-k 个输出,来取代一次一个输出的贪心搜索。

4. rerank 模块


使用的模型和上面是一样的,根据输入问题来为候选答案打分,使用平均概率作为评分函数:

实验结果

本文对结果做了详细的评估,首先评估了 rerank 模块平均概率的结果。然后分别对 IR,生成,IR+rerank,IR+rerank+ 生成这些不同组合的系统做了性能评测。并对该系统和 baseline 的 Chatbot 做了在线 A/B 测试。最后比较了这个系统和已经上市的 Chatbot 之间的差别。

不同 rerank 模型的效果:

不同模块组合的结果:

和 baseline 对比的结果:


文章评价

本文给出了一种 attentive Seq2Seq 的模型来结合 IR 和生成模块,从而对原结果进行 rerank 优化。阿里已经把这个投入了阿里小蜜的商用。

总的系统还是比较简单的,符合商用的需求。但由于函数设计过于简单,不排除是靠数据堆起来的系统,毕竟阿里有大量的真实用户数据,所以算法价值层面比较一般,没有合适的数据恐怕很难达到预期的效果。

揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎相关推荐

  1. 揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  2. 论文翻译-阿里小蜜,基于检索模型和生成模型相结合的聊天引擎

    1.摘要 阿里小蜜是一款开放领域的聊天机器人引擎,他结合了IR(检索)模型与带有注意力机制的seq2seq生成模型.从效果上来讲,阿里小蜜的表现明显优于只使用某一种单一模型的情况. 2.介绍 近年来, ...

  3. 颠覆传统的电商智能助理-阿里小蜜技术揭秘

    http://www.infoq.com/cn/articles/electricity-supplier-intelligent-assistant 一.双11的挑战与服务模式的转型 在全球人工智能 ...

  4. 未来已来!阿里小蜜AI技术揭秘

    原文链接 1.双11的挑战与服务模式的转型 在全球人工智能领域不断发展的今天,包括Google.Facebook.Microsoft.Amazon.Apple等互联公司相继推出了自己的智能私人助理和机 ...

  5. 机器如何猜你所想?阿里小蜜预测平台揭秘 1

    阿里妹导读:阿里小蜜是2015年阿里发布的一款智能客服机器人.2017年双11期间,阿里小蜜的服务量达到643万,其中智能解决率达到95%,占整体服务量的95%.经过近几年的发展,能否更进一步解决智能 ...

  6. 如何构建阿里小蜜算法模型的迭代闭环?

    简介: 伴随着 AI 的兴起,越来越多的智能产品诞生,算法链路也会变得越来越复杂,在工程实践中面临着大量算法模型的从 0 到 1 快速构建和不断迭代优化的问题,本文将介绍如何打通数据分析 - 样本标注 ...

  7. 2017年出品干货 | 阿里小蜜-电商领域的智能助理技术实践

    作者简介 陈海青,阿里巴巴智能服务事业部资深技术专家,在阿里从事智能人机交互领域相关的工作和研究8年,带领团队构建了阿里巴巴智能交互机器人系统.本文来自陈海青在"携程技术沙龙--人机语义交互 ...

  8. 情感分析算法在阿里小蜜的应用实践

    来自:DataFunTalk 主要作者:宋双永 阿里达摩院 算法专家 编辑整理:Hoh 导读:人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应 ...

  9. 深度学习要多深,才能读懂人话?|阿里小蜜前沿探索...

    小叽导读:本篇文章全面阐述了"机器阅读理解综述及在电商领域的探索"主题,总字数近五千字,预计需要10分钟左右的阅读时间.推荐对深度学习.大数据.自然语言处理感兴趣的童鞋收藏. ▌研 ...

最新文章

  1. 根据浏览器内核判断是web/iOS/android/ipad/iphone 来打开不同的网站或页面
  2. linux bin文件制作
  3. LateUpdate、Late、FixedUpdate的意义
  4. [转载]Programming MS Office 2000 Web Components第二章第三节
  5. 数据分析领域七大热门职业
  6. 状压DP【洛谷P1896】 [SCOI2005]互不侵犯
  7. 4.Linux/Unix 系统编程手册(上) -- 文件IO:通用的IO模型
  8. (转)周明:未来5-10年,自然语言处理将走向成熟
  9. 利用反射等离激元超表面的模拟光计算
  10. python for循环求1到100的和_python中用for循环语句实现1加到100的方法
  11. Android 蓝牙 inquiry、inquiry scan、page、page scan等概念解析
  12. php后缀加swp,当编辑文件出现swp的时候如何处理
  13. 《大数据》笔记 Bonferroni correction
  14. 影响企业未来的十大管理理念
  15. 求矩阵的特征根和特征向量
  16. 武汉科技大学数学计算机考试范围,2018年考研数学三考试大纲
  17. 实时渲染:实时、离线、云渲染、混合渲染的区别
  18. CSS3实现过渡效果 (transition)
  19. MySQL_5 有丶牛逼的查询语句
  20. android 播入mps框架,【精】MPS安卓导航如愿完工(已更新)

热门文章

  1. Mac系统下查看和生成SSH Key
  2. 500万相机芯片尺寸_供应 500万像素 COMS芯片 高清图片效果真实性高 工业相机
  3. mysql 点赞数据库设计_基于redis实现的点赞功能设计思路详解
  4. airpods pro是按压还是触摸_AirPods Pro个人使用体验
  5. 修改idea窗体背景颜色
  6. Visual Studio 2013键盘码农常用快捷键
  7. 双目摄像头Matlab参数定标
  8. Android 7.1新特性
  9. 厉棠娘)-ISO/安卓终端
  10. Qt/C++编写自定义控件44-天气仪表盘