阿里小蜜

论文题目:AliMe Assist: An Intelligent Assistant for Creating an Innovative E-commerce Experience

这篇论文主要讲了阿里小蜜的整体架构,在技术细节上并没有深入的讲解

  • 这篇论文的贡献点

    • 设计并开发了一个真实世界的具有工业智能的助手,提供助手服务,客户服务,和聊天服务,在电子商务领域
    • 提出了一个卷积神经网络模型来做意图识别,用来处理带有上下文的用户问题
    • 提出了语义归一化和基于知识图谱方法的知识导向型的用户问答服务
    • 提出了了混合IR和attentive Seq2Seq模型优化开放领域聊天

2 系统总览

  • 第一层是输入层,支持语音,文本,等多端输入
  • 第二层是意图层,决定了每个问题的路由
  • 第三层指明了处理问题的组件
  • 第四层代表了只是的来源,QA对,知识图谱

问题处理流程

  • 给出一个问题q,首先传输到一个业务规则解析器(business rule parser, a trie-based pattern matcher),应该是一种基于trie树规则的匹配

    • 如果匹配到确定的模式

      • 如果请求的是任务型助手服务,那么将会匹配槽位填充引擎。例如:我想预定飞机票
      • 如果问的是促销活动,一个预先配置的答案将会被返回
      • 如果问的是在线服务相关的,例如"real person, please"。那么将会要求用户提供描述问题的信息
    • 如果没有匹配到确定的模式,问题q将会被发送到意图分类器(intention classifier)当中被分类,问题会带上被分类的意图场景
  • 接着 q 将会被送到基于trie树的语义解析器当中,如果 q 当中有任何 语义标签被解析到了(知识图谱当中的实体,例如用户账户),q 就将被视为业务相关(即知识导向的)的,识别出来的标签将会被用来从知识图谱引擎当中检索出来答案,如果没有答案被检索出来,AliMe将会使用q的上下文和q进行concat,重新送到语义解析器当中
    • 有两点要注意:一是q没有上下文信息,二是concat(q, c)仍然没有答案。 那么进入下一步,如果识别出来的标签仅包含一个实体,或者行动,那么向用户询问更多的信息,否则的话,将q传入IR引擎当中。
    • 如果IR引擎依旧没有答案,那么q将会根据意图场景被发送给客服人员,这里可以给客服人员使用推荐系统
  • 如果q识别出来跟业务无关,并且是一个聊天,那么聊天引擎将会提供答案
  • 如果q也不是一个聊天,那么预先配置的答案将会返回

意图识别

  • 阿里小米的用户意图分为三个类别:

    1. 寻求帮助,eg: 我想订飞机票
    2. 寻求信息,或者解决方案。 eg: how to find back my password
    3. 聊天
  • 两个组件,业务规则解析器 + 意图分类器
    • 意图分类器使用了 Text-CNN,如下图所示

任务导向的助手服务(任务型)task-oriented

  • 任务型的QA,通常会定义一个固定的模式,并对一个task指定强制的slot 和 可选的 slot,使用slot-filling 相关的技术,从用户的输入当中抽取信息并填入到预定义的slots当中。
  • aliMe已经能够识别15种槽位信息,如产品,位置,日期等
  • AliMe会向用户询问强制的信息,然后调用第三方服务来完成task

知识型(Knowledge-oriented)

  • 解决的是 looking for information/solutions 需要尽可能的强调准确度,使用了知识图谱
  • 构建知识图谱
    • 抽取名词,动词,从自然语言知识当中,使用分词,词性标注,tf-idf过滤等技术
    • 使用人工信息构建高级别的实体
    • 业务分析师,review这些实体,并设计实体之间的关系,构建层次结构
    • 最后使用Neo4j作为我们的查询引擎
  • 我们的只是图谱包含了上千的实体和固定数目的关系
  • 支持简单的推理(短跳推理)
  • 这个只是图谱展示如何回答"how to find my lost login password"
  • 实践中,语义的归一化是一个关键的因素:如何将不同的表达映射到一个在知识图谱当中相同的语义实体

聊天服务

  • 结合了IR + attentive seq2seq,有专门对应的一片论文

【论文笔记】AliMe Assist阿里小蜜(未完。。。)相关推荐

  1. 论文翻译-阿里小蜜,基于检索模型和生成模型相结合的聊天引擎

    1.摘要 阿里小蜜是一款开放领域的聊天机器人引擎,他结合了IR(检索)模型与带有注意力机制的seq2seq生成模型.从效果上来讲,阿里小蜜的表现明显优于只使用某一种单一模型的情况. 2.介绍 近年来, ...

  2. 揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  3. 情感分析算法在阿里小蜜的应用实践

    来自:DataFunTalk 主要作者:宋双永 阿里达摩院 算法专家 编辑整理:Hoh 导读:人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应 ...

  4. 揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎

    面向 open domain 的聊天机器人无论在学术界还是工业界都是个有挑战的课题,目前有两种典型的方法:一是基于检索的模型,二是基于 Seq2Seq 的生成式模型.前者回复答案可控但无法处理长尾问题 ...

  5. 深度学习核心技术精讲100篇(四十六)-情感分析算法在阿里小蜜的应用实践

    前言 人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应用.其中,智能客服系统受到了很多企业尤其是中大型企业的广泛关注.智能客服系统旨在解决传统 ...

  6. 全球最强大脑在哪?阿里小蜜算法团队在寻找

    阿里妹导读:阿里小蜜的算法专家们最近在意大利都灵筹备一场国际数据挖掘竞赛.这场竞赛的名字叫CIKM AnalytiCup,是全球著名的公开.公正的大数据开放式竞赛. 去年,这场比赛是与阿里云.深圳气象 ...

  7. 阿里小蜜多模态知识图谱的构建及应用

    分享嘉宾:徐国海 阿里巴巴 编辑整理:monk 国家管网 出品平台:DataFunTalk 导读:本文由阿里巴巴达摩院阿里小蜜团队带来,介绍其在知识图谱方面一年多以来的一些工作进展.主要内容包括:①  ...

  8. 阿里小蜜人工智能助理,唯一入选麻省理工十大突破性技术的中国代表

    从 2001 年开始,<麻省理工科技评论>每年都会评选出当年的"十大突破性技术".这份报告会对未来的科技发展方向进行分析与预测,在全球科技领域都有着举足轻重的作用. 今 ...

  9. 如何构建阿里小蜜算法模型的迭代闭环?

    简介: 伴随着 AI 的兴起,越来越多的智能产品诞生,算法链路也会变得越来越复杂,在工程实践中面临着大量算法模型的从 0 到 1 快速构建和不断迭代优化的问题,本文将介绍如何打通数据分析 - 样本标注 ...

  10. 前沿重器[5] | 阿里小蜜的数据量分级处理机制

    [前沿重器] 全新栏目,那么栏目主要给大家分享各种大厂.顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术.具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有. 往期回顾 前沿 ...

最新文章

  1. WPF下可编辑Header的Tab控件实现
  2. 用友ERP服务器的连接
  3. SAP ABAP SQL查询分析器
  4. 【CSDN】图片居中与调整大小
  5. GDCM:获取图像像素间距的测试程序
  6. C\C++\Java字符串拼接比较
  7. 函数式编程 -- 函子(Functor)
  8. 提升自己身价的四个方式
  9. Linux如何安装python pandas科学库
  10. Arrays工具、二维数组以及LeetCode练习题
  11. Windows Server 2016上具有Docker容器SQL Server
  12. sencha touch 2与phonegap 2.0结合 打包web app
  13. sqlite 常用数据类型
  14. 【交通标志识别】基于matlab GUI模板匹配交通标志识别【含Matlab源码 1059期】
  15. 网页访问计数器 html,网页计数器(访问量)
  16. sdut 1299最长上升子序列
  17. c语言出现错误c1083,DES 算法,出现异常:fatal error C1083: Cannot open include file: 'des_encode.h'...
  18. 流量卡之家:AI、无人机、物联网、自动驾驶 未来取决于5G
  19. 概率论---古典概型
  20. 启蒙教师周志华亲自讲解,机器学习视频课上线了

热门文章

  1. 【机器学习】【决策树】自己动手用Python实现一个类:in样本集,out特征分布、概率密度、熵、条件熵、信息增益、信息增益比
  2. 概率论与数理统计 期末突击复习
  3. Keil报错:Libraries\CMSIS\stm32f10x.h(298): error: #67: expected a }
  4. ubuntu16.04安装Preempt RT实时内核
  5. 解决:RSA host key for [ip] has changed and you have requested strict checking.
  6. DDR中的一些知识点说明(ODT,ZQ校准,OCT,TDQS)
  7. Java设计模式——工厂模式——模拟Spring
  8. 网上图书商城项目学习笔记-018生成订单
  9. P2704 [NOI2001] 炮兵阵地
  10. 【慧河网络安全组】Web基础和http协议培训题_1