文 | AI训练师

整理 | 吾来君


前言

一般来说,知识点中相似问越多,效果越好。但一味增加反而会导致知识点下相似问的冗余。

很多情况下,用户描述一个句子可能是用了某个很具体的特征,可以看下面两个例子。

案例一:“什么时候发货”这个知识点,在用户的叙述中很可能是“今天有没有发货信息”、“周一能发货吗”、“18号当天能发货吗”;

案例二:“产品是不是正品行货”这个知识点,用户叙述的可能一般都是具体的产品,“X系列产品是正品吗”、“X产品X型号是真的吧”、“我买的XX是行货吧”;

那我们想可不可以让机器人把“XX系列”都当成一种特征,而这些特征反复的出现在我们的知识中,可以单独进行维护,这样用户说产品的任意一个系列,机器人对这个知识点也能认识。谨以此文献给那些一起战斗过的AI训练师和产品经理。

0

1

句式的产生

含有“XX系列”,“X型号”,“X色号”,“X条件”,这种情况的相似问题,我们就可以添加句式来解决,用户说的时间和产品名称,型号,系列等关键信息就是实体。

这时用户说XX系列是真的吗?就可以升级成句式“@产品系列 是真的吗?”。

句式是相似说法的模板。当你需要在一个知识点中添加大量句子结构类似的相似说法时,就可以使用句式来减少相似说法的数量。

其实“XX系列”,“X型号”,“X色号”,“X规则”我们也想全都让机器人识别到任意一个配上后面的提问“是不是正品”等就能全部识别到这个知识点呢?

那吾来现在是可以设定只要符合这些规则中的任意一个,就能放到这个模式下,让机器人来识别。

盛放这些不同实体值的工具我们叫做词槽,大家可以简单的理解为一个篮子。

加上词槽之后,这个句式就变成了“@产品:产品系列,产品型号,产品色号 是真的吗”。

其中,产品是盛放不同实体值的词槽,符合产品系列,产品型号,产品色号这些实体规定规则的值或文本,类似于金装(奶粉系列),10875H(CPU型号),999(口红色号),我们称作实体值

产品系列,产品型号,产品色号是不同的实体,是判定用户语句是否包含或符合特定规则的筛选工具。

:关于实体与词槽的更多解释请注册登录后查看吾来产品手册。

0

2

配置个性化回复的准备工作

那我们需要添加实体词槽来帮助我们完成这件事。

首先需要将用户说的特征信息总结一下,先在对话搭建的词库菜单里添加枚举实体等,吾来自身也配有如日期,数字这种预设实体,有需要也可以直接使用。

第二步要在词槽管理新建问答词槽并关联实体。

第三步新建知识点或在已有知识点点击新增句式添加,在需要使用这些信息替代用户的具体说法的地方输入“@”调用对应词槽。

这样,无需穷举所有具体信息,就能覆盖所有模式一样的句子了。

机器人会将句式在参与召回的时候将句式还原成具体的相似问题,参与计算评分。这样做了之后,句式的评分和相似问题的评分就变得可以比较了。

句式的评分和相似问题的评分可以比较后,吾来的召回逻辑理解起来就很简单了。

吾来也支持使用更多的词槽来描述一个具体的问题,比如“@产品系列:产品系列 的@产品型号:产品型号 介绍一下?”,这样避免了一个问题仅有一个重要特征来描述不够精确,容易无召回或误召回的问题

通过实体而不是同义词的方法,能让我们区分出不同的实体值,甚至可以根据不同的实体值,比如说产品型号,给用户个性化的回复,又不增加更多的泛化相似问题投入。

0

3

个性化回复的设置

不同的产品型号系列的对应答案,为了方便整理,可以放置到一个表格中,这样就能精准的找到应该回复用户的问题了。

商品编号

系列

阶段

答案

100001

天启

二段

天启二段奶粉……

100002

天启

三段

天启三段奶粉……

100003

美赋

三段

美赋三段奶粉……

其实在很多知识在业务中,也都是使用表格存放的,所以如果直接能将表格中的内容组织后回复出来,对机器人搭建来说是非常高效的。

个性化回复的答案我们可以在对话搭建-个性化体验-个性化回复创建表格并添加。

目前吾来支持创建多个表格,每个表格可以有一万行,可以添加10组用来定位条件的属性列,以及20组答案列;答案列中的答案可以点击添加,支持文字、图片、图文、卡片、文件、语音和视频格式答案也可以批量导入批量导入的答案只支持文字。

关联表格也很简单,只需要开启个性化回复,选择表格,配置查询条件,返回的答案所在列就行了。

保存后,我们就可以在调试机器人,体验版网页或其他正式渠道看到效果了。

可以在调试机器人处看到对应的句式,知道这个问题是哪个知识点,甚至是哪个句式影响下才发送回复的,这可以支持我们进行快速准确的进行调优

查询的条件现在还支持用户的询问语句结合用户自身的属性一起使用,可以实现不同地区,身份,渠道的用户提问可以回复不一样的答案。

现在,吾来机器人对话平台可以在配置这样结构的知识点后,精准的回复用户诸如“帮我找一下X城市的门店地址”,“X系列产品有X功能吗”这样的问题,并且可以减少很多低水平重复的相似问添加工作

多个知识点可以利用同一张表格,更加节省配置的工作量。

所以,通过知识点关联表格,用句式来查询表格并回复答案这个方案非常的精准,避免了仅采用词向量、句向量和自然语言查表查数据库的能力进行召回,效果难以干预和修复问题。

简单的知识图谱类需求,我们可以转化成问答调用表格进行回复,大大降低搭建和维护知识图谱的成本。

0

4

个性化回复的其他优化

针对句式和读表我们也做了大量的优化,以使这个过程更具有实操性和落地性

在搭建时,完全不需要英文单词,不需要代码或者任何接口,只要准备好表格,我们就能创建这样一个知识点。

在配置过程中,也可以将已输入的相似问题,简单点击就能升级为句式。

原有的知识库可以很方便的升级为带句式和个性化回复的知识库。

知识库也支持了携带句式的导入导出,方便在其他APP复用知识库。

任务对话中,也可以利用句式来填槽和触发,这样在触发的同时,我们也能精准的收集到用户说的关键信息。

添加了词槽之后,使用句式可以精准的将诸如出发地和到达地这样的信息精准的收集到。

例如,“帮我买一张@出发地:城市 到@到达地:城市 的@出行类型:交通方式 票”,就可以识别如帮我买一张上海到北京的高铁票这样的需求,并且精准的将出发地填入上海,到达地填入北京,出行类型填入高铁。

那如果有新增的品类或者给另外的产品线使用,我们只需要替换或者新增实体值就可以完美复用原来的知识点了。知识库的通用性和专业性都能得到保证。

除此之外,我们还针对这类知识点的相似说法挖掘能力做了大量优化。

如果您有清洗过的和用户对话记录,可以先导入语料库,而后从挖掘机器人导入挖掘库中指定的语料。

导入之后选择立即挖掘。

注:挖掘功能及部分效果优化功能目前仅在基础版和专业版提供。

机器人会根据句子的特征和里面包含的实体进行聚类,含有实体的聚类的结果可以点击自动升级句式,得到更加精准的推荐,方便做进一步处理

点击对应的代表问题后的筛选问题,可以查看机器自主聚类的的单簇结果。

上图所示就是句式携带实体时的聚类表现,我们可以再展开相应的相似问挑选相似问,可以看到机器人已经将类似于“X个月宝宝的正常体重”,“X个月宝宝X斤是否正常”这样的句子全都汇总在一起了。

点击簇后可以发现有些已经被机器人预选上了,另外一些没有,预选上的句子是机器人推荐入库的,其余的句子和已被预选的句子十分接近,不需要重复添加机器人也能回复正确。

更少但更有代表性的句子,也减少了我们后期维护知识库的难度。

筛选时仍然要注意注意要选择保留意图单一,非关键词,完整又不和其他知识点的意图重合的句子。

对挖掘出来的知识做必要的整理,根据聚类的结果对知识点进行命名,如添加相似问,选择分类,转移,删掉不相关意图的相似问之后,我们就能在下方将知识点入库了。

如果是属于现有知识点的相似说法,我们也可以点击转移到已有知识点进行添加,若还想找到更多相似问题,可以尝试点击推荐相似簇推荐相似问按钮。

结语

专业开放的对话机器人平台"吾来"已全面支持句式查询表格给出个性化回复答案,无需编程、无需部署、免费试用,支持企业快速拥有自己的对话机器人。

大家可以扫描下方二维码,免费注册一个吾来平台的账号,尝试搭建自己的个性化智能机器人,并利用本文的方法将自己的机器人快速发布并体验

点击「阅读原文」

快速免费试用吾来对话机器人平台!

????????

什么样的回答才足够个性?吾来个性化回复举手参评相关推荐

  1. 面试第一问:简单做个自我介绍吧,怎么回答才让面试官频频点头?

    面试第一问:简单做个自我介绍吧,怎么回答才让面试官频频点头? 前言 个人的基本信息,扬长避短 突出自己的技能 个人兴趣爱好与结尾 总体案例: 前言 面试问题第一问,99.99999%都是:请先做个自我 ...

  2. 【英文】当歪果仁说quot;thank youquot;,怎样回答才地道?

    如果你做了一件很值得感激的事情,外国朋友感激对你说:Thank you! 这时你该如何回答呢? You're welcome? 但是! 据美国新闻聚合类网站Buzzfeed介绍,对于母语是英文的老外来 ...

  3. 面试常见问题:如何回答才得体?

    ​面试是我们进入职场必须经历的一道难关,也是企业寻找合适员工的重要方法.面试结果的好坏直接关系着求职者是否能够得到工作机会,同时,一次精彩的面试可以给领导留下好的印象,对后期职业发展也可以起到推动作用 ...

  4. Git 这样回退代码,才足够优雅

    来源 | 占小狼的博客 从接触编程就开始使用 Git 进行代码管理,先是自己玩 Github,又在工作中使用 Gitlab,虽然使用时间挺长,可是也只进行一些常用操作,如推拉代码.提交.合并等,更复杂 ...

  5. 面试被问到这道送命题,怎么回答才不会变成炮灰

    你在面试时,有没有被问到这个问题:请问你从上家公司离职的理由是什么? 这段时间,疫情刚进入尾声,身边很多想换工作的朋友都开始找工作了,所以向我问这个问题的人特别多.于是,我把这个问题发到朋友圈里,看看 ...

  6. 面试时被问到职业规划,怎样回答才最加分?

    "能否简述下你未来5年的职业规划呢?" 相信大多数求职者在面试的时候都会被问到过这个问题. 实际面试时,HR和业务部门的面试考核维度不同,这也代表着公司评估一个应聘者的能力不仅仅是 ...

  7. 技术面试时,被问及职业规划,怎么回答才加分?

    对于职场人士来说,但凡涉及到面试,90%以上的概率你会被问到职业规划.而作为一个技术人士,本身的表达能力就比硬实力薄弱一些.很多人一上来的回答就是:先做技术岗,阅历深点了做管理.这样的回答,往往前脚刚 ...

  8. Spring Boot 配置文件这样加密,才足够安全!

    1. 前景 在使用Springboot时,通常很多信息都是在application.yml中直接明文配置的,比如数据库链接信息,redis链接信息等等.但是这样是不安全的. 所以需要对敏感数据进行加密 ...

  9. 应聘时被问到「你的期望薪资是多少」,怎样回答才是最合理的呢?

    作者:徐强 链接:https://www.zhihu.com/question/19841590/answer/14204814 来源:知乎 著作权归作者所有,转载请联系作者获得授权. 1)明确3个价 ...

最新文章

  1. 重磅!GitHub 日收 7000 星, Windows 计算器项目开源即爆红!
  2. WinObjC?这是什么鬼?
  3. web api 二
  4. python所有变量更新_PYTHON:使用python变量更新MULTIPLE COLUMNS
  5. 西南交大计算机组成原理考试大纲,西南交大计算机组成原理实验二七段LED数码管显示译码器的设计.docx...
  6. HTTP 遭 Google 抛弃,开发者该如何应对?
  7. U890第二次开发的BOM表工具--自主知识产权
  8. SpringBoot高级篇-属性配置
  9. AD教程系列 | 0-认识Altium Designer:汉化和新建项目
  10. ch2 gpio应用:Buzzer封装
  11. 谁说菜鸟不会数据分析python mobi_利用Python进行数据分析[azw3+epub+mobi][30.34MB]
  12. oracle recover database,standby库,在sqlplus下用recover standby database进行手工恢复
  13. DB2表空间状态代码解释
  14. OpenCV —— 特征点检测之 SIFT 特征检测器
  15. 电脑ps计算机磨皮,用PS磨皮详解教程 -电脑资料
  16. go开发gui还是python开发gui_golang为什么没有官方的gui包?
  17. Windows 7 SATA与XP IDE双启动多个磁盘
  18. HbuilderX下载安装
  19. 二十四、冷战和消费主义
  20. 点云处理:Kitti数据集中点云坐标转化到彩色摄像机坐标

热门文章

  1. 距离程序员玩转云上魔方还有多远?
  2. TP_LINK交换机配置
  3. 趣漫揭秘!中国程序员生存现状?
  4. Linux和Windows间的远程桌面访问
  5. 第8课:彻底实战详解使用IDE开发Spark程序--集群模式运行
  6. 面经实习:美团测试开发 成都华为 软件开发
  7. 什么是负一屏,场景识别
  8. 中创算力|库里18万美元买个猴头像 到底是个啥?
  9. es5的data语法_ES5中新增的Array方法详细说明
  10. python键盘控制程序延迟_python 实现控制鼠标键盘