搜索智能问答的探索与实践

搜索引擎的演化历程

搜索智能问答的探索与实践
搜索引擎的演化历程


搜索中的问题需求

搜索中的问答形态

搜索中问答的技术路线

KBQA
什么是KBQA


解决方案
方案一:结构化推理

基于组合范畴语法 (CCG) 或句法依存树解析Query结构,并将其以固定的规则转换为图引擎表达式

方案二:结果端到端

基于神经网络,一站式完成从原始文本的输入到图引擎表达式/查询语 句的输出

方案选择

Query解析:模板挖掘
基于种子SPO,从多方数据来源挖掘模板


Query解析:层次化模板匹配
简单识别,与多层次嵌套模板识别

Query解析:模型预测
使用轻量且精准的模型兜住模板未能覆盖的10%的用户表达

结构化推理:算子引擎
算子的无限种组合,可以解决搜索场景下绝大多数复杂问题

DeepQA
DQA解决什么问题
背景:

DeepQA是指深度挖掘自由文本内容,结合QP匹配和MRC等技术,从自由文本中抽取文本片段作为答案,从而产出高质量问答对,扩充线上FAQ库,提升问答整体覆盖率。

特点:

来源简单 数据丰富 广泛适配多数场景

难点 如何从中抽取正确的答案?

搜索场景下的DQA

问答Query的理解

Query意图据识模型



MRC模型优化

MRC数据强化

答案选择与排序
答案选择排序

•答案聚合:多来源多文档下,同答案聚合,提升信号强度

•答案排序:选取基础Q-T-P-A四元组基础字面匹配特征、MRC模型特征、语义类特征等,做多维信号融合打分排序

据识后置

• MRC据识:MRC模型面临大量负样 本,过召回问题收敛难度大,过度 收敛会导致召回变低

• 后置据识:通过后置多维度融合后 的分数,对答案进行进一步据识, 降低过召回情况

方案的效果
Motian预训练 + MRC + rank 取得 CLUE-CMRC 榜单 Top1


IRQA
IRQA需要做哪些事情


匹配:相关性计算模型

预训练模型应用


大模型加速

一些思考
IRQA对内容生态的依赖、TOP1&SEO的互利结合
DQA事实的支撑、 KB完备性、KB的联合
更全面的应用

搜索智能问答的探索与实践相关推荐

  1. 美团智能问答技术探索与实践

    分享嘉宾:美团 江会星 博士 编辑整理:韩佳 出品平台:DataFunTalk 导读:本文主要介绍在美团业务中智能问答技术的相关落地与实践.通常问答系统需要提前构建好问答对知识库,这种方式对高频问题能 ...

  2. 美团外卖广告智能算力的探索与实践(二)

    在深度学习时代,算力的需求和消耗日益增长,如何降低算力成本,提高算力效率,逐渐成为一个重要的新课题.智能算力旨在对流量算力进行精细化和个性化分配,从而实现系统算力约束下的业务收益最大化. 本文主要介绍 ...

  3. 【实践】美团外卖广告智能算力的探索与实践

    在深度学习时代,算力的需求和消耗日益增长,如何降低算力成本,提高算力效率,逐渐成为一个重要的新课题.智能算力旨在对算力进行精细化和个性化分配,实现最优化资源利用.本文主要分享美团外卖广告在智能算力探索 ...

  4. 视频AI对话杭州云栖:新一代视频智能生产的探索与实践

    在今年的杭州云栖大会AB区中庭,有一个全透明建筑备受瞩目,这就是云栖数据指挥中心.在这块大屏中的媒体中央厨房部分,正是采用了视频智能生产方案,将多模态内容理解与云导播和云剪辑相结合,使原来小时级别的视 ...

  5. 美团外卖广告智能算力的探索与实践

    在深度学习时代,算力的需求和消耗日益增长,如何降低算力成本,提高算力效率,逐渐成为一个重要的新课题.智能算力旨在对算力进行精细化和个性化分配,实现最优化资源利用.本文主要分享美团外卖广告在智能算力探索 ...

  6. 深度学习在搜索业务中的探索与实践

    本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理而成,内容有修改. 引言 2018年12月31日,美团酒店单日入住间夜突破200万,再次创下行业的新纪录,而酒店搜索在 ...

  7. 深度学习在搜索业务中的探索与实践 1

    本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理而成,内容有修改. 引言 2018年12月31日,美团酒店单日入住间夜突破200万,再次创下行业的新纪录,而酒店搜索在 ...

  8. 美团高级技术专家艺涛:深度学习在搜索业务中的探索与实践

    数据猿导读 本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理修改而成.文章分享了深度学习在酒店搜索NLP中的应用,并重点介绍了深度学习排序模型在美团酒店搜索的演进路线 ...

  9. BERT在美团搜索核心排序的探索和实践

    为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与NLP部算法团队从2019年底开始基于BERT优化美团搜索排序相关性,经过三个月的算法迭代优化,离线和线上效果均取得一定进展.本文主要 ...

最新文章

  1. html5 静态网页 线程,HTML5 Web Workers之网站也能多线程的实现
  2. html如何获得网址,已知一个网址,如何获得该网址对应的html源代码?在del 找人事管理软件...
  3. windows8中的数据上下文和简单的ListView
  4. html 内嵌xml数据库,是否可以在SQLite数据库中存储XML/HTML文件?
  5. Java运行时,指定程序文件的编码
  6. 无法连接远程计算机,远程桌面由于以下原因之一无法连接到远程计算机
  7. 解析函数的幂级数理论【洛朗展开(Laurent 展开)】
  8. 晓莲说-何不原创:如何通过jad把class批量反编译成java文件
  9. css div居中对齐
  10. Java分别获取指定日期的年月日
  11. 一步拿下抖音+微信生态圈,让内容变现再次加速
  12. 利用百度poi计算城市能级及评价街道范围便利度、生活宜居情况等
  13. 2022年动力电池回收行业研究报告
  14. 知三维空间中任意旋转抛物面的顶点和焦点坐标,建立该旋转抛物面方程
  15. 传神语联网完美塑造“惊奇队长” 展现影视译制的突围之路
  16. 登山赛车2服务器正在维护什么意思,登山赛车2无法打开怎么办 登山赛车2登录不了解决方案...
  17. Spring Boot基于注解方式处理接口数据脱敏
  18. PIEGEE下载三款10米土地利用数据代码
  19. Dropout:随即失活
  20. wordpress更新php,wordpress怎么更新

热门文章

  1. ABB变频器恒压供水触摸屏通讯程序 采用ABB变频器Acs510 自带恒压供水功能 用昆仑通态触摸屏直接通讯变频器
  2. 538. 把二叉搜索树转换为累加树(java)
  3. 【Proteus仿真】51单片机洗衣机模拟控制程序
  4. Labview 和TortoiseSVN 版本控制
  5. python 实现对话聊天机器人
  6. SpringMVC全注解环境搭建
  7. Matlab中生成圆形和环形模板
  8. WaterDrop的使用
  9. MFC打印 打印预览
  10. excel导入数据校验_从Excel数据验证列表中选择多个项目