图谱问答-理解query
内容来自七月算法nlp课程。
图谱问题是用户输入一句话,系统返回这句话的答案。这里分多种情况。例如根据实体和关系查询尾实体,或者根据实体查询关系,甚至还会出现多跳的情况,不同的情况采用的方法略有不同。
文章目录
- 1 根据实体和关系查询尾实体
- 1.1 找到实体与关系
- 1.1.1 AC自动机
- 1.2 实体链接
- 1.3 实体消岐
1 根据实体和关系查询尾实体
需要两个步骤完成:第一步找到实体与关系;第二步实体链接和实体消岐。
1.1 找到实体与关系
NER的方式很多。可以采用传统机器学习的分类方法,也可以使用深度学习神经网络,一般架构为encoder+cfr层。
这里重点介绍AC自动机
1.1.1 AC自动机
1、构建前缀树
2、给前缀树加上fail指针
节点i的fail指针,如果在第一层,则指向root节点,其它情况指向其父节点的fail指针指向的节点的相同节点
1.2 实体链接
根据上一步抽取出实体和关系:例如 一句话“周董的女儿叫什么”。抽取出 周董、女儿。
图数据库中的实体可能和抽取出来的实体不一致。这个时候就需要实体链接。例如库中可能是周杰伦。这样第一步就需要找到一个候选实体集合。最好的方法是构建实体词典。用抽取出来的词在词典中查询。
例如词典中包含 周董、周杰伦、Jay都指向周杰伦这个实体。那抽取出来的“周董”也就可以连接到周杰伦这个实体了。
如果这个时候查出来的实体只有一个那实体链接就结束了。如果查出来是多个,那就需要实体消岐了。
1.3 实体消岐
实体消岐,简单的可以度最高的那个。这里度可以是这个节点的热度或者节点在图中的出度和入度之和。当然也可以选择匹配的方法。
老师讲的是候选实体与query做相似度计算,我理解的应该是候选实体与抽取出来的subject做相似度计算。
经过思考证明我的想法是错误的。例如query=“周董的女儿”。提取出subject=周董。经过实体链接之后发现库中有2个周董相关的实体。一个是歌手,一个是某公司领导。这个时候就需要实体消岐。如果拿着subject去与两个实体的相关属性计算相似度是没有意义的。只能用“周董的女儿”去计算相似度。也许其中一个实体没有女儿的关系。那就只能选择另外一个实体了。而用subject=周董去计算相似度,信息太少了。
所以用于计算文本相似度的应该是query。
1、使用孪生网络,计算相似度
例如模型m1,m2权重共享参数,query作为m1的输入,候选实体1作为m2的输入,分别得到embedding之后,两个embedding计算相似度,得到一个(0,1)范围内的值。
可以把m1,m2换成bert,使用bert做相似度计算。
也可以采用[CLS]query[SEP]候选实体1[SEP] 这个作为输入,输入到bert中。
用来计算相似度的模型
参考老师的博客:https://blog.csdn.net/u012526436/article/details/90179466
重点是ESIM模型。
2、对问题和候选集做embedding,计算余弦相似度
步骤如下:
a 例如选择模型x ELMo
b 将query输入到模型x,得到embedding_query
c 将候选实体1输入到模型x,得到embedding_1
d 计算embedding_query和embedding_1的余弦相似度。
e 计算多个候选实体的余弦相似度,选择最高的。
哈工大开源的多语言ELMo
https://github.com/HIT-SCIR/ELMoForManyLangs
中文版本的ELMo
https://pan.baidu.com/s/1RNKnj6hgL-2orQ7f38CauA
图谱问答-理解query相关推荐
- 技术动态 | 针对复杂问题的知识图谱问答最新进展
本文转载自公众号:PaperWeekly. 作者:付彬.唐呈光.李杨.余海洋.孙健 单位:阿里巴巴达摩院小蜜Conversational AI团队 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义 ...
- 美团知识图谱问答技术及在商家推荐回复场景中的实践与探索
猜你喜欢 0.电商知识图谱的构建及在搜索推荐场景的应用实践1.如何搭建一套个性化推荐系统?2.内容推荐策略产品经理的方法与实践3.京东推荐算法精排技术实践4.微博推荐算法实践与机器学习平台演进5.腾讯 ...
- 针对复杂问题的知识图谱问答最新进展
作者|付彬.唐呈光.李杨.余海洋.孙建 单位|阿里巴巴达摩院小蜜Conversational AI团队 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义关联信息,能够深入理解用户问题并给出答案,近 ...
- 知识图谱问答的实践技术分享的书面版本
公众号 系统之神与我同在 编者按:随着互联网软硬件相关技术的飞速发展,人们逐渐从信息时代进入智能时代.知识图谱作为承载底层海量知识并支持上层智能应用的重要载体,在智能时代中扮演了极其重要的角色.而利用 ...
- KBQA知识图谱问答
KBQA知识图谱问答 1.学习图数据库Neo4j 1.1引言 1.2创建节点 1.3创建关系 1.4查询 1.5修改和删除 2.医药知识图谱问答 2.1 搭建项目需要的python虚拟环境. 2.2 ...
- 【KG】美团知识图谱问答技术实践与探索
美团知识图谱问答技术实践与探索 1 背景与挑战 2 解决方案 2.1 Query理解 2.2 关系识别 2.3 复杂问题理解 2.3.1 带约束问题 2.3.2 多跳问题 2.4 观点问答 2.5 端 ...
- 知识图谱问答 | (1) 针对复杂问题的知识图谱问答(KBQA)最新进展
原文地址 1. 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义关联信息,能够深入理解用户问题并给出答案,近年来吸引了学术界和工业界的广泛关注.KBQA 主要任务是将自然语言问题(NLQ)通过不同 ...
- 报名 | CCKS 2021评测任务:生活服务领域知识图谱问答
理解和运用自然语言是人工智能的核心问题之一,如何让机器可以像人一样感知和认识世界,知识图谱作为机器可以理解的"语言",在智能时代中扮演了极其重要的角色.然而,由于知识图谱高度结构化 ...
- 论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答
论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. 来源:WSDM '20 链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812 动机 知 ...
最新文章
- K-BERT | 基于知识图谱的语言表示模型
- 20160208.CCPP体系具体解释(0018天)
- 团队Blog功能改进
- Java 经典问题 for 基础知识
- 记录 Linux crontab 的使用
- 基于visual Studio2013解决C语言竞赛题之0705矩阵转置
- 数据库连接池配置(案例及排查指南)
- Since WWDC released the first developer
- Leetcode461Hamming Distance汉明距离
- 错误解决办法:‘NULL’ was not declared in this scope
- CAD转图片如何调整输出格式?
- redis的持久化机制详解
- 通过shell脚本来rerun一个oozie调度失败的job,从而可以跳过执行失败的节点
- 入门GTD时间管理系统必读(链接必读--很完整的一个GTD系统)
- Docker容器技术与应用(项目2 Docker容器安装和使用)
- 工作之路---记录LZ如何在两年半的时间内升为PM
- java计算机毕业设计干洗店订单管理系统设计与实现MyBatis+系统+LW文档+源码+调试部署
- 好雨知时节 不甚欢喜
- 用华为手机助手备份恢复的问题解决
- 如何调整HTML段落宽度,word空格宽度不一样 选中需要调节间距的文字段落
热门文章
- [转]调试 smallcorgi/Faster-RCNN_TF 的demo过程遇到的问题
- 百度经验 回享计划
- CAEmitterLayer实现粒子效果
- iOS屏幕尺寸和分辨率了解
- 求s=a+aa+aaa+aaaa+aa...a的值,其中a是一个数字。例如2+22+222+2222+22222(此时共有5个数相加...
- WPF中打印问题的探讨[转]
- WEBSERVICE 之WSDL
- oracle11gasm,oracle11gASM管理
- java 实现 常见排序算法(三)快速排序
- 【bug】HbuilderX运行到微信小程序 报错