内容来自七月算法nlp课程。

图谱问题是用户输入一句话,系统返回这句话的答案。这里分多种情况。例如根据实体和关系查询尾实体,或者根据实体查询关系,甚至还会出现多跳的情况,不同的情况采用的方法略有不同。

文章目录

  • 1 根据实体和关系查询尾实体
    • 1.1 找到实体与关系
      • 1.1.1 AC自动机
    • 1.2 实体链接
    • 1.3 实体消岐

1 根据实体和关系查询尾实体

需要两个步骤完成:第一步找到实体与关系;第二步实体链接和实体消岐。

1.1 找到实体与关系

NER的方式很多。可以采用传统机器学习的分类方法,也可以使用深度学习神经网络,一般架构为encoder+cfr层。
这里重点介绍AC自动机

1.1.1 AC自动机

1、构建前缀树

2、给前缀树加上fail指针
节点i的fail指针,如果在第一层,则指向root节点,其它情况指向其父节点的fail指针指向的节点的相同节点

1.2 实体链接

根据上一步抽取出实体和关系:例如 一句话“周董的女儿叫什么”。抽取出 周董、女儿。
图数据库中的实体可能和抽取出来的实体不一致。这个时候就需要实体链接。例如库中可能是周杰伦。这样第一步就需要找到一个候选实体集合。最好的方法是构建实体词典。用抽取出来的词在词典中查询。

例如词典中包含 周董、周杰伦、Jay都指向周杰伦这个实体。那抽取出来的“周董”也就可以连接到周杰伦这个实体了。

如果这个时候查出来的实体只有一个那实体链接就结束了。如果查出来是多个,那就需要实体消岐了。

1.3 实体消岐

实体消岐,简单的可以度最高的那个。这里度可以是这个节点的热度或者节点在图中的出度和入度之和。当然也可以选择匹配的方法。
老师讲的是候选实体与query做相似度计算,我理解的应该是候选实体与抽取出来的subject做相似度计算。

经过思考证明我的想法是错误的。例如query=“周董的女儿”。提取出subject=周董。经过实体链接之后发现库中有2个周董相关的实体。一个是歌手,一个是某公司领导。这个时候就需要实体消岐。如果拿着subject去与两个实体的相关属性计算相似度是没有意义的。只能用“周董的女儿”去计算相似度。也许其中一个实体没有女儿的关系。那就只能选择另外一个实体了。而用subject=周董去计算相似度,信息太少了。
所以用于计算文本相似度的应该是query。

1、使用孪生网络,计算相似度
例如模型m1,m2权重共享参数,query作为m1的输入,候选实体1作为m2的输入,分别得到embedding之后,两个embedding计算相似度,得到一个(0,1)范围内的值。

可以把m1,m2换成bert,使用bert做相似度计算。
也可以采用[CLS]query[SEP]候选实体1[SEP] 这个作为输入,输入到bert中。

用来计算相似度的模型
参考老师的博客:https://blog.csdn.net/u012526436/article/details/90179466

重点是ESIM模型。

2、对问题和候选集做embedding,计算余弦相似度
步骤如下:
a 例如选择模型x ELMo
b 将query输入到模型x,得到embedding_query
c 将候选实体1输入到模型x,得到embedding_1
d 计算embedding_query和embedding_1的余弦相似度。
e 计算多个候选实体的余弦相似度,选择最高的。

哈工大开源的多语言ELMo

https://github.com/HIT-SCIR/ELMoForManyLangs

中文版本的ELMo
https://pan.baidu.com/s/1RNKnj6hgL-2orQ7f38CauA

图谱问答-理解query相关推荐

  1. 技术动态 | 针对复杂问题的知识图谱问答最新进展

    本文转载自公众号:PaperWeekly. 作者:付彬.唐呈光.李杨.余海洋.孙健 单位:阿里巴巴达摩院小蜜Conversational AI团队 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义 ...

  2. 美团知识图谱问答技术及在商家推荐回复场景中的实践与探索

    猜你喜欢 0.电商知识图谱的构建及在搜索推荐场景的应用实践1.如何搭建一套个性化推荐系统?2.内容推荐策略产品经理的方法与实践3.京东推荐算法精排技术实践4.微博推荐算法实践与机器学习平台演进5.腾讯 ...

  3. 针对复杂问题的知识图谱问答最新进展

    作者|付彬.唐呈光.李杨.余海洋.孙建 单位|阿里巴巴达摩院小蜜Conversational AI团队 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义关联信息,能够深入理解用户问题并给出答案,近 ...

  4. 知识图谱问答的实践技术分享的书面版本

    公众号 系统之神与我同在 编者按:随着互联网软硬件相关技术的飞速发展,人们逐渐从信息时代进入智能时代.知识图谱作为承载底层海量知识并支持上层智能应用的重要载体,在智能时代中扮演了极其重要的角色.而利用 ...

  5. KBQA知识图谱问答

    KBQA知识图谱问答 1.学习图数据库Neo4j 1.1引言 1.2创建节点 1.3创建关系 1.4查询 1.5修改和删除 2.医药知识图谱问答 2.1 搭建项目需要的python虚拟环境. 2.2 ...

  6. 【KG】美团知识图谱问答技术实践与探索

    美团知识图谱问答技术实践与探索 1 背景与挑战 2 解决方案 2.1 Query理解 2.2 关系识别 2.3 复杂问题理解 2.3.1 带约束问题 2.3.2 多跳问题 2.4 观点问答 2.5 端 ...

  7. 知识图谱问答 | (1) 针对复杂问题的知识图谱问答(KBQA)最新进展

    原文地址 1. 背景介绍 知识图谱问答(KBQA)利用图谱丰富的语义关联信息,能够深入理解用户问题并给出答案,近年来吸引了学术界和工业界的广泛关注.KBQA 主要任务是将自然语言问题(NLQ)通过不同 ...

  8. 报名 | CCKS 2021评测任务:生活服务领域知识图谱问答

    理解和运用自然语言是人工智能的核心问题之一,如何让机器可以像人一样感知和认识世界,知识图谱作为机器可以理解的"语言",在智能时代中扮演了极其重要的角色.然而,由于知识图谱高度结构化 ...

  9. 论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答

    论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. 来源:WSDM '20 链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812 动机 知 ...

最新文章

  1. K-BERT | 基于知识图谱的语言表示模型
  2. 20160208.CCPP体系具体解释(0018天)
  3. 团队Blog功能改进
  4. Java 经典问题 for 基础知识
  5. 记录 Linux crontab 的使用
  6. 基于visual Studio2013解决C语言竞赛题之0705矩阵转置
  7. 数据库连接池配置(案例及排查指南)
  8. Since WWDC released the first developer
  9. Leetcode461Hamming Distance汉明距离
  10. 错误解决办法:‘NULL’ was not declared in this scope
  11. CAD转图片如何调整输出格式?
  12. redis的持久化机制详解
  13. 通过shell脚本来rerun一个oozie调度失败的job,从而可以跳过执行失败的节点
  14. 入门GTD时间管理系统必读(链接必读--很完整的一个GTD系统)
  15. Docker容器技术与应用(项目2 Docker容器安装和使用)
  16. 工作之路---记录LZ如何在两年半的时间内升为PM
  17. java计算机毕业设计干洗店订单管理系统设计与实现MyBatis+系统+LW文档+源码+调试部署
  18. 好雨知时节 不甚欢喜
  19. 用华为手机助手备份恢复的问题解决
  20. 如何调整HTML段落宽度,word空格宽度不一样 选中需要调节间距的文字段落

热门文章

  1. [转]调试 smallcorgi/Faster-RCNN_TF 的demo过程遇到的问题
  2. 百度经验 回享计划
  3. CAEmitterLayer实现粒子效果
  4. iOS屏幕尺寸和分辨率了解
  5. 求s=a+aa+aaa+aaaa+aa...a的值,其中a是一个数字。例如2+22+222+2222+22222(此时共有5个数相加...
  6. WPF中打印问题的探讨[转]
  7. WEBSERVICE 之WSDL
  8. oracle11gasm,oracle11gASM管理
  9. java 实现 常见排序算法(三)快速排序
  10. 【bug】HbuilderX运行到微信小程序 报错