LM任务

T a s k : L a n g u a g e M o d e l i n g ( L M ) 任 务 i n p u t c t = ( w 1 , w 1 … , w t − 1 ) o u t p u t p ( w t ∣ c t ) c 即 c o n t e x t , 即 由 上 下 文 预 测 下 一 个 单 词 或 字 符 是 什 么 常 规 方 法 B a s e L M : h t = f ( c t ) ∈ R d , p ( w t ∣ c t ) = S o f t m a x ( W h t ) E v a l u a t i o n M e t r i c : p e r p l e x i t y Task :Language Modeling(LM)任务\\ input \ c_t=(w_1,w_1…,w_{t-1}) \\ output \ p(w_t\vert c_t) \\ {\tiny c即context,即由上下文预测下一个单词或字符是什么} \\ 常规方法BaseLM:h_t=f(c_t)\in R^d,p(w_t\vert c_t) =Softmax(Wh_t)\\ Evaluation \ Metric: \href{https://www.zhihu.com/question/58482430}{perplexity} Task:LanguageModeling(LM)任务input ct​=(w1​,w1​…,wt−1​)output p(wt​∣ct​)c即context,即由上下文预测下一个单词或字符是什么常规方法BaseLM:ht​=f(ct​)∈Rd,p(wt​∣ct​)=Softmax(Wht​)Evaluation Metric:perplexity

本网络

基于图神经网络的语义理解模型的GNN-LM,它将传统的NLP的闭卷模式,转变为开卷模式:在推理过程中允许参考训练数据。

输入的样例为query,首先在训练数据中通过K近邻(KNN)寻找相似的样例为邻居。通过图神经网络GNN建立输入样例与邻居的关系。

KNN

We further combine GNN-LM with kNN-LM (Khandelwal et al., 2019), an orthogonal technique enhancing language models, to improve the overall performance of our model.1

近邻查询的结果展示:

图的构建

V : v e r t e x 即 每 个 t o k e n A : 点 的 类 型 , { a o 取 自 i n p u t , a n 取 自 r e t r i v e } R : 边 的 类 型 , { r i n t e r 不 同 c o n t e x , r i n t r a 同 c o n t e x } 函 数 : τ 点 类 别 查 询 , Φ 边 类 别 查 询 V:vertex 即每个token \\ A:点的类型,\{a_o取自input,a_n取自retrive\} \\ R:边的类型,\{r_{inter}不同contex,r_{intra}同contex\}\\ 函数:\tau 点类别查询 , \Phi 边类别查询 V:vertex即每个tokenA:点的类型,{ao​取自input,an​取自retrive}R:边的类型,{rinter​不同contex,rintra​同contex}函数:τ点类别查询,Φ边类别查询

其中计算attention的方法:

GNN+KNN


注:本文使用的KNN除以了超参数T,以将尖峰平滑
        BaseLM选择一个sota的LM训练后freeze

参考文献

GNN-LM: LANGUAGE MODELING BASED ON GLOBAL CONTEXTS VIA GNN
【AI Drive】第104期 - 香侬科技孟昱先:GNN-LM 从“闭卷考试”到“开卷考试”
求通俗解释NLP里的perplexity是什么?
代码


  1. Generalization through Memorization: Nearest Neighbor Language Models ↩︎

香侬科技GNN-LM:基于全局信息的图神经网络语义理解模型笔记相关推荐

  1. NeurIPS 2019 | 香侬科技开源Glyce2.0,中文字形增强BERT表征能力

    文章标题:Glyce: Glyph-vectors for Chinese Character Representations 文章链接:https://arxiv.org/pdf/1901.1012 ...

  2. 香侬科技:打造出有中国文化特色的全球技术领先人工智能公司 | 百万人学AI评选

    2020 无疑是特殊的一年,而 AI 在开年的这场"战疫"中表现出了惊人的力量.站在"新十年"的起点上,CSDN[百万人学AI]评选活动正式启动.本届评选活动在 ...

  3. ICLR 2022 | 香侬科技提出基于图神经网络的语义理解模型,获单项满分

    ©作者 | 香侬科技 来源 | 香侬科技 近日,深度学习国际顶级会议ICLR 2022向作者公布了论文录用结果.香侬科技3篇论文被大会收录,研究内容覆盖通用自然语义理解.NLP神经网络模型安全性.自动 ...

  4. 【ACL2020】香侬科技提出基于span prediction的共指消解模型

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要11分钟 跟随小博主,每天进步一丢丢 来源:香侬科技 论文标题: Coreference Resolution as Query-based S ...

  5. 香侬科技李纪为:初入NLP领域的一些小建议

    作者 | 香侬科技李纪为,斯坦福大学计算机博士 来源 | 李纪为知乎专栏 ACL 2019投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以来最盛大的一届ACL.在深度学习的推动下,自然语言处理这个 ...

  6. 专访香侬科技:致力于让世界听到中文NLP的声音

    像所有的创业者一样,香侬科技的初创团队胸怀梦想,期待有一天当人们提起香侬的时候,除了"信息论之父",还能想起来有一家用技术在链接大千世界的科技公司--香侬科技. 新生的香侬科技选择 ...

  7. 香侬科技提出中文字型的深度学习模型Glyce,横扫13项中文NLP记录

    香侬科技近期提出 Glyce,首次在深度学习的框架下使用中文字形信息(Glyph),横扫 13 项中文自然语言任务记录,其中包括:(1) 字级别语言模型 (2) 词级别语言模型 (3) 中文分词 (4 ...

  8. 【研究生】横扫13项中文NLP任务:香侬科技提出汉语字形表征向量Glyce+田字格CNN...

    选自arXiv 作者: Wei Wu.Yuxian Meng等 转载于 机器之心 最近,香侬科技发表研究,提出了一种汉语字形向量 Glyce.该研究基于汉字的进化过程,采用多种汉字古今文字和多种书写风 ...

  9. 专栏 | 香侬科技独家对话Facebook AI研究院首席科学家Devi Perikh

    Facebook 人工智能研究院(FAIR)首席科学家.佐治亚理工交互计算学院教授.计算机视觉实验室主任 Devi Parikh 是 2017 年 IJCAI 计算机和思想奖获得者(IJCAI 两个最 ...

最新文章

  1. LeetCode 75. 颜色分类(Sort Colors)
  2. python str转dict_在python中将str转换为dict
  3. HTML/CSS——form表单select联动(JavaScript方法)
  4. Linux中 oracle SQL*PLUS 命令大全
  5. 浅析call和apply的不同
  6. 一次网站性能排查的经历
  7. c语言写天气预报程序,微信小程序实现天气预报功能
  8. 09-Windows Server 2012 R2 会话远程桌面-标准部署-使用PowerShell进行部署2-2
  9. spring4.1.3模块的官方说明
  10. 测试经理如何规范测试团队(测试管理篇)
  11. Mysql查询语句使用select.. for update导致的数据库死锁分析
  12. [4G+5G专题-143]: 一体化小基站-硬件架构设计概述
  13. 服务器字体放在服务器什么位置,服务器缺少字体如何查看与添加
  14. Java 使用OpenCV进行颜色识别
  15. 信道——通信原理笔记(二)
  16. VTM代码学习(1)CU划分
  17. 三种摘要算法的简单介绍
  18. win10如何调整计算机时间同步,Win10如何修改时间同步服务器?Windows时间同步出错解决方法...
  19. ABAP 客户主数据批量导入
  20. 重装系统win7教程

热门文章

  1. iOS开发之模仿简书App自定义TabBar详解
  2. 知乎live笔记01-《怎样成为年薪50万的程序员》
  3. 集成行业企业,这是CS五个级别的介绍,请查收~
  4. 手机视频直播系统开发关于Js敏感词替换成*功能介绍
  5. 金蝶Kis旗舰版不能反过账?
  6. 压缩文件密码丢了怎么办 <1>
  7. ev录屏嵌入摄像头花屏问题
  8. C语言 求整数的位数及各位数字之和
  9. 新构造运动名词解释_构造运动与地质构造(教材第八章)_普通地质学矿物
  10. go1.57安装框架iris12.1遇到的坑及解决