摘要:

之前的词汇替换是通过查询目标词汇的同义词来实现的(e.g. WordNet), 然后基于文本对候选词打分。这种方法有两个限制:

  1. 忽略了不是同义词的但是效果很好的候选词汇

  2. 没有考虑同意替换对整个文本的影响

主体:

对目标词进行embedding dropout,使得可以平衡目标词的语义信息和上下文信息。

如果完全遮盖,返回的候选词可能与原词意思不同,却能满足上下文信息;

如果不遮盖,返回的候选词大约99.99%会预测到原词。

计算相似度时,将BERT前四层的表示做拼接来计算相似度。

推荐时使用了词的似然和句子的余弦相似度求和:

Reference:

Zhou, W., Ge, T., Xu, K., Wei, F., & Zhou, M. (2019, July). BERT-based lexical substitution. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (pp. 3368-3373).

BERT-based Lexical Substitution论文阅读相关推荐

  1. 论文阅读——《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》

    论文阅读--<Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient> ...

  2. [论文阅读] (07) RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  3. 目标检测论文阅读:GHM(anchor based)

    目标检测论文阅读:GHM(anchor based) 论文链接:https://arxiv.org/abs/1811.05181 代码链接:https://github.com/libuyu/GHM_ ...

  4. 论文阅读06——《CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional Network for Clustering》

    欢迎到我的个人博客看原文 论文阅读06--<CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional Network f ...

  5. 【论文阅读】Attention Based Spatial-Temporal GCN...Traffic Flow Forecasting[基于注意力的时空图卷积网络交通流预测](1)

    [论文阅读]Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting[基于注 ...

  6. 论文阅读 [TPAMI-2022] Grid Anchor Based Image Cropping: A New Benchmark and An Efficient Model

    论文阅读 [TPAMI-2022] Grid Anchor Based Image Cropping: A New Benchmark and An Efficient Model 论文搜索(stud ...

  7. 论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection

    论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection (1)Author (2)Abstract (3 ...

  8. 《论文阅读》RoBERTa: A Robustly Optimized BERT Pretraining Approach

    <论文阅读>RoBERTa: A Robustly Optimized BERT Pretraining Approach 简介 想法来源 数据集的选择 创新点 总结 期刊:arxiv 2 ...

  9. 论文阅读:Visual Semantic Localization based on HD Map for AutonomousVehicles in Urban Scenarios

    题目:Visual Semantic Localization based on HD Map for Autonomous Vehicles in Urban Scenarios 中文:基于高清地图 ...

最新文章

  1. 多服务器session共享之memcache共享安装和实现篇(apache+php-windows)
  2. VMware中为linux设置网络
  3. 如何解决移动端键盘弹起将底部导航栏顶起
  4. 360浏览器 - 自定义切换内核 meta标签 总结
  5. 怎么不保存退出、保存退出vim、vi编辑
  6. python pprint_python读写文件(七)
  7. java gc日志乱码_gc原理以及gc日志剖析
  8. JS(JQuery)操作Array的相关方法
  9. 应用程序不被系统杀死
  10. lamp php用开吗,LAMP环境之PHP安装使用
  11. NAT技术与代理服务器的区别
  12. 海洋环境科学概论知识整理--1
  13. python爬虫基础案例——爬取猫眼电影并保存数据到excel
  14. matlab画黎曼函数,[2018年最新整理]matlab画复数函数图象和黎曼面.docx
  15. 记一个印象深刻的项目
  16. 阿里云ECS迁移数据流程
  17. 2021年第十二届蓝桥杯A组省赛
  18. JAVA23种设计模式学习,源码+案例分析+类图讲解
  19. Booth(布斯)算法——补码乘法运算过程
  20. 【转】初入NLP领域的一些小建议

热门文章

  1. Android 11系统签名修改
  2. 蚂蚁课堂史上最全SpringBoot视频教程
  3. 分布式系统与RPC概述
  4. 华中科技大学计算机课程设计,华中科技大学计算机学院操作系统课程设计报告[1] (精选可编辑)...
  5. 【板栗糖GIS】GIS系统中2D-3D-4D的含义以及区分
  6. 巴黎计算机工程师学院排名,深度分析l’Étudiant2021工程师学校排名:哪些学校排名上升?通才工程师和专才工程师如何选择?...
  7. listview控件不兼容
  8. Ettercap-arp欺骗
  9. FXGL JAVA游戏引擎 教程 03.游戏UI
  10. 15个国内常用语料库