对于NLP中 Mask 的作用(ps:padding mask 和 Subsequent mask不是官方命名):

  • Padding mask:处理非定长序列,区分padding和非padding部分,如在RNN等模型和Attention机制中的应用等
  • Subsequent mask:防止标签泄露,如:Transformer decoder中的mask矩阵,BERT中的[Mask]位,XLNet中的mask矩阵等

一、Padding Mask【处理非定长序列】

在NLP中,文本一般是不定长的,所以在进行 batch训练之前,要先进行长度的统一,过长的句子可以通过truncating 截断到固定的长度,过短的句子可以通过 padding 增加到固定的长度,但是 padding 对应的字符只是为了统一长度,并没有实际的价值,因此希望在之后的计算中屏蔽它们,这时候就需要 Mask。


上图为中文场景下,一个 batch=5 的,以字为单位的输入矩阵(也可以在分词后以词为单位)和 mask 矩阵,左图已经将文本 padding 到统一长度了,右图中的1表示有效字,0代表无效字。

1、RNN中的Mask

对于RNN等模型,本身是可以直接处理不定长数据的,因此它不需要提前告

自然语言处理(NLP)-模型常用技巧:Mask【Padding Mask、Subsequent Mask】相关推荐

  1. 直播 | SemEval-2020自由文本关系抽取冠军方案解读(附NLP竞赛常用技巧总结)

    「PW Live」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交 ...

  2. SemEval-2020自由文本关系抽取冠军方案解读 (附NLP竞赛常用技巧总结)

    本文将回顾平安人寿近期在PaperWeekly × Biendata直播间进行的主题为「SemEval-2020自由文本关系抽取冠军方案解读(附NLP竞赛常用技巧总结)」的技术分享,由平安人寿AI团队 ...

  3. (含源码)「自然语言处理(NLP)」社区问答评估Bert模型优化

    来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2020-03-21 引言: 本文分享的内容主要包括社区问答质量评估(基于Bert模型微调). ...

  4. 利用计算机技术实现对文本篇章,自然语言处理NLP学习笔记一:概念与模型初探...

    前言 先来看一些demo,来一些直观的了解. 自然语言处理: 可以做中文分词,词性分析,文本摘要等,为后面的知识图谱做准备. 知识图谱: 还有2个实际应用的例子,加深对NLP的理解 九歌机器人: 微软 ...

  5. 自然语言处理(NLP)之使用TF-IDF模型计算文本相似度

    自然语言处理(NLP)之使用TF-IDF模型计算文本相似度 所用数据集:ChnSentiCorp_htl_all.csv 语料库即存放稀疏向量的列表. 要注意的是,搜索文本text与被检索的文档共用一 ...

  6. ChineseGLUE:为中文NLP模型定制的自然语言理解基准

    机器之心整理 参与:张倩.郑丽慧 GLUE 是一个用于评估通用 NLP 模型的基准,其排行榜可以在一定程度上反映 NLP 模型性能的高低.然而,现有的 GLUE 基准针对的是英文任务,无法评价 NLP ...

  7. NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据

    全文链接:tecdat.cn/?p=2155 随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带.领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的 ...

  8. 自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 基于BERT模型微调实现句子分类

    自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 基于BERT模型微调实现句子分类 目录 基于BERT模型微调实现句子分类案例实战 Installing the H ...

  9. NLP:自然语言处理技术中常用的文本特征表示方法(整数编码、one-hot编码法、BOW法、TF-IDF法、N-Gram法等)及其代码案例实现

    NLP:自然语言处理技术中常用的文本特征表示方法(整数编码.one-hot编码法.BOW法.TF-IDF法.N-Gram法等)及其代码案例实现 目录 自然语言处理技术中常用的文本特征表示方法(整数编码 ...

最新文章

  1. stm32f302实现斩波控制步进电机_什么是步进电机控制器?
  2. [转]解决linux下sqldeveloper 中文环境显示乱码的问题
  3. [WEKA]如何将英文文本数据集转换为ARFF格式
  4. 1 QM配置-基本配置-维护工厂等级设置
  5. “浴霸”三摄出镜率真高!中兴Blade 20工信部入网
  6. shell读取文件的每一行
  7. 别人家的程序员是如何使用 Java 进行 Web 抓取的? 1
  8. Triangle Generative Adversarial Networks
  9. 伽玛校正(Gamma Correction)
  10. Vue解决无数据图片闪现的问题
  11. Iocomp Crack和ProEssentials Crack
  12. 如何将qlv格式视频转换成MP4?这款功能极强的视频格式转换工具不要错过
  13. 在不借助第三方变量情况下实现两个变量的交换(借助于异或运算)
  14. 《C语言入门经典》Ivor Horton第十章练习题1
  15. 天耀18期 – 6.面向对象-类和对象【作业】.
  16. 智能手机也是一种计算机对不对,介绍手机内存的新闻,我转的,对不对不要喷啊...
  17. 【Unity VR开发窍门】如何在Unity中以VR视角捕捉游戏360度全景
  18. 学计算机没有电脑怎么办,电脑没有excel怎么办
  19. 招生1400名!这所985高校发布2023年博士研究生招生简章!
  20. 求数组中最长递增子序列

热门文章

  1. 新型和增强的Guardium离群值检测
  2. Inception v3 自学笔记
  3. Mission Planner初学者安装调试教程指南(APM或PIX飞控)5——规划航点航线
  4. 根据斗破苍穹改编的Java游戏_不仅《斗破苍穹》改编动漫游戏,这个作者才是游戏IP大师!...
  5. 最新版网页浏览器Flash插件离线版安装程序下载
  6. 在vue中使用高德地图添加窗体
  7. android pak文件_Android资源文件说明
  8. iphone 3.1.2开发环境搭建——linux平台
  9. unity能连jsp吗_使用JSPWiki丰富Unity-UPM包的使用
  10. linux根据文件内容查找文件名,文件查找:find命令,文件名后缀