Prompt+对比学习，更好地学习句子表征

每天给你送来NLP技术干货！

作者 | 王嘉宁@华师数据学院

整理 | NewBeeNLP

https://wjn1996.blog.csdn.net/article/details/125528859

虽然BERT等语言模型有很大的成果，但在对句子表征方面（sentence embeddings）上表现依然不佳，因为BERT存在 sentence bias 、 anisotropy 问题；
我们发现prompt，再给定不同的template时可以生成不同方面的positive pair，且避免embedding bias。

三、方法

如何避免BERT在表征句子时出现上述提到的问题，本文提出使用Prompt来捕捉句子表征。但不同于先前prompt的应用（分类或生成），我们并不是获得句子的标签，而是获得句子的向量，因此关于prompt-based sentence embedding，需要考虑两个问题：

如何使用prompt表征一个句子；
如何寻找恰当的prompt；

本文提出一种基于prompt和对比学习的句子表征学习模型。

3.1 如何使用prompt表征一个句子

本文设计一个template，例如“[X] means [MASK]”，[X] 表示一个placehoder，对应一个句子，[MASK]则表示待预测的token。给定一个句子，并转换为prompt后喂入BERT中。有两种方法获得该句子embedding：

方法一：直接使用[MASK]对应的隐状态向量：；
方法二：使用MLM在[MASK]位置预测topK个词，根据每个词预测的概率，对每个词的word embedding进行加权求和来表示该句子：

方法二将句子使用若干个MLM生成的token来表示，依然存在bias，因此本文只采用第一种方法

3.2 如何寻找恰当的prompt

关于prompt设计上，可以采用如下三种方法：

manual design：显式设计离散的template；
使用T5模型生成；
OptiPrompt：将离散的template转换为continuous template;

3.3 训练

采用对比学习方法，对比学习中关于positive的选择很重要，一种方法是采用dropout。本文采用prompt方法，为同一个句子生成多种不同的template，以此可以获得多个不同的positive embedding。

The idea is using the different templates to repre- sent the same sentence as different points of view, which helps model to produce more reasonable pos- itive pairs.
为了避免template本身对句子产生语义上的偏向。作者采用一种trick：

喂入含有template的句子，获得[MASK]对应的embedding ；
只喂入template本身，且template的token的position id保留其在原始输入的位置，此时获得[MASK]对应的embeding：

最后套入对比学习loss中进行训练：

四、实验

作者在多个文本相似度任务上进行了测试，实验结果如图所示：

惊奇的发现，PromptBERT某些时候竟然比SimCSE高，作者也提出使用对比学习，也许是基于SimCSE之上精细微调后的结果。

Prompt+对比学习，更好地学习句子表征相关推荐

强化学习q学习求最值_通过Q学习更深入地学习强化学习
强化学习q学习求最值 by Thomas Simonini 通过托马斯·西蒙尼(Thomas Simonini) 通过Q学习更深入地学习强化学习 (Diving deeper into Reinfor ...

ACL2022论文分类汇总-Prompt、句子表征、检索排序摘要
写在前面大家好,我是刘聪NLP. ACL2022会议的论文已经出来一阵子了,将论文列表过了一边,筛选了一些自己正在做或者感兴趣方向的相关论文,包括:Prompt(35篇).句子表征(21篇).检索排 ...

【NLP】Prompt+对比学习，更好地学习句子表征
作者 | 王嘉宁@华师数据学院整理 | NewBeeNLP https://w‍jn1996.blog.csdn.net/article/details/125528859 ‍ 虽然BERT等语言模 ...

超越SimCSE两个多点，Prompt+对比学习的文本表示新SOTA
可能是因为对比学习,今年以来文本表示方向突然就卷起来了,SOTA刷的嗖嗖的,我还停留在我们ConSERT的阶段,结果别人不精调就已经超了. 昨天实习同学发了我几篇Open Review上ACL的投稿, ...

Robert+Prompt+对比学习+对抗训练文本分类
基于Robert的文本分类任务,在此基础上考虑融合对比学习.Prompt和对抗训练来提升模型的文本分类能力,我本地有SST-2数据集的train.txt.dev.txt两个文件,每个文件包含文本内容和 ...

阿里+中科院提出：将角度margin引入到对比学习目标函数中并建模句子间不同相似程度...
作者:李加贝 (浙江工商大学) 方向:跨模态搜索标题:A Contrastive Framework for Learning Sentence Representations from Pairw ...

从各大顶会看对比学习在句子表征研究进展
作者 | 上杉翔二悠闲会 · 信息检索整理 | NewBeeNLP 前已经有博文整理过了对比学习的概念,比较重要且流行的文章,和一些已经有的应用: YYDS!对比学习还能这么用? 从顶会论文看对比 ...

php serialize和json_encode哪个更快_学习PHP的10个技巧
在开始学习PHP之前,花一些时间计划学习语言的方法可能是明智的. 学习过PHP的专业开发人员已经花费了大量时间来学习他们的技术.要模拟它们,您将需要确保有动力去做,并且理想地能够快速有效地学习PHP. ...

吃瓜笔记 | Momenta王晋玮：让深度学习更高效运行的两个视角
主讲人:王晋玮 | Momenta合伙人屈鑫编辑整理量子位出品 | 公众号 QbitAI 2月1日晚,量子位·吃瓜社联合Momenta带来吃瓜社第五期:让深度学习更高效运行的两个视角. 作为顶 ...

最新文章

【Git+Docker】Docker初期学习认识和安装配置详解

CSP认证201612-1 中间数[C++题解]：遍历

软件工程博客---团队项目---个人设计2（算法）

有钱就是任性！阿里20亿美元拿下网易考拉：欢迎加入阿里动物园

STM32工作笔记0049---JLINK在线调试__软件调试方法与技巧

android 如何实现apk search出现在系统的推荐列表里

jbig java_jbig2 Java Develop 238万源代码下载- www.pudn.com

springboot指定属性返回_Spring Boot 最最最常用的注解梳理

pythonwhileelse,关于Python while语句的Else子句

二分类变量相关性分析spss_两个有序分类变量相关性的卡方检验-SPSS教程

Android——实现光点模糊渐变的自旋转圆环特效

cityscape 数据集 mmsegmentation训练记录

函数式编程（lambda表达式）

2022最新微信步数提交平台网站PHP源码

解决Macbook互联网不能共享因为它是受802.1X保户问题

Onedrive服务器位置,移动或更改Windows 10中OneDrive文件夹的位置 | MOS86

armbian 斐讯n1_斐讯N1安装Armbian

international journal of remote sensing投稿经历给我的感悟

Canvas实现微信大转盘抽奖代码

金蝶KIS专业版客户端登录提示“无效的授权”最全解决方案合辑

热门文章

《东周列国志》第八十一回美人计吴宫宠西施言语科子贡说列国

[mysql] ERROR 2002 (HY000): Can‘t connect to local MySQL server...问题解决

南昌大学计算机学硕和专硕,专硕和学硕哪个好？该怎么选？

Android adb查看网络连接情况

openssl 1.0.2k-fips 升级到 openssl-3.0.5

android开发底部虚拟键,android手机底部的虚拟按键怎么弄,像android平板那样。

第三章迭代器（iterators）概念与traits编程技法

软件设计是怎样炼成的（5）——规划系统的骨架（架构设计）（上篇）

Receptive Field Block Net for Accurate and Fast Object Detection（RFB）

var foo = function(){} 和 function foo(){}

Prompt+对比学习，更好地学习句子表征

相关工作

发现

三、方法

3.1 如何使用prompt表征一个句子

3.2 如何寻找恰当的prompt

3.3 训练

四、实验

Prompt+对比学习，更好地学习句子表征相关推荐

最新文章

热门文章