Introduction

我们提出了一个开创性的基于跨度的原型网络(SpanProto),它通过一个两阶段的方法来解决少量的NER问题,包括跨度提取和提及分类。在跨度提取阶段,我们将顺序标签转化为全局边界矩阵,使模型能够专注于明确的边界信息。对于提及分类,我们利用原型学习来捕捉每个标记的跨度的语义表示,并使模型更好地适应小说类实体。

模型分为两个部分,通过表填充方式解决mention识别问题,使用原型网络解决mention分类问题。

Model


第一部分:mention识别是通过pointer network解决的。损失函数时二分类交叉熵损失函数

第二部分:原型学习实现关系分类。在每一个episode中,通过平均化相同实体类型的span的表示得到对应class的原型。损失函数是分类损失函数

当识别出的flase positive类型,则将the false positive can be viewed as a special entity mention, which has no type to be assigned in Ttrain, but could be an entity in other
episode data
. In other words, the real type of this
false positive is unknown. Thus, a natural idea is
that we can keep it away from all current prototypes
in the semantic space. S

fewshot_NER:SpanProto: A Two-stage Span-based Prototypical Network for Few-shot Named Entity Recogni相关推荐

  1. span based model

    论文解读 span 表示 A Minimal Span-Based Neural Constituency Parser最小的基于span的神经网络解析器 摘要 介绍 模型 chart parsing ...

  2. Large-Scale Named Entity Disambiguation Based on Wikipedia Data

    Large-Scale Named Entity Disambiguation Based on Wikipedia Data 基于维基百科数据的大规模命名实体消岐 1.引言 1.1. 概念 实体(e ...

  3. Dynamic Memory Based Attention Network for Sequential Recommendation【论文解读】

    Dynamic Memory Based Attention Network for Sequential Recommendation 从题目中可以看出这篇论文的三个关键点是动态记忆,注意力机制和序 ...

  4. 【论文笔记】【2020TMM】Towards Imperceptible Adversarial Image Patches Based on Network Explanations

    个人总结: 本文与PS-GAN有些相似,但是前者是通约束与原图像距离生成对抗样本,后者基于GAN,约束与patch种子的距离生成,但是两篇文章中都引用了CAM的方法--Grad_CAM通过权重汇集,再 ...

  5. 代码学习(DeamNet)CVPR | Adaptive Consistency Prior based Deep Network for Image Denoising

    本文提出了一种新的深度网络图像去噪方法. 与现有的基于深度网络的去噪方法不同,我们将新的ACP项引入到优化问题中,然后利用优化过程,通过展开策略设计深度网络. 我们的ACP驱动去噪网络结合了经典去噪方 ...

  6. MECT: Multi-Metadata Embedding based Cross-Transformer forChinese Named Entity Recognition论文解析

    <MECT: Multi-Metadata Embedding based Cross-Transformer forChinese Named Entity Recognition>的论 ...

  7. 6.DeepFM: A Factorization-Machine based Neural Network for CTR Prediction论文详解和代码实现

    一.总述 这篇论文来自哈工大&华为诺亚方舟实验室,主要关注如何学习user behavior背后的组合特征(feature interactions),从而最大化推荐系统的CTR.但目前的方法 ...

  8. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

    简介:学习用户行为背后的复杂特征交互对于推荐系统的CTR预估是很重要的,任务是预测用户点击推荐项目的概率.在在线广告中,提升收益是很重要的.所以排序策略成了CTR*bid,bid就是如果被一个用户点击 ...

  9. Adaptive Consistency Prior based Deep Network for Image Denoising

    这是2021cvpr的一篇去噪的文章,讲的是利用神经网络来实现传统模型,把传统算法模型中的一些函数用神经网络代替. 一.模型架构 它提出了一个自适应一致性先验的去噪框架(Adaptive Consis ...

最新文章

  1. sharepoint 2007 将%complete作为条件判断时,工作流无法正常工作
  2. JAVA8 获取叶节点_Java找出所有的根节点到叶子节点的节点值之和等于sum 的路径...
  3. Python过渡性模块重载(递归重载模块)
  4. Mockito框架研究 - how is match any string implemented
  5. 解决IE6下,给图片加上line-height属性不起作用的方法
  6. setTimeout详解
  7. 天正lisp文件路径_AutoCAD的文件组织形式和搜索路径 | 坐倚北风
  8. DataStream API及源算子
  9. Xv6 Page Table
  10. 神经网络与机器学习导言笔记——网络结构与知识表示
  11. [4G5G专题-106]:部署 - LTE无线网络规划与设计概览
  12. 台式计算机有hdmi口,我的台式电脑没有hdmi接口怎么解决
  13. 简单的使用Python处理Excel数据文件
  14. Spring Boot技术知识点:如何实现二维码生成工具
  15. python默认字体大小_如何设置PIL加载的默认字体的大小,使其适合我的8x8矩阵?...
  16. Spark RDD实训4:计算总成绩
  17. 俞渝手撕李国庆:他是同性恋,李回应:变态精神病患者!大量细节惊呆网友...
  18. android kodi,XBMC之Android硬解之路
  19. word如何取消封面或者目录下方的页码,页码从正文开始
  20. 100+大屏模板免费领!葡萄城BI行业应用方案重磅发布!

热门文章

  1. xterm.js V4.13.0 学习文档(for vue)
  2. Java的后端开发那些事
  3. jquary学习之路--2
  4. Hadoop Pig 使用中碰到的问题与例子
  5. 河北画报杂志河北画报杂志社河北画报编辑部2023年第8期目录
  6. 学校计算机室安全责任书,学校功能室安全责任书
  7. 输出一个由*组成的三角形图案_我问遍整个设计院,居然没有一个人会画古建?...
  8. 一篇不错的Python入门教程
  9. Java基础入门笔记2
  10. declared implicitly