论文地址:《Bidirectional LSTM-CRF Models for Sequence Tagging》

文章目录

  • 论文阅读
    • 研究背景
    • BI-LSTM-CRF 网络
    • 训练流程
    • 实验
    • 结果对比
    • 结论

论文阅读

研究背景

序列标记包括部分语音标记(POS)、分块和命名实体识别(NER),一直是一项经典的NLP任务。现有的序列标记模型大多是线性统计模型,其中包括隐马尔可夫模型(HMM)、最大熵马尔可夫模型(MEMMs)和条件随机场(CRF)。以及基于卷积网络的模型被提出来解决序列标记问题。本文首次将BI-LSTM-CRF模型应用于NLP基准序列标记数据集。

BI-LSTM-CRF 网络

将一个双向的LSTM网络和一个CRF网络结合起来,形成了一个BI-LSTM-CRF网络。除了LSTM-CRF模型中过去使用的输入特征和句子级标签信息外,BI-LSTM-CRF模型还可以使用未来的输入特征。这些额外的特征可以提高标记的准确性。

训练流程

对于每个batch,首先运行双向LSTM-CRF模型正向传递,其中包括LSTM的正向状态和向后状态的正向传递。得到了在所有位置上的所有标签的输出分数(发射矩阵)。然后,我们运行CRF层向前和向后传递来计算网络输出和状态转换边缘的梯度(转移矩阵)。在此之后,我们可以将错误从输出反向传播到输入,其中包括LSTM的正向状态和反向状态的反向传递。最后,更新了网络参数。

实验

(1) 数据:在三个NLP标记任务中使用的数据集为,Penn TreeBank (PTB) 词性标注,
CoNLL 2000 分块,和 CoNLL 2003 命名实体识别。

(2)特征:为三个数据集提取相同类型的特征。这些特性可以分组为拼写特性和上下文特性。
(3) 拼写特征:

(4)上下文特征: 使用unigram 特征 和bi-grams 特征。
(5)特征连接技巧:把拼写和上下文特征当作单词特征来处理。也就是说,网络的输入包括单词、拼写和上下文特征。然而,我们发现从拼写和上下文特征到输出的直接连接加速了训练,它们导致了非常相似的标记精度。在特征和输出之间建立完全的连接,以避免潜在的特征冲突。

结果对比

结论

观察结果相比,BI-LSTM-CRF模型是鲁棒性的,并且它对单词嵌入的依赖性更小。它可以不需要使用单词嵌入来实现精确的标记精度。

论文阅读《Bidirectional LSTM-CRF Models for Sequence Tagging》相关推荐

  1. 《基于卷积神经网络的深度迁移学习,用于燃气轮机燃烧室的故障检测》论文阅读

    目录 突出 抽象 引言 1.1动机 1.2文献综述获得的结论 1.3贡献 1.4组织 2方法 2.1燃汽轮机组故障知识共享 2.2迁移学习 2.3 基于卷积神经网络的深度迁移学习 2.4用于燃气轮机燃 ...

  2. 基于卷积神经网络和投票机制的三维模型分类与检索 2019 论文笔记

    作者:白静 计算机辅助设计与图形学学报 1.解决的问题 由于三维模型投影得到的视图是由不同视点得到,具有相对独立性,这种像素级的融合运算并没有直接的物理或者几何意义,更有可能造成图像有益信息淹没和混淆 ...

  3. TextCNN——基于卷积神经网络的文本分类学习

    1.CNN基础内容 CNN的全称是Convolutional Neural Network,是一种前馈神经网络.由一个或多个卷积层.池化层以及顶部的全连接层组成,在图像处理领域表现出色. 本文主要学习 ...

  4. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  5. 一种基于卷积神经网络的图像去雾研究-含matlab代码

    目录 一.绪论 二.去雾卷积网络 2.1 特征提取 2.2 多尺度映射 2.3 局部均值 2.4 非线性回归 三.实验与分析 四.Matlab代码获取 一.绪论 雾是一种常见的大气现象,空气中悬浮的水 ...

  6. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  7. 毕业设计 - 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

    文章目录 1 前言 2 前言 3 数据集 3.1 良性样本 3.2 病变样本 4 开发环境 5 代码实现 5.1 实现流程 5.2 部分代码实现 5.2.1 导入库 5.2.2 图像加载 5.2.3 ...

  8. 基于卷积神经网络与迁移学习的油茶病害图像识别

    基于卷积神经网络与迁移学习的油茶病害图像识别 1.研究思路 利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习油茶病害特征,并借助迁移学习方法将AlexNet模型在ImageNet图像数据集上 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

  10. 基于卷积神经网络实现图片风格的迁移 1

    卷积神经网络详解 一.实验介绍 1.1 实验内容 Prisma 是最近很火的一款APP,它能够将一张普通的图像转换成各种艺术风格的图像.本课程基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后 ...

最新文章

  1. Linux里新建文件/目录的默认权限
  2. 全球人工智能战略与政策观察(2019)
  3. Linux修改mysql的密码
  4. 非平衡数据处理方式与评估
  5. 小白的第一本python书_读书笔记:编程小白的第一本python入门书
  6. php绘制历史曲线,thinkphp浏览历史功能实现方法
  7. SAP UI5 app view router - Haiji's application
  8. bootstrap-代码-内联代码
  9. 带Spring Boot的GWT
  10. NHibernate之映射文件配置说明(转载1)
  11. 管理新语:员工随口回答,并不是有意忽悠,而是都这样
  12. 面象对象与面象过程内存分区
  13. 移动通信网络演进之路
  14. IoT平台功能架构图
  15. 工信部BIM工程师系列发布测评考试大纲
  16. python开发微信点餐_微信点餐平台开发 (一)
  17. [Groovy]Groovy with Ant Task
  18. 让机器辨别气味:利用图神经网络预测分子的嗅觉属性
  19. java游戏后端日志【6】 -- 初生牛犊不怕虎?
  20. 连接问题:ORA-3136:inbound connection timed out

热门文章

  1. 本“徕”就美,Xiaomi 12S 系列原生双画质的修炼秘籍
  2. 【文献翻译】基于IEEE802.15.4的物联网网络的捕获和威胁感知安全配置策略
  3. Mac os 查看PDM文件
  4. 转载:U盘格式化同时支持mac和win系统
  5. linux显示屏没信号,电脑开机显示器无信号然后黑屏怎么办|电脑黑屏没有信号的解决方法...
  6. 数模优秀论文总结 — 2017 “拍照赚钱的任务定价”
  7. 关于hibernate不支持sqlserver中nchar映射的解决办法
  8. 如何把音乐去掉人声只留伴奏?这两个方法很简单!
  9. TurtleBot基于已知地图的自主导航
  10. 云技术,智能家居与嵌入式——前景好的产业