这篇文章发表于2016.04,作者还发表了一篇Text Unders tanding from Scratch的论文,有兴趣的可以去看看。

字符级的卷积网络是一个有效的方法。 模型如何很好地进行比较,这取决于许多因素,比如数据集的大小,文本是否是组织化的,以及对字母表的选择。

1:Character quantization

构建字母表,包含70种字符。

The alphabet used in all of our models consists of 70 characters, including 26 english letters, 10digits, 33 other characters and the new line character. The non-space characters are:

abcdefghijklmnopqrstuvwxyz0123456789-,;.!?:’’’/\|_@#$%ˆ&*˜‘+-=<>()[]{}

2:Model Design

9 layers deep with 6 convolutionallayers and 3 fully-connected layers

因为字母表最大为70个,输入特征数都等于70,也就是行数,输入特征长度为1014.

The input have number of features equal to 70 due to our character quantization method, and the input feature length is 1014. It seems that 1014 characters could already capture most of the texts ofinterest. We also insert 2 dropout [10] modules in between the 3 fully-connected layers to regularize.They have dropout probability of 0.5. Table 1 lists the configurations for convolutional layers, andtable 2 lists the configurations for fully-connected (linear)

6个卷积层,每一层的最大最小特征长度,卷积核的个数,和是否接池化,卷积核都是用的大小为3和7的。

上面是作者给出的3个池化层的信息。

3:数据增强技术

通过对数据集的扩充能增强模型泛化性能减小模型的泛化误差,比如图像处理中经常要对图片进行缩放、平移、

旋转等操作不会改变图片整体本身的含义;语音识别中对语音的声调、语速、噪声也不会改变其结果,但是文本

处理中,随意改变字符顺序会改变原文的语义信息,所以其提出使用同义词替换技术对数据集进行处理。

同义词替换时需要处理的问题主要有

1:哪些词应当被替换。

2:应该是用哪个词来替换该词,其提出以一定概率方式进行随机旋转。

4:模型对比

在9个不同的数据集上进行对比实验。

作者分别与传统的机器学习模型和深度学习模型方法进行了对比。

Character-level Convolutional Networks for Text Classification之每日一篇相关推荐

  1. Very Deep Convolutional Networks for Text Classification之每日一篇

    源码:https://github.com/lethienhoa/Very-Deep-Convolutional-Networks-for-Natural-Language-Processing 一: ...

  2. Character-level Convolutional Networks for Text Classification

    论文总体结构 本文历史意义: 1.构建多个文本分类数据集,推动文本分类发展 2.提出CharTextCNN方法,由于只使用字符信息,所以可以用于多种语言中 一.Abstract(通过实验探究了字符级别 ...

  3. 【论文复现】Character-level Convolutional Networks for Text Classification

    写在前面 今天讨论的论文依然是文本分类主题的.Character-level Convolutional Networks for Text Classification这篇论文是在2016年4月份发 ...

  4. 论文阅读笔记:Graph Convolutional Networks for Text Classification

    Abstract 文本分类作为一个经典的自然语言处理任务,已经有很多利用卷积神经网络进行文本分类的研究,但是利用图卷积神经网络进行研究的仍然较少. 本文基于单词共现和文档单词间的关系构建一个text ...

  5. 当GCN遇见NLP(三) Tensor Graph Convolutional Networks for Text Classification,AAAI2020

    文章目录 1.Introduction 2.Model 2.1 Graph Tensor 2.2 Text graph tensor construction Semantic-based graph ...

  6. 【文本分类】Recurrent Convolutional Neural Networks for Text Classification

    ·摘要:   从模型的角度,本文作者将RNN(Bi-LSTM)和max_pooling结合使用,提出RCNN模型,应用到了NLP的文本分类任务中,提高了分类精度. ·参考文献:   [1] Recur ...

  7. 【论文解读 ICLR 2020 | DropEdge】TOWARDS DEEP GRAPH CONVOLU-TIONAL NETWORKS ON NODE CLASSIFICATION

    论文题目:DROPEDGE: TOWARDS DEEP GRAPH CONVOLU-TIONAL NETWORKS ON NODE CLASSIFICATION 论文来源:ICLR 2020 论文链接 ...

  8. Recurrent Convolutional Neural Networks for Text Classification(中文版)

    文章目录 用于文本分类的递归卷积神经网络 摘要 介绍 相关工作 文本分类 深度神经网络 模型 词表示学习 文本表示学习 训练 训练网络参数 预训练单词嵌入 实验 数据集 20Newsgroups 复旦 ...

  9. Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps

    开源:http://code.google.com/p/cuda-convnet/ 网上的代码实现(在这个网页里面,自己寻找):https://www.jianshu.com/p/e46b1aa488 ...

最新文章

  1. Linux的IPC机制(二):Socket/管道/消息队伍/信号量
  2. 年轻人的第一只机器狗,只要1.6万
  3. Django的核心思想ORM
  4. OC无法进行多人会话
  5. react 版权问题_react兼容ie
  6. 2016年5月25日下午(妙味课堂js预热课程-4笔记一)
  7. 温故知新 —— Floyd算法
  8. 几种方法帮你更有效率的记笔记
  9. 我的IntelliJ IDEA一直都是这么设置的,效果很棒!
  10. mysql-5.6.24-win32解决没有my.ini并且修改编码
  11. [渝粤教育] 云南大学 大学生心理健康教育 参考 资料
  12. 认识MyBatis、Mybatis笔记.MyBatis的核心配置,动态Mapper,动态SQL,表的关联及分页操作和缓存理解
  13. 高德地图获取城市所有小区的POI
  14. 10个免费的游戏开发引擎
  15. 接口授权时已经有access_token了为啥还需要refresh_token
  16. 【Nginx】记录 nginx 配置文件中 location下根据 ua (user-agent) 判断移动端和电脑端不同浏览器来源
  17. 导出虚拟机的OVF 模板
  18. python练习实例——字母图形
  19. PS进阶篇——如何PS软件给衣服换个颜色或图案风格(七)
  20. 《NAO机器人程序设计》---第四章 运动控制

热门文章

  1. 计算机二级在线模拟考试免费,全国计算机等级考试模拟试题集(二级QBASIC).pdf...
  2. 经常用的代码 命令行解析 api 以及vue组件复用方法总结
  3. 【3DSmax】3DSmax9基础建模教程—读书笔记2(第二课)
  4. matlab中离开网格的流量,数学建模【数据处理方法(一维、二维插值方法;数据拟合方法;插值and拟合的MATLAB实现)】...
  5. Synchro Arts五月促销
  6. HEAD: HEtero-Assists Distillation for Heterogeneous Object Detectors
  7. 基于LPC2364的串口转网口专用协议卡的研制
  8. 基于Spring+SpringMvc+Mybatis开发javaWeb汽车维修管理系统
  9. 如何在线进行PDF批量拆分
  10. php开发的抽奖系统源码,幸运九宫格类型的,带后台可控制