来自 DBpedia 2014 的 14 个不重叠的分类的 40,000 个训练样本和 5,000 个测试样本。

This article offers an empirical exploration on the use of character-level convolutional networks (ConvNets) for text classification. We constructed several large-scale datasets to show that character-level convolutional networks could achieve state-of-the-art or competitive results. Comparisons are offered against traditional models such as bag of words, n-grams and their TFIDF variants, and deep learning models such as word-based ConvNets and recurrent neural networks.

译:

本文对字符级卷积网络(ConvNets)在文本分类中的应用进行了实证研究。我们构建了几个大规模的数据集,以证明字符级卷积网络可以达到最先进或最具竞争力的结果。比较了传统模型,如单词包、n-grams及其TFIDF变体,以及基于单词的ConvNets和递归神经网络等深度学习模型。

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020082501”获取下载链接。


只要自己有时间,都尽量写写文章,与大家交流分享。

本人公众号:

CSDN博客地址:https://blog.csdn.net/ispeasant

DBPedia ontology-数据集相关推荐

  1. 数据集下载地址(转)

    以下内容转自https://baijiahao.baidu.com/s?id=1615853849218131902&wfr=spider&for=pc 图像分类领域 1)MNIST ...

  2. 33个机器学习常用数据集

    若是本文能帮助到大家,希望可以关注小编 并转发分享!(thanks) 现如今构建人工智能或机器学习系统比以往的时候更加容易.普遍存在的尖端开源工具如 TensorFlow.Torch 和 Spark, ...

  3. 【论文翻译】DBpedia - A Crystallization Point for the Web of Data-2009

    翻译论文第一.二节,The DBpedia Konwledge Base,见下图 译文: DBpedia项目为Web of Data的发展做了如下贡献: 我们提出了一个信息抽取框架,这个框架可以Wik ...

  4. cub数据集多少张图片_AI 从业者都应该知道的实验数据集

    原标题:AI 从业者都应该知道的实验数据集 雷锋网AI 科技评论按:数据集对于深度学习模型的重要性不言而喻,然而根据性质.类型.领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理. fas ...

  5. 机器学习cnn数据集_33个机器学习常用数据集CV/NLP

    若是本文能帮助到大家,希望可以关注小编 并转发分享!(thanks) 现如今构建人工智能或机器学习系统比以往的时候更加容易.普遍存在的尖端开源工具如 TensorFlow.Torch 和 Spark, ...

  6. #####@@@#好好好好#####最全知识图谱介绍:关键技术、开放数据集、应用案例汇总

    1 知识图谱构建技术 本节首先给出知识图谱的技术地图,然后介绍知识图谱构建的关键技术,包括关系抽取技术.知识融合技术.实体链接技术和知识推理技术. 1.1 知识图谱技术地图 构建知识图谱的主要目的是获 ...

  7. NAACL19笔记:自然语言处理应用的实用理解(多图解链接)

    作者:Nikita Zhiltsov 翻译:王威力 校对:申利彬 本文长度约为3000字,建议阅读10分钟 本文介绍了NLP在文本相似性.文本分类.序列标注和语言生成中的重要成果. 继续这个系列文章的 ...

  8. 【深度学习NLP论文笔记】《Deep Text Classification Can be Fooled》

    Abstract 当前存在的加扰算法不能直接应用于文本上.三种对文本的加扰策略:插入(insertion).修改(modification).移除(removal).本文针对DNN文本分类器(DNN- ...

  9. [转发]知识图谱 (Knowledge Graph) 专知 荟萃

    知识图谱 (Knowledge Graph) 专知 荟萃 入门学习 大规模知识图谱技术 王昊奋 华东理工大学 [http://history.ccf.org.cn/sites/ccf/xhdtnry. ...

  10. fastTEXT入门自然语言处理NLP

    推荐算法已经死了,而且没有出路,一线饱和,二线不需要,三线更不需要,而NLP则是一二线都有的坑,不矛盾,NLP也可辅助做好推荐,但NLP的路子更宽了.二线中需要CV,NLP,但没听说有要推荐方面的,搜 ...

最新文章

  1. CentOS 7.4 安装 MySQL 5.6.40 完美教程
  2. 详细介绍Intel SGX开发环境搭建和Hello Enclave程序运行
  3. java 实例化 bean,Spring(02)——bean实例化
  4. SQLServer更改sa用户名
  5. python读excel表格
  6. python一个富翁试图与陌生人做一笔生意_VB实验报告一
  7. javascript json_JavaScript 之 JSON.parse 导致大数精度丢失问题的解决方案
  8. (八)boost库之异常处理
  9. 客服机器人代码_电脑问题不会解决?小白智能客服来帮你!
  10. 如何备份服务器日志到其他服务器_云计算迁移别忘了备份物理服务器和数据
  11. oracle 同步索引,oracle全文索引之同步和优化索引做了什么
  12. CakePHP 2.x CookBook 中文版 第三章 入门(三)
  13. [转]C#:手把手教你用C#打包应用程序(安装程序卸载程序)
  14. 软件测试教程视频入门基础篇-千锋出品
  15. 开封文化艺术职业学院学报杂志社开封文化艺术职业学院学报编辑部2022年第4期目录
  16. 基于二叉树的家谱系统
  17. CTF--PWN必备技能--理解c程序从编译开始到运行结束的过程
  18. ch9200 usb网卡驱动_21包邮的PCMCIA无线网卡开箱+对比测评
  19. 新手小白如何用linux云服务器搭建wordpress个人网站
  20. 处理器压力测试软件,处理器压力测试小工具——云汉烤机大师

热门文章

  1. BHO,C#实现了超级拖拽的效果
  2. 面向Java程序员的15个SpringBoot面试问题和答案
  3. Java工具包之-Guava
  4. 初识ActionContext
  5. 百度提交Sitemap提示“索引型不予处理”的解决办法
  6. 待就业六人组——团队博客汇总
  7. arduino控制烟雾报警器
  8. 配乐诗朗诵《祝福的话语》
  9. 更改Windows 登录屏幕保护程序
  10. 【DL】网络搭建及训练