来自 2015 年 Yelp Dataset Challenge 数据集的 1,569,264 个样本。该子集中的不同极性分别包含 280,000 个 训练样本和 19,000 个测试样本。

This article offers an empirical exploration on the use of character-level convolutional networks (ConvNets) for text classification. We constructed several large-scale datasets to show that character-level convolutional networks could achieve state-of-the-art or competitive results. Comparisons are offered against traditional models such as bag of words, n-grams and their TFIDF variants, and deep learning models such as word-based ConvNets and recurrent neural networks.

译:

本文对字符级卷积网络(ConvNets)在文本分类中的应用进行了实证研究。我们构建了几个大规模的数据集,以证明字符级卷积网络可以达到最先进或最具竞争力的结果。比较了传统模型,如单词包、n-grams及其TFIDF变体,以及基于单词的ConvNets和递归神经网络等深度学习模型。

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020082505”获取下载链接。


只要自己有时间,都尽量写写文章,与大家交流分享。

本人公众号:

CSDN博客地址:https://blog.csdn.net/ispeasant

Yelp reviews - Polarity-数据集相关推荐

  1. Yelp reviews - Full-数据集

    来自 2015 年 Yelp Dataset Challenge 数据集的 1,569,264 个样本.每个评级分别包含 130,000 个训练样本和 10,000 个 测试样本. This arti ...

  2. 数据集下载地址(转)

    以下内容转自https://baijiahao.baidu.com/s?id=1615853849218131902&wfr=spider&for=pc 图像分类领域 1)MNIST ...

  3. 33个机器学习常用数据集

    若是本文能帮助到大家,希望可以关注小编 并转发分享!(thanks) 现如今构建人工智能或机器学习系统比以往的时候更加容易.普遍存在的尖端开源工具如 TensorFlow.Torch 和 Spark, ...

  4. cub数据集多少张图片_AI 从业者都应该知道的实验数据集

    原标题:AI 从业者都应该知道的实验数据集 雷锋网AI 科技评论按:数据集对于深度学习模型的重要性不言而喻,然而根据性质.类型.领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理. fas ...

  5. 机器学习cnn数据集_33个机器学习常用数据集CV/NLP

    若是本文能帮助到大家,希望可以关注小编 并转发分享!(thanks) 现如今构建人工智能或机器学习系统比以往的时候更加容易.普遍存在的尖端开源工具如 TensorFlow.Torch 和 Spark, ...

  6. 深度学习经典数据集汇总

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 很多朋友在学习了神经网络和深度学习之后,早已迫不及待要开始动手实战 ...

  7. 【深度学习】深度学习经典数据集汇总

    深度学习数据集 Author:louwill From:深度学习笔记 很多朋友在学习了神经网络和深度学习之后,早已迫不及待要开始动手实战了.第一个遇到的问题通常就是数据.作为个人学习和实验来说,很难获 ...

  8. TensorFlow 直接可用的 30 个最大的机器学习数据集

    30 Largest TensorFlow Datasets for Machine Learning TensorFlow 直接可用的 30 个最大的机器学习数据集 01 Created by re ...

  9. 深度学习相关公开数据集

    目录 介绍 图像处理相关 自然语言处理相关 语音处理相关 Supplement 一.介绍 通常来说,深度学习的关键在于实践.从图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法. 然而, ...

最新文章

  1. react-router-dom v6 中的Routes
  2. 局域网防雷电***实用解决方案
  3. 董明珠的葫芦到底卖的什么药:董姐开店卖口罩
  4. poj2002 STL set
  5. 广东高中生多少人_“广东人参”五指毛桃根的功效与作用,有多少人真的清楚...
  6. 如何不让FCKEditor自动添加P标签
  7. JS中utf8和GBK的字符编码转换
  8. 做到我这样,你也能拿到京东Offer
  9. 轻量级的ORM框架 fluentdata
  10. 每个人心中都有一片极乐净土
  11. 重磅:达摩院医疗AI团队CVPR'20论文解读 | 凌云时刻
  12. 使用POI操作Ecxel文档遇到转化成String类型的电话号码无法转化成Cell类型了
  13. 洛谷刷题笔记5.p1116 车厢重组
  14. hw1 COVID-19 Cases prediction
  15. 搜狗输入法自动打开问题
  16. java怎么读取数据?
  17. 百度云的产品及使用场景分析
  18. Java并发编程(一):并发编程的挑战
  19. 梯形波的傅里叶级数分解
  20. linux fd dup 使用

热门文章

  1. 无线路由器中WMM/Short GI/AP隔离各是什么功能, 开启时PC无法ping通手机.
  2. 编程的思想性——议编程与“武功”的一致性
  3. Python之——实现网卡流量图表绘制
  4. uniapp云开发云函数获取微信openid
  5. shopee根据ID取商品详情 API
  6. 汇川H5U模拟量输出模拟量转换FC: S_RTI
  7. 富士通FRAM筑造自动驾驶的坚固后盾
  8. 当右键新建当中没有新建word、powerpoint、excel文档的选项
  9. 安卓8:Andorid常见问题-图片插入后,列表内有波浪线
  10. JVM中篇:字节码与类的加载篇