原文:

Sentiment140 allows you to discover the sentiment of a brand, product, or topic on Twitter.

The data is a CSV with emoticons removed. Data file format has 6 fields:

0 - the polarity of the tweet (0 = negative, 2 = neutral, 4 = positive)

1 - the id of the tweet (2087)

2 - the date of the tweet (Sat May 16 23:58:44 UTC 2009)

3 - the query (lyx). If there is no query, then this value is NO_QUERY.

4 - the user that tweeted (robotickilldozr)

5 - the text of the tweet (Lyx is cool)

译:

情感140允许你在Twitter上发现品牌、产品或主题的情感。

数据是CSV,删除了表情符号。数据文件格式有6个字段:

0-tweet的极性(0=负极,2=中性,4=正极)

1-推特的id(2087)

2-推特的日期(2009年5月16日星期六23:58:44 UTC)

3-查询(lyx)。如果没有查询,则此值为no_query。

4-发推特的用户(robotkilldozr)

5-微博的文字(Lyx很酷)

大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020092402”获取下载链接。

Sentiment140数据集相关推荐

  1. 23 个优秀的机器学习训练公共数据集

    Iris 数据集的那些示例你是不是已经用腻了呢?不要误会我的意思,Iris 数据集作为入门用途来说是很不错的,但其实网络上还有很多有趣的公共数据集可以用来练习机器学习和深度学习.在这篇文章中,我会分享 ...

  2. 面面俱到,这 23 个公共数据集赶紧Mark起来!

    作者 | Nikola M. Zivkovic 译者 | 弯月     责编 | 晋兆雨 出品 | CSDN(ID:CSDNnews) 巧妇难为无米之炊,机器学习或深度学习的开发者常常为寻找合适的训练 ...

  3. 【开源】23个优秀的机器学习数据集

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | Nikola M. Zivkovic 译者 | 王强 策 ...

  4. 【开源】23个优秀的机器学习数据集,推荐!

    本文来源"AI有道"公众号,侵权删. 原文链接:https://mp.weixin.qq.com/s/rZtUBmY_HJSKsa4qaDB41Q 本文最初发布于 rubiksco ...

  5. 23个优秀的机器学习训练公开数据集,一文全知道!

    作者 | Nikola M. Zivkovic   转自AI前线 译者 | 王强 策划 | 凌敏 对于学习机器学习的朋友,一般都会用到那些常用的机器学习数据集,这里一篇文章一网打尽,大家可以一次性下载 ...

  6. 共享单车数据集超10万条

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 共享单车数据集,包括骑行时间.会员骑行时间.会员类型.骑行路线类别.开始时间.结束时间.开始站 ...

  7. Python基于机器学习的文本情感分析详细步骤[附代码和文字解释]

    最近在研究情感分析,感谢CSDN上很多博主的文章,让我受益匪浅.因此在跑出准确率高达88%的分类结果后,写下自己的代码和总结,希望对大家有所帮助~ 目录 一.文本数据预处理 1.读取json并转化为列 ...

  8. Streamlit+Flair开发微博情感分析应用【含源码】

    Streamlit是一个出色的机器学习工具开发库,这个教程将学习 如何使用streamlit和flair开发一个twitter微博情感分析的应用. 相关链接:Streamlit开发手册 1.strea ...

  9. Streamlit实战Twitter微博情感分类【Flair】

    Streamlit是一个出色的机器学习工具开发库,这个教程将学习如何使用streamlit和flair开发一个twitter微博情感分析的应用. 相关链接:Streamlit开发手册 1.stream ...

  10. NLP微博文本分类【Snorkel弱监督+ULMFiT迁移学习】

    本文是作者一个tweet/微博文本分类实战项目的全程重现与总结.该项目的最大特点是使用了弱监督技术(Snorkel)来获得海量标注数据,同时使用预训练语言模型进行迁移学习. 项目的主要步骤如下: 采集 ...

最新文章

  1. ACMNO.37 C语言-数字交换 输入10个整数,将其中最小的数与第一个数对换,然后把最大的数与最后一个数对换。写三个函数; ①输入10个数;②进行处理;③输出10个数。
  2. 英特尔变身数据公司 未来最大数据市场定是中国
  3. 【原创】单片系统SoC
  4. Lucky Substrings
  5. 2017第17周五当前困境思考2
  6. python多线程用法及与单线程耗时比较
  7. 西门子博图的FB块_西门子S7-300/400PLC OB-FB-FC-DB块介绍
  8. 牛客练习赛 65 (待补E-网络流)
  9. destoon网站mysql分表_destoon : 常用数据库操作
  10. javascript 代码可读性
  11. magento2 checkout totals添加产品属性
  12. 【ElasticSearch】Es 源码之 SearchTransportService 源码解读
  13. 税控服务器管理系统发票号段重复,两个税控盘都有同样的发票号码可以吗
  14. 处理机调度之时间片轮转调度算法实现
  15. [保姆级教程] 从原理到应用,超级详细的MPU6050传感器整理,看完这一篇就够了
  16. 小白都能学会的Spring Boot!
  17. jupyter notebook把txt文件写成所需格式的txt文件
  18. 怎么看电脑是32位还是64位?2个方法,快速查看
  19. 简单爬取红牛分公司基本数据part01
  20. 【软件之道】Word模板的制作及使用

热门文章

  1. 深圳安全研讨会11月15日举行
  2. Average (区间最大均值,二分)
  3. 资源管理器清楚WPS网盘、百度网盘方法
  4. Python助你抢红包
  5. 文氏电桥振荡电路Mulitisim仿真
  6. 一文看懂人工智能产业链!
  7. sd卡怎么格式化?5个步骤轻松教会你
  8. 如何查看Excel文件最大行数
  9. J2EE进阶之tomcat服务器搭建,HTTP协议 八
  10. java“的注脚_百度得到的数据如何写脚注