原文:

Daily News for Stock Market Prediction

Using 8 years daily news headlines to predict stock market movement

Actually, I prepare this dataset for students on my Deep Learning and NLP course.

But I am also very happy to see kagglers play around with it.

Have fun!

Description:a

There are two channels of data provided in this dataset:

  1. News data: I crawled historical news headlines from Reddit WorldNews Channel (/r/worldnews). They are ranked by reddit users' votes, and only the top 25 headlines are considered for a single date.

(Range: 2008-06-08 to 2016-07-01)

  1. Stock data: Dow Jones Industrial Average (DJIA) is used to "prove the concept".

(Range: 2008-08-08 to 2016-07-01)

I provided three data files in .csv format:

  1. RedditNews.csv: two columns

The first column is the "date", and second column is the "news headlines".

All news are ranked from top to bottom based on how hot they are.

Hence, there are 25 lines for each date.

  1. DJIA_table.csv:

Downloaded directly from Yahoo Finance: check out the web page for more info.

  1. CombinedNewsDJIA.csv:

To make things easier for my students, I provide this combined dataset with 27 columns.

The first column is "Date", the second is "Label", and the following ones are news headlines ranging from "Top1" to "Top25".

译:

股市预测日报

利用8年的每日新闻标题预测股市走势

实际上,我为我的深度学习和NLP课程的学生准备了这个数据集。

但我也很高兴看到卡格尔人玩它。

玩得高兴!

说明:

此数据集中提供了两个数据通道:

1新闻数据:我从redditworldnews频道(/r/WorldNews)获取历史新闻标题。他们是根据reddit用户的投票进行排名的,只有前25名的头条新闻被认为是一次约会。

(范围:2008-06-08至2016-07-01)

2股票数据:道琼斯工业平均指数(DJIA)被用来“证明概念”。

(范围:2008-08-08至2016-07-01)

我提供了三个.csv格式的数据文件:

1红色新闻.csv:两列

第一栏是“日期”,第二栏是“新闻标题”。

所有新闻都是根据新闻的热度从上到下排列的。

因此,每行都有25行日期。

2道指_表格.csv:

直接从雅虎财经下载:查看网页了解更多信息。

三。组合新闻djia.csv:

为了方便我的学生,我提供了这个包含27列的组合数据集。

第一栏是“日期”,第二栏是“标签”,下面是从“Top1”到“Top25”的新闻标题。

链接:获取数据集

Daily News for Stock Market Prediction(股市预测日报)相关推荐

  1. 【文献阅读】Applications of deep learning in stock market prediction: Recent progress

    Applications of deep learning in stock market prediction: Recent progress 1 本文相关介绍 本文为 2021 年 CCF-C ...

  2. 【量化交易】94篇论文分析股市预测的深度学习技术

    论文 | Stock Market Prediction via Deep Learning Techniques: A Survey 作者 | Jinan Zou, Qingying Zhao, Y ...

  3. 【计算机科学】【2016.05】基于递归神经网络的股市预测研究

    本文为美国密苏里大学(作者:Qiyuan Gao)的硕士论文,共55页. 在本文中,我们研究了利用长短期记忆(LSTM)的递归神经网络(RNN)进行股市预测的问题.本研究旨在探讨LSTM在股市预测中的 ...

  4. 告别RNN,迎来TCN!将深度学习应用于股市预测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|计算机视觉联盟 本文介绍了 TCN 在股市趋势预测任务中 ...

  5. 告别RNN,迎来TCN!股市预测任务是时候拥抱新技术了

    转载自 机器之心, 关注"迈微AI研习社",内容首发于公众号 本文介绍了 TCN 在股市趋势预测任务中的应用,表明在集成新闻事件和知识图谱后,TCN 的性能大幅超过 RNN. 选自 ...

  6. 论文导读:Deep Attentive Learning for Stock Movement Prediction From Social Media Text and Company Correl

    1. Introduction 股票走势受到多方面影响,没有了解相关信息的投资决策会面临金融风险以及金钱损失,而仔细考虑过的投资可以使收益增大.传统的方法依赖于时间序列,以及对股票的分析,比如利用历史 ...

  7. 1578: [Usaco2009 Feb]Stock Market 股票市场

    1578: [Usaco2009 Feb]Stock Market 股票市场 Time Limit: 10 Sec  Memory Limit: 64 MB Submit: 414  Solved:  ...

  8. 【论文研读】【金融】Predicting the direction of stock market prices using random forest

    [论文研读]Predicting the direction of stock market prices using random forest Abstract Key Words 1. Intr ...

  9. jane street market prediction 冠军方案 奇巧淫技与topline链接整理(3/3)

    目录 前言 将income 作为loss(优化目标) 读取数据,定义优化目标 模型训练与微调 提交结果 多目标学习 Topline整理 AE+MLP (rank10) Current 17th sol ...

最新文章

  1. 算法岗面试复盘 | 阿里、百度、作业帮、华为
  2. FreeSWITCH快速录音
  3. 理解__repr__
  4. 大数据征信应用与启示 ——以美国互联网金融公司 ZestFinance为例
  5. 4kyu Sum by Factors
  6. 阿里财报:云计算年度营收133亿,季度营收连续12个季度翻番
  7. github上传本地项目_提交本地项目到GitHub
  8. CPU time与WALL time
  9. 一旦有辞职念头就干不长了吗_每天都有辞职不想上班的冲动,你有吗?
  10. 微服务的概念——《微服务设计》读书笔记
  11. 如何以及何时使用枚举和注释
  12. 冠榕智能灯光控制协议分析(controller init)
  13. Java中static的作用详解_详解java中static关键词的作用
  14. 【网络安全入门大总结】—Java语言中常用的渗透漏洞大汇总
  15. GJB150.10A-2009霉菌试验标准费用-霉菌试验GJBA检测机构
  16. CSS font-family 属性值大全
  17. [MDK]MDK通杀版注册机(更新最新的注册机,支持5.15, 5.16, 5.17,5.18,5.20,5.21, 5.22,5.23,5.24)
  18. 02-客房预订系统数据库-用户和客房预订数据操作
  19. 键盘怎么按出计算机,怎么在电脑键盘上打出艾特@键? 原来是这样的
  20. 那些年,我们一起喜欢的诺基亚

热门文章

  1. 安装完sdk后,在cmd运行adb,发现不行。
  2. VTK 学习----VTK对象绘制-点(vtkPoints、vtkSphereSource)、线(vtkLine、vtkLineSource)
  3. JVM 的线程堆栈等数据分析:操千曲而后晓声、观千剑而后识器
  4. Android 彩信发送
  5. HTML+css 会旋转的可乐瓶子
  6. 2017年10月 oracle 关键补丁更新
  7. 推荐系统之FM与MF傻傻分不清楚
  8. 商品交易系统之---产品介绍
  9. wow盗号木马事件前后
  10. “笨办法”学Python3,Zed A. Shaw,习题33