金融数据

数据分析离不开数据的获取,这里介绍几种常用的获取金融方面数据的方法。

pandas-datareader

pandas-datareader 库包含了全球最著名的几家公司所整理的金融数据,这些数据库包括:

安装

pip install -U pandas-datareader

使用

引入库:import pandas_datareader.data as web

获取数据:

web.DataReader(name=,data_source=,start=,end=)

通过指定的数据源获取金融数据并返回 DataFrame 类型的数据。

name:数据集名称,通常是股票代码

data_source:数据源,yahoo,google,fred,ff 等

start,end 起始(默认为 2010/01/01)、结束日期(默认为当天)

start_dt = datetime.datetime(2010, 1, 1)

end_dt = datetime.date.today()

google_data = web.DataReader(name='GOOG', data_source='google', start=start_dt, end=end_dt)

TuShare

免费、开源的python财经数据接口包

实现对股票等金融数据从数据采集、清洗加工到数据存储的过程

TuShare 返回的绝大部分的数据格式都是 pandas DataFrame 类型

数据类型

使用

安装:

pip install -U tushare

引入

import tushare as ts

历史数据获取

ts.get_k_data()

import tushare as ts

start_dt = datetime.datetime(2010, 1, 1)

end_dt = datetime.date.today()

maotai_data = ts.get_k_data(code='600519', start='2010-01-01', end='2017-07-01')

实时数据获取

ts.get_today_all()

金融学图表

matplotlib 库自带的画图工具 matplotib.finance 可满足我们的基本使用。

常用的方法有:

candlestick2__ochl,candlestick2_ohlc

candlestick_ochl,candlestick_ohlc

plot_day_summary2_ochl,plot_day_summary2_ohlc

plot_day_summary_oclh,plot_day_summary_ohlc

案例

引入相应库:

import tushare as ts

import matplotlib.pyplot as plt

import matplotlib

from matplotlib.dates import date2num, DateFormatter

import matplotlib.finance as mpf

import pandas as pd

%matplotlib inline

获取数据:

stock_data = ts.get_k_data(code='600519', start='2017-01-01', end='2017-07-01')

candlestick2_ochl

fig, ax = plt.subplots(figsize=(12, 5))

mpf.candlestick2_ochl(ax, stock_data['open'], stock_data['close'], stock_data['high'], stock_data['low'],

width=0.6, colorup='r', colordown='g')

ax.set_xticklabels(stock_data['date'])

plt.grid(True)

plt.xticks(rotation=45)

plt.ylabel('Stock Price')

plt.xlabel('Date')

plt.show()

candlestick_ochl

ochl_data = stock_data[['date', 'open', 'close', 'high', 'low']]

ochl_data['date'] = pd.to_datetime(ochl_data['date'])

ochl_data['date'] = ochl_data['date'].apply(date2num)

fig, ax = plt.subplots(figsize=(12, 5))

# 蜡烛图

mpf.candlestick_ochl(ax, ochl_data.values, width=.6, colorup='r', colordown='g')

ax.xaxis_date()

ax.autoscale_view()

ax.xaxis.set_major_formatter(DateFormatter('%Y-%m-%d'))

plt.grid(True)

plt.xticks(rotation=45)

plt.ylabel('Stock Price')

plt.xlabel('Date')

plt.show()

plot_day_summary2_ochl

fig, ax = plt.subplots(figsize=(12, 5))

mpf.plot_day_summary_ochl(ax, stock_data['open'], stock_data['close'], stock_data['high'], stock_data['low'],

colorup='r', colordown='g')

ax.set_xticklabels(stock_data['date'])

plt.grid(True)

plt.xticks(rotation=45)

plt.ylabel('Stock Price')

plt.xlabel('Date')

plt.show()

plot_day_summary_oclh

oclh_data = stock_data[['date', 'open', 'close', 'low', 'high']]

oclh_data['date'] = pd.to_datetime(oclh_data['date'])

oclh_data['date'] = oclh_data['date'].apply(date2num)

fig, ax = plt.subplots(figsize=(12, 5))

mpf.plot_day_summary_oclh(ax, oclh_data.values, colorup='r', colordown='g')

ax.xaxis_date()

ax.autoscale_view()

ax.xaxis.set_major_formatter(DateFormatter('%Y-%m-%d'))

plt.grid(True)

plt.xticks(rotation=45)

plt.ylabel('Stock Price')

plt.xlabel('Date')

plt.show()

python处理金融数据_Python 数据分析中金融数据的来源库和简单操作相关推荐

  1. 系统的认识大数据人工智能数据分析中的数据

    今天,大量数据.信息充斥我的日常生活和工作中,仿佛生活在数据和信息的海洋中,各类信息严重影响了我们的生活,碎片.垃圾.过时信息耗费了我们宝贵时间,最后可留在我们大脑中的数据.信息和知识少之又少,如何提 ...

  2. python 插补数据_python 2020中缺少数据插补技术的快速指南

    python 插补数据 Most machine learning algorithms expect complete and clean noise-free datasets, unfortun ...

  3. Python数据分析中的数据预处理:数据标准化

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据分析中的 数据预处理:数据标准化 ● 选择题 以下关于 ...

  4. Python之pandas:对pandas中dataframe数据中的索引输出、修改、重命名等详细攻略

    Python之pandas:对pandas中dataframe数据中的索引输出.修改.重命名等详细攻略 目录 对pandas中dataframe数据中的索引输出.修改.重命名等详细攻略 知识点学习 输 ...

  5. java代码转置sql数据_SQL Server中的数据科学:数据分析和转换–使用SQL透视和转置

    java代码转置sql数据 In data science, understanding and preparing data is critical, such as the use of the ...

  6. 基于python家庭用电量数据的数据分析可视化 完整数据可直接运行

    项目演示:基于python的家庭用电量数据的数据分析可视化 完整数据评论区自取_哔哩哔哩_bilibili 本博客附完整的数据代码: from numpy import nan from pandas ...

  7. python文本筛选_使用python对多个txt文件中的数据进行筛选的方法

    使用python对多个txt文件中的数据进行筛选的方法 一.问题描述 筛选出多个txt文件中需要的数据 二.数据准备 这是我自己建立的要处理的文件,里面是随意写的一些数字和字母 三.程序编写 impo ...

  8. 高性能计算系统——大数据/快速数据分析中的高性能技术

    大数据/快速数据分析中的高性能技术 高性能计算的目的是为了数据密集型以及处理密集型的工作实现少费而多用的目标.计算机.存储设备和网络解决方案也相应变得高性能和可扩展. 高通量计算(HTC)同高性能计算 ...

  9. 大数据与数据分析:大数据开发岗和分析岗对比

    近几年的大数据,确实在行业当中得到越来越多的重视,越来越多的企业开始成立数据业务部门,针对企业不断累积起来的数据资产,进行价值挖掘和应用.对于企业而言,大数据相关人才的引进,有大数据开发,也有数据分析 ...

最新文章

  1. php excel 转数组函数,使用PHPExcel将数组转换为Excel 2007
  2. TED:如何掌控你的自由时间以及让自己变得更好,这样就能看到爱情应有的样子...
  3. 学习笔记(29):Python网络编程并发编程-信号量
  4. pta最长连续递增子序列C语言,pta 习题集 5-5 最长连续递增子序列 (dp)
  5. OpenShift - 扩展收缩应用部署规模
  6. NAS DIY的设计和实施过程-5-Openfiler篇
  7. EntLib 4.1 第2.5章 DAAB+Unity (数据访问程序块)
  8. js实现类似jquery基础功能 简单选择器/事件/属性
  9. mysql的时间类型的比较
  10. mac查看电脑系统位数
  11. flac格式怎么转换mp3格式?
  12. 新浪微博第三方登录 文件不存在 c8998
  13. EMI共模电感一般什么材质你知道吗
  14. Python 已知三角形的三条边,求面积
  15. GL benchmark测试解析
  16. 英语读书笔记-Book Lovers Day 11
  17. Instagram: 从图片发布到聊天工具的蜕变
  18. World一页打印变成两页怎么缩放
  19. 线性代数:秩的各章节串烧、秩的所有公式总结、秩的常用结论及其推论、线性相关与线性表示线性表出和秩的关系
  20. 暗影精灵8 安装ubuntu 问题汇总

热门文章

  1. python中定义函数时有用到箭头符号的,箭头主要干什么用
  2. 【续】深度学习软件安装(显卡为1080ti)CUDA8.0+cuDNN5.1+pytorch1.0.0
  3. 未来十年,最赚钱的17大行业全在这
  4. 【算法】将数组循环左移
  5. 推荐系统[二]:召回算法超详细讲解[召回模型演化过程、召回模型主流常见算法(DeepMF/TDM/Airbnb Embedding/Item2vec等)、召回路径简介、多路召回融合]
  6. 软件工程导论—软件测试
  7. 【社招3年day1】面了一次今日头条:成功入职
  8. 云盘满足校园存储与数据共享
  9. 平安壹钱包CTO李志辉:“众愚成智”的管理之道
  10. uniapp 跳转外部app(淘宝)