统计分析包括描述统计和推断统计两个部分。

对已有的数据整理,计算数据指标,平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差)是最常用的技术手段,也是最容易的。

# hanbb
# come on!!!
import tushare as ts
import matplotlib.pyplot as plt# 股票数据获取
data_zglt = ts.get_hist_data('600050',start='2015-06-23',end='2017-11-16')
data_pfyh = ts.get_hist_data('600000',start='2015-06-23',end='2017-11-16')# 收益率计算
data_zglt['returns'] = (data_zglt['close']-data_zglt['close'].shift(1))/data_zglt['close'].shift(1)
data_pfyh['returns'] = (data_pfyh['close']-data_pfyh['close'].shift(1))/data_pfyh['close'].shift(1)# 求平均值
print(data_zglt['returns'].mean(),data_pfyh['returns'].mean())
# 求中位数
print(data_zglt["returns"].median(),data_pfyh["returns"].median())
# 求众数
print(data_zglt["returns"].mode(),data_pfyh["returns"].mode())# 四分位数
print(data_zglt['returns'].quantile(i) for i in [0.25,0.75])
print(data_pfyh['returns'].quantile(i) for i in [0.25,0.75])# 数据的离散度 稳定性
# 极差
print(data_zglt['returns'].max()-data_zglt['returns'].min())
print(data_pfyh['returns'].max()-data_pfyh['returns'].min())# 平均绝对偏差(MAD:mean absolute devation)
# define:数据和均值差值的 之和 的平均数(除以N)
print(data_zglt["returns"].mad(),data_pfyh["returns"].mad())# 方差(variance)和标准差(standard deviation)
# var define:数据和均值差值的 平方之和 的平均数(除以N-1)
print(data_zglt["returns"].var(),data_pfyh["returns"].var())
print(data_zglt["returns"].std(),data_pfyh["returns"].std())# 描述性数据
print(data_zglt["returns"].describe(),data_pfyh["returns"].describe())

转载于:https://www.cnblogs.com/hanbb/p/8031216.html

2.13 描述性统计(平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差))...相关推荐

  1. python量化交易笔记---13.描述性统计

    统计分为描述统计和推断统计,我们在这一章里,主要讲解描述性统计.我们用到的数据如下所示: images/c13f004.png 上图中,gsyh代表工商银行收益率,pfyh代表浦发银行收益率,zglt ...

  2. SPSS Modeler18.0数据挖掘软件教程(二):数据描述性统计与可视化

    教程传送门: SPSS Modeler18.0数据挖掘软件教程(一):背景及软件简介 SPSS Modeler18.0数据挖掘软件教程(三):逻辑回归分析 SPSS Modeler18.0数据挖掘软件 ...

  3. [转载] python查看的统计量_python 描述性统计_Python中的基本统计:描述性统计

    参考链接: Python中的统计函数 1(中位数和平均值的度量) python 描述性统计 The field of statistics is often misunderstood, but it ...

  4. 统计学原理之描述性统计——开篇

    缘由: 学习笔记的起始缘由:遇到了一个活跃的学习小组,学习内容又是一直想学而且想用好的领域. 学习内容大纲如下: 第一周学习内容--描述性统计 知识点如下: 数据集中趋势: 中位数.均值.众数.极差. ...

  5. python 描述性统计_Python中的基本统计:描述性统计

    python 描述性统计 The field of statistics is often misunderstood, but it plays an essential role in our e ...

  6. R语言使用epiDisplay包的summ函数计算向量数据在不同分组下的描述性统计汇总信息并可视化有序点图(名称、有效值个数、均值、中位数、标准差、最大值、最小值)

    R语言使用epiDisplay包的summ函数计算向量数据在不同分组下的描述性统计汇总信息并可视化有序点图(名称.有效值个数.均值.中位数.标准差.最大值.最小值) 目录

  7. R语言使用epiDisplay包的summ函数计算dataframe中指定变量的描述性统计汇总信息并可视化有序点图、通过dot.col参数配置数据点的颜色(名称、有效值个数、均值、中位数、标准差)

    R语言使用epiDisplay包的summ函数计算dataframe中指定变量的描述性统计汇总信息并可视化有序点图.通过dot.col参数配置数据点的颜色(名称.有效值个数.均值.中位数.标准差.最大 ...

  8. R语言rnorm函数生成正太分布数据、使用epiDisplay包的summ函数计算向量数据的描述性统计汇总信息并可视化有序点图(名称、有效值个数、均值、中位数、标准差、最大值、最小值)

    ↵ R语言rnorm函数生成正太分布数据.使用epiDisplay包的summ函数计算向量数据的描述性统计汇总信息并可视化有序点图(名称.有效值个数.均值.中位数.标准差.最大值.最小值) 目录

  9. R语言使用epiDisplay包的summ函数计算向量数据在不同分组下的描述性统计汇总信息并可视化有序点图、使用main参数为可视化图像添加自定义标题(名称、有效值个数、均值、中位数、标准差、最大值)

    R语言使用epiDisplay包的summ函数计算向量数据在不同分组下的描述性统计汇总信息并可视化有序点图.使用main参数为可视化图像添加自定义标题(名称.有效值个数.均值.中位数.标准差.最大值. ...

最新文章

  1. UI设计学习的对比原则怎么运用?
  2. java中的实例初始化
  3. ThreadLocal 和 InheritableThreadLocal
  4. Swift数据类型(五)
  5. 中公事业单位计算机模拟试题,事业单位考试计算机基础知识模拟试题汇总—单选题(2)...
  6. docker镜像下载太慢
  7. 玩转3D全息图像!AI即刻生成
  8. 国产在线三维云CAD:CrownCAD (在线建模CAD软件)
  9. c# gerber文件读取_PCB加工中Gerber文件的解析及其图形绘制和分割的研究
  10. 傅里叶分析之掐死教程(完整版)
  11. 洛谷P2141 珠心算测验
  12. python实现插值填充有序均匀点云空洞
  13. PyPDF2读取PDF文件内容保存到本地TXT
  14. 什么是内存屏障?具有什么作用?
  15. ev3和python哪个好_乐高教育EV3比SPIKE Prime更好的十个理由!
  16. SOTIF 预期功能安全ISO21448介绍、功能安全标准ISO26262 与若干安全标准的适用范围和开发流程映射
  17. mac brew 测速 软件_最好用的网络测速工具speedtest
  18. Android 在线预览PDF
  19. 固态继电器基础知识和工作原理
  20. 小米android8.0新功能,性能大优化:小米A1已向所有用户推Android 8.0更新

热门文章

  1. BFC、IFC、GFC 和 FFC的概念
  2. Arduino Uno 实验14——声音传感器
  3. 数学专业的考计算机博士,在数字中发现乐趣 过来人谈数学专业考研
  4. node.js错误解决:Syntax Error: Error: No ESLint configuration found.
  5. 【元器件】2.无源晶振
  6. 如何查看目前所有会话的状态oracle,Oracle一些常用查看数据库状态SQL
  7. 实战1 - 空气质量数据的校准
  8. jmeter逻辑控制器之while循环控制器(一)
  9. iOS开发——MRC(手动内存管理)
  10. 使用蒙特卡洛技术解决一个小虫爬铁丝问题。