describe

比如:df一个dataframe

它的describe字段计算如下

其中
count:数出有该列有多少行数据
mean:该列的平均值
std:标准偏差值,即为方差开根号【√(Σ(x-E(x))²)/n】
min:最小值
25%:正好有25%的样本比这个值高
50%:正好有50%的样本比这个值高,即中位数
75%:正好有75%的样本比这个值高
max:最大值

而其中75百分位A列计算解释(25%同理)如下:

公式为:formula = percentile * n (n is number of values)
从小到大依次是
-0.439352、0.195702、0.394809
、0.404898、0.421427、0.665446

(6-1)/4×3=4.75
所以变为0.25×0.404898+0.75×0.421427
即75%×(0.421427-0.404898)+0.404898
=0.75×0.016529+0.404898
=0.41729475 即为所求
与显示0.417294省略后面两位不进行四舍五入。

首先确定四分位数的位置:
Q1的位置= (n+1) × 0.25
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表示项数
对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即
Q1的位置=1+(n-1)x 0.25
Q2的位置=1+(n-1)x 0.5
Q3的位置=1+(n-1)x 0.75
1、将数据从小到大排序,计为数组a(1 to n),n代表数据的长度
2、确定四分位数的位置:b= 1+(n-1) × 0.25= 2.25,b的整数部分计为c b的小数部分计为d
计算Q1:Q1=a©+[a(c+1)-a©]*d=a(2)+[a(3)-a(2)] *0.25 =15+(36-15)×(2.25-2)=20.25
3、计算如上 Q2与Q3的求法类似,四分位差=Q3-Q1

关于pandas的describe里面的字段含义相关推荐

  1. 成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内daiding

    成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内 目录 解决问题 解决方法 解决问题 将python的列表格式(如pandas ...

  2. linux操作系统字段含义,Linux系统 /etc/fstab各个字段含义解释

    Linux系统 /etc/fstab各个字段含义解释 # fstab文件的作用 文件/etc/fstab存放的是系统中的文件系统信息.当正确的设置了该文件,则可以通过"mount /dire ...

  3. python的describe参数_Python Pandas Series.describe()用法及代码示例

    Pandas 系列是带有轴标签的一维ndarray.标签不必是唯一的,但必须是可哈希的类型.该对象同时支持基于整数和基于标签的索引,并提供了许多方法来执行涉及索引的操作. Pandas Series. ...

  4. Pandas中describe()函数的使用介绍

    Pandas中describe()函数的使用介绍 一.describe()函数介绍 pandas 是基于numpy构建的含有更高级数据结构和工具的数据分析包,提供了高效地操作大型数据集所需的工具.pa ...

  5. 【Python】pandas的describe参数详解

    pandas的describe可以用来展示数据的一些描述性统计信息,因此经常用到. describe的官网参数如下图: 使用实例: df = pd.DataFrame(data={'A':list(' ...

  6. Pandas中describe()函数

    先附上官方文档: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html d ...

  7. pandas之describe函数分析

    DataFrame.describe(percentiles=None, include=None, exclude=None) 描述统计数据,统计数据集的集中趋势,分散和行列的分布情况,不包括 Na ...

  8. 微信聊天消息,好友转账消息的xml数据样本(分3种情况),以及各个字段含义

    转账消息只能对好友,其数据内容也是一段xml数据. 转账跟红包不一样,有3种情况的消息: 别人给自己转账: 自己给别人转账: 转账收款后,系统回执的消息: 每种消息大同小异,只有个别字段不一样. 1. ...

  9. SQL语句中explain各字段含义

    SQL语句中explain各字段含义 1 id: 2 select_type 3 type 4 table 5 possible_keys 6 Key key列显示MySQL实际决定使用的键(索引) ...

最新文章

  1. [20150309]使用冷备份做恢复的问题.txt
  2. Linux 操作系统原理 — 零拷贝技术
  3. python的多线程threading
  4. Python应用实战-在Python中进行数据处理操作的几种方法
  5. CentOS 6.4下操作kdump执行过程
  6. 计算机导论的知识,计算机导论课的认识
  7. houdini 渲染wireframe
  8. oracle数据转换,Oracle数据库转换函数
  9. 输入输出工具技术(ITTO)要背吗?——软考高项笔记8
  10. 解决一例:“无法删除文件,无法读源文件或磁盘”
  11. PAT甲级准备方法(附2021年PAT甲级秋季考试题解)
  12. Pandas:利用Styler对象设置Series、Dataframe在Jupyter Notebook中的输出样式(3)——格式化显示值、内置显示值格式化方法、表格外观、样式复用
  13. 深度学习(Python)-- 神经网络的数学构建块
  14. 生产排程系统_生产计划排程APS系统中排产算法的探讨
  15. 禅道管理员admin密码登录失败,更改密码
  16. 5G要来了,实际测试告诉你它的速度到底有多快!
  17. matlab偏导数方程,[转载]Matlab求解微分方程(2)——偏微分方程的求解
  18. python实现高级计算器_高级计算器功能Tkinter GUI和variab
  19. HTML+CSS3(六)——行内元素和块级元素
  20. 【Logisim】Logisim入门实验

热门文章

  1. opencv [c++] OpenCV实现Halcon相关算子算法
  2. Matlab矩阵的变换函数
  3. 将字符串中的单词位置倒置,如student a an I倒置后是I am a student
  4. 服务器无法远程的原因是什么?116.211.144.x
  5. linux apr防火墙,教你一招:解决linux下arp攻击的方法
  6. CAD构造线如何使用
  7. e会学c语言中有哪几个视频有提问的,C-语言期末复习题
  8. 爬取B站视频播放量及数据可视化
  9. 完整全面的Java资源库(包括构建、操作、代码分析、编译器、数据库、社区等等)
  10. php模块生成,生成模块 · HisiPHP V2开发手册 · 看云