关于pandas的describe里面的字段含义
describe
比如:df一个dataframe
它的describe字段计算如下
其中
count:数出有该列有多少行数据
mean:该列的平均值
std:标准偏差值,即为方差开根号【√(Σ(x-E(x))²)/n】
min:最小值
25%:正好有25%的样本比这个值高
50%:正好有50%的样本比这个值高,即中位数
75%:正好有75%的样本比这个值高
max:最大值
而其中75百分位A列计算解释(25%同理)如下:
公式为:formula = percentile * n (n is number of values)
从小到大依次是
-0.439352、0.195702、0.394809
、0.404898、0.421427、0.665446
(6-1)/4×3=4.75
所以变为0.25×0.404898+0.75×0.421427
即75%×(0.421427-0.404898)+0.404898
=0.75×0.016529+0.404898
=0.41729475 即为所求
与显示0.417294省略后面两位不进行四舍五入。
首先确定四分位数的位置:
Q1的位置= (n+1) × 0.25
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表示项数
对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即
Q1的位置=1+(n-1)x 0.25
Q2的位置=1+(n-1)x 0.5
Q3的位置=1+(n-1)x 0.75
1、将数据从小到大排序,计为数组a(1 to n),n代表数据的长度
2、确定四分位数的位置:b= 1+(n-1) × 0.25= 2.25,b的整数部分计为c b的小数部分计为d
计算Q1:Q1=a©+[a(c+1)-a©]*d=a(2)+[a(3)-a(2)] *0.25 =15+(36-15)×(2.25-2)=20.25
3、计算如上 Q2与Q3的求法类似,四分位差=Q3-Q1
关于pandas的describe里面的字段含义相关推荐
- 成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内daiding
成功解决将python的列表格式输出数值(如pandas.read_excel().describe()),批量转到表格内 目录 解决问题 解决方法 解决问题 将python的列表格式(如pandas ...
- linux操作系统字段含义,Linux系统 /etc/fstab各个字段含义解释
Linux系统 /etc/fstab各个字段含义解释 # fstab文件的作用 文件/etc/fstab存放的是系统中的文件系统信息.当正确的设置了该文件,则可以通过"mount /dire ...
- python的describe参数_Python Pandas Series.describe()用法及代码示例
Pandas 系列是带有轴标签的一维ndarray.标签不必是唯一的,但必须是可哈希的类型.该对象同时支持基于整数和基于标签的索引,并提供了许多方法来执行涉及索引的操作. Pandas Series. ...
- Pandas中describe()函数的使用介绍
Pandas中describe()函数的使用介绍 一.describe()函数介绍 pandas 是基于numpy构建的含有更高级数据结构和工具的数据分析包,提供了高效地操作大型数据集所需的工具.pa ...
- 【Python】pandas的describe参数详解
pandas的describe可以用来展示数据的一些描述性统计信息,因此经常用到. describe的官网参数如下图: 使用实例: df = pd.DataFrame(data={'A':list(' ...
- Pandas中describe()函数
先附上官方文档: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html d ...
- pandas之describe函数分析
DataFrame.describe(percentiles=None, include=None, exclude=None) 描述统计数据,统计数据集的集中趋势,分散和行列的分布情况,不包括 Na ...
- 微信聊天消息,好友转账消息的xml数据样本(分3种情况),以及各个字段含义
转账消息只能对好友,其数据内容也是一段xml数据. 转账跟红包不一样,有3种情况的消息: 别人给自己转账: 自己给别人转账: 转账收款后,系统回执的消息: 每种消息大同小异,只有个别字段不一样. 1. ...
- SQL语句中explain各字段含义
SQL语句中explain各字段含义 1 id: 2 select_type 3 type 4 table 5 possible_keys 6 Key key列显示MySQL实际决定使用的键(索引) ...
最新文章
- [20150309]使用冷备份做恢复的问题.txt
- Linux 操作系统原理 — 零拷贝技术
- python的多线程threading
- Python应用实战-在Python中进行数据处理操作的几种方法
- CentOS 6.4下操作kdump执行过程
- 计算机导论的知识,计算机导论课的认识
- houdini 渲染wireframe
- oracle数据转换,Oracle数据库转换函数
- 输入输出工具技术(ITTO)要背吗?——软考高项笔记8
- 解决一例:“无法删除文件,无法读源文件或磁盘”
- PAT甲级准备方法(附2021年PAT甲级秋季考试题解)
- Pandas:利用Styler对象设置Series、Dataframe在Jupyter Notebook中的输出样式(3)——格式化显示值、内置显示值格式化方法、表格外观、样式复用
- 深度学习(Python)-- 神经网络的数学构建块
- 生产排程系统_生产计划排程APS系统中排产算法的探讨
- 禅道管理员admin密码登录失败,更改密码
- 5G要来了,实际测试告诉你它的速度到底有多快!
- matlab偏导数方程,[转载]Matlab求解微分方程(2)——偏微分方程的求解
- python实现高级计算器_高级计算器功能Tkinter GUI和variab
- HTML+CSS3(六)——行内元素和块级元素
- 【Logisim】Logisim入门实验
热门文章
- opencv [c++] OpenCV实现Halcon相关算子算法
- Matlab矩阵的变换函数
- 将字符串中的单词位置倒置,如student a an I倒置后是I am a student
- 服务器无法远程的原因是什么?116.211.144.x
- linux apr防火墙,教你一招:解决linux下arp攻击的方法
- CAD构造线如何使用
- e会学c语言中有哪几个视频有提问的,C-语言期末复习题
- 爬取B站视频播放量及数据可视化
- 完整全面的Java资源库(包括构建、操作、代码分析、编译器、数据库、社区等等)
- php模块生成,生成模块 · HisiPHP V2开发手册 · 看云