info()函数与describe函数
info()函数与describe()函数
一,info()函数
- 功能: 给出样本数据的相关信息概览 :行数,列数,列索引,列非空值个数,列类型,内存占用
- 使用格式:data.info()
- DataFrame.info(verbose=None, memory_usage=True, null_counts=True)
- verbose:True or False,字面意思是冗长的,也就说如何DataFrame有很多列,是否显示所有列的信息,如果为否,那么会省略一部分;
- memory_usage:True or False,默认为True,是否查看DataFrame的内存使用情况;
- null_counts:True or False,默认为True,是否统计NaN值的个数
二,describe()函数
功能:直接给出样本数据的一些基本的统计量,包括均值,标准差,最大值,最小值,分位数等。
使用格式:data.describe()
可以传递一些参数,如percentiles = [0.2,0.4,0.6,0.8]就是指定0.2,0.4,0.6,0.8分位数,而不是默认的0.25,0.5,0.75分位数。
>data.describe()age
> count 3.000000
> mean 20.666667
> std 2.516611
> min 18.000000
> 25% 19.500000
> 50% 21.000000
> 75% 22.000000
> max 23.000000
>data.describe(percentiles = [0.2,0.4,0.6,0.8])
> age
> count 3.000000
> mean 20.666667
> std 2.516611
> min 18.000000
> 20% 19.200000
> 40% 20.400000
> 50% 21.000000
> 60% 21.400000
> 80% 22.200000
>max 23.000000
info()函数与describe函数相关推荐
- pandas使用groupby函数和describe函数计算不同分组的描述性统计(descriptive statistics of each group in dataframe)
pandas使用groupby函数和describe函数计算不同分组的描述性统计(descriptive statistics of each group in dataframe) 目录
- pandas describe函数_SQL和Pandas同时掉到河里,你先救谁?
今日份知识你摄入了么? 在我的数据分析生涯中,我几乎完全是在SQL中锻炼我的技能.虽然SQL可以做一些非常酷的事情,但它有它的局限性 - 这些限制在很大程度上让我决定了要不要去感受数据科学别的巨大魅力 ...
- 【Python学习】 - Pandas包,对于describe函数和mean函数求平均值的效率问题
经测验,describe函数要快很多,不知道是不是当做一个属性直接存储起来,然后调用函数的时候O1输出? 对于30000*288的数据,describe是秒出结果,但是调用mean函数则需要10秒左右 ...
- python describe 分位数设置_Python Pandas – 如何通过describe函数计算25百分位数
对于数据框中的给定数据集,当我应用describe函数时,我得到的基本统计数据包括min,max,25%,50%等. 例如: data_1 = pd.DataFrame({'One':[4,6,8,1 ...
- pandas中describe函数详解
describe()函数可以查看DataFrame中数据的基本情况 参数: include:包含哪类数据.默认只包含连续值,不包含离散值:include = 'all' 设置全部类型 percenti ...
- Pandas中describe()函数的使用介绍
Pandas中describe()函数的使用介绍 一.describe()函数介绍 pandas 是基于numpy构建的含有更高级数据结构和工具的数据分析包,提供了高效地操作大型数据集所需的工具.pa ...
- pandas之describe函数分析
DataFrame.describe(percentiles=None, include=None, exclude=None) 描述统计数据,统计数据集的集中趋势,分散和行列的分布情况,不包括 Na ...
- describe函数的参数举例详解
# 把我们数据输进去 import pandas as pd df = pd.DataFrame(data={'A':list('13579'),'B':[2,4,6,8,10] }) # perce ...
- Python之pandas:利用describe函数统计【类别型】特征/离散型变量的描述性统计信息(包括个数count、unique、top及其freq、first、last)之详细攻略
Python之pandas:利用describe函数统计[类别型]特征/离散型变量的描述性统计信息(包括个数count.unique.top及其freq.first.last)之详细攻略 目录 利用d ...
最新文章
- 夏天过去了, 姥爷推荐几套来自smashingmagzine的超棒秋天主题壁纸
- 科研文献|粪便污染可以解释人为影响环境中抗生素耐药基因丰度
- 网络营销外包——网络营销外包专员是如何提升网站权重数值的?
- bzoj 1146 [CTSC2008]网络管理Network
- Spring和JSF集成:转换器
- 给大家推荐9个专业分享生信技术的公众号
- PHP 编写和使用web服务 第一节
- 配置阿里云docker加速与云镜像配置
- Python使用numpy计算矩阵特征值、特征向量与逆矩阵
- java反射机制深入详解_Java反射机制深入详解
- linux proc目录 是什么意思,linux 下proc目录里面有什么
- 【JWT】JWT+HA256加密 Token验证
- SICP习题 1.17 (用加法求乘积)
- 大数据笔记--Spark机器学习(第一篇)
- 如何自动生成目录,并设置目录格式(一看就懂)
- 小程序获取上一个页面或者某个页面内的值
- Drop user与cascade
- 【前端】【JavaScript】通过成绩判断等级
- 流量卡之家:5G网速快慢取决于多方面因素 实际应用难达到理论速度
- 2021年团体程序设计天梯赛-总决赛题解