描述统计学(descriptive statistics)是一门统计学领域的学科,主要研究如何取得反映客观现象的数据,并以图表形式对所搜集的数据进行处理和显示,最终对数据的规律、特征做出综合性的描述分析

常用的统计学函数:count() 统计某个非空值的数量

sum() 求和

mean() 求均值

median() 求中位数

mode() 求众数

std() 求标准差

min() 求最小值

max() 求最大值

abs() 求绝对值

prod() 求所有数值的乘积

cumsum() 计算累计和,axis=0,按照行累加;axis=1,按照列累加

cumprod() 计算累计积,axis=0,按照行累积;axis=1,按照列累积

corr() 计算数列或变量之间的相关系数,取值-1到1,值越大表示关联性越强

从描述统计学角度出发,可以对 DataFrame 结构执行聚合计算等其他操作,比如 sum() 求和、mean()求均值等方法
在 DataFrame 中,使用聚合类方法时需要指定轴(axis)参数

两种传参方式:

对行操作,默认使用 axis=0 或者使用 "index"

对列操作,默认使用 axis=1 或者使用 "columns"

axis=0 表示按垂直方向进行计算,而 axis=1 则表示按水平方向

创建一个 DataFrame 结构:

sum()求和:

在默认情况下,返回 axis=0 的所有值的和

mean()求均值:

std()求标准差:

标准差是方差的算术平方根,它能反映一个数据集的离散程度。但是要注意,平均数相同的两组数据,标准差未必相同

数据汇总描述

describe() 函数显示与 DataFrame 数据列相关的统计信息

describe() 函数输出了平均值、std 和 IQR 值(四分位距)等一系列统计信息。通过 describe() 提供的include能够筛选字符列或者数字列的摘要信息

include 相关参数值说明:

object: 表示对字符列进行统计信息描述

number:表示对数字列进行统计信息描述

all:汇总所有列的统计信息

描述统计学(descriptive statistics)相关推荐

  1. 概率论与数理统计 1 Overview and Descriptive Statistics(概述和描述性统计) (上篇)

    概率论_1.1_1.2 1.1 Populations,Samples,and Processes Branches of Statistics the Scope of Modern Statist ...

  2. pandas使用groupby函数和describe函数计算不同分组的描述性统计(descriptive statistics of each group in dataframe)

    pandas使用groupby函数和describe函数计算不同分组的描述性统计(descriptive statistics of each group in dataframe) 目录

  3. R语言编写自定义描述统计计算函数、使用doBy包的summaryBy函数计算不同分组(group)的描述性统计值(Descriptive statistics by group、样本个数、均值、标准)

    R语言编写自定义描述统计计算函数.使用doBy包的summaryBy函数计算不同分组(group)的描述性统计值(Descriptive statistics by group using summa ...

  4. R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息、数值数据的描述性统计(Numerical data)、离散型数据的描述性统计(Categorical)

    R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息.数值数据的描述性统计(Numerical data).离散型数据的描述性统计(Categorical) 目录

  5. 什么是描述性统计分析( descriptive statistics)?主要包含哪些内容?

    什么是描述性统计分析( descriptive statistics)?主要包含哪些内容? 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估 ...

  6. Descriptive Statistics

    references:[1] 描述统计学基础 - 知乎 [2] 异常值的处理 - 简书 数据分析的基础之一描述统计学,描述统计学定义:将一系列复杂的数据减少为几个能起到描述作用的数字,用这些有代表性的 ...

  7. 教你如何区分描述统计学与推断统计学

    统计学被广泛的应用于各个领域之上,从物理和社会科学,再到人文科学,甚至被用在工商业及ZF的情报决策当中.统计学又可分为描述统计学和推断统计学,那么要怎样来区分她们呢?   我们先来了解描述统计学和推断 ...

  8. 数据分析之描述统计学

    [什么是描述统计学] 定义[1]:描述统计学(descriptive statistics)是研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合概括与分析得出 ...

  9. 推断统计学 假设检验 显著性检验 第一类错误 第二类错误

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1 描述统计学与推断统计学 上大学的时 ...

最新文章

  1. jenkins安装和使用
  2. 4.3 matlab常用的特殊图形(条形图、直方图、饼图、散点图等)
  3. Redis 主从集群搭建及哨兵模式配置
  4. 马化腾、李彦宏、雷军,程序员国服三强谁的编程能力最牛?
  5. Aspx页面内 成员变量丢失的问题
  6. html选择区域高亮,css+js实现部分区域高亮可编辑遮罩层
  7. OverFeat,分类、定位、检测
  8. super-csv文档的部分翻译及基本使用
  9. 路由器总是有信号无网络连接到服务器,路由器经常连不上网信号很差怎么回事...
  10. MT7921:WIFI、AP、BT基础知识
  11. Windows远程桌面实现物理机访问控制虚拟机2-Tomcat发布网页
  12. Settings搜索栏界面绘制
  13. DevExpress 设置DateEdit显示年月
  14. 60天月活破亿,ChatGPT之父传奇:16岁出柜,20岁和男友一同当上CEO
  15. 配置Nginx前端Apache后端服务器LNMPA-与LNMP,HHVM性能比拼
  16. TCP/IP各流程中的seq number与ack seq number
  17. 10个挖掘edusrc常用工具、脚本
  18. 一元享移动怎么样_揭露铜仁移动公司138元全家享套餐中的骗局!
  19. 区块链运营总监招聘要求
  20. 使用camtasia studio制作视频心得

热门文章

  1. 【Bezier 贝塞尔曲线】原理与公式推导
  2. 使用phpqrcode生成带logo二维码 并生成海报
  3. 百心安生物上市步伐暂停:无基石投资人认购,高盛已“消失”
  4. Javabase万年历
  5. linux进行校时ntp,Linux下快速搭建ntp时间同步服务器
  6. ssh 关系维护 inverse
  7. Oracle 的常用数据类型
  8. php 发验证码,php发送短信验证码
  9. python 实现ip分配_Python实现根据IP地址和子网掩码算出网段的方法
  10. 怎样避免“中国味”英语