python数据清洗之学习总结(五、数据清洗之数据统计)
文章目录
- 1.数据分组运算
- 2. 聚合函数使用
- 3. 分组对象与apply函数
- 4. 透视图与交叉表
- 透视图
- 交叉表用于计算分组频率
1.数据分组运算
- 使用groupby方法进行分组计算,得到分组对象GroupBy
- 语法为df.groupby(by=)
- 分组对象GroupBy可以运用描述性统计方法, 如count、mean 、 median、 max和min等
2. 聚合函数使用
- 对分组对象使用agg聚合函数
- Groupby.agg(func)
- 针对不同的变量使用不同的统计方法
3. 分组对象与apply函数
- 函数apply即可用于分组对象,也可以作用于dataframe数据
- Groupby.apply(func)
- 需要注意axis=0和axis=1的区别
4. 透视图与交叉表
透视图
pivot_table( data, index, columns,values, aggfunc, fill_value, margins, margins_name=)
index,columns 行分组键,列分组键
value 分组的字段,只能为数量型变量
aggfunc 后接聚合函数
margins 是否需要总计
margins_name 总结名称 默认为 all
交叉表用于计算分组频率
pd.crosstab(index,columns,normalize)
Index: 行索引
Columns: 列索引
Normalize: 数据对数据进行标准化,index表示行,column表示列
python数据清洗之学习总结(五、数据清洗之数据统计)相关推荐
- 【python量化交易学习】pandas获取mysql数据,使用pyecharts画K线图,ma移动均线。
将pyecharts官方提供的数据源,替换成已经存在mysql中的数据.画出专业的k线图(k线+ma移动均线+交易额柱状图(单位是千)) 参考: [python量化交易学习]pandas获取tusha ...
- 组队学习笔记Task1:论文数据统计
数据分析第一次组队学习笔记--Lizzy @Datawhale Task1:论文数据统计 学习主题:论文数量统计(数据统计任务),统计2019年全年,计算机各个方向论文数量: 学习内容:赛题理解.Pa ...
- python网络编程需要学什么,python网络编程学习笔记(五):socket的一些补充 Python 网络编程需要学习哪些网络相关的知识...
python的socket编程问题hdr = recvall(s, 5) if hdr is None: print 'Unexpected EOF receivingstruct在unpack的时候 ...
- 【python教程入门学习】五、Python中的列表(list)
列表是在Python中是一组数据的集合 如: li = ['jack','tom','jim'] 列表中的数据类型也可以不同 如: li = ['jack',123,'tom',89] 列表中也可以嵌 ...
- 【python】入门学习(五)
字符串: 正索引,从0开始 和 负索引,从-1开始 >>> s = 'apple' >>> s[0] 'a' >>> s[1] 'p' >& ...
- python连接excel存放数据_有了这篇python操作Excel学习笔记,以后储存数据 办公很轻松!...
最近在做一些数据处理和计算的工作,因为数据是以.csv格式保存的,因此刚开始直接用Excel来处理.但是做着做着发现重复的劳动其实并没有多大的意义,于是就想着写个小工具帮着处理.以前正好在一本书上看到 ...
- Python之分享常用的五款动态数据可视化工具
一.Tableau 世界知名的 BI 工具,以超强的可视化能力著称.它已经成为商业 BI 界的 TOP 选手,很多大型公司像阿里.谷歌都在使用,能快速搭建数据系统. 可以通过设置页面动画,来制作动态可 ...
- 小白入门深度学习 | 第五篇:数据不均衡的处理方法
前言:
- python怎么判断日期是星期几_python数据统计告诉你,是不是周四周五会跌的比较多...
昨天在论坛看到有网友的一个提问: 对于很多投资来说,印象中最近这几年,尤其是前面的2016~2018年,周四跌的概率是比较大的,有时候会被戏谑为"法定砸盘日". 好奇百度了一下: ...
- 数学建模学习(1):数据统计与分析之平均数,中位数,方差,标准差,极差
第一篇文章已经带大家入门matlab,如果你还没有看到,点击传送门:传送 下面开始进入数学建模内容了,一定要打好基础再看此篇以及以后的内容,步入正题. 平均数: >> A=[2 3 4 7 ...
最新文章
- spring+mybatis整合读取不了配置文件
- 数据中心太废电?为省电费阿里和微软是这么做的....
- 在Windows下基于libx264.a的Qt 4.8.2视频压缩
- 阻塞和非阻塞队列下两种生产者消费者实现
- butter滤波器是iir吗_如何快速设计应用一个IIR滤波器
- 软件测试的定义与分类
- [HDOJ]1018. Big Number
- [转载] Python 主成分分析PCA
- 谷歌的诀窍:如何取消验证码
- Snagit 2021 for mac截图工具 v2021.4.2(98044)汉化版
- 自主创新生态圈再扩大,深度科技与金格科技完成产品兼容性认证
- 十一月 Z 星月度速览 | 个性化推荐技术解读、Mivus demo 服务框架切换缘解、精选好书推荐、AI 收藏夹……...
- MySQL下载与安装教程(小白)
- MicroPython_ESP8266_IoT——第四回 初入联网(接入了贝壳物联)
- 大数除法(超长整数运算除法器)详解
- Shell双重for循环
- Vmware 虚拟机虚拟网络编译器中无法勾选连接适配器或者在自己主机中没有vmnet1和vmnet8
- Shell基础知识及字符处理
- 布丁机器人APP响应超时_布丁机器人app下载-布丁机器人官方版下载(使用方法)V6.8.1.0-3355游戏网...
- 开发小程序多少费用?