最近发现gruopby这个有点意思,具体如下:

-groupby.head() 是个dataframe-

首先随便地构造了一个dataframe

import pandas as pd
import numpy as np
df = pd.DataFrame({"group":["a","b","c","c","a","a"],"score1":np.random.randn(6),"score2":np.random.randn(6)})
df

我们知道如果想要print groupby结构的数据结果是这样的

有个方法算是可以检视(算吧)groupby结构,就是groupby.head(),这个操作相当于让groupby结构每组抽样相同数量的data组成一个dataframe.

print ("groupby 后,每组只抽样一个")
print("-"*30)
print (df.groupby("group").head(1),"\n")print ("groupby 后,每组只抽样两个(因为group b只有一个所以只抽了一个)")
print("-"*30)
print (df.groupby("group").head(2),"\n")

-groupby.apply() 是个先分组然后对每个单独的组进行apply函数的操作-

after_group = df.groupby("group").head(2)
count_se =pd.Series(len(after_group),index = after_group.index).to_frame("counting _group")
print (count_se)def counting(df):return pd.Series(len(df),index = df.index).to_frame("counting _group")
print (df.groupby("group").apply(lambda x: counting(x.head(2))))


因为这里是groupby结构,而apply 对groupby就是会先分好组再逐个组地进行操作,所以上面两个操作的结果截然不同。
上面的是整个df.groupby("group").head(2) 的长度,下面return的是df.groupby("group").head(2)分好组后,各个组的长度。

-groupby还有一个骚操作,算是可以完整地检视groupby-

最后分享一个我觉得讲的还挺不错的讲groupby的帖子

欢迎讨论

「Python」浅说pandas.groupby.apply相关推荐

  1. 「Python」python调用单个C++文件生成的动态库(.so)Part I

    环境说明 系统:Ubuntu 18.04 python:python 2.7.17 额外环境 上面的环境是普通测试,但是最终标题中的任务我需要在docker中执行,很多块内容我也不太懂,所以一步一步测 ...

  2. python做地图导航_「Python」利用高德地图做你想做之事

    玩grasshopper基本上都知道OpenStreetMap 这个地图网站,毕竟有一个好用的地图插件,可以在Rhino中绘制出所需,但是一个不好的地方就在于国内的数据量太少,无法满足我们的需求. 此 ...

  3. python 文件读写 newline_「Python」:文件读写

    原标题:「Python」:文件读写 ##############txt文件读写################## # txt文件:记事本文件,一般用来存储测试日志 # 方式1: 不推荐,每次读写结束 ...

  4. C站英豪榜第一期之「Python」有奖征文

    请到活动页进行投稿,非本界面哦! 各位Python小主们,专属于你们的技术征文来啦,奖品超超超丰富! C站技术征文系列第一期将以「Python」为主题,邀请所有的Python技术开发者参与投稿. 请你 ...

  5. 小学生的计算题自动生成小程序「python」

    小学生的计算题自动生成小程序「python」 #!/usr/bin/python # -*- coding: UTF-8 -*- #liuqiping fred from docx import Do ...

  6. 「Python」socket指南

    开始 网络中的 Socket 和 Socket API 是用来跨网络的消息传送的,它提供了 进程间通信(IPC) 的一种形式.网络可以是逻辑的.本地的电脑网络,或者是可以物理连接到外网的网络,并且可以 ...

  7. python的pandas包使用教程_「Python」pandas入门教程

    pandas适合于许多不同类型的数据,包括: 具有异构类型列的表格数据,例如SQL表格或Excel数据 有序和无序(不一定是固定频率)时间序列数据. 具有行列标签的任意矩阵数据(均匀类型或不同类型) ...

  8. 「Python」pandas入门教程

    pandas适合于许多不同类型的数据,包括: 具有异构类型列的表格数据,例如SQL表格或Excel数据 有序和无序(不一定是固定频率)时间序列数据. 具有行列标签的任意矩阵数据(均匀类型或不同类型) ...

  9. python 绘制柱状图-「Python」python绘制图表

    介绍一种简单而又功能强大的绘制图形或报表的包-pyecharts,一个基于Echarts(基于JS的数据可视化库)的图标类库,除了绘制常见的折线图.柱状图.饼图.箱型图和散点图外,还可以绘制3D柱状图 ...

最新文章

  1. 简介SharePoint 2010 14 Hive文件夹
  2. linux隐藏文件的方法,Linux下隐藏文件的操作方法
  3. python的实现和测试是啥意思_Python接口自动化测试之pytest与unittest区别
  4. Stanford机器学习笔记-5.神经网络Neural Networks (part two)
  5. 25个实用编程小技巧
  6. 存储器芯片巨头动态观察:三星、美光、SK海力士都在做什么?
  7. 如何优雅的绘制一棵省市区三级可选择的树?
  8. 桌面虚拟化之用户行为审计
  9. vue的生命周期和钩子函数的理解
  10. H5的本地保存localStorage、sessionStorage用法总结
  11. python中用于绘制各种图形的区域称作_Python--matplotlib绘图可视化知识点整理(示例代码)...
  12. hua图软件 mac_细数Mac上那些好用且免费的软件(四)
  13. 使用 SignalR 实现推送功能
  14. excel做ns流程图_如何制作传统流程图和NS流程图教程详解.ppt
  15. 智能电视 无服务器,服务器之家教你修改DNS,让电视、网络机顶盒告别卡顿
  16. 最完美的“婚”鞋? NMD_R2“囍”(台灣愛迪達)
  17. 2112731-95-8,N-(Azido-PEG3)-N-Boc-PEG4-acid与炔丙基、BCN或DBCO试剂进行点击化学反应
  18. 基于JavaWeb的文明城市宣传系统
  19. 从GIS地图生成生成建筑模型
  20. 苹果手机能有软件测试硬件是否给更换过,爱思助手等第三方软件检测靠谱吗?果粉必须了解!...

热门文章

  1. 申请软件著作权申请需要那些材料?
  2. hj118888.com162287l9999提出的mysql索引问题
  3. 良匠-手把手教你写NFT抢购软(四)
  4. Windows应用程序如何调用驱动:打印机举例
  5. vps实时流量监控linux,Linux流量监控工具/vps流量监控工具 – iftop
  6. Dev-C++使用to_string()函数报错“[Error] ‘to_string‘ was not declared in this scope”原因及解决方案
  7. 中南大学计算机网课网址,中南大学计算机网课复习要点.doc
  8. c语言 初始化数组,C 数组的初始化方法详解
  9. 2020京东618叠蛋糕脚本,亲测可以用
  10. php brotobuf,用Golang构建gRPC服务