1:构建数据

"""
pivot_table() 的特点就是默认显示指定索引列和所有数值列。
索引显示的是唯一值,所以会把对应的数值处理成均值。
其他str类型的列都会自动忽略。\n当然,使用pivot_table() 时,
可以通过添加参数进行计数或求和\n\n示例中账号是int类型,
如果是str类型,那么运行结果不会显示[‘账号’]这一列的内容。
"""import numpy as np
import pandas as pd
df = pd.DataFrame({'账号':[714466,714466,714466,737550,146832,218895,218895,412290,740150,141962,163416,239344,239344,307599,688981,729833,729833],'客户名称':['华山派股份有限公司','华山派股份有限公司','华山派股份有限公司','丐帮(北京) 合伙人公司','恶人谷资产管理公司','桃花岛','桃花岛','有间客栈','逍遥子影业','白驼山(上海)影视艺术有限公司','聚贤庄','全真教药业','全真教药业','天地会快递','福寿堂','快手三教育培训有限公司','快手三教育培训有限公司'],'销售':['令狐冲','令狐冲','令狐冲','令狐冲','江小鱼','江小鱼','江小鱼','段誉','段誉','欧阳克','欧阳克','欧阳克','欧阳克','韦小宝','韦小宝','韦小宝','韦小宝'],'销售总监':['岳不群','岳不群','岳不群','岳不群','岳不群','岳不群','岳不群','岳不群','岳不群','完颜洪烈','完颜洪烈','完颜洪烈','完颜洪烈','完颜洪烈','完颜洪烈','完颜洪烈','完颜洪烈'],'产品':['黑玉断续膏','葵花宝典','含笑半步癫','黑玉断续膏','黑玉断续膏','黑玉断续膏','葵花宝典','含笑半步癫','黑玉断续膏','黑玉断续膏','黑玉断续膏','含笑半步癫','葵花宝典','含笑半步癫','黑玉断续膏','黑玉断续膏','如意勾'],'数量':[1,2,1,3,1,3,1,2,4,2,2,1,3,5,2,3,1],'价格':[3000,2000,1000,3000,1000,3000,1000,2000,4000,2000,2000,1000,2000,3000,1000,4000,2000],'状态':['流程中','流程中','待审批','驳回','已完成','流程中','流程中','待审批','驳回','已完成','流程中','待审批','待审批','已完成','已完成','驳回','流程中'],})

数值类型的字段只有:账号,数量,价格。

2:index 指定单索引\n索引变成了[客户名称]这一列,values显示的只有数字,而且都处理成均值。

比如:华山三个,数量4/3,价格6000/3,账号就不用说了,三个都一样,均值自然就是其中一个;快手两个,数量4/2,价格6000/2

df1 = pd.pivot_table(df, index=['客户名称'])

3:指定多索引   索引顺序能决定不同的视觉体验,虽然结果是一致的。

df2 = pd.pivot_table(df, index=['销售总监', '销售', '客户名称'])df3 = pd.pivot_table(df, index=[ '销售', '客户名称','销售总监'])

3:values

如果不需要显示全部的数值列,可以用Values参数指定

# 显然Values不能随便指定,pivot_table()只能显示数值列
print(pd.pivot_table(df, index=['客户名称'], values=['状态']))

4:aggfunc

当我们未设置aggfunc时,它默认aggfunc='mean’计算均值。其它如下

df4 = pd.pivot_table(df, index=['销售总监','销售','客户名称'],values=['数量','价格'],aggfunc=np.sum)
df5 = pd.pivot_table(df, index=['销售总监','销售','客户名称'],values=['数量','价格'],aggfunc=[np.mean,len,np.sum])

5:columns

fill_value

columns参数就是用来显示字符型数据的,和fill_value搭配使用

补充:当 values,aggfunc,columns 的取值只有一个时,有无中括号效果略有不同。

df6 = pd.pivot_table(df, index=['销售总监'], values=['价格'],aggfunc=[np.sum],columns=['产品'],fill_value=0)

6:更加复杂的有:

df7 = pd.pivot_table(df,index=['销售总监','状态'], values=['数量','价格'], columns=['产品'],aggfunc={'数量':len,'价格':np.sum},fill_value=0,margins=True)

数据透视表——pivot_table学习(特征工程)相关推荐

  1. 用python做透视表_python制作数据透视表pivot_table方法详解

    数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等.所进行的计算与数据跟数据透视表中的排列有关. 之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照 ...

  2. Python数据分析——Pandas基础:dt.datetime与pivot_table()数据透视表

    系列文章目录 Chapter 1:创建与探索DF.排序.子集化:Python数据分析--Pandas基础入门+代码(一) Chapter 2:聚合函数,groupby,统计分析:Python数据分析- ...

  3. 【DS with Python】DataFrame的合并、分组聚合与数据透视表

    文章目录 前言 一.DataFrame的合并 1.1 按列名合并 (pd.merge()) 1.2 相同列添加行数 (pd.concat()功能) 二.应用 (.apply()功能) 三.分组 (.g ...

  4. 实战 SQL:销售数据的小计/合计/总计以及数据透视表

    文章目录 小计.合计与总计 多维度交叉统计 自定义统计维度 数据透视表 总结 学习过 SQL 的人都知道,使用聚合函数(AVG.SUM.COUNT.MIN/MAX 等)和分组操作(GROUP BY)可 ...

  5. Excel 数据透视表小技巧之 02 如何统计唯一值数量 (教程含数据和解决方案)

    实战问题 如何统计唯一值数量 ABC 123 ABC 123 ABC 123 DEF 456 DEF 567 DEF 456 DEF 456 这似乎是一个简单的数据透视表来学习.我想为我分组的特定值计 ...

  6. 学习SQL:SQL Server数据透视表

    In the previous few articles in this series, we've set the foundations on how to create a report. We ...

  7. 对比Excel,学习pandas数据透视表

    Excel中做数据透视表 ① 选中整个数据源: ② 依次点击"插入"-"数据透视表" ③ 选择在Excel中的哪个位置,插入数据透视表 ④ 然后根据实际需求,从 ...

  8. Excel数据透视表只能求和运算?快来学习求差运算小技巧

    点赞再看,养成习惯:天下兴亡,匹夫有责. 微信搜索[亦心Excel]关注这个不一样的自媒体人. 本文 GitHub https://github.com/hugogoos/Excel 已收录,包含Ex ...

  9. Pandas实现(pivot_table函数)数据透视表

    使用pandas中的pivot_table()实现数据透视表.语法格式如下: pd.pivot_table(data,values=None,index=None,columns=None,aggfu ...

最新文章

  1. 四个Webix实例:生成多种类型的JavaScript列表
  2. 推荐:周志华《机器学习》西瓜书精炼版笔记来了!
  3. 如何在ChemDraw中打出符号π
  4. python中的深拷贝与浅拷贝
  5. 12306能删候补订单记录_12306候补购票功能在哪里怎么用 火车票候补购票使用攻略...
  6. 如何把Eclipse工程导入到Android Studio
  7. linux多cpu运行python脚本,linux系统使用python获取cpu信息脚本分享
  8. LeetCode2. 两数相加
  9. 《淘宝网开店 拍摄 修图 设计 装修 实战150招》一一2.8  黄金分割的三分法构图...
  10. python shelve模块_python中的Shelve模块不工作:“无法确定db type”
  11. 神经网络与机器学习笔记
  12. ST-LINK官方驱动下载方法
  13. PHP TCPDF导出订单合同并且每页加一个印章
  14. 模拟人生畅玩版正在连接至服务器,模拟人生™:畅玩版无法连接服务器如何解决...
  15. Protell99中的铺铜设置
  16. Apache Shiro 1.2.4 反序列化漏洞(CVE-2016-4437 )
  17. 从0使用keil5软件仿真调试GD32F305
  18. Opencv 笔记5 边缘处理-canny、sobel、Laplacian、Prewitt
  19. 2021年全球及中国集成电路销售及趋势分析
  20. PHP中奇葩的 ?:,??,isset,empty

热门文章

  1. 关于色彩管理的若干个问题
  2. 常用设计模式的正确应用
  3. 数学公式(1) - 分段函数
  4. 《读书笔记》C#/.Net 的托管堆和垃圾回收
  5. 2019年北京画室排名前十位(考央美比较好的画)
  6. mysql忘记账号密码忘记了_mysql忘记帐号密码 解决办法。
  7. 我说2w字可以入门ES,非但不信还打我
  8. 送书 | 博士学位真的那么重要吗?上交大博士亲述科研心路,获4万高赞,网友:这是知乎最好的回答...
  9. SOFM自组织特征映射第一步:选取样本点
  10. python中的linq - asq