链接:https://pan.baidu.com/s/11Y2YLIfojs0IAYqs4pduNA 
提取码:pghe

1、读取Excel文件中的数据存储于变量中,并打印
提示:file=pd.read_excel(file_path,sheet_name=sheetName) 写出相关代码,并提交结果截图。

df1=pd.read_excel('./dataes/超市营业额-测试用.xlsx',sheet_name='2019-3月销售详情',header=0)df2=pd.read_excel('./dataes/超市营业额-测试用.xlsx',sheet_name='2019-4月销售详情',header=0)df3=pd.read_excel('./dataes/超市营业额-测试用.xlsx',sheet_name='员工详情',header=0)print(df1)print(df2)print(df3)


2、获取2019年3月销售详情中第3,6,9行的所有数据存储于变量temp中,并输出temp,查看结果效果

temp = df1.loc[[2,5,8]]print(temp)

3、获取2019年3月销售详情中前10行的’姓名‘、’日期‘、’柜台‘的数据,并输出

temp1 = df1.loc[:9,['姓名','日期','柜台']]print(temp1)

4、获取2019年3月销售详情中交易额高于1500元数据,输出一共含有多少条符合条件的记录,并输出结果详情

temp2 = df1[df1['交易额']>1500]
print(temp2.shape[0])
print(temp2)


5、获取2019年3月销售详情中下午班(14:00~21:00)的交易总额数据,并输出结果

temp3 = df1[df1['时段']=='14:00-21:00']
print(temp3['交易额'].sum())

6、获取2019年3月销售详情中张三下午班的交易详情,并输出

temp4 = df1[df1['姓名']=='张三']
temp5 = temp4[temp4['时段']=='14:00-21:00']
print(temp5)

7、获取2019年3月销售详情中张三和李四两人的销售总额,并输出

temp6=df1[(df1['姓名']=='张三')]
a=temp6['交易额'].sum()
temp7=df1[(df1['姓名']=='李四')]
b=temp7['交易额'].sum()
print(a+b)

8、获取2019年3月销售详情中日用品柜台销售总额,并输出

temp8 =df1[df1['柜台']=='日用品']
print(temp8['交易额'].sum())

9、获取2019年3月销售详情中交易额在800~850之间的交易记录,并输出

temp9=df1[(df1['交易额']>800) &(df1['交易额']<850)]
print(temp9)

10、获取所有销售详情中(包括3月、4月)每个员工上班次数并输出,并输出上班次数最多的员工

df4=pd.concat([df1,df2])
df5=df4['姓名'].value_counts()
print(df5)
temp10=df5.max()
print(temp10)

11、获取所有销售详情中(包括3月、4月)每个员工不同时段的交易额,并输出

temp11 = df4.groupby(['姓名','时段'])['交易额'].sum()
temp11

12、所有销售详情中(包括3月、4月)对不同的列采用不同的统计分析,对交易额统计,交易额的(总量、均值、最小值、最大值、中位数),同时对日期列也做统计,但只需要统计两个数值(最小值和最大值),其他的数据不用统计。

group = df4['交易额'].sum()
group1 = df4['交易额'].mean()
group2 = df4['交易额'].min()
group3 = df4['交易额'].max()
group4 = df4['交易额'].median()
group5 = df4['日期'].max()
group6 = df4['日期'].min()
print("交易额的总量:%.0f" %group)
print("交易额的均值:%.2f" %group1)
print("交易额的最小值:%.0f" %group2)
print("交易额的最大值:%.0f" %group3)
print("交易额的中位数:%.0f" %group4)
print(group5)
print(group6)

13、对所有销售详情中(包括3月、4月)进行分组统计,统计每个员工的交易额的(总量、均值、最小值、最大值、中位数)

group = df4.groupby(['姓名'])['交易额'].count()
group1 = df4.groupby(['姓名'])['交易额'].min()
group2 = df4.groupby(['姓名'])['交易额'].max()
group3 = df4.groupby(['姓名'])['交易额'].mean()
group4 = df4.groupby(['姓名'])['交易额'].median()
print(group)
print(group1)
print(group2)
print(group3)
print(group4)

14、查看每人每天交易总额,只需要展示5天的数据即可

df5 =  df4[df4['日期']<='2019-03-05']
group = df5.groupby(['姓名','日期'])['交易额'].sum()
group

15、按职级(员工详情sheet)统计不同职级下的交易额均值,并输出

df6 = pd.merge(df4,df3,how='left',on='姓名')
group = df6.groupby('职级')['交易额'].sum()
group


16、绘制各员工在不同柜台业绩平均值的柱状图

temp3 = df6[df6['职级']=='员工'].groupby(['姓名','柜台'])['交易额'].agg('count').unstack()
temp3.plot.bar(figsize=(10,5))

数据分析综合应用练习:超市销售额分析相关推荐

  1. 【案例教程】无人机生态环境监测、图像处理与GIS数据分析综合实践

    [查看原文]无人机生态环境监测.图像处理与GIS数据分析综合实践技术应用 构建"天空地"一体化监测体系是新形势下生态.环境.水文.农业.林业.气象等资源环境领域的重大需求,无人机生 ...

  2. 数据分析实战二:超市数据处理

    数据分析实战二:超市数据处理 大家好!我是未来村村长!就是那个"请你跟我这样做,我就跟你那样做!"的村长

  3. 无人机生态环境监测、图像处理与GIS数据分析综合实践技术应用

    构建"天空地"一体化监测体系是新形势下生态.环境.水文.农业.林业.气象等资源环境领域的重大需求,无人机生态环境监测在一体化监测体系中扮演着极其重要的角色.通过无人机航空遥感技术可 ...

  4. 无人机生态环境监测、图像处理与GIS数据分析综合应用

    构建"天空地"一体化监测体系是新形势下生态.环境.水文.农业.林业.气象等资源环境领域的重大需求,无人机生态环境监测在一体化监测体系中扮演着极其重要的角色.通过无人机航空遥感技术可 ...

  5. python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析

    项目背景 近年来,我国的环境问题比较严重,很多城市出现了雾霾天气,当然也有很多城市空气依旧清新,为了研究具体的空气环境城市分布,我们采用了假设检验以及线性回归的思想对AQI(空气质量指数)进行分析和预 ...

  6. Java学习之综合案例——水果超市商品管理系统

    案例介绍: 水果超市管理系统包括两个界面:系统欢迎界面和超市货物管理界面,在系统欢迎界面中,通过单击"进入系统"按钮,进入超市货物管理界面.在超市货物管理界面中,可以对水果信息实现 ...

  7. python数据分析综合案列--星巴克门店数据分析及可视化

    本实训针对一组关于全球星巴克门店的统计数据,分析了在不同国家和地区以及中国不同城市的星巴克门店数量. 获取数据,数据放在directory.csv 这个案例主要分为以下几个部分: 数据清洗和预处理:使 ...

  8. 信号完整性分析大作业_Matplotlib数据可视化 amp; Pandas数据分析 综合实训大作业...

    csv文件链接 链接:https://pan.baidu.com/s/1-Q9riIfwTWN1AdV2Fb0eVw 提取码:7stb 1.1设置中文以及负数的编码方式,使得其能够正常显示: # re ...

  9. python数据分析实验报告_Python数据分析综合小练习:销售数据分析

    有这样一个小小的练习题: 卖电子商品的老板,每天记录了自己卖出的U盘,电脑支架,插座,电池,音箱,鼠标,usb数据线,手机充电线等数量,客户的需求是一方面,也可以通过客户购买关联性比较强的商品进行引导 ...

最新文章

  1. TimeQuest学习之三------外部寄存器模型
  2. linux内核 semaphore,2.4内核里semaphore源码的一个疑问
  3. 算法 - 最好、最坏、平均复杂度
  4. 双向LSTM在时间序列异常值检测的应用
  5. npm nodejs包管理工具 简介
  6. jQuery1.4新特性
  7. FirewallD is not running
  8. 数组中第K个最大元素
  9. oracle死锁的解决方法
  10. linux telnet localhost 25,测试邮件系统:telnet localhost 25时的问题~
  11. python处理包_Python 包
  12. 网课时代,在线教育的新机遇在哪?
  13. Glib2之定义手册(十八)
  14. Hero传奇引擎47个疑难问题解答
  15. Bongiovi DPS for Mac(优秀的声音增强软件)
  16. SpriteKit在iOS8和OSX10.10中的新特性(强悍来袭)
  17. java 分析图片文字大小时,剔除部分异常数据,思路梳理(格拉布斯准则)
  18. mysql从入门到精通pdf百度云明日科技_PHP从入门到精通(第3版) 明日科技 中文完整pdf扫描版[42MB]_IT教程网...
  19. Flink在流处理上的Source和sink操作、Flink--sink到kafka
  20. 小马哥-----高仿苹果6s plus刷机拆机主板型号Q39主板图与开机界面图 分版本

热门文章

  1. 信息系统集成错题-IT技术
  2. 谷歌page speed 安装使用及页面问题详解
  3. PNG8和PNG24的区别
  4. JavaWeb笔记(五)后端(Thymeleaf)(Tomcat类加载机制)(编写图书管理系统)
  5. 儿科肠炎与病毒和微生物组
  6. WinMount 2008 鼠年新春版发布
  7. MySql安装过程全记录
  8. BitNami.com:做开源服务器软件的应用商店
  9. 傻瓜式php环境套装,BitNami 傻瓜式开源软件安装套件
  10. EXCEL/WPS小技巧(自动填充排序,身份证生日号码的提取)