四大会计师事务所python数据分析_利用Python进行数据分析(附详细案例)
一、前期准备
分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。
#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd
二、基础知识
2.1 一维数据分析:NumPy
2.2 一维数据结构:Pandas
2.3 二维数据分析:numpy对应array
2.4 二维数据分析:pandas对应数据框DateFrame
此处遇到一个问题:读取Excel文件报错。
解决方法:
1 查看Excel文件存放路径
具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
2 将上面标红的两处合成文件的路径,
格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb
3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\\)
最后的路径为F:\\ann\\Untitled1.ipynb
三、Python具体案例分析:药店销售数据
3.1 提出问题
分析指标:月均消费次数
月均消费金额
客单件
消费趋势
3.2 理解数据
3.3 清洗数据
3.3.1 选择子集
3.3.2 列名重命名
3.3.3 缺失数据处理(dropna()函数)
Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。Python内置的None值;
pandas中,将缺失值表示 为NA,表示不可用not available;
对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;
None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
3.3.4 数据类型转换
3.3.5 数据排序
3.3.6 异常值处理
3.4 构建模型
3.4.1 指标1:月均消费次数=总消费次数/月份数
3.4.2 指标2:月均消费金额=总消费金额/月份数
3.4.3 指标3:客单价=总消费金额/总消费次数
客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
3.4.3 消费趋势
End.
四大会计师事务所python数据分析_利用Python进行数据分析(附详细案例)相关推荐
- 利用python进行数据分析_利用python进行数据分析复现(1)
一直以来,都想学习python数据分析相关的知识,总是拖拖拉拉,包括这次这个分享也是.<利用python进行数据分析 第2版>是一次无意之间在简书上看到的一个分享,我决定将很详细.一直都 ...
- 用python进行股票数据分析_利用python进行股票数据分析
个人觉得这问题问的不太对,说句不好的话,你是来搞编程的还是做股票的. 当然,如果题主只是用来搜集资料,看数据的话那还是可以操作一波的,至于python要怎么入门,个人下面会推荐一些入门级的书籍,通过这 ...
- python怎么做面板数据分析_利用python进行数据分析之准备(一)
原标题:利用python进行数据分析之准备(一) 欢迎关注天善智能微信公众号,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区. 对商业智能BI.大数据分析挖掘.机器学习,python,R等数 ...
- excel python插件_利用 Python 插件 xlwings 读写 Excel
Python 通过 xlwings 读取 Excel 数据 去年底公司让我做设备管理,多次委婉拒绝,最终还是做了.其实我比较喜欢技术.做管理后发现现场没有停机率统计,而原始数据有,每次要自己在Exce ...
- 利用python发送邮件_利用python实现简单的邮件发送客户端示例
脚本过于简单,供学习和参考.主要了解一下smtplib库的使用和超时机制的实现.使用signal.alarm实现超时机制. #!/usr/bin/env python # -*- coding: ut ...
- 动态照片墙 python 实现_利用python生成照片墙的示例代码
这篇文章主要介绍了利用python生成照片墙的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 PIL(Python Im ...
- python推荐_利用Python构建一个简单的推荐系统
原标题:利用Python构建一个简单的推荐系统 摘要:快利用python构建一个属于你自己的推荐系统吧,手把手教学,够简单够酷炫.在此之前读者需要对pandas和numpy等数据分析包有所了解. 什么 ...
- ppt python 图表_利用python分析weibo数据做成图表放入PPT中
起因 很久以前,就有个想法,就是自动分析微博的数据,但是之前一直想的是网页版展示,flask想学了好久都没学,偶然的一次看到了一篇关于python处理pptx的文章,再加上同窗三年的室友在毕业后竟然主 ...
- python 认证机构_利用Python爬了SIG官网BQB认证公司清单,我有一些重大发现..
关注"无线技术联盟"提供有价值的物联网市场信息和最新的技术分析 利用Python爬取了蓝牙联盟上近一年BQB认证公司的清单,把爬到的有价值的东西写出来分享给大家. 1 蓝牙认证 产 ...
- python 离散化_利用Python将数值型特征进行离散化操作的方法
利用Python将数值型特征进行离散化操作的方法 如下所示: data = np.random.randn(20) factor = pd.cut(data,4) pd.get_dummies(fac ...
最新文章
- 活久见!谷歌开源“大杀器”,CV、NLP都能用!
- 【贪心】【codeforces】651A Joysticks
- 黄聪:PHP网站流量统计开源程序大全
- 太阳能板清洗机器人科沃斯_科沃斯推出水清洗扫地机器人 要把打扫做的更彻底...
- html div 子元素 过多 卡顿,CSS不定高元素transition动画的解决方案
- 5.6m元多项式的表示
- 每天进步一点点《PCA的简要学习》
- lisp抛物线插值_抛物线插值法
- CentOS 7 使用yum安装出现错误
- 【Linux】【Shell】【Basic】函数
- 一、Netflix Eureka
- openwrt mt7620a添加wifi指示灯(wled)的方法
- Android 启动过程介绍
- yolo数据集剪裁:切割目标框并将该框内的其他目标一并提取并转为可用数据集
- 获取当前日期的上一个月和后三个月。
- STM32F429 21. LTDC 液晶屏幕
- Boost串口通信 boost::asio::serial_port基本使用
- LoadRunner技巧之IP欺骗
- 数据分析,怎么做才能有前瞻性?
- c++算法——枚举法
热门文章
- 冒烟的意思_冒烟-冒烟的意思,拼音及解释
- 2021年陕西省安全员B证考试题及陕西省安全员B证报名考试
- 树结构解析及python实现
- vncviewer使用教程,6步掌握vncviewer的使用教程
- 0113连接wifi日记
- RadioButton 单选
- 像素和厘米怎么换算_临帖要像?计算机“算法”精确你的每一个像素!惊呆书法圈...
- Mux-vlan (产生背景、mux-vlan的特点、mux-vlan基本配置)
- 细思恐极,插上U盘就开始执行Python代码
- 22考研西安交大915编程题