一、前期准备

分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。

#导入numpy包

import numpy as np

#导入pandas包

import pandas as pd

二、基础知识

2.1 一维数据分析:NumPy

2.2 一维数据结构:Pandas

2.3 二维数据分析:numpy对应array

2.4 二维数据分析:pandas对应数据框DateFrame

此处遇到一个问题:读取Excel文件报错。

解决方法:

1 查看Excel文件存放路径

具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。

2 将上面标红的两处合成文件的路径,

格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb

3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\\)

最后的路径为F:\\ann\\Untitled1.ipynb

三、Python具体案例分析:药店销售数据

3.1 提出问题

分析指标:月均消费次数

月均消费金额

客单件

消费趋势

3.2 理解数据

3.3 清洗数据

3.3.1 选择子集

3.3.2 列名重命名

3.3.3 缺失数据处理(dropna()函数)

Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。Python内置的None值;

pandas中,将缺失值表示 为NA,表示不可用not available;

对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;

None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。

3.3.4 数据类型转换

3.3.5 数据排序

3.3.6 异常值处理

3.4 构建模型

3.4.1 指标1:月均消费次数=总消费次数/月份数

3.4.2 指标2:月均消费金额=总消费金额/月份数

3.4.3 指标3:客单价=总消费金额/总消费次数

客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。

3.4.3 消费趋势

End.

四大会计师事务所python数据分析_利用Python进行数据分析(附详细案例)相关推荐

  1. 利用python进行数据分析_利用python进行数据分析复现(1)

    一直以来,都想学习python数据分析相关的知识,总是拖拖拉拉,包括这次这个分享也是.<利用python进行数据分析 第2版>是一次无意之间在简书上看到的一个分享,我决定将很详细.一直都 ...

  2. 用python进行股票数据分析_利用python进行股票数据分析

    个人觉得这问题问的不太对,说句不好的话,你是来搞编程的还是做股票的. 当然,如果题主只是用来搜集资料,看数据的话那还是可以操作一波的,至于python要怎么入门,个人下面会推荐一些入门级的书籍,通过这 ...

  3. python怎么做面板数据分析_利用python进行数据分析之准备(一)

    原标题:利用python进行数据分析之准备(一) 欢迎关注天善智能微信公众号,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区. 对商业智能BI.大数据分析挖掘.机器学习,python,R等数 ...

  4. excel python插件_利用 Python 插件 xlwings 读写 Excel

    Python 通过 xlwings 读取 Excel 数据 去年底公司让我做设备管理,多次委婉拒绝,最终还是做了.其实我比较喜欢技术.做管理后发现现场没有停机率统计,而原始数据有,每次要自己在Exce ...

  5. 利用python发送邮件_利用python实现简单的邮件发送客户端示例

    脚本过于简单,供学习和参考.主要了解一下smtplib库的使用和超时机制的实现.使用signal.alarm实现超时机制. #!/usr/bin/env python # -*- coding: ut ...

  6. 动态照片墙 python 实现_利用python生成照片墙的示例代码

    这篇文章主要介绍了利用python生成照片墙的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 PIL(Python Im ...

  7. python推荐_利用Python构建一个简单的推荐系统

    原标题:利用Python构建一个简单的推荐系统 摘要:快利用python构建一个属于你自己的推荐系统吧,手把手教学,够简单够酷炫.在此之前读者需要对pandas和numpy等数据分析包有所了解. 什么 ...

  8. ppt python 图表_利用python分析weibo数据做成图表放入PPT中

    起因 很久以前,就有个想法,就是自动分析微博的数据,但是之前一直想的是网页版展示,flask想学了好久都没学,偶然的一次看到了一篇关于python处理pptx的文章,再加上同窗三年的室友在毕业后竟然主 ...

  9. python 认证机构_利用Python爬了SIG官网BQB认证公司清单,我有一些重大发现..

    关注"无线技术联盟"提供有价值的物联网市场信息和最新的技术分析 利用Python爬取了蓝牙联盟上近一年BQB认证公司的清单,把爬到的有价值的东西写出来分享给大家. 1 蓝牙认证 产 ...

  10. python 离散化_利用Python将数值型特征进行离散化操作的方法

    利用Python将数值型特征进行离散化操作的方法 如下所示: data = np.random.randn(20) factor = pd.cut(data,4) pd.get_dummies(fac ...

最新文章

  1. 活久见!谷歌开源“大杀器”,CV、NLP都能用!
  2. 【贪心】【codeforces】651A Joysticks
  3. 黄聪:PHP网站流量统计开源程序大全
  4. 太阳能板清洗机器人科沃斯_科沃斯推出水清洗扫地机器人 要把打扫做的更彻底...
  5. html div 子元素 过多 卡顿,CSS不定高元素transition动画的解决方案
  6. 5.6m元多项式的表示
  7. 每天进步一点点《PCA的简要学习》
  8. lisp抛物线插值_抛物线插值法
  9. CentOS 7 使用yum安装出现错误
  10. 【Linux】【Shell】【Basic】函数
  11. 一、Netflix Eureka
  12. openwrt mt7620a添加wifi指示灯(wled)的方法
  13. Android 启动过程介绍
  14. yolo数据集剪裁:切割目标框并将该框内的其他目标一并提取并转为可用数据集
  15. 获取当前日期的上一个月和后三个月。
  16. STM32F429 21. LTDC 液晶屏幕
  17. Boost串口通信 boost::asio::serial_port基本使用
  18. LoadRunner技巧之IP欺骗
  19. 数据分析,怎么做才能有前瞻性?
  20. c++算法——枚举法

热门文章

  1. 冒烟的意思_冒烟-冒烟的意思,拼音及解释
  2. 2021年陕西省安全员B证考试题及陕西省安全员B证报名考试
  3. 树结构解析及python实现
  4. vncviewer使用教程,6步掌握vncviewer的使用教程
  5. 0113连接wifi日记
  6. RadioButton 单选
  7. 像素和厘米怎么换算_临帖要像?计算机“算法”精确你的每一个像素!惊呆书法圈...
  8. Mux-vlan (产生背景、mux-vlan的特点、mux-vlan基本配置)
  9. 细思恐极,插上U盘就开始执行Python代码
  10. 22考研西安交大915编程题