Python 零基础入门数据分析实战之小费数据集应用
一、数据来源
本节选用的是 Python 的第三方库 seaborn 自带的数据集,该小费数据集为餐饮行业收集的数据,其中 total_bill 为消费总金额、tip 为小费金额、sex 为顾客性别、smoker 为顾客是否吸烟、day 为消费的星期、time 为聚餐的时间段、size 为聚餐人数。
import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns #导入seaborn库
tips=sns.load_dataset('tips') #seaborn库自带的数据集
tips.head()
二、问题探索二、问题探索
- 小费金额与消费总金额是否存在相关性?
- 性别、是否吸烟、星期几、聚餐人数和小费金额是否有一定的关联?
- 小费金额占小费总金额的百分比是否服从正态分布?
三、数据清洗
tips.shape #数据集的维度
(244,7)
共有 244 条数据,7 列。
tips.describe() #描述统计
描述统计结果如上所示。
tips.info() #查看缺失值信息
此例无缺失值。
四、数据探索
tips.plot(kind='scatter',x='total_bill',y='tip') #绘制散点图
由图可看出,小费金额与消费总金额存在正相关性。
import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns #导入seaborn库
tips=sns.load_dataset('tips')#seaborn库自带的数据集
tips.head()
3.0896178343949052
female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消费金额female_tip
2.833448275862069
s = Series([male_tip,female_tip],index=['male','female'])
s
male 3.089618
female 2.833448
dtype: float64
s.plot(kind='bar') #男女平均小费柱状图
由图可看出,女性小费金额小于男性小费金额。
sun_tip = tips[tips['day'] == 'Sun']['tip'].mean()
sat_tip = tips[tips['day'] == 'Sat']['tip'].mean()
thur_tip = tips[tips['day'] == 'Thur']['tip'].mean()
fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各个日期的平均小费值
s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun'])
s
s.plot(kind='bar') #日期平均小费柱状图
由图可看出,周六、周日的小费比周四、周五的小费高。
tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip'])
tips.head(10) #小费所占百分比
tips['percent_tip'].hist(bins=50)#小费百分比直方图
由图可看出,小费金额占小费总金额的百分比基本服从正态分布。
Python 零基础入门数据分析实战之小费数据集应用相关推荐
- Python 零基础入门到实战(一)笔记:内置对象、浅拷贝、深拷贝、计算圆面积、凯撒密码、英文大小写转换、输入国家打印出国家名和首都、输入数字英文输出、统计句子中的字母数量、猜随机数
Python入门到实战(一) 为什么写这篇文章 Part 1 入门部分 什么是编程语言? Python的优势 目前应用 特点 Part 2 6种内置对象 1 整数.浮点数 2 字符串 3 列表 4 元 ...
- python零基础入门教程(非常详细),从零基础入门到精通,看完这一篇就够了
前言 本文罗列了了python零基础入门到精通的详细教程,内容均以知识目录的形式展开. 第一章:python基础之markdown Typora软件下载 Typora基本使用 Typora补充说明 编 ...
- Python零基础入门教程( 快速入门)
前言 学无止境,无止境学. 今天要给大家分享的是<Python零基础入门教程01 快速入门>,这是一个系列的教程,从零基础到项目实战.在本教程中,我会给大家介绍Python入门的一些基础知 ...
- Python入门必备,Python零基础入门
近几年来,Python发展势头强劲,越来越多的公司加大了对Python开发人才的招聘.很多人都看好Python的发展,纷纷前来学习Python. 目前Python应用范围还是挺多的,从Web.爬虫.数 ...
- 阿里云天池学习赛-零基础入门数据分析-学术前沿趋势分析(task1)
阿里云天池学习赛零基础入门数据分析-学术前沿趋势分析 前言 一.赛题描述及数据说明 1:数据集的格式如下: 2:数据集格式举例: 二.task1论文数量统计(数据统计任务):统计2019年全年,计算机 ...
- 视频教程-Python零基础入门教程-Python
Python零基础入门教程 从2012年从事互联网至今有7年软件编程经验,曾任职国内北京互联网公司,中南林业大学授课Python 现任逻辑教育Python课程负责人,精通Python语言,精通人工智能 ...
- 视频教程-Python零基础入门高薪必看动画课程-Python
Python零基础入门高薪必看动画课程 从事多年的Web应用开发,拥有10余年一线开发经验和教学经验.曾在中国银行从事数据采集服务,现专注于Python教学相关工作.参与过O2O外卖平台系统.微信商城 ...
- python零基础入门教程视频下载-Python零基础入门学习视频教程全42集,资源教程下载...
课程名称 Python零基础入门学习视频教程全42集,资源教程下载 课程目录 001我和Python的第一次亲密接触 002用Python设计第一个游戏 003小插曲之变量和字符串 004改进我们的小 ...
- python基础教程视频教程百度云-Python零基础入门学习视频教程全42集百度云网盘下载...
课程简介 Python零基础入门学习视频教程全42集百度云网盘下载 课程目录 042魔法方法:算术运算 041魔法方法:构造和析构 040类和对象:一些相关的BIF 039类和对象拾遗 038类和对象 ...
最新文章
- 想轻松入门Python编程,这10个经典案例你还不知道嘛?
- Linux从入门到精通系列之SHELL编程awk语法结构及案例解析
- IT人员健康信号之舌苔
- svn查看登录过的账号密码
- 交公粮了:国庆在家我都逛哪些技术网站?
- 在用的虚拟服务器减少内存,降低虚拟服务器内存使用率
- LeetCode 846. 一手顺子(map)
- 华为鸿蒙操作界面,华为鸿蒙被“实锤”,操作界面曝光,为何被吐槽是换皮安卓?...
- 21南阳理工oj新生赛Round#5--这是一道防ak题
- git版本库的创建和yaf框架环境的部署
- gbdt算法_GBDT算法原理及应用
- 第一次部署海康威视DEMO的一些坑,最终运行成功
- 数据包络分析DEA有哪些指标?
- SLA服务可用性4个9是什么意思?如何保证服务的高可用性 HA(High Availability)?...
- echart2文档(简单明白)
- Processing创意编程(进阶篇)
- 举个栗子!Tableau 技巧(152):横向对比堆叠柱形图的各部分占比
- IDEA tomcat 发布时出现Error running 'Tomcat 7.0' Can't set permissions for file ***\jmxremote.access
- Linux下如何正确停止重启启动redis服务
- How to Daemonize in Linux
热门文章
- c语言添加学生信息代码,《C语言-学生信息管理系统(代码)》.doc
- 绩效管理在好企业中起着什么样的作用
- 各相机模型(针孔+鱼眼)综述
- php怎么添加背景图html,html怎么导入背景图
- 移植libibverbs到riscv架构
- 计算机专业学了快一年, 只会一点C语言,你好意思说自己是IT专业的?
- IntelliJ IDEA 代码字体大小的快捷键设置放大缩小【图文详解】
- 操作系统OS - 重装Windows7卡在completing installation
- 为什么合约权限放弃了, 还会 貔貅
- iNode mac版用网线上不去网的解决方法 thunderbolt