Python数据分析18——公务员工资数据分析
巴尔的摩公务员数据分析
数据准备
由于我没有找到我们国家的公务员的工资数据,只能用《从零开始学Python数据分析》这本书提供的美国的巴尔的摩的公务员的工资数据。其实,你也可以直接在网上下载,巴尔的摩公务员数据
查看数据情况
先导入相关的包了打开我们下载好的数据集。
import pandas as pd
import numpy as np
%matplotlib inline
data = pd.read_csv(open('Baltimore.csv'))
data.head()
下面,我来查看数据集与什么数据。
data.shape
还有,再看看它的空数据有多少个。
由于我们的数据集比多多数据,可以忽略272个空想,直接去掉就好了。
data = data.dropna()
去掉空集之后,再来看看数据。
数据清洗
我们之前就看到AnnualSalary和GrossPay两项四有美元符号’ $ '的,所以我们先去掉它。
data['AnnualSalary'] = data['AnnualSalary'].str.strip('$')
data['GrossPay'] = data['GrossPay'].str.strip('$')
data.head()
然后,我们再把两项数据转换为浮点型。
data['AnnualSalary'] = data['AnnualSalary'].astype(float)
data['GrossPay'] = data['GrossPay'].astype(float)
接下来,我们处理日期数据。我们新建一列入职月份的数据,用于后年的分析。
data['month'] = data['HireDate'].str.split('/').str[0]
data[['HireDate', 'month']].head()
探索数据
首先,我们用直方图来看看公务员们的年薪的分布情况。
然后,我们利用刚才新建的入职月份的列,利用横向柱状图查看哪个月份的入职人数最多。
接下来,我们利用聚合运算,来看看各职位的平均年薪和职位个数。
agg_salary = data.groupby('JobTitle')['AnnualSalary'].agg(['mean', 'count'])
agg_salary.head()
查看最高年薪的五个职位。
最后,我们看看最多人数的职位。
Python数据分析18——公务员工资数据分析相关推荐
- 基于Python实现的微信好友数据分析——抓取好友性别、位置、头像签名
最近微信迎来了一次重要的更新,允许用户对"发现"页面进行定制.不知道从什么时候开始,微信朋友圈变得越来越复杂,当越来越多的人选择"仅展示最近三天的朋友圈",大概 ...
- Python 分析近2000条“数据分析”相关岗位招聘信息
文章目录 准备阶段 数据获取 数据清洗 数据可视化 (1)岗位名称 (2)工作地点 (3)公司所属行业 (4)工作经验要求 (5)公司规模情况 (7)学历要求 (8)公司类型 (9)招收人数 (10) ...
- (附源码)Python云顶之弈数据分析系统 毕业设计451545
目 录 摘要 1 1 绪论 1 1.1研究背景 1 1.2开发意义 1 1.3系统开发技术的特色 1 1.4论文结构与章节安排 1 2 基于Python云顶之弈数据分析系统系统分析 3 2.1 可行性 ...
- 【Python作业】对股票数据分析处理
文章目录 一.前言 二. 题目要求 三. 原数据 三.代码示例 四.结果 一.前言 上午写了一个版本,将简单问题复杂化了,本题主要考的是 文件操作及常见数据类型的处理 ,惭愧学了几个月基础还是很差,想 ...
- python计算汽车的平均油耗_用python对汽车油耗进行数据分析(anaconda python3.6完全跑通)...
原标题:用python对汽车油耗进行数据分析(anaconda python3.6完全跑通) 编者按:前两天我们微信发了一篇文章<用python对汽车油耗进行数据分析 >,有一网友学习后用 ...
- python网页爬虫+简单的数据分析
python网页爬虫+简单的数据分析 文章目录 python网页爬虫+简单的数据分析 一.数据爬取 二.数据分析 1.我们今天爬取的目标网站是:http://pm25.in/ 2.需要爬取的目标数据是 ...
- python爬大学生就业数据_小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...
一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...
- 小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...
一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...
- Python大作业——爬虫+可视化+数据分析+数据库(爬虫篇)
相关链接 Python大作业--爬虫+可视化+数据分析+数据库(简介篇) Python大作业--爬虫+可视化+数据分析+数据库(可视化篇) Python大作业--爬虫+可视化+数据分析+数据库(数据分 ...
最新文章
- 电子科大博士生杨超火了!2年实现Science+Nature一作双杀
- java jtable逐行遍历_Java获取JTable值(每行)
- 中秋祝福网页制作_10大中秋H5模板分享,助力吸粉10000+
- XenDesktop 5.5 – HDX RealTime TCP UDP Audio演示
- Java支持IPv6研究
- 在Zuul中设置服务访问限流
- 为何python不好找工作-学完Python,为什么还找不到工作?现实很残酷!
- 懒人的小技巧, 批处理修改IP
- Drupal的taxonomy_manager模块合并分类的方法
- 犀牛3D造型软件Rhino 7 for Mac
- 初识B/S结构编程技术
- cssci核心期刊(cssci核心期刊目录)
- 二叉树遍历算法C++实现
- Oracle备份恢复之闪回技术
- android fastboot 刷机教程,已进入fastboot怎么刷机教程
- 【Java算法学习】鸡兔同笼问题
- Infomages: Embedding Data into Thematic Images
- ActiveMQ中Consumer特性详解与优化
- 调用tel://打电话
- Panasonic Lumix GH5: Tips, Tricks, and Techniques 松下Lumix GH5使用技巧 Lynda课程中文字幕
热门文章
- 银河麒麟V10-SP2服务器操作系统安装vnc
- 大头报文_20种具有创意的“大头”照片操作
- 【GitHub】Failed to connect to github.com port 443 的一种解决方案
- 应用提交 App Store 上架被拒的原因都有哪些?
- MySQL数据库的练习(数据库的创建,使用,查看,查看表格,初始化数据库)
- 趣来宝机器人_王嘉尔上演真人版智能机器人舞台帅炸,但都不及他的说话艺术炸...
- C# System.Windows.Forms.Application.DoEvents()
- centos 挂载磁盘并做磁盘加密
- Android手机App安全漏洞
- 华大HC32F460 DCU实验