巴尔的摩公务员数据分析

数据准备

由于我没有找到我们国家的公务员的工资数据,只能用《从零开始学Python数据分析》这本书提供的美国的巴尔的摩的公务员的工资数据。其实,你也可以直接在网上下载,巴尔的摩公务员数据

查看数据情况

先导入相关的包了打开我们下载好的数据集。

import pandas as pd
import numpy as np
%matplotlib inline
data = pd.read_csv(open('Baltimore.csv'))
data.head()

下面,我来查看数据集与什么数据。

data.shape


还有,再看看它的空数据有多少个。
由于我们的数据集比多多数据,可以忽略272个空想,直接去掉就好了。

data = data.dropna()

去掉空集之后,再来看看数据。

数据清洗

我们之前就看到AnnualSalary和GrossPay两项四有美元符号’ $ '的,所以我们先去掉它。

data['AnnualSalary'] = data['AnnualSalary'].str.strip('$')
data['GrossPay'] = data['GrossPay'].str.strip('$')
data.head()

然后,我们再把两项数据转换为浮点型。

data['AnnualSalary'] = data['AnnualSalary'].astype(float)
data['GrossPay'] = data['GrossPay'].astype(float)


接下来,我们处理日期数据。我们新建一列入职月份的数据,用于后年的分析。

data['month'] = data['HireDate'].str.split('/').str[0]
data[['HireDate', 'month']].head()

探索数据

首先,我们用直方图来看看公务员们的年薪的分布情况。


然后,我们利用刚才新建的入职月份的列,利用横向柱状图查看哪个月份的入职人数最多。

接下来,我们利用聚合运算,来看看各职位的平均年薪和职位个数。

agg_salary = data.groupby('JobTitle')['AnnualSalary'].agg(['mean', 'count'])
agg_salary.head()


查看最高年薪的五个职位。

最后,我们看看最多人数的职位。

Python数据分析18——公务员工资数据分析相关推荐

  1. 基于Python实现的微信好友数据分析——抓取好友性别、位置、头像签名

    最近微信迎来了一次重要的更新,允许用户对"发现"页面进行定制.不知道从什么时候开始,微信朋友圈变得越来越复杂,当越来越多的人选择"仅展示最近三天的朋友圈",大概 ...

  2. Python 分析近2000条“数据分析”相关岗位招聘信息

    文章目录 准备阶段 数据获取 数据清洗 数据可视化 (1)岗位名称 (2)工作地点 (3)公司所属行业 (4)工作经验要求 (5)公司规模情况 (7)学历要求 (8)公司类型 (9)招收人数 (10) ...

  3. (附源码)Python云顶之弈数据分析系统 毕业设计451545

    目 录 摘要 1 1 绪论 1 1.1研究背景 1 1.2开发意义 1 1.3系统开发技术的特色 1 1.4论文结构与章节安排 1 2 基于Python云顶之弈数据分析系统系统分析 3 2.1 可行性 ...

  4. 【Python作业】对股票数据分析处理

    文章目录 一.前言 二. 题目要求 三. 原数据 三.代码示例 四.结果 一.前言 上午写了一个版本,将简单问题复杂化了,本题主要考的是 文件操作及常见数据类型的处理 ,惭愧学了几个月基础还是很差,想 ...

  5. python计算汽车的平均油耗_用python对汽车油耗进行数据分析(anaconda python3.6完全跑通)...

    原标题:用python对汽车油耗进行数据分析(anaconda python3.6完全跑通) 编者按:前两天我们微信发了一篇文章<用python对汽车油耗进行数据分析 >,有一网友学习后用 ...

  6. python网页爬虫+简单的数据分析

    python网页爬虫+简单的数据分析 文章目录 python网页爬虫+简单的数据分析 一.数据爬取 二.数据分析 1.我们今天爬取的目标网站是:http://pm25.in/ 2.需要爬取的目标数据是 ...

  7. python爬大学生就业数据_小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...

    一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...

  8. 小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...

    一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...

  9. Python大作业——爬虫+可视化+数据分析+数据库(爬虫篇)

    相关链接 Python大作业--爬虫+可视化+数据分析+数据库(简介篇) Python大作业--爬虫+可视化+数据分析+数据库(可视化篇) Python大作业--爬虫+可视化+数据分析+数据库(数据分 ...

最新文章

  1. 电子科大博士生杨超火了!2年实现Science+Nature一作双杀
  2. java jtable逐行遍历_Java获取JTable值(每行)
  3. 中秋祝福网页制作_10大中秋H5模板分享,助力吸粉10000+
  4. XenDesktop 5.5 – HDX RealTime TCP UDP Audio演示
  5. Java支持IPv6研究
  6. 在Zuul中设置服务访问限流
  7. 为何python不好找工作-学完Python,为什么还找不到工作?现实很残酷!
  8. 懒人的小技巧, 批处理修改IP
  9. Drupal的taxonomy_manager模块合并分类的方法
  10. 犀牛3D造型软件Rhino 7 for Mac
  11. 初识B/S结构编程技术
  12. cssci核心期刊(cssci核心期刊目录)
  13. 二叉树遍历算法C++实现
  14. Oracle备份恢复之闪回技术
  15. android fastboot 刷机教程,已进入fastboot怎么刷机教程
  16. 【Java算法学习】鸡兔同笼问题
  17. Infomages: Embedding Data into Thematic Images
  18. ActiveMQ中Consumer特性详解与优化
  19. 调用tel://打电话
  20. Panasonic Lumix GH5: Tips, Tricks, and Techniques 松下Lumix GH5使用技巧 Lynda课程中文字幕

热门文章

  1. 银河麒麟V10-SP2服务器操作系统安装vnc
  2. 大头报文_20种具有创意的“大头”照片操作
  3. 【GitHub】Failed to connect to github.com port 443 的一种解决方案
  4. 应用提交 App Store 上架被拒的原因都有哪些?
  5. MySQL数据库的练习(数据库的创建,使用,查看,查看表格,初始化数据库)
  6. 趣来宝机器人_王嘉尔上演真人版智能机器人舞台帅炸,但都不及他的说话艺术炸...
  7. C# System.Windows.Forms.Application.DoEvents()
  8. centos 挂载磁盘并做磁盘加密
  9. Android手机App安全漏洞
  10. 华大HC32F460 DCU实验