在前面一篇文章—拉勾网职位数据爬取,我爬取了拉勾网在杭州Python职位应届生这三个条件下的所有数据。下面我对这些数据做一下分析。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline#配置中文字体和修改字体大小
matplotlib.rcParams['font.family'] = 'SimHei'
matplotlib.rcParams['font.size'] = 30
df = pd.read_csv("Python-School-Hangzhou.csv",encoding = 'utf-8')

数据清洗

df.columns.values.tolist()
['adWord','appShow','approve','businessZones','city','companyFullName','companyId','companyLabelList','companyLogo','companyShortName','companySize','createTime','deliver','district','education','explain','financeStage','firstType','formatCreateTime','gradeDescription','hitags','imState','industryField','industryLables','isSchoolJob','jobNature','lastLogin','latitude','linestaion','longitude','pcShow','plus','positionAdvantage','positionId','positionLables','positionName','promotionScoreExplain','publisherId','resumeProcessDay','resumeProcessRate','salary','score','secondType','stationname','subwayline','workYear']

原始数据有太多的无用信息,下面进行数据清洗。

df.drop(['adWord','appShow','approve'],axis = 1,inplace = True)
df.drop(['businessZones','companyLabelList','companyLogo'],axis = 1,inplace = True)
df.drop(['createTime','deliver','district','education','explain'],axis = 1,inplace = True)
df.drop(['formatCreateTime','gradeDescription','hitags'],axis = 1,inplace = True)
df.drop(['imState','industryLables'],axis = 1,inplace = True)
df.drop(['isSchoolJob'],axis = 1,inplace = True)
df.drop(['lastLogin','promotionScoreExplain','publisherId','resumeProcessDay','resumeProcessRate','stationname','subwayline'],axis = 1,inplace = True)
df.drop(['pcShow','plus','positionAdvantage','positionId','positionLables','score'],axis = 1,inplace = True)
df.drop(['latitude','linestaion','longitude'],axis = 1,inplace = True)
df.drop(['city','companyFullName'],axis = 1,inplace = True)
df.drop(['companyId','firstType'],axis = 1,inplace = True)

数据分析

下面根据我想要的信息做一下数据处理、分析。

职位大类别统计

secondType_Series = df['secondType'].value_counts()
secondType_Series
数据开发      29
后端开发      28
人工智能      23
测试        21
运维        14
移动前端开发    10
数据分析       6
企业软件       6
硬件开发       2
产品经理       2
风控         1
Name: secondType, dtype: int64

下面用Pandas画一下直方图。

plt.figure(figsize=(10,5))
secondType_Series.plot.bar()
plt.show()

实习、全职统计

jobNature_Series = df['jobNature'].value_counts()
jobNature_Series
实习    76
全职    66
Name: jobNature, dtype: int64

公司统计

统计每个公司出现的个数,然后选取招聘Python相关职位个数大于等于3的公司。

companyShortName_Series = df['companyShortName'].value_counts()
companyShortName_Series_3 = companyShortName_Series[companyShortName_Series > 2] # 选取招聘Python相关职位个数大于等于3的公司
companyShortName_Series_3
个推            10
大搜车            8
同花顺            7
一周CP           4
袋鼠云            4
元素链            4
网易游戏           4
谷神星            4
美国道富           3
网易             3
点我达            3
阿里巴巴-B类事业群     3
Name: companyShortName, dtype: int64

下面用Pandas画一下直方图。

plt.figure(figsize=(10,5))
companyShortName_Series_3.plot.bar()
plt.show()

具体职位

数据开发

下面我具体看下“数据开发”对应的职位。

dba = df.loc[df['secondType'] == '数据开发']
dba
companyShortName companySize financeStage industryField jobNature positionName salary secondType workYear
4 个推 150-500人 D轮及以上 移动互联网 全职 数据研发工程师(校招) 10k-15k 数据开发 应届毕业生
14 美丽联合集团 500-2000人 D轮及以上 电子商务 全职 大数据开发工程师 15k-20k 数据开发 应届毕业生
15 个推 150-500人 D轮及以上 移动互联网 全职 ​数据开发工程师(校招岗位) 10k-15k 数据开发 应届毕业生
19 美国道富 2000人以上 上市公司 金融 实习 数据分析(数据挖掘)实习生 3k-4k 数据开发 不限
23 乐刻运动 500-2000人 C轮 O2O 全职 算法实习生 3k-5k 数据开发 应届毕业生
27 SensOmics 50-150人 未融资 企业服务,硬件 全职 生物信息学工程师 10k-20k 数据开发 应届毕业生
33 网易游戏 2000人以上 上市公司 游戏 实习 数据挖掘实习生-杭州 2k-3k 数据开发 不限
34 Club Factory 150-500人 C轮 电子商务,移动互联网 全职 数据分析师 8k-15k 数据开发 应届毕业生
39 袋鼠云 150-500人 A轮 数据服务 实习 大数据开发实习生 4k-6k 数据开发 应届毕业生
40 安恒信息 500-2000人 D轮及以上 信息安全 ,数据服务 实习 数据解析工程师(实习) 3k-5k 数据开发 应届毕业生
42 大搜车 2000人以上 D轮及以上 移动互联网,O2O 实习 数据开发实习生 2k-3k 数据开发 应届毕业生
44 览众数据 50-150人 B轮 电子商务,数据服务 实习 建模工程师实习生 3k-5k 数据开发 应届毕业生
47 网易游戏 2000人以上 上市公司 游戏 实习 爬虫工程师(实习生) 3k-4k 数据开发 不限
52 数美 150-500人 B轮 企业服务,数据服务 实习 机器学习(校招/实习) 4k-8k 数据开发 应届毕业生
67 大搜车 2000人以上 D轮及以上 移动互联网,O2O 实习 量化研究实习生10-03-01 2k-4k 数据开发 应届毕业生
69 数美 150-500人 B轮 企业服务,数据服务 全职 机器学习(实习/校招) 4k-8k 数据开发 应届毕业生
78 美丽联合集团 500-2000人 D轮及以上 电子商务 实习 数据仓库开发实习生 2k-3k 数据开发 应届毕业生
80 壹宝 50-150人 A轮 移动互联网,医疗健康 实习 数据开发实习生 3k-5k 数据开发 不限
97 TELETRAAN 15-50人 天使轮 数据服务,企业服务 实习 实习生 2k-4k 数据开发 应届毕业生
99 河象 15-50人 不需要融资 教育,移动互联网 实习 实习机器学习工程师 2k-4k 数据开发 应届毕业生
100 淳毅资产 少于15人 未融资 金融 实习 量化算法工程师 3k-5k 数据开发 应届毕业生
107 中软安人 150-500人 未融资 电子商务,企业服务 实习 大数据开发实习生 5k-8k 数据开发 应届毕业生
108 贝安云 50-150人 未融资 移动互联网,医疗健康 全职 数据挖掘工程师 10k-18k 数据开发 应届毕业生
128 稻芒数据 少于15人 未融资 数据服务 实习 数据专员兼职实习 3k-6k 数据开发 应届毕业生
131 网易 2000人以上 上市公司 电子商务,移动互联网 实习 数据挖掘实习生 4k-6k 数据开发 不限
134 个推 150-500人 D轮及以上 移动互联网 全职 ​数据建模工程师(校招岗位) 10k-15k 数据开发 应届毕业生
135 个推 150-500人 D轮及以上 移动互联网 全职 数据建模工程师 10k-15k 数据开发 应届毕业生
137 个推 150-500人 D轮及以上 移动互联网 全职 数据分析师(校招岗位) 10k-15k 数据开发 应届毕业生
138 大搜车 2000人以上 D轮及以上 移动互联网,O2O 实习 风险建模实习生10-01-01 2k-4k 数据开发 应届毕业生

人工智能

下面看下“人工智能”对应的职位。

ai = df.loc[df['secondType'] == '人工智能']
ai
companyShortName companySize financeStage industryField jobNature positionName salary secondType workYear
26 图普科技(深度学习图像识别云) 50-150人 A轮 移动互联网,数据服务 全职 00069-深度学习工程师(校招) 13k-23k 人工智能 应届毕业生
41 翼米网络 少于15人 天使轮 移动互联网 社交网络 实习 算法工程师 3K-6K 人工智能 不限
43 城市大数据 50-150人 未融资 移动互联网 实习 算法实习生 3k-4k 人工智能 应届毕业生
48 袋鼠云 150-500人 A轮 数据服务 实习 算法实习生(杭州) 5k-6k 人工智能 应届毕业生
50 亿咖通科技 500-2000人 不需要融资 移动互联网,硬件 实习 增强学习算法实习生 3k-5k 人工智能 不限
54 点我达 500-2000人 D轮及以上 O2O 全职 2019届校招-风控建模 12k-20k 人工智能 应届毕业生
55 中科视拓 50-150人 A轮 企业服务 实习 算法实习工程师 3k-5k 人工智能 应届毕业生
63 点我达 500-2000人 D轮及以上 O2O 全职 2019届校招-算法 20k-40k 人工智能 应届毕业生
65 Obsbot寻影 15-50人 天使轮 硬件,其他 实习 深度学习算法实习生 4k-8k 人工智能 应届毕业生
70 灵西智能 15-50人 天使轮 企业服务,硬件 实习 运动规划算法实习岗 3k-5k 人工智能 不限
82 虹软 500-2000人 不需要融资 移动互联网,信息安全 全职 计算机视觉算法工程师(2019应届生) 15k-30k 人工智能 应届毕业生
83 Obsbot寻影 15-50人 天使轮 硬件,其他 实习 深度学习算法工程师 12k-16k 人工智能 应届毕业生
87 杭州智团 15-50人 不需要融资 医疗健康 全职 人工智能实习生 3k-6k 人工智能 应届毕业生
89 杭州默安科技有限公司 50-150人 A轮 信息安全 全职 机器学习算法实习生 4k-6k 人工智能 应届毕业生
92 智慧视通 50-150人 天使轮 数据服务,人工智能 实习 视频图像算法工程师(实习岗) 3k-5k 人工智能 不限
94 零零无限 50-150人 A轮 硬件 实习 计算机视觉算法实习生 3k-4k 人工智能 应届毕业生
106 零零无限 50-150人 A轮 硬件 实习 机器学习算法实习生 3k-4k 人工智能 应届毕业生
113 东信软件 150-500人 上市公司 移动互联网,数据服务 实习 人工智能-实习生 2k-4k 人工智能 应届毕业生
116 昇星网络 15-50人 天使轮 其他,移动互联网 实习 计算机视觉、机器学习、深度学习的实习生 4k-8k 人工智能 不限
117 eyecloud 15-50人 天使轮 移动互联网,其他 实习 图像算法实习生 3k-6k 人工智能 应届毕业生
118 虹软 500-2000人 不需要融资 移动互联网,信息安全 全职 机器学习算法工程师(2019应届生) 15k-30k 人工智能 应届毕业生
130 网易 2000人以上 上市公司 电子商务,移动互联网 实习 人工智能实习生 6k-8k 人工智能 不限
141 大搜车 2000人以上 D轮及以上 移动互联网,O2O 全职 算法实习生 07-01-32 4k-5k 人工智能 应届毕业生

后端开发

下面看下“后端开发”对应的职位。

rd = df.loc[df['secondType'] == '后端开发']
rd
companyShortName companySize financeStage industryField jobNature positionName salary secondType workYear
0 Eigen 50-150人 A轮 移动互联网,数据服务 全职 Python开发工程师 10k-20k 后端开发 应届毕业生
1 大搜车 2000人以上 D轮及以上 移动互联网,O2O 实习 Python实习生07-01-56 4k-5k 后端开发 应届毕业生
2 安恒信息 500-2000人 D轮及以上 信息安全 ,数据服务 全职 c++研发实习生(漏洞扫描引擎方向) 2k-4k 后端开发 应届毕业生
3 Club Factory 150-500人 C轮 电子商务,移动互联网 全职 后端工程师 8k-15k 后端开发 应届毕业生
5 电魂网络 500-2000人 上市公司 游戏 实习 服务器/客户端开发工程师 8k-11k 后端开发 不限
7 天猫 2000人以上 上市公司 移动互联网,电子商务 全职 研发工程师 12k-20k 后端开发 应届毕业生
9 同花顺 2000人以上 上市公司 金融 全职 算法工程师 15k-25k 后端开发 应届毕业生
10 齐治科技 50-150人 不需要融资 信息安全 全职 软件开发工程师 10k-15k 后端开发 应届毕业生
12 网易游戏 2000人以上 上市公司 游戏 实习 Unity3D开发实习生-杭州 3k-4k 后端开发 不限
17 数澜科技 150-500人 A轮 企业服务,数据服务 实习 Node.js实习生【杭州】 3k-5k 后端开发 应届毕业生
21 智慧视通 50-150人 天使轮 数据服务,人工智能 实习 C++工程师(实习生) 3k-5k 后端开发 应届毕业生
28 同花顺 2000人以上 上市公司 金融 全职 C++开发工程师(主服务端) 7k-14k 后端开发 应届毕业生
30 个推 150-500人 D轮及以上 移动互联网 全职 Node.js开发工程师(校招岗位) 10k-15k 后端开发 应届毕业生
32 一周CP 15-50人 A轮 移动互联网,社交网络 实习 后端工程师-实习 6k-12k 后端开发 应届毕业生
36 溯博链鑫区块链 15-50人 不需要融资 移动互联网 全职 go 开发工程师 10k-20k 后端开发 应届毕业生
45 个推 150-500人 D轮及以上 移动互联网 实习 Java/机器学习方向实习生 3k-5k 后端开发 不限
49 一周CP 15-50人 A轮 移动互联网,社交网络 实习 一周工程师-校招 6k-12k 后端开发 应届毕业生
58 阿里巴巴-B类事业群 2000人以上 上市公司 移动互联网,电子商务 全职 资深c++开发工程师 30k-40k 后端开发 应届毕业生
73 阿里巴巴-B类事业群 2000人以上 上市公司 移动互联网,电子商务 全职 算法专家 30k-40k 后端开发 应届毕业生
75 袋鼠云 150-500人 A轮 数据服务 实习 Java开发实习生 3k-4k 后端开发 应届毕业生
77 数梦工场 500-2000人 A轮 移动互联网,数据服务 实习 云服务工程师实习生 3k-5k 后端开发 应届毕业生
85 阿里巴巴-B类事业群 2000人以上 上市公司 移动互联网,电子商务 全职 C++技术专家 30k-40k 后端开发 应届毕业生
86 蚂蚁金服集团 2000人以上 B轮 金融,移动互联网 实习 【支付宝.实习】Java开发工程师 6k-9k 后端开发 应届毕业生
90 蚂蚁金服集团 2000人以上 B轮 金融,移动互联网 实习 【实习生.支付宝】研发工程师JAVA 7k-10k 后端开发 应届毕业生
102 心景科技 15-50人 天使轮 游戏 全职 自然语言处理工程师 20k-30k 后端开发 应届毕业生
121 翼米网络 少于15人 天使轮 移动互联网 社交网络 实习 风控算法工程师 4K-6K 后端开发 不限
129 谷神星 50-150人 A轮 信息安全,移动互联网 全职 软件开发(实习) 4k-5k 后端开发 应届毕业生
133 个推 150-500人 D轮及以上 移动互联网 全职 Node.js开发实习生 5k-8k 后端开发 应届毕业生

测试

下面看下“测试”对应的职位。

qa = df.loc[df['secondType'] == '测试']
qa
companyShortName companySize financeStage industryField jobNature positionName salary secondType workYear
6 有赞 500-2000人 上市公司 移动互联网,企业服务 全职 [2019校招]测试开发工程师 10k-18k 测试 应届毕业生
8 菜鸟网络 2000人以上 B轮 电子商务 全职 测试开发工程师 15k-20k 测试 应届毕业生
13 亿方云科技 150-500人 B轮 移动互联网,数据服务 实习 I02006 测试工程师实习生-杭州 3k-4k 测试 应届毕业生
29 Face++ 500-2000人 C轮 移动互联网,硬件 实习 测试实习生 2k-4k 测试 应届毕业生
37 元素链 50-150人 C轮 金融 移动互联网 全职 资深测试开发工程师 12k-24k 测试 应届毕业生
51 为简科技 150-500人 不需要融资 移动互联网,电子商务 全职 初级测试工程师双休 4k-8k 测试 应届毕业生
72 同花顺 2000人以上 上市公司 移动互联网,金融 全职 软件测试工程师 5k-10k 测试 应届毕业生
74 浙江核新同花顺网络信息股份有限公司 2000人以上 上市公司 金融 全职 测试 9k-18k 测试 应届毕业生
76 大搜车 2000人以上 D轮及以上 移动互联网,O2O 实习 测试实习生 07-01-19 4k-5k 测试 应届毕业生
88 浙江泰源 50-150人 不需要融资 移动互联网 硬件 全职 测试工程师 4K-6K 测试 应届毕业生
93 贝连 50-150人 不需要融资 移动互联网,金融 实习 测试实习生 2k-3k 测试 不限
96 同花顺 2000人以上 上市公司 移动互联网,金融 全职 金融软件测试 8k-15k 测试 应届毕业生
98 点我达 500-2000人 D轮及以上 O2O 全职 2019届校招-测试开发 15k-25k 测试 应届毕业生
104 南昌鎏彩科技有限公司 150-500人 不需要融资 移动互联网,人工智能 全职 测试实习生双休 4k-8k 测试 应届毕业生
109 同花顺 2000人以上 上市公司 移动互联网,金融 全职 自动化测试工程师 12k-18k 测试 应届毕业生
110 数梦工场 500-2000人 A轮 移动互联网,数据服务 实习 测试工程师实习生 3k-5k 测试 应届毕业生
111 宇为科技 15-50人 天使轮 数据服务,移动互联网 全职 软件测试 10k-15k 测试 应届毕业生
112 慧码科技 50-150人 未融资 移动互联网 全职 测试实习生 4k-6k 测试 应届毕业生
114 浙江核新同花顺网络信息股份有限公司 2000人以上 上市公司 金融 全职 测试工程师 9k-15k 测试 应届毕业生
122 元素链 50-150人 C轮 金融 移动互联网 全职 测试工程师 12k-24k 测试 应届毕业生
126 贝贝网 500-2000人 D轮及以上 电子商务 实习 测试实习生(19届及以后毕业) 4k-5k 测试 不限

拉勾网`Python职位`分析相关推荐

  1. python爬取拉勾网给定关键词职位信息存入数据库_Python 爬取拉勾网python职位信息...

    今天的任务是爬取拉勾网的职位信息. 首先,我们进入拉勾网,然后在职位搜索栏搜索Python 的同时,打开控制面板F12,来查看网页构成. 在XHR里,可以清楚的看见Ajax请求,所以需要使用sessi ...

  2. 初级选手数据分析——Python职位数据分析全链路

    目录 0. 数据采集 1. 数据清洗 1.0 筛选python相关的职位 1.1 按照创建时间清洗异常值 1.2 按照薪资清洗异常值 2. 统计分析 2.0 大盘数据 2.1 单维度分析 2.1 二维 ...

  3. python数据分析工资_拉勾网爬取全国python职位并数据分析薪资,工作经验,学历等信息...

    确定网页的加载方式是JavaScript加载 通过谷歌浏览器开发者工具分析和寻找网页的真实请求,确定真实数据在position.Ajax开头的链接里,请求方式是POST 使用requests的post ...

  4. 基于Python的拉勾网Python工程师招聘信息的爬取和处理分析

    目录 一.项目简介 1.项目完成的功能 2.项目完成的特色 3.项目采用的技术栈 二.项目的需求分析 1.项目的功能需求分析 2.项目的非功能需求分析 系统性能需求 系统观感需求(界面需求) 三.项目 ...

  5. 借问钱程何处有,牧童劝我学Python——2019python职位分析

    欢迎关注,敬请点赞! 借问钱程何处有--2019python职位分析 加载并探索数据 基本信息: 不同学历职位分布 按学历规约 按学历规约后 饼图 小节 不同学历薪资待遇 最低薪资 最高薪资 按不同学 ...

  6. Python数据采集分析告诉你为何上海二手房你都买不起

    感谢关注Python爱好者社区公众号,在这里,我们会每天向您推送Python相关的文章实战干货. 来吧,一起Python. 对商业智能BI.大数据分析挖掘.机器学习,python,R等数据领域感兴趣的 ...

  7. python爬虫教程:Scrapy框架爬取Boss直聘网Python职位信息的源码

    今天小编就为大家分享一篇关于Scrapy框架爬取Boss直聘网Python职位信息的源码,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧 分析 使用Crawl ...

  8. Scrapy框架爬取Boss直聘网Python职位信息的源码

    分析 使用CrawlSpider结合LinkExtractor和Rule爬取网页信息 LinkExtractor用于定义链接提取规则,一般使用allow参数即可 LinkExtractor(allow ...

  9. Scrapy框架学习 - 爬取Boss直聘网Python职位信息

    分析 使用CrawlSpider结合LinkExtractor和Rule爬取网页信息 LinkExtractor用于定义链接提取规则,一般使用allow参数即可 LinkExtractor(allow ...

最新文章

  1. 2021年夏季学期“清华大学大数据能力提升项目” 招募《大数据实践课》企业合作项目...
  2. java递归深度克隆_递归方法实现深度克隆原理:遍历对象、数组直到里边都是基本数据类型,然后再去复制,就是深度拷贝。...
  3. 大学c语言课程及答案,某大学《C语言程序设计》课程考试试卷(含答案).doc
  4. JavaScript正则式练习
  5. Python简单监控键盘输入的木马实现
  6. 《弃子长安》第十六章 道阳心经
  7. PPT到WORD的组合图片复制
  8. upnp 文件服务器,upnp服务器
  9. Java从数据库中读取Blob对象图片并显示的方法
  10. java 压缩pdf_java实现文件的压缩和解压
  11. 孟岩所说的革命到底是什么?
  12. 深度deep Linux系统软件应用商店下载地址
  13. 欺骗的艺术——第二部分(1)
  14. SMBIOS读取本机的MEMORY信息
  15. 哪些靠谱的方法能在十年内赚 3000 万?
  16. android9壁纸存放路径,Android基础入门教程——10.9 WallpaperManager(壁纸管理器)
  17. Object 转Map,Map转Object方式总结
  18. Bootstrap 学习之 (一) ------ 网格系统
  19. 离散数学学习笔记-02-对偶和范式
  20. 关于印发《注册测绘师执业管理办法(试行)》的通知

热门文章

  1. Ubuntu新旧版本下载地址
  2. ngui 教程一 转载自:雨松MOMO程序研究院
  3. 巴比特 | 元宇宙每日必读:“国产VR之光”PICO正式出海,首发避战Meta,业内人士认为,此为缓兵之计,两者终有一战...
  4. 数字孪生技术在自动驾驶测试领域的应用研究概述
  5. 不安分的 Go 强势入侵前端,后端难道要抢前端饭碗了?
  6. [网络安全技术文章之其一] 给数据科学家的十条数据安全建议
  7. HTML标签练习(二)
  8. jquery显示隐藏元素
  9. i58400升级可以换什么cpu_为什么明星经常换发型发质还那么好?只要学会这一点,你也可以...
  10. 在这个云时代,如何选择性价比更高的云服务器