大家好,我是测试奇谭的作者谭叔。

自开通博客以来,谭叔被问及最多的问题,便是:

软件测试要做些什么?

软件测试需要掌握什么技能?

软件测试有发展前景吗?

……

针对以上问题,谭叔写过文章介绍,也做过线上分享,你可以翻翻之前推送的文章。

但我总觉得还差个东西——软件测试的职业环境。

就我个人来说,我每隔一段时间(或半年、或一年)便会审视、总结软件测试职业,给自己的未来一个交代。

最近,借金三银四招聘旺季的契机,我爬取了某招聘网站8483条测试工程师的用人需求,通过分析这些数据,跟大家讲一讲软件测试的职业环境。

具体请看:数据爬取、数据清洗、数据分析

数据爬取

我不喜欢重复造轮子,在分析之前,我依旧在网上浏览,却发现并无多少博主通过分析招聘需求来研究软件测试。

因此,我找到了尘封在我资料库里两年的代码(两年前 ,我在做职业抉择时,做过类似的分析)。

但却发现,两年过去,招聘网站进步了不少——反爬虫机制成熟,一些关键数据,已无法通过正常手段获取。

可我还是不想重复造轮子,但在网上能找到的爬虫脚本,也无法使用。

于是乎,我花费了两个下午的休息时间,仔细研究了该网站的反爬虫机制,加上一休老师的灵光一闪。最终,我成功找到该网站的后门,爬取到了我需要的所有数据。

计,8483条测试工程师的招聘需求。

数据清洗

我设计了两张表,一张position表,用于存储岗位信息,如薪资、公司规模、年限要求、学历要求等。

一张info表,用于存储岗位描述,如岗位职责、岗位要求。

01 去重

我group by了下position表的数据,发现数据有不少重复值。去重后,只有7650条,足足少了833条。

在确保爬虫脚本无误的情况下,我检查了数据的create时间点,再次排除脚本问题,并且排除动态页面刷新导致的重复(比如,岗位编号123,原本在第2页,但因为岗位新增,可能跑到第3页去了,造成数据重复记录)。

最终,我猜测:该招聘网站的岗位总数,可能有水分。

但此为个人猜测,并且不是本篇文章的重心,故看看就好。

02 清洗position表(职位信息)

我选取关键字段做分析,并分别要处理:

  • positionName岗位名称:去关键词,获取一些定制岗位的招聘数量(如性能测试工程师、自动化测试工程师、测试开发、测试主管等)

  • salary薪水:取上下限

  • salaryMonth能拿到的薪水月份(年终奖):获取枚举值

  • workYear工作年限:获取枚举值

  • education教育程度:获取枚举值

  • positionAdvantage岗位福利:提取关键词,做词云分析

  • companySize公司规模:获取枚举值

  • financeStage公司融资情况:获取枚举值

  • industryField公司行业:提取关键词,做词云分析

  • companyLabelList公司福利:提取关键词,做词云分析

  • city城市:获取枚举值

  • district区域:获取枚举值

03 清洗info表(职位信息)

将爬取到的汇总数据,拆分成:

  • work_duty岗位职责:提取关键词,做词云分析

  • work_requirement岗位要求:提取关键词,做词云分析

数据分析(单因素)

因谭叔本人在成都工作,故此篇文章,我只会放上成都的测试岗位(550条招聘需求)分析。

如果你需要查看其它城市的分析报告,可关注同名公号,在后台回复地区即可获取。

01 招聘岗位分析

①招聘需求

在招聘的岗位名称上,**自动化、测试开发等关键词的比例为17%,**但真实的占比不止17%(一些企业在招聘时并不会打上自动化、测试开发等标签,但实际却需要此类技能)。

你觉得高吗?悄悄告诉你,北京、杭州是40%。

其次,测试开发的招聘需求明显大于自动化测试——毕竟,掌握了测试开发技术,再做自动化测试并不是什么难事。

so,还没学自动化技术、测试开发技术的小伙伴,赶紧行动起来,未来这个比例只会更高。

此外,专职的性能测试、安全测试,依旧是小众需求。

②岗位职责

什么是词云?由词汇组成类似云的彩色图形。某词汇出现次数越多,则在词云上显示最大。

测试工程师的岗位职责,仍旧以产品为主:理解产品需求、对产品进行、发现产品缺陷、确保产品质量等关联词,出现频次最高,近6成的公司有此基础要求。

此外,近5成的公司,要求自动化技术,4成的公司,要求求职者具备独立工作的能力。

结合上一个分析 & 两年前的职责数据,我们能看出:测试在向全技能型人才(自动化、开发、性能测试等技术)发展。

关键词出现的频率,如下:产品 61.03%、自动化 45.06%、负责 40.68%、问题 29.28%、执行 28.33%、分析 28.14%、质量 27.19%、编写 27.00%、开发 25.48%、性能 25.48%

③岗位要求

**经验,经验,经验,重要的事情说三遍!**丰富的测试经验,带来的更加优秀的迁移能力,快速发现问题、定位问题的能力……懂者自懂,不再强调。

**软技能方面,沟通能力、学习能力、分析能力,**符合测试工程师岗位的客观规律。

关键词出现的频率,如下:经验 111.98%(一个岗位要求里可能有多个经验关键词,故超过100%)、沟通 34.79%、项目 34.60%、流程 34.22%、产品 33.84%、技术 32.13%、学习 31.56%、测试工具 29.85%、分析 26.24%

02 福利分析

①年终奖

从数据可以看出,近6成的公司没有年终奖(数据不绝对,此数据挂靠在薪水上,不排除无法挂靠的项目/绩效奖金,或者部分企业未填写此字段),愿意给年终奖的公司占到4成,以13-15薪为最大占比。

那么,年终奖大于15薪的是哪些神仙公司呢?

给出18薪的,又是哪家神仙公司呢?

一家培训机构,真香。

②岗位福利

在岗位福利上面,我们可以看出:五险一金、周末双休、带薪年假、团队nice等为测试工程师这个岗位的高频福利,和其他技术岗没多大区别。

关键词出现的频率,如下:五险一金 23.45%、周末双休 14.00%、带薪年假 10.36%、团队好 8.91%、六险一金 6.73%、弹性工作 6.18%

③公司福利

在公司福利上面,近3成的公司愿意给带薪年假,其次,节日礼物、定期体检、技能培训等福利出现的频次相对较高。

关键词出现的频率,如下:带薪年假 29.27%、节日礼物 17.27%、定期体检 12.73%、技能培训 12.36%、年底双薪 12.18%、股票期权 12.00%、岗位晋升 11.64%

数据分析(多因素)

01 公司规模与学历的关系

从图中得出的结论:大公司对学历的要求更高,专科生进大公司的路相对较狭窄。

02 公司规模、融资情况与薪水的关系

**公司规模越大,薪水越高。**所以,想提高薪水,进大公司是一种选择。

天使轮和D轮+的公司,更愿意给出高薪职位。毕竟这两个阶段是公司快速冲刺的阶段。

03 工作年限与薪水的关系

什么是箱型图?一种用作显示一组数据分散情况资料的统计图,有上边缘、下边缘、中位数和两个四分位数。

什么是四分位数?指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。

还是不懂?了解最少、最大、中位数三个值即可。

抛开应届毕业生不谈(大公司开高价招聘应届生,不具备统计学意义),其余数据符合社会客观规律。

你可以根据以下数据,对比自己的薪资是平均别人还是被别人平均。

不限:最少3k,最大7k,中位值3.7k,Q1 3k,Q3 6.4k。最少、最大、中位值趋近且中位数靠近Q1,说明大部分岗位薪水在3.7k-7k之间。

1年以下:最少4.5k,最大32k,中位值8.5k,Q1 6.7k,Q3 11.5k。中位值趋近Q1,说明有更多高薪选择,意味着摇摆更大,择业容易出现特别明显的分水岭。

1-3年:最少6.5k,最大37k,中位值12.5k,Q1 10k,Q3 15.5k。中位值稳定,该中位值能代表平均水平。

3-5年:最少2.5k**,最大44.5k,中位值18k**,Q1 13.5k,Q3 22.5k。同上,中位值稳定,该中位值能代表平均水平。

5-10年:基本不走简历投递招聘模式。

04 学历与薪水的关系

学历方面,本科(及以上)与专科,在薪水方面,差异明显。

本科:最少1.5k,最大44.5k,中位值11.5k,Q1 8.5k,Q3 15.5k

大专:最少2.5k,最大22.5k,中位值7k,Q1 5.5k,Q3 9.5k

硕士:最少1.5k**,最大32.5k,中位值11.5k**,Q1 6k,Q3 15k

你还想看哪方面的数据,欢迎留言~

我爬取了8483条测试工程师招聘需求,竟发现……相关推荐

  1. 利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?

    作者:JackTian.黄伟呢 公众号:杰哥的IT之旅,后台回复:「运维」可获取本文完整数据 大家好,我是 JackTian. 我经常会收到读者关于一系列咨询运维方面的事情,比如:杰哥,运维到底是做什 ...

  2. python运维招聘_利用 Python 爬取了 13966 条运维招聘信息,看看你是否符合招聘信息!...

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:Python进阶者 ( 想要学习Python?Pyth ...

  3. 用 Python 爬了 10 万条软件测试工程师信息有这些发现!

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 软件测试工程师,听起来蛮高大上的对不? 也是,毕竟测试工程师也是需要前能镇定自若寻找产品bu ...

  4. Python爬取近十万条程序员招聘数据,告诉你哪类人才和技能最受热捧! | 原力计划...

    作者 | Huang supreme 编辑 | 郭芮 出品 | CSDN博客 图源 | 视觉中国 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆脱不了与数据打交道,社会对于"数据&qu ...

  5. Python 爬取近十万条程序员招聘数据,告诉你哪类人才和技能最受热捧! | 原力计划...

    作者 | Huang supreme,责编 | 郭芮 出品 | CSDN博客 封图 | CSDN 下载于视觉中国 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆脱不了与数据打交道,社会对于&qu ...

  6. 爬取了 48048 条评论数据,解读 9.3 分的《毒液》是否值得一看?

    微信改版,加星标不迷路! 9.3 分的<毒液>是否值得一看? 作者 | Ryan 公众号 | 格雷福斯 编辑 | 阿广 概述 前言 获取数据 数据可视化 用户评论,词云图 毒液中六大搞笑台 ...

  7. 爬取了 36141 条评论数据,解读 9.5 分的《海王》是否值得一看

    这是第一个python项目,之前看到了<爬取了 48048 条评论数据,解读 9.3 分的<毒液>是否值得一看?>这篇文章,一直想自己动手做一个,刚刚好前两天看了<海王& ...

  8. 这届网友实在是太有才了!用python爬取15万条《我是余欢水》弹幕

    年初时我们用数据解读了几部热度高,但评分差强人意的国产剧,而最近正午阳光带着两部新剧来了,<我是余欢水>和<清平乐>,截止到目前为止,这两部剧在豆瓣分别为7.5分和7.9分,算 ...

  9. python获取游戏数据_Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是.........

    原标题:Python 爬取 3 万条游戏评分数据,原来程序员最爱玩的游戏竟然是...... 作者 |量化小白H 责编 | 胡巍巍 本文爬取了豆瓣游戏网站上所有可见的游戏评分数据进行分析,全文包括以下几 ...

最新文章

  1. 十一、explain属性介绍
  2. Servlet--05--HttpServletRequest; HttpServletResponse
  3. 信息安全技术 网络安全事件应急演练指南_省局举办网络安全培训讲座
  4. python 字符串拼接_Python字符串拼接的6种方法(转)
  5. 把100减锐城1用计算机怎么算,北师大四年级下册数学
  6. web获取多行mysql结果_mysql中的多行查询结果合并成一个
  7. [转]迭代、集合、字典表和列表
  8. 单关闭功能_广告弹窗关闭
  9. VS.NET(C#)--1.4项目与解决方案
  10. 睿至大数据与北交大强强联手布局大数据
  11. nginx学习笔记之安装
  12. 如何让同局域网的同事访问我电脑上的PHP网站和数据库
  13. linux压缩和备份工具
  14. js遍历jstl数组
  15. 常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript
  16. 计算机组装与维护李毅,青春力量 | 优秀校友李毅专访
  17. restclient发送json_如何使用restclient来发送post请求参数
  18. 微信电影影视小程序系统源码
  19. 结合P2P软件使用Ansible分发大文件 1
  20. Ubuntu在物理机系统安装和teamviewer安装过程问题和解决的记录

热门文章

  1. 在上海创业的日子之我们开始创业了
  2. 你们说说kafka是如何做到百万级高并发低迟延的?
  3. CleanMyMac免费苹果MAC系统清理APP
  4. macOS逆向(MindNode)
  5. 第三方微信登陆的后台实现
  6. 获取阿里巴巴中国站商品详情返回值说明
  7. 大家帮忙看一下这两个ip地址到底距离多远
  8. android 中一段文字设置不同颜色
  9. 远程集中抄表系统四表合一由武汉七叶研发
  10. Slicer学习笔记(二十八)Elastix扩展模块