九月份的时候胡萝卜参加了讯飞的人岗匹配挑战赛,后面机缘巧合和老肥组队打团。比赛过程可谓跌宕起伏,非常有意思。在这里和大家分享一下我们的建模方案。

赛题任务

智能人岗匹配需要强大的数据作为支撑,本次大赛提供了大量的岗位JD和求职者简历的加密脱敏数据作为训练样本,参赛选手需基于提供的样本构建模型,预测简历与岗位匹配与否。实质上,可以看做一个多分类问题

赛题数据

本次比赛为参赛选手提供了大量的岗位JD和求职者简历,其中:岗位JD数据包含4个特征字段:job_id, 职位名称, 职位描述, 职位要求。求职者简历数据包含15个特征字段:id, 学校类别, 第一学历, 第一学历学校, 第一学历专业, 最高学历, 最高学历学校, 最高学历专业, 教育经历, 学术成果, 校园经历, 实习经历, 获奖信息, 其他证书信息, job_id。这里面的数据都是加密脱敏的,不太会bert的我们只能说:xgb/lgb yyds!

评估指标

本模型依据提交的结果文件,采用macro-F1 score进行评价。

建模方案要点

1 模型有lgb和xgb,其中xgb要比lgb效果好!!!!

2 10折比5折好

3 特征工程包括业务特征如下图,还有一些类别特征之间count、nunique和count/nunique计算,以及计算个人信息与每一个职位之间的余弦相似度(个人信息=学校类别+教育经历+学术成果+校园经历+实习经历+获奖信息+其他证书信息,职位信息=职位名称+职位描述+职位要求,采用TFIDF(2-gram)算法处理),人个信息用TFIDF(2-gram)进一步处理生成文本特征矩阵。

4 个人信息生成的文本特征矩阵非常高维,降维处理会降低精度,不降维训练时间长,需要人工调整min_df和max_df参数。

5 结果概率后处理提分,老肥神操作,看不懂!知乎的包包大人有关于这方面的详细解答,详见https://zhuanlan.zhihu.com/p/106766826。

6 调调参和模型融合有进一步提升。

写在末尾,数据挖掘一些的tricks基本有用,关键是多做特征和多尝试。

温馨提示:如果你觉得离冠军很远,直接艾特前排冠军组队就好。

老肥说:

感谢胡萝卜同学的精彩分享,如果还有同学想要分享比赛相关内容的,可以在群内或者私聊戳我,大家一起交流学习!

科大讯飞人岗匹配Top1方案总结相关推荐

  1. e成科技人岗匹配中的匹配模型

    随着网络招聘的发展与壮大,网聘渠道积攒着数亿份个人简历以及上千万份企业招聘信息.如何将这些简历和岗位进行精准匹配是各大招聘平台面临的重大挑战. 问题描述 在人岗匹配中,JD文档由多句工作描述和岗位要求 ...

  2. 企业如何在组织架构改变时,来实现员工的人岗匹配

    时代的快速发展,带来的系列性组织变革,需要企业不断改变组织模式,以适应行业的发展.企业的组织发展以及客户发展的需要.因此随着环境的不断变化,企业的组织架构的适时变化将会是一种趋势,是无法阻挡.特别是在 ...

  3. 组织架构改变时如何实现员工的人岗匹配

    时代的快速发展,带来的系列性组织变革,需要企业不断改变组织模式,以适应行业的发展.企业的组织发展以及客户发展的需要.因此随着环境的不断变化,企业的组织架构的适时变化将会是一种趋势,是无法阻挡.特别是在 ...

  4. 严格匹配_2020湖北省考招录“刚柔并济”强调“人岗匹配”

    6月23日,2020湖北省考公告发布,预示着2020湖北省考招录工作正式启动.本次考录计划招录公务员(参公人员)共计8103人.中公教育专家在仔细对比了2020湖北省考公告与往年的公告后发现,今年湖北 ...

  5. 做好人岗匹配,实现业绩增长

    索尼公司创始人盛田昭夫之所以被称为"经营之圣",是因为他非常重视对员工的情感激励.工作期间,盛田昭夫一直保持着和员工一起吃工作餐.聊天的习惯,以便深入了解员工所需. 某天晚上,盛田 ...

  6. 【CIKM 2020】基于多视图协作学习的人岗匹配研究

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要16分钟 跟随小博主,每天进步一丢丢 来自:RUC AI BOX 近日,第29届国际计算机学会信息与知识管理大会(CIKM 2020)在线上召开 ...

  7. 一文速览人岗匹配领域研究进展

    每天给你送来NLP技术干货! © 作者|郑博文 机构|中国人民大学高瓴人工智能学院 来自:RUC AI Box 本文主要从文本匹配.历史行为偏好建模以及混合推荐三个角度介绍了当前人岗匹配中的主要模型与 ...

  8. 科学使用人才,做到人岗匹配

    为了摆脱危机,迎接挑战,企业只有优化自己的内部行为,解决市场化与国际化的融合问题,才能从根本上使企业转机. 但是一个企业光有人力资本的积累是远远不够的,还必须对其进行有效配置和合理使用,做到人岗匹配, ...

  9. oppo人岗匹配测评_在测试中使用匹配器

    oppo人岗匹配测评 我们被迫在测试代码中写太多断言行的日子已经一去不复返了. 镇上有一个新的警长:assertThat和他的代理人:匹配者. 好吧,这不是什么新东西,但是无论如何,我想向您介绍匹配器 ...

最新文章

  1. windows下编译leveldb
  2. 为什么ConcurrentHashMap是弱一致的(jdk6)
  3. 2018.08.27 lucky(模拟)
  4. php javabean对象,Struts2 bean标签:创建并示例化一个JavaBean对象
  5. html dom 知乎,知乎登录页 - 粒子运动效果
  6. 人工智能学习书单推荐
  7. 数据结构与算法分析(十)——母牛的故事
  8. FairScheduler的任务调度机制——assignTasks
  9. Django——百知听课笔记一
  10. 树莓派教程 - 1.0 树莓派GPIO库wiringPi 点亮LED
  11. servlet html js提交表单,使用jquery.form.js实现form表单无刷新提交简单示例
  12. 获取公司的maven库 和 idea maven 中Projects Settings的Libraries中正常,但是在Maven Projects中Dependencies一直出现红线的解决办法
  13. VS使用SDL2时LNK2019无法解析的外部符号_main
  14. win10专业版开机画面模糊_怎么解决win10专业版字体模糊发虚的教程
  15. 浅谈Http长连接和Keep-Alive以及Tcp的Keepalive
  16. linux内存的优化大师,Linux性能优化大师(调整操作系统参数)
  17. Windows Server 2019 Datacenter OVF 模板 百度网盘 下载
  18. FFmpeg基础:视频流转图片
  19. C语言实现循环左移和右移
  20. 10^5以下素数筛法——素数表法

热门文章

  1. 年终总结免费PPT模版 9998套PPT免费送
  2. 牛客小白月赛19B:「木」迷雾森林
  3. win10下scapy get_working_if()不能获得正确的网卡原因分析
  4. 【算法】KMP算法完全解析(C语言实现)
  5. 适用于Mac的OmniFocus更新了macOS Big Sur的新小部件
  6. Java继承——抽象类
  7. 配置案例|Modbus转Profinet网关连接丹佛斯变频器
  8. 元年洞察|如何打造企业数据能力组件中心
  9. 如何设置word页码 第几页共几页 从第二页算起
  10. 调用百度地图接口获取城市住宅小区边界信息