0 序言

本文是基于2022 CCF BDCI 返乡发展人群预测 [0.9117+]做的进一步优化提升,虽然没有什么很大的提升空间,但是还是共享给大家,希望能给大家一些思路。

这次特征工程提交后的A榜结果为:0.91195301485

1 特征工程思路

特征离散化+特征交叉

主要思路来源于Feature Engineering for Numeric Variables

具体的特征工程代码如下:

# 离散化
all_f = [f'f{idx}' for idx in range(1, 47) if idx != 3]
for df in [train_data, test_data]:for col in all_f:df[f'{col}_log'] = df[col].apply(lambda x: int(np.log(x)) if x > 0 else 0)
# 特征交叉
log_f = [f'f{idx}_log' for idx in range(1, 47) if idx != 3]
for df in [train_data, test_data]:for i in range(len(log_f)):for j in range(i + 1, len(log_f)):df[f'{log_f[i]}_{log_f[j]}'] = df[log_f[i]]*10000 + df[log_f[j]]

其实就是将数值特征进行 l o g log log取值后进行离散化,然后特征两两进行特征交叉,这里的特征交叉,我采用高低位的形式,即 x ∗ 10000 + y x*10000+y x∗10000+y,其他特征交叉方式也是一样可以的。

3 参考代码

由于之前很多人提及我之前的不能复现,所以本次提供了完整的代码,方便大家复现。

代码地址:特征离散化[0.91195301485].ipynb

2022 CCF BDCI 返乡发展人群预测 微弱提升(特征离散化)相关推荐

  1. 2022 CCF BDCI 返乡发展人群预测 [0.9117+]

    一.赛题介绍 比赛地址:返乡发展人群预测 1.1 任务介绍 基于中国联通的大数据能力,通过使用对联通的信令数据.通话数据.互联网行为等数据进行建模,对个人是否会返乡工作进行判断 1.2 数据简介 tr ...

  2. 【直播合集】2022 CCF BDCI赛题直播分享会结束啦

    自8月29日上线以来,第十届CCF大数据与计算智能大赛(即2022 CCF BDCI)就进入激烈鏖战状态--截至目前,已有来自全国各高校.科研院所及企事业单位共计12817人报名参赛. 作为国内大数据 ...

  3. 颁奖:2022 CCF BDCI数字经济创新应用案例大赛在苏州相城圆满落幕

    7月10日,2022年(第十四届)苏州国际精英创业周相城分会场暨长三角人才交流与项目合作峰会拉开帷幕,来自各个领域的创新创业精英齐聚苏州相城分会场.作为第十届CCF 大数据与计算智能大赛(即2022 ...

  4. ModelArts的雪中送炭,让我拿下CCF BDCI华为Severless工作负载预测亚军

    摘要: 中国计算机学会大数据与计算智能大赛(CCF BDCI)华为Severless工作负载预测亚军方案和ModelArts使用体验分享 本文分享自华为云社区<免费薅ModelArts算力资源- ...

  5. 2022 CCF BDCI数字经济创新应用案例大赛决赛晋级名单

    自4月26日开赛以来,2022 CCF BDCI·数字经济创新应用案例大赛共吸引了381名选手报名并组成262支队伍参赛.经过近2个月的激烈角逐,大赛完成了初赛比拼. 依据大赛规则,秉持公平公正的原则 ...

  6. 【2022 CCF BDCI 文心大模型创意项目】乐享词话—诗词意境辅助记忆工具

    [2022 CCF BDCI 文心大模型创意项目]「乐享词话」--诗词意境辅助记忆工具 唐诗宋词记忆不下来?快来领取你的专属辅助记忆工具! 「乐享词话」允许你将古诗词中的意境提取出来,更直观地感受古诗 ...

  7. [2022 CCF BDCI 文心大模型]还在愁没有头像?属于你的个人头像来了!

    [2022 CCF BDCI 文心大模型]还在愁没有头像?属于你的个人头像来了! 用文本就可以生成不错的图片??这不快来体验一下??! AiStudio项目地址,选择hub版,代码fork后无脑运行: ...

  8. 【2022 CCF BDCI 文心大模型创意项目】中秋款文心带你轻松搞定MV制作

    [2022 CCF BDCI 文心大模型创意项目]中秋款文心带你轻松搞定MV制作 项目效果先知 项目地址: https://aistudio.baidu.com/aistudio/projectdet ...

  9. 【2022 CCF BDCI 文心大模型创意项目】AI一键搞定全套写文稿

    ★★★ 本文源自AI Studio社区精品项目,[点击此处]查看更多精品内容 >>> [2022 CCF BDCI 文心大模型创意项目]AI一键搞定全套写文稿加配图(文心大模型图文创 ...

最新文章

  1. OpenGL:使用FBO为渲染对象并从GPU取出存图
  2. docker 搭建 ftp服务器
  3. Mysql的数据库和客户端环境搭建(三)
  4. 夜班工作有哪些优缺点?
  5. mysql tcp优化_mysql 优化
  6. golang 判断时间是否是 rfc3339_[Golang实现JVM第一篇] 知识准备amp;前言
  7. Datalogic DS2100
  8. 《数字图像处理》实验二
  9. 在网页中实现录音功能
  10. 松翰单片机定时器c语言,松翰T0 定时器中断
  11. 利用GSensor让屏幕实现360度旋转
  12. 看小姐姐用动图展示 10 大 Git 命令
  13. 计算机图片颜色是红色怎么办,电脑变色是怎么回事?(有图片)
  14. led的伏安特性曲线 matlab实现_光电池伏安特性测试MATLAB制图程序
  15. 八数码(有一个空的移动拼图模型+map.count的用法)
  16. OPA 20 - deliberately generate an error
  17. 基金小白理财收益超过1万+的回顾
  18. 本地的registry图形化界面harbor安装与使用--02
  19. 人际关系三维理论(转载)
  20. 用raptor计算计算机课成绩,RAPTOR程序设计例题参考答案课案

热门文章

  1. 读后感:《曾国藩》收编 绿营兵
  2. java计算机毕业设计燕理快递中转站系统设计与实现MyBatis+系统+LW文档+源码+调试部署
  3. Linux下设备树中常用的of操作函数举例
  4. 荒谬!高校院长在Nature论文一作位置P上自己名字,还写到简历里...
  5. 4个经典的品牌营销活动案例分析,值得借鉴!
  6. 车联网布局,阿里领先了百度腾讯多少?
  7. kaggle新赛:蛋白质功能预测大赛baseline
  8. SnackBar 的使用
  9. TYPE-C转DC转接头方案,取电芯片ECP5701支持5V、9V、12V、15V、20V电压输出
  10. 红外线遥控c语言程序,红外线遥控解码接收程序-C语言.doc