1 kaggle简介

赛题分类方式一:

Featured:商业或科研难题,奖金一般较为丰厚

Recruitment:比赛的奖励为yi

Research:科研和学术性较强的比赛,也有一般需要较强的领域和专业知识

Playground:提供一些简单的任务用于熟悉平台和比赛

Getting Started:提供一些简单的任务用于熟悉平台和比赛

In Class:用于课堂项目作业或者考试

赛题分类方式二:

在线提交和离线提交

赛题分类方式三 :

数据分类:数据挖掘、图像、语音、自然语言

2 比赛通用流程

1)EDA数据分析

看数据长什么样,从数据的结构、分布来思考如何解决问题,用一些trip来弥补数据上的问题

2)特征工程

现在CV比赛较多,这部分就比较少

3)模型训练

选一个baseline,选一套模型框架来训练,训练的模型有很多trike,可能是训练时的,可能是构建时的

4)线下验证

通过验证集分析BadCase为什么效果不好,找模型改进的方式

要多找工具复用来满足比赛的需求

3 数据样本分析:

训练集样本bbox分布。看没有bbox样本的数量,单样本量,分布是否符合正态分布。

部分样本存在超大bbox,两种解决方案,1把这部分的样本直接去除掉;2把这部分作为噪声保留,可能会提升泛化能力,至于哪种方案自己决定

4 Baseline思路介绍

1)基础数据增强(CV常用)

HSV通道颜色变换、亮度、对比度变换,水平翻转、垂直翻转,转灰度图,随机裁剪

2)进阶数据增强

Cutout:随机的将样本中的部分区域cut掉,并且填充0像素值,分类的结果不变,模拟被遮挡的效果,模仿了dropout的效果,随机丢弃一些神经元,随机丢弃一些像素

Cutmix:将一部分区域cut掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值,分类结果按一定的比例分配

3)训练策略

K-fold训练

学习率策略:

ReduceLROnPlateau自适应调整学习率,当某指标不再变化(下降或升高),调整学习率

LambadLR:将每一个参数组的学习率设置为初始学习率lr的某个函数倍

Kaggle比赛如何开始相关推荐

  1. 竞赛老陪跑怎么办?来自一位Kaggle比赛失败者的含泪总结

    大数据文摘出品 来源:medium 编译:zeroInfinity.笪洁琼 Kaggle比赛应该是数据竞赛中公认含金量最高的那个.每场比赛,参加的队伍至少上千人,也并非每次都次都能脱引而出,一不小心就 ...

  2. 在参加了39场Kaggle比赛之后,有人总结了一份图像分割炼丹的「奇技淫巧」

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转载自:机器之心 一个经历了 39 场 Kaggle 比赛的团队 ...

  3. 通俗理解kaggle比赛大杀器xgboost + XGBOOST手算内容 转

    通俗理解kaggle比赛大杀器xgboost    转 https://blog.csdn.net/v_JULY_v/article/details/81410574 XGBOOST有手算内容 htt ...

  4. Kaggle比赛冠军经验分享:如何用 RNN 预测维基百科网络流量

    Kaggle比赛冠军经验分享:如何用 RNN 预测维基百科网络流量 from:https://www.leiphone.com/news/201712/zbX22Ye5wD6CiwCJ.html 导语 ...

  5. Kaggle常用函数总结 原创 2017年07月03日 21:47:34 标签: kaggle 493 kaggle比赛也参加了好几次,在这里就把自己在做比赛中用到的函数汇总到这,方便自己以后查阅

    Kaggle常用函数总结 原创 2017年07月03日 21:47:34 标签: kaggle / 493 编辑 删除 kaggle比赛也参加了好几次,在这里就把自己在做比赛中用到的函数汇总到这,方便 ...

  6. kaggle比赛模型融合指南

    kaggle比赛模型融合指南 转载 2017年10月13日 16:29:32

  7. EL之Bagging:kaggle比赛之利用泰坦尼克号数据集建立Bagging模型对每个人进行获救是否预测

    EL之Bagging:kaggle比赛之利用泰坦尼克号数据集建立Bagging模型对每个人进行获救是否预测 目录 输出结果 设计思路 核心代码 输出结果 设计思路 核心代码 bagging_clf = ...

  8. ML之RF:kaggle比赛之利用泰坦尼克号数据集建立RF模型对每个人进行获救是否预测

    ML之RF:kaggle比赛之利用泰坦尼克号数据集建立RF模型对每个人进行获救是否预测 目录 输出结果 实现代码 输出结果 后期更新-- 实现代码 #预测模型选择的RF import numpy as ...

  9. ML之FE:结合Kaggle比赛的某一案例细究特征工程(Feature Engineering)思路框架

    ML之FE:结合Kaggle比赛的某一案例细究特征工程(Feature Engineering)思路框架 目录 Feature Engineering思路框架 1.结合Kaggle比赛的某一案例细究F ...

  10. ML之FE:Kaggle比赛之根据城市自行车共享系统数据进行FE+预测在某个时间段自行车被租出去的个数

    Kaggle比赛之根据城市自行车共享系统数据预测在某个时间段自行车被租出去的个数 目录 一.FE整体设计思路 二.FE分步骤处理 相关代码 输出结果 一.FE整体设计思路 二.FE分步骤处理 相关代码 ...

最新文章

  1. 图论之拓扑排序 poj 2367 Genealogical tree
  2. Intel Realsense D435 python (Python Wrapper)example -1: quick start (快速开始)
  3. firebird 3.0 开发者指南_11月19日召开 2020 vivo开发者大会报名正式开启
  4. psql where里有自定义函数慢_使用gplearn自定义特征自动生成模块
  5. python实例32[简单的HttpServer]
  6. Silverlight实用窍门系列:63.Silverlight中的Command,自定义简单Command
  7. flowable实战(十一)flowable 删除数据库表先后顺序
  8. C#LeetCode刷题-几何
  9. 读取PDF的文字--zt
  10. mutations vuex 调用_Vuex源码解析
  11. django 如何接收bootstrap-table传送的 ajax数组
  12. 1月29日以后需要做的事情
  13. php ajax 返回字符串而不是对象
  14. LynxFly科研小四轴横空出世,开源,F4,WIFI
  15. java仓库管理设计报告_仓库管理系统(课程设计JSPJAVA大学设计).doc
  16. 创业公司如何划分股份
  17. 必应壁纸php,PHP 自动保存Bing 每日壁纸
  18. verify_area
  19. 再论硬件产品经理的岗位要求
  20. python从菜鸟到高手李宁pdf_尹成学院-Python从菜鸟到高手编程实战【已完结 28G】...

热门文章

  1. 苹果手机升级后怎么恢复旧版本_手机误删视频怎么恢复?同时适合安卓和苹果手机的恢复方法!...
  2. OGRE在渲染通路中使用顶点程序和片断程序
  3. apt-get E: invalid for another 97d 16h 31min 18s) / ubuntu修改系统时间
  4. Modbus协议与SerialPort端口读写
  5. Linux安装Maven一条龙服务
  6. win10怎么显示文件后缀_U盘数据丢失怎么恢复?数据恢复软件推荐
  7. Android使用Builder模式自定义Dialog
  8. BootStrap4工具类之屏幕阅读器
  9. vSphere部署黑群晖详细步骤---实现家庭云盘,文件同步等实用功能(上)
  10. maven nexus-staging-maven-plugin exception-connect timed out