杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI

Kaggle大神是如何炼成的?

最近,一个印度裔Kaggle大神在论坛上分享了他获得4个类别的Grandmaster的经历。

嗯,一共就只有四种。

可以看到,他的金牌总数加起来就有84枚,其中Discussion上获得了56枚,数据集这一类别的排名术最高,在27466个选手中位列第7位,最高排名为第6位。

在Competitions里,他共获得了4枚单人金牌和4枚团队金牌。

为此,他就发表了一篇博文回忆了过去一些印象深刻的项目,并感谢Kaggle给他这样一个平台:

我断断续续在Kaggle上跑了七年,这真是一段旅程。

Kaggle不仅仅是网站或竞赛。对于喜欢数据科学和机器学习的人来说,这是一生的经历。

除此之外,他还是一个数独爱好者,多次获得国家冠军,最高排名第8。

4个Kaggle Grandmaster的经历

首先是Competitions

在过去7年中,他共完成了56场比赛,他的最高成绩是4枚个人金牌和4枚团队金牌。

其中Santander、ASHRAE这几个金牌项目令他印象深刻。

Santander Product Recommendation,桑坦德产品推荐。(桑坦德,西班牙的一个银行)

这一挑战中,主要是根据客户过去的行为以及类似客户的行为,来预测现有客户下个月将使用哪些产品,进而将产品和人来匹配。

最终,共有1779支队伍参加,而他与另一位数据科学家合作@sudalairajkumar,排列第11位,摘得他第五枚金牌。

还有像ASHRAE,预测建筑物将消耗多少能量?Rossmann Store Sales,利用商店促销、竞争对手来分析销售情况等等。

作者认为,这是唯一具有意义的积分排名系统类别。他希望可以成为Kaggle以外的行业标准,使其更具价值。

然后是Datasets

作者表示,为数据集争取投票是最具挑战性任务之一。

因此,他就以对终端用户最有用、最为结构化的格式来准备数据集,并加以尽可能多的细节描述。

一些令人印象深刻的数据有这些:

  • 印度的空气质量:作者花了100小时来汇总、清理和准备这个数据集。

  • Chai Time Data Science Show(对ML专家的采访节目)每集的统计数据;

  • 女特级大师的国际象棋比赛(2009-2020年)。嗯,国际象棋是作者的最爱。

不过,在他发布的18个数据集当中,我还是发现了一些有趣的数据集。

比如,拜登的从2007年-2020年数据推特数。

SpaceX的数据(2006-2020)。

还有Notebooks

在比赛结束之前,作者是不会看公共EDA Notebook。一般是在完成自己深度EDA后再看别人的工作。

按照这样的方式,他就获得了15枚金牌,4枚银牌以及6枚铜牌,达到大师级别。

不过,他也感叹道,用Macbook Air赢得比赛的日子已经一去不复返了,但谁说不会再尝试了呢。

最后还有,Discussions

作为喜欢交流的他,除了获得以上成绩之外,他还对社区一些建议,

社区通过帖子的净投票来优先处理有用的讨论,并过滤掉垃圾信息,这一点做得很好。

我希望Datasets和Notebooks也能允许下拉投票,不被区别对待。

2020年亚洲数独锦标赛银牌得主

来介绍一下作者本作——Vopani,真名叫做Rohan Rao,来自印度,是H2O.ai的数据科学家,毕业于印度孟买理工学院应用统计学专业。

而H2O.ai是一家成立于2012年,总部位于硅谷的开源软件公,该公司拥有一个数据科学和机器学习的开源平台H2O。据介绍称,一半的世界五百强公司都在使用这个平台。

除此之外,他还是一个数独爱好者。

他曾获得7次全国数独冠军,5次全国拼图类冠军,4次时代数独国家冠军,2020年亚洲数独锦标赛银牌得主。

目前数独世界排名在第23名,最佳成绩到过第8名。

果然,优秀的人一定不只一个地方优秀。

好了,所以你身边有没有遇到Kaggle大神的经历,欢迎与我们分享。

参考链接:
https://www.kaggle.com/general/195396

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

印度裔Kaggle大神自述:我是如何获得所有4个类别的Grandmaster相关推荐

  1. 计算机专业报考小学语文老师,各位大神,我是今年的专科应届毕业生,计算机应用专业,想当小学语文老师,考教师资格证对专业有限制吗?...

    各位大神,我是今年的专科应届毕业生,计算机应用专业,想当小学语文老师,考教师资格证对专业有限制吗?以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让 ...

  2. 电脑发短信_让电脑自动给老婆发短信?!这个懒到极致的大神,我是服了...

    话说, 比尔·盖茨大大说过这么一句名言: "我会选个懒人去做复杂的工作,因为他们总能想出更快速简单的解决方案." 我觉得他说的一点错没有,人懒到一定程度,创造力真的会爆表. 躺着看 ...

  3. 独家 | Kaggle 大神Dan Becker与你分享他的数据科学之旅!

    作者:ANALYTICS VIDHYA 翻译:吴振东 校对:和中华 本文约4000字,建议阅读10分钟 本文中Kaggle大佬Dan Becker谈论了自己从经济学向数据科学的转变,从零开始成为数据科 ...

  4. Kaggle 大神 Eureka 的高手进阶之路

    转自:https://baijiahao.baidu.com/s?id=1594269125827729365&wfr=spider&for=pc 雷锋网 AI 研习社按:作为全球首屈 ...

  5. 大神用法 | 我是这样「拆建」笔记结构的

    穆月课的原文地址为:http://www.douban.com/note/480245098/ 以下为印象笔记整理的结果,其原文地址为:http://chuansong.me/n/1709922 今天 ...

  6. k8w大神,我是真服了!跪服

    ❓ 帧同步和状态同步可以并用? ❓ 200ms 毫秒延迟也能实现单机游戏般的丝滑流畅? ❓ 有延迟的情况下怎么实现技能判定? 先来看看 2 天时间做的 Demo (由 TSRPC + Cocos Cr ...

  7. 竞赛比完,代码、模型怎么处理?Kaggle 大神:别删,这都是宝藏

    选自 | medium 作者 | Vladimir Iglovikov 转自 | 机器之心 那些被遗忘的竞赛项目代码.权重可能也是一笔宝藏. 很多人可能参加过许多比赛,做过许多项目,但比赛或项目结束之 ...

  8. Kaggle大神:竞赛代码别删,这都是宝藏

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 选自medium 作者:Vladimir Iglovikov 机器之心编译 那些被遗忘 ...

  9. 如何把薪资谈高一倍?请看大厂offer拿到手软的ML大神自述

    点击"小詹学Python","星标"或"置顶" 关键时刻,第一时间送达 本文转载自"机器之心" 本文作者刚刚博士毕业,在 ...

最新文章

  1. 数据库中日期大小的判断
  2. Mac使用自带的屏幕共享实现VNC连接KVM时需要输入密码的问题解决
  3. python代码壁纸-70行python代码实现壁纸批量下载
  4. HDU1166 敌兵布阵(树状数组模板题)
  5. 对MVC、MVP、MVVM的理解
  6. Linux系统中fflush,sync,syncfs,fdatasync,fsync的比较
  7. 第七届蓝桥杯(国赛)——随意组合-dfs,next_permutation
  8. Upload-Labs(11-15)
  9. pythonpyqt5线程暂停重启时间_PyQT5 停止死循环线程(监控文件是否修改)
  10. Java移位运算符:<<,>>,>>>
  11. 在+android+4.4+系统使用+flash功能,科技来电:flash王者归来 全面支持安卓4.2+
  12. Windows系统封装(二)导入封装工具安装软件,安装系统。
  13. linux实验报告ALU,《linux内核分析》第一次课 实验作业
  14. 企业级Docker Registry —— Harbor搭建和使用
  15. 项目管理心得:一个项目经理的个人体会、经验总结
  16. Java内存区域和GC机制
  17. Linux+开发+运维-推荐书籍与学习路线
  18. 《推荐系统实践》__第1章__好的推荐系统
  19. linux系统优化脚本,linux系统优化脚本详解
  20. 不可注册为ActiveX控件

热门文章

  1. java序列化的作用-这个挺有用的,不妨学学
  2. 【组队学习】十一月微信图文索引
  3. 【直播】杨剑砺:数据可视化漫谈
  4. 有符号整型的数据范围为什么负数比正数多一个?
  5. 如何利用 C# 爬取「当当 - 计算机与互联网图书销量榜」!
  6. Matlab与线性代数 -- 矩阵的水平连接和垂直连接
  7. IDEA HDFS客户端准备
  8. 图神经网络如何对知识图谱建模? | 赠书
  9. 多场景下的AI疫情防控“天网”:解读云边端联动下的全栈AI技术
  10. 基于深度学习的低光照图像增强方法总结(2017-2019)| CSDN博文精选