鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

工欲善其事,必先利其器。

在工作中动手实施自己的ML项目之前,了解领域里的前沿进展,吸收前人的经验,是很有必要的。

不过,现在arXiv上每天都有成百篇新论文冒头,哪些值得看?

为此,亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。

这些论文/文章涵盖24种不同分类,从搜索排名到NLP、CV,都能在这里找到:

  1. 数据质量

  2. 数据工程

  3. 数据挖掘

  4. 分类

  5. 回归

  6. 推荐算法

  7. 搜索排名

  8. 嵌入

  9. 自然语言处理

  10. 序列建模

  11. 预测

  12. 计算机视觉

  13. 强化学习

  14. 异常检测

  15. 图形

  16. 优化

  17. 信息提取

  18. 弱监督

  19. 生成

  20. 效率

  21. 验证和A/B测试

  22. 伦理道德

  23. 实践

  24. 失败

目前标星2.3k。

推荐算法为例。

对于不同的行业,业务差别很大。即使算法基础框架大同小异,想要训练出精准的推荐模型,细节上还是有许多不同之处。

而这份清单,收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。

比如阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。

论文介绍了行为序列Transformer在阿里电子商务推荐系统中的应用。

研究人员提出,利用Transformer模型来捕捉用户行为序列背后的顺序信号,以增强个性化推荐的有效性,提升点击量。经过实验验证后,他们将该模型部署在了淘宝线上,证明与基线相比,该方法能显著提高在线点击率。

论文链接:
https://arxiv.org/abs/1905.06874

在视频个性化推荐方面,YouTube、网飞、TikTok的技术方案都有收录。

比如YouTube这篇引用次数达到1039次的《Deep Neural Networks for YouTube Recommendations》。

论文重点介绍了深度学习给YouTube推荐系统带来的巨大性能提升。首先,研究人员详细介绍了深度候选征程模型和深度排名模型。而后,研究人员还在论文中分享了从设计、迭代到维护一个拥有海量用户的大规模推荐系统这个过程中,获得的实践经验和启示。

论文地址:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

另外,比较有趣的是,这份论文/文章列表还收录了一些失败的经验。

比如Google Photos在给照片打标签时,曾经严重翻车:把黑人标记成了“大猩猩”。

最近大火的GPT-3,则没有解决前代GPT-2的“偏见”问题,在生成的文字中,总是将穆斯林和暴力、死亡联系在一起。

关于作者

这一项目的主要维护者,是亚马逊应用科学家Eugene Yan。

他本科毕业于新加坡管理大学,专业是心理学和人力资源管理,后于佐治亚理工学院获计算机科学硕士学位。

现在的主要工作是利用消费者数据,构建机器学习系统以提升用户体验。

传送门

项目地址:
https://github.com/eugeneyan/applied-ml

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

一键三连「分享点赞和在看」

科技前沿进展日日相见~

这份GitHub 2.3k星的ML论文清单拿好,工作用得上相关推荐

  1. GitHub超3k星!从Python代码到APP只需要一个小工具~

    来源:机器之心 本文约2600字,建议阅读7分钟. 本文带你了解这款工具,在你写 Python 代码的时候,实时更新你的应用. 机器学习开发者想要打造一款 App 有多难?事实上,你只需要会 Pyth ...

  2. 特斯拉AI总监用300行代码实现“迷你版GPT”,上线GitHub三天收获3.3k星

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI "GPT并不是一个复杂的模型." 前OpenAI科学家.现任特斯拉AI总监的Andrej Karpathy在自己的Gi ...

  3. BAT华为美团头条面试考什么?这份GitHub万星资源,告诉你面试题+答案+出题人分析...

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 2020校招脚步临近,怎样备战即将到来的面试,在众多面试者中脱颖而出惊艳到面试官,化身大厂Offer收割机? GitHub上就有这样一个万星 ...

  4. PyTorch超级资源列表(Github 2.4K星)包罗万象

    PyTorch超级资源列表,包罗万象 PyTorch超级资源列表(Github 2.4K星)包罗万象 -v7.x 1 Pytorch官方工程 2 自然语言处理和语音处理(NLP & Speec ...

  5. GitHub超过2600星的TensorFlow教程,简洁清晰还不太难丨资源

    伊瓢 发自 凹非寺  量子位 报道 | 公众号 QbitAI 最近,弗吉尼亚理工博士Amirsina Torfi在GitHub上贡献了一个新的教程,教程清晰简单,喜提2600颗星~ 这个教程不一样 T ...

  6. 留言赠书|GitHub收获1W星标《迁移学习导论》重新整理升级

    迁移学习怎么学? 相信不少小伙伴最初都是通过王晋东老师知乎上的<小王爱迁移>系列文章或在GitHub上开源发布的<迁移学习简明手册>来学习的! 这一系列的材料帮助了很多读者可以 ...

  7. @即将开学的你,请收好这份必读论文清单

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  8. CSDN:2018年度CSDN博客之星评选竞赛——094号,感谢您,投上的宝贵一票,感谢!感恩!

    CSDN:2018年度CSDN博客之星评选竞赛--094号,感谢您,投上的宝贵一票,感谢!感恩! 目录 导读 2018年我的主题-感恩 CSDN简介 CSDN使命 CSDN的合作伙伴 导读 我是第09 ...

  9. 崩坏星穹铁道电脑版 如何用模拟器在PC上玩崩坏星穹铁道手游教程

    米哈游崩坏系列最新作,大地图箱庭迷宫探索RPG游戏<崩坏:星穹铁道>1.0版本「通往群星的轨道」官宣将于4月23日开启预下载,并于4月26日上午10点正式上线,敬请期待! <崩坏星穹 ...

最新文章

  1. Kali2021.2 VMware最新版安装步骤
  2. HDU 1155 Bungee Jumping
  3. yolov3 权重转换
  4. php 自带sql防注入函数,php 最简单sql防注入函数与方法_PHP教程
  5. 用python解决生活问题_Python解决生活问题之闹钟程序的实现
  6. 【Web应用-FTP】FTP 容量显示说明
  7. 在WCF中使用Ninject轻量级IOC框架 之 SOAP风格服务
  8. h5微信游戏服务器,H5游戏微信大型帮派战源码分享 带服务器端+客户端
  9. 微软云服务器的优点,探寻:微软私有云的优势究竟是什么
  10. 数据挖掘--决策树ID3+k-means聚类分析西瓜数据
  11. 20+非常棒的Photoshop卡通设计教程
  12. 2019年互联网寒冬,带你走进真实的面试杀出重围
  13. java 支持哪些字体_java有哪些字体
  14. 如何绘制程序流程图?绘制程序流程图工具介绍及功能讲解
  15. cpe(通用平台枚举)命名规范及python CPE库实战
  16. Verilog 总结
  17. 外企面试,哪有你想象的那么难!
  18. 力扣今日打卡数独解答
  19. Vue中gsap库实现数字递增动画
  20. Compuware Softice的烦恼

热门文章

  1. sql的四种连接 用mysql的语句写_170221、浅谈mysql的SQL的四种连接
  2. 分享3个好用到爆的 Python 模块,点赞收藏
  3. 卷学历、卷加班……程序员拥有什么能力才能破局内卷?
  4. Copilot 真会砸了程序员的饭碗?
  5. 梯度中心化,一行代码加速训练并提升泛化能力
  6. AI+大数据顶级技术盛会开幕在即,6.6折特惠票限时抢购
  7. 未来之城,管理者可能不是人......
  8. 史上最简单的人脸识别项目登上GitHub趋势榜
  9. AI,被“横扫记录”反噬?
  10. 用这个Python库,训练你的模型成为下一个街头霸王!