这份GitHub 2.3k星的ML论文清单拿好,工作用得上
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
工欲善其事,必先利其器。
在工作中动手实施自己的ML项目之前,了解领域里的前沿进展,吸收前人的经验,是很有必要的。
不过,现在arXiv上每天都有成百篇新论文冒头,哪些值得看?
为此,亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。
这些论文/文章涵盖24种不同分类,从搜索排名到NLP、CV,都能在这里找到:
数据质量
数据工程
数据挖掘
分类
回归
推荐算法
搜索排名
嵌入
自然语言处理
序列建模
预测
计算机视觉
强化学习
异常检测
图形
优化
信息提取
弱监督
生成
效率
验证和A/B测试
伦理道德
实践
失败
目前标星2.3k。
以推荐算法为例。
对于不同的行业,业务差别很大。即使算法基础框架大同小异,想要训练出精准的推荐模型,细节上还是有许多不同之处。
而这份清单,收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。
比如阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。
论文介绍了行为序列Transformer在阿里电子商务推荐系统中的应用。
研究人员提出,利用Transformer模型来捕捉用户行为序列背后的顺序信号,以增强个性化推荐的有效性,提升点击量。经过实验验证后,他们将该模型部署在了淘宝线上,证明与基线相比,该方法能显著提高在线点击率。
论文链接:
https://arxiv.org/abs/1905.06874
在视频个性化推荐方面,YouTube、网飞、TikTok的技术方案都有收录。
比如YouTube这篇引用次数达到1039次的《Deep Neural Networks for YouTube Recommendations》。
论文重点介绍了深度学习给YouTube推荐系统带来的巨大性能提升。首先,研究人员详细介绍了深度候选征程模型和深度排名模型。而后,研究人员还在论文中分享了从设计、迭代到维护一个拥有海量用户的大规模推荐系统这个过程中,获得的实践经验和启示。
论文地址:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf
另外,比较有趣的是,这份论文/文章列表还收录了一些失败的经验。
比如Google Photos在给照片打标签时,曾经严重翻车:把黑人标记成了“大猩猩”。
最近大火的GPT-3,则没有解决前代GPT-2的“偏见”问题,在生成的文字中,总是将穆斯林和暴力、死亡联系在一起。
关于作者
这一项目的主要维护者,是亚马逊应用科学家Eugene Yan。
他本科毕业于新加坡管理大学,专业是心理学和人力资源管理,后于佐治亚理工学院获计算机科学硕士学位。
现在的主要工作是利用消费者数据,构建机器学习系统以提升用户体验。
传送门
项目地址:
https://github.com/eugeneyan/applied-ml
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
一键三连「分享点赞和在看」
科技前沿进展日日相见~
这份GitHub 2.3k星的ML论文清单拿好,工作用得上相关推荐
- GitHub超3k星!从Python代码到APP只需要一个小工具~
来源:机器之心 本文约2600字,建议阅读7分钟. 本文带你了解这款工具,在你写 Python 代码的时候,实时更新你的应用. 机器学习开发者想要打造一款 App 有多难?事实上,你只需要会 Pyth ...
- 特斯拉AI总监用300行代码实现“迷你版GPT”,上线GitHub三天收获3.3k星
晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI "GPT并不是一个复杂的模型." 前OpenAI科学家.现任特斯拉AI总监的Andrej Karpathy在自己的Gi ...
- BAT华为美团头条面试考什么?这份GitHub万星资源,告诉你面试题+答案+出题人分析...
铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 2020校招脚步临近,怎样备战即将到来的面试,在众多面试者中脱颖而出惊艳到面试官,化身大厂Offer收割机? GitHub上就有这样一个万星 ...
- PyTorch超级资源列表(Github 2.4K星)包罗万象
PyTorch超级资源列表,包罗万象 PyTorch超级资源列表(Github 2.4K星)包罗万象 -v7.x 1 Pytorch官方工程 2 自然语言处理和语音处理(NLP & Speec ...
- GitHub超过2600星的TensorFlow教程,简洁清晰还不太难丨资源
伊瓢 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最近,弗吉尼亚理工博士Amirsina Torfi在GitHub上贡献了一个新的教程,教程清晰简单,喜提2600颗星~ 这个教程不一样 T ...
- 留言赠书|GitHub收获1W星标《迁移学习导论》重新整理升级
迁移学习怎么学? 相信不少小伙伴最初都是通过王晋东老师知乎上的<小王爱迁移>系列文章或在GitHub上开源发布的<迁移学习简明手册>来学习的! 这一系列的材料帮助了很多读者可以 ...
- @即将开学的你,请收好这份必读论文清单
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- CSDN:2018年度CSDN博客之星评选竞赛——094号,感谢您,投上的宝贵一票,感谢!感恩!
CSDN:2018年度CSDN博客之星评选竞赛--094号,感谢您,投上的宝贵一票,感谢!感恩! 目录 导读 2018年我的主题-感恩 CSDN简介 CSDN使命 CSDN的合作伙伴 导读 我是第09 ...
- 崩坏星穹铁道电脑版 如何用模拟器在PC上玩崩坏星穹铁道手游教程
米哈游崩坏系列最新作,大地图箱庭迷宫探索RPG游戏<崩坏:星穹铁道>1.0版本「通往群星的轨道」官宣将于4月23日开启预下载,并于4月26日上午10点正式上线,敬请期待! <崩坏星穹 ...
最新文章
- Kali2021.2 VMware最新版安装步骤
- HDU 1155 Bungee Jumping
- yolov3 权重转换
- php 自带sql防注入函数,php 最简单sql防注入函数与方法_PHP教程
- 用python解决生活问题_Python解决生活问题之闹钟程序的实现
- 【Web应用-FTP】FTP 容量显示说明
- 在WCF中使用Ninject轻量级IOC框架 之 SOAP风格服务
- h5微信游戏服务器,H5游戏微信大型帮派战源码分享 带服务器端+客户端
- 微软云服务器的优点,探寻:微软私有云的优势究竟是什么
- 数据挖掘--决策树ID3+k-means聚类分析西瓜数据
- 20+非常棒的Photoshop卡通设计教程
- 2019年互联网寒冬,带你走进真实的面试杀出重围
- java 支持哪些字体_java有哪些字体
- 如何绘制程序流程图?绘制程序流程图工具介绍及功能讲解
- cpe(通用平台枚举)命名规范及python CPE库实战
- Verilog 总结
- 外企面试,哪有你想象的那么难!
- 力扣今日打卡数独解答
- Vue中gsap库实现数字递增动画
- Compuware Softice的烦恼
热门文章
- sql的四种连接 用mysql的语句写_170221、浅谈mysql的SQL的四种连接
- 分享3个好用到爆的 Python 模块,点赞收藏
- 卷学历、卷加班……程序员拥有什么能力才能破局内卷?
- Copilot 真会砸了程序员的饭碗?
- 梯度中心化,一行代码加速训练并提升泛化能力
- AI+大数据顶级技术盛会开幕在即,6.6折特惠票限时抢购
- 未来之城,管理者可能不是人......
- 史上最简单的人脸识别项目登上GitHub趋势榜
- AI,被“横扫记录”反噬?
- 用这个Python库,训练你的模型成为下一个街头霸王!