据移动应用数据分析平台 App Annie 在 7 月 10 日发布的 2019 年第二季度最新移动应用市场报告显示,快手在 2019 年第二季度消费额排名中位于第四,成为中国最赚钱的短视频平台之一。

快手的盈利能力从侧面反映出快手内容的受欢迎程度,用过这个软件的小伙伴可能深有体会,当你点击感兴趣的视频之后,快手会自动推荐更多符合你的兴趣的内容,不知不觉时间就过去很久。快手能够了解用户兴趣并根据用户喜好推荐感兴趣的视频,归功于它背后的个性化推荐系统。

然而,面对 2 亿日活,日均千万级视频上传的业务规模,快手推荐系统面临的技术挑战巨大。短视频内容推荐领域有哪些难点和痛点?快手推荐系统如何解决这些问题?与同类型平台的推荐系统相比,快手推荐系统有何特别之处?这些疑问,快手推荐架构负责人任恺将在本文一一解答。

短视频内容推荐的难点和挑战

任恺表示,和其他大体量的短视频平台一样,快手的短视频内容推荐面临着多方面的挑战:一是推荐系统扩展性的挑战,随着活跃用户数、用户时长日益增加,推荐模型和策略日益复杂,都对推荐系统的扩展性形成巨大压力;另一方面,快手短视频每天有千万级别的视频上传,如何进行平等普惠和秒级实时的流量分发、创建社区生态,也对系统和算法提出了巨大挑战。

为了解决上述问题,快手在架构层面上使用计算与存储分离的方式来水平扩展系统,以提高硬件资源的利用率。另一方面,为了建立秒级实时系统,快手首先使用自建的实时数据流系统保证特征和训练样本的实时更新,同时利用自研的模型训练框架来支撑千亿参数的深度模型的在线学习。通过从系统、数据和模型三个层面改善实时性和扩展性,快手基本上可以克服上述短视频内容推荐的难点和痛点。

在此,任恺重点强调了工业级环境对推荐系统提出的挑战,推荐系统如何迭代才能应对工业环境变化带来的挑战呢?任恺说道,工业级别的推荐系统都是多人团队同时迭代的,如何构建好的平台型工具提高每个工程师的效率,以及如何进行服务治理提高系统整体效率和稳健性,都是决定一个系统是否成功的关键要素。另外,任何推荐算法和机制的改进都要围绕用户需求和用户生态来构建,任何工业级的推荐系统迭代都需要考虑以上要素。

快手推荐系统机制与架构

与 YouTube、今日头条、优酷等同类视频内容平台相比,快手的推荐系统有着自身的独特机制与策略,比如为了防止信息茧房,快手会在为用户进行个性化推荐的同时,帮助用户拓展兴趣边界,推荐用户可能感兴趣的内容。

通过推荐,快手想要鼓励视频生产和用户表达。快手每天用户的视频上传量达到千万级别,其中生产者的占比较高,且用户的平均视频上传量较高,因此,快手推荐系统的机制会考虑流量分发的普惠性,通过普惠性来鼓励用户通过短视频表达自己,并与其他用户建立社交关系。

在架构上,目前快手推荐系统采用计算与存储分离的模式(如下图所示)。其中,推荐系统中的存储型服务主要用来存储和实时更新上亿规模的用户画像、数十亿规模的短视频候选池,以及千亿规模的排序模型参数。而计算型服务主要进行视频召回检索、推荐模型预估和推荐策略计算。

(快手推荐系统架构简略图)

短视频行业推荐系统技术变迁

推荐系统用于短视频的历史不算很长,但是在这段时间,推荐技术已经经历过迅速的迭代和优化。从系统架构层面来说,随着用户规模和业务复杂程度的增长,系统逐渐呈现出分布式和异构化的趋势。在算法层面上则经历了树模型、大规模稀疏模型、在线学习模型、在线深度模型等一系列发展。

快手推荐系统也在技术变迁中紧跟技术潮流,采用最新的技术,并成为技术变迁的推动者之一,包括采用千亿级参数在线学习的深度模型、强化学习排序模型、基于 Embedding 向量召回等机器学习技术。

推荐系统值得关注的研究热点

任恺还提到了推荐系统领域未来可以重点关注的一些研究热点。他说道,在系统层面,很多新的商业级硬件技术,如可持久内存、RDMA 和 TPU 等都值得关注,因为系统架构可能需要对这些新硬件进行适配实现效率最大化。在算法层面上,关于推荐算法的公平性、可解释性以及数据隐私的保护也将是未来研究的关注热点。

最后,任恺表示,在不断迭代优化推荐系统的过程中,快手总结出一个经验,那就是以用户为中心和客观指标为导向的快速迭代,是构建推荐系统的成功关键,相信这对所有从事推荐领域的研究者和实践者都有借鉴意义。

想要了解更多关于快手推荐系统的技术细节和推荐技术发展现状吗?9 月 6 日,任恺将在 2019 AI ProCon 推荐系统技术论坛现场为大家解密《短视频推荐系统的架构设计与前沿技术探索》。

除了快手科技推荐架构负责人任恺,AI ProCon 推荐系统论坛上还有阿里妈妈深度学习算法平台负责人朱小强、京东集团高级总监殷大伟和华为诺亚方舟实验室推荐与搜索项目组资深研究员唐睿明,从不同维度对推荐系统和推荐技术做一次深度解析。

任恺,快手科技推荐架构负责人,2015年毕业于卡内基梅隆大学 (Carnegie Mellon University),获得博士学位。主要研究领域方向为大规模分布式系统、机器学习系统和大数据分析。博士期间发表多篇系统领域顶级会议论文,并曾获得2014年世界超算大会(Supercomputing)最佳论文奖。博士毕业后,曾担任Instagram广告组的研究科学家。作为Instagram广告组的创始成员,从零开始建设Instagram广告排序服务,和团队合作在一年内将Instagram广告营收做到数十亿美元规模。2019年加入快手,负责核心推荐系统和中台的建设,包括推荐线上服务、推荐模型大规模实时训练、推荐异构计算等项目。

演讲议题:

短视频推荐系统的架构设计与前沿技术探索

演讲内容简介:

快手短视频应用拥有2亿日活和日均千万级视频上传的世界级业务规模。

演讲提纲:

  1. 快手短视频推荐业务介绍

  2. 短视频推荐系统技术挑战

  3. 短视频推荐系统架构设计

    1. 计算与存储分离

    2. 计算引擎设计

    3. 存储引擎设计

  4. 推荐系统中的软硬结合设计

    1. GPU落地经验介绍

    2. 可持久内存落地经验介绍

  5. 推荐系统架构演进展望

大会全日程信息

(演讲内容以现场为准)

距离大会开幕还有 2 天,扫描下方二维码或点击阅读原文,马上来到大会现场!

2亿日活,日均千万级视频上传,快手推荐系统如何应对技术挑战?相关推荐

  1. 视频上传快手怎么去水印

    视频上传快手怎么去水印 在短视频操作中,视频修改的作用显得尤为重要,这里介绍几款常见的工具 1,批量下载软件(短视频无水印下载) 2,批量消重伪原创软件(视频深度消重伪原创处理) 歌乐软件,专业自媒体 ...

  2. PaaS 平台学习(开源力量OSF)构建千万级大规模、高可靠PaaS平台的技术挑战 学习笔记

    感谢许志强老师的辛苦付出.2015年1月13日 参加云通讯PaaS平台学习,特作此记录. 大纲: 选择Paas平台的考量(我的企业是否适合选PaaS平台,我应该选怎么样的PaaS平台) 基于PaaS平 ...

  3. 【揭秘】12306是如何抗住几亿日活、百万级高并发的?

    [欢迎关注微信公众号:厦门微思网络] 微思网络(官网):https://www.xmws.cn/ 每到节假日期间,一二线城市返乡.外出游玩的人们几乎都面临着一个问题:抢火车票! 虽然现在大多数情况下都 ...

  4. 快手架构师:3亿日活的快手微服务架构实践

    本文整理了,快手基础平台架构师曹福祥.大数据架构团队负责人赵健博,在技术大会上的分享,内容包括:快手微服务架构.大数据存储架构.Kafka技术演进等.从完整的技术架构视角,为你拆解3亿日活的快手App ...

  5. 快手架构师:3亿日活的快手微服务架构实践!8页ppt分享

    点击"技术领导力"关注∆  每天早上8:30推送 作者| Mr.K   编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 本文整理了,快手基础平台架构师曹 ...

  6. 微信技术总监:11亿日活的超大型系统架构之道!13页ppt详解

    点击"技术领导力"关注∆  每天早上8:30推送 作者| 周颢    整理| Mr.K 来源| 技术领导力(ID:jishulingdaoli) 作者,微信技术总监 周颢,2001 ...

  7. 怎样将本地视频上传到微信公众平台?

    最近不少小伙伴反映,需要将自己的本地视频发布到微信公众号文章里面,但是不知道该怎样发布. 网上的教程也是五花八门,但是大都需要上传到腾讯视频以后才可以,其实,如果是30分钟以内的视频,不需要上传到腾讯 ...

  8. php 视频 乐视云,乐视云视频PHP接口操作视频上传,编辑,查询以及删除

    最近项目接触到和视频有关的功能,同事推荐了乐视云开放平台.了解后觉得还不错,可以一试,于是开始查询相关接口. 功能开发从15年11月3日开始,到2015年11月12日完成上传.基本功能也完毕.中间碰到 ...

  9. 利用WebUploader实现大文件上传和视频上传

    文件上传是网站开发必不可少的,常见的有图片上传.但是大文件和视频上传不常见.这里我将自己写的视频上传demo贴出来供大家参考: 利用是最新的WebUploader插件请 下载使用最新版即可 js代码 ...

最新文章

  1. 数据结构-二叉树面试 常考
  2. kali linux切换更新源_使用Xshell链接Linux、kali更换更新源及kali安装软件
  3. 深度学习-Tensorflow2.2-RNN循环神经网络{11}-评论分类-25
  4. jmeter异步请求测试_使用JMeter对异步HTTP / REST服务进行压力/负载测试
  5. 使用wrapper将java程序注册程windows服务后不生效
  6. 张平文当选美国工业与应用数学学会会士
  7. 好象现在才开始热爱生活了
  8. centos 调整home分区xfs_centos下扩容根分区(针对xfs和ext4不同文件系统)
  9. 程序员面试金典——17.4无判断max
  10. [Flex] Flex 控件类 的自定义事件添加
  11. 【基础】CNN是靠什么线索学习到深度信息的?——一个经验性探索
  12. 图标和文字跟着div比例放大缩小_【方法技巧】高考地理越来越重视基本概念的考查,看高中地理如何考查比例尺的判读和应用,附专项练习...
  13. 2022爱分析· 地产科技厂商全景报告
  14. 使用MLM和TLM训练XLM
  15. 借助 Lucene.Net 构建站内搜索引擎(下)
  16. mongodb默认的用户名密码_MongoDB 用户名密码登录
  17. 保险行业CRM客户关系管理系统解决方案
  18. Thinkphp开发无需挂机开源版本支付系统原码带云端ZFB和WX免输入金额跳转支付
  19. bodgeito通关教程
  20. 2021-2027全球及中国远红外桑拿行业研究及十四五规划分析报告

热门文章

  1. Python-Django毕业设计白酒营销管理(程序+Lw)
  2. 服务器发送wifi信号,路由器用久了,WiFi信号慢,用以下方法解决,让网络飞起来...
  3. Linux命令之重启系统reboot
  4. imageview设置在最顶层_ImageView 常见知识
  5. 人工智能写一封种子信,真诚又用心(挽回必备神器)
  6. python安装urllib2_Python3安装与使用urllib2包之小坑
  7. 猿创征文|大数据bug笔记之利用Hudi将数据落地到HDFS
  8. jQuery DataTables 使用方法整理
  9. 第九章 从推销员干起
  10. 荒野行动幽灵修复服务器,幽灵行动荒野