一家创业公司面临的挑战

“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战,Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程,使我们仅用了3个月就完成了整个系统的建设并承受了实际用户访问的压力,实现了从0到1的突破。”谈起与AWS的合作,大宇无限技术副总裁刘克东如是说道。

深圳大宇无限科技有限公司(以下简称“大宇无限”)是一家专注于移动互联网应用的创业公司,2016年初成立,团队主要成员来自北京大学、香港科技大学、UCLA、Emory 等国内外知名高校,具有一流互联网公司从业背景。大宇无限每月为全球超过1亿的用户提供服务。

作为一家创业公司,大宇无限主要业务面向中东、东南亚、拉美等新兴市场国家,移动短视频服务是公司的主要业务方向之一。在成立之初,大宇无限的首要目标是开拓新业务并实现业务的快速增长,要实现这一目标,大宇无限需要应对一系列挑战。

首先要解决的是开发人员数量少与快速起步之间的矛盾。移动短视频服务包含在线视频推荐服务,需要构建机器学习系统,从设计架构、建立训练模型、选择算法和框架到最终部署到生产系统中,整个流程极为复杂,需要大量的开发人员耗费很长的时间才有可能完成。

其次是大宇无限的主要业务市场位于中东、东南亚与拉美,必须采用能够覆盖整个目标市场并提供稳定的网络访问的云平台。

第三是要尽量减轻整个系统运维管理的负担,降低系统的总体成本。

为了应对这些挑战,大宇无限在分析、比较了主流的云平台之后,选择了AWS,将整个业务系统部署在AWS云上,借助AWS云在机器学习领域的一系列云服务,快速完成了整个系统的开发和部署,实现了快速起步、为用户提供高质量短视频服务的目标。

为什么大宇无限选择了AWS

AWS云提供了很多业界认可的应用开发及部署服务、具有全球化的布局且提供多种计费方式,这些特点非常适合大宇无限对IT基础设施的要求。大宇无限的主打业务是基于人工智能的短视频分发系统,为了给用户提供良好体验,它需要解决两个重要问题:其一是根据用户的个人喜好进行视频的在线推荐;其二是过滤掉不当视频。完成这两项任务都需要开发人员具有深厚的机器学习专业技能,AWS云提供的Amazon SageMaker和Amazon Rekognition服务,极大地简化了大规模构建、训练和部署机器学习的流程,使大宇无限的开发团队能够快速实现这两项重要功能。

Amazon SageMaker是一个完全托管的服务,可以帮助开发人员和数据科学家快速而轻松地构建、训练和部署机器学习模型。一方面,Amazon SageMaker 可快速连接至训练数据所需的内容,使用户可以轻松构建机器学习模型并为训练做好准备;另一方面,Amazon SageMaker预装并优化了常用的机器学习算法,这使得用户无需花费大量时间去选择算法和框架。在进行训练时,用户只需单击一下,就可以在Amazon SageMaker控制台中开始训练自己的模型。当模型经过训练和调整后,Amazon SageMaker可以轻松地在生产环境中进行部署。“线上推荐我们是白手起家,如果没有Amazon SageMaker,我们需要花费半年的时间才能完成。有了它,我们无需构建基础设施,只需要算法工程师去驱动,为Amazon SageMaker准备数据,仅用了三个月的时间就完成了整个系统的建设并承受了实际用户访问的压力,实现了从0到1的突破。”刘克东说道。

在过滤不当视频方面,Amazon Rekognition发挥了至关重要的作用。Amazon Rekognition是基于Amazon计算机视觉科学家开发的成熟且高度可扩展的深度学习技术,每天可分析数十亿图像和视频,无需使用任何机器学习专业技能,只需要向Amazon Rekognition API提供图像或视频,它就可以快速识别对象、人员、文字、场景和活动,检测出任何不适宜的内容。Amazon Rekognition还不断接受新数据的训练以扩展其识别对象、场景和活动能力,从而提高准确识别的能力。借助Amazon Rekognition,大宇无限的视频供给及审核系统方便地实现了视频内容事前审核功能,可以自动筛选出大约97%的不当视频。“如果没有Amazon Rekognition服务,要想实现视频内容的上线前审核功能需要投入大量的人力,造成运营成本上升。”刘克东表示。

全部业务系统实现上云

目前,大宇无限的全部业务系统都部署在AWS云上,主要包括三部分内容。

其一是线上服务,用于支撑公司所有产品的多端(Android/IOS/Web)发送的服务请求,包括用户中心、信息流视频推荐、频道推荐、关注列表、视频解析、分享短链、消息推送及升级服务等;

其二是大数据系统,用于搜集客户端的行为数据,为数据分析及推荐系统提供原始数据,日处理行为事件达数十亿;

其三是视频推荐系统,采用Amazon EMR和Amazon SageMaker处理数据、训练模型以获得个性化的推荐结果,同时还使用Amazon Rekognition每日自动审核数十万的新视频封面。

大宇无限所使用的AWS云服务,包括Amazon Elastic Compute Cloud(Amazon EC2)、Amazon Simple Storage Service(Amazon S3)、Amazon Rekognition、Amazon SageMaker、Amazon EMR、Amazon CloudWatch、Amazon DynamoDB、Amazon Relational Database Service(Amazon RDS)、Amazon RedShift、Amazon Kinesis、Amazon Elastic Container Registry(Amazon ECR)、AWS Data Transfer以及AWS Support等。以下是大宇无限使用AWS云的架构示意图。

大宇无限使用AWS云的架构示意图

使用AWS云服务后的成效

使用亚马逊AWS云服务,使大宇无限在多个方面获益匪浅。

在开发上,AWS云丰富的应用开发及部署功能,极大地降低了大宇无限在基础架构上的开发投入,同时AWS Support全面、及时的技术支持服务,也使大宇无限的开发团队可以及时解决所遇到的技术问题,加快产品迭代速度,大宇无限新版本的交付时间缩短到2周以内。同时借助Amazon SageMaker、Amazon Rekognition等智能服务,实现了视频审核和推荐的自动化,大宇无限可以给用户提供稳定、可靠且高质量的视频服务。

在运维上,大宇无限目前用到的Amazon EC2实例超过600个,全部利用AWS云服务进行自动化管理,不需要专门的运维人员,降低了运维成本。

在运营上,无论用户是在中东、拉美、东南亚还是世界其他地方,大宇无限都能借助遍布全球的AWS云,为用户提供高质量的视频服务。

此外,在计算资源使用方面,AWS云提供的预留实例、按需实例和竞价实例的计费方式,使大宇无限能够根据业务拓展状况的变化,以尽可能最佳方式租用AWS云资源,在满足业务拓展需求的同时节省总成本。

选择正确的云服务,初创企业也能服务上亿用户相关推荐

  1. 云平台如何支持百万千万或者上亿用户?

    本文讲的是云平台如何支持百万千万或者上亿用户?,在云计算发展飞速的时代,传统通讯正在与互联网.IT等各大领域融合发展,无论是IM.视频.VoIP.还是呼叫中心,企业都需要根据自身业务形态开发和部署属于 ...

  2. 亚马逊收购以色列云存储初创企业E8 Storage

    [TechWeb]8月1日消息,据国外媒体报道,亚马逊收购了以色列云存储初创企业E8 Storage,这笔交易的价值估计在5000万美元至6000万美元之间. 收购完成后,E8 Storage的25名 ...

  3. FB接连出事儿?上亿用户记录在亚马逊云服务器上就公之于众了……下滑到第七?领英说苹果怎么就不受雇员欢迎了呢? | 极客头条...

    戳蓝字"CSDN云计算"关注我们哦! 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快. ...

  4. 4月24日云栖精选夜读 | 阿里云POLARDB如何助力轻松筹打造5亿用户信赖的大病筹款平台?...

    [点击订阅云栖夜读周刊] 轻松筹首创了"大病救助"模式,帮助了众多病患在第一时间解決了医疗资金等问题,为了从源头解决了医疗资金问题.而在轻松筹这样全球5.5亿用户信赖的大病筹款平台 ...

  5. 阿里云POLARDB如何助力轻松筹打造5亿用户信赖的大病筹款平台?

    2019独角兽企业重金招聘Python工程师标准>>> 轻松筹首创了"大病救助"模式,帮助了众多病患在第一时间解決了医疗资金等问题,为了从源头解决了医疗资金问题. ...

  6. 云服务器布置_如何选择正确的云服务器配置?

    在我们选择购买云主机时,必须要了解云服务器配置.不同的云服务器配置的价格和性能有很大的区别,和我们的生产环境息息相关,要想最高性价比的购买云服务器必须要提前了解好云服务器配置的基础知识,它能让我们减少 ...

  7. 58同城CTO邢宏宇:云服务助力企业多元化飞速发展

    58同城,一个神奇的网站! 没错,提及58同城这句口号一定令人耳熟能详.58同城成立于2005年12月,十年来,依托于人们飞速发展的日常生活需求,已发展成为覆盖全领域的生活服务平台.作为覆盖全领域的生 ...

  8. 如何推广你的区块链初创企业,顺利完成ICO及后续发展

    摘要:如你所知,区块链与加密货币是时下全世界范围内最热门的话题之一,而且有望颠覆整个世界.然而为了实现这一点,区块链初创企业需要扎实的公关策略,成功进行ICO,从而顺利发展到声名鹊起.本文作者就综合各 ...

  9. 40亿美元,Uber自动驾驶“大甩卖”!明星初创企业Aurora接手,首款产品不做出租车...

    来源|大数据文摘 作者|刘俊寰 疫情仍未散去,Uber太难了. 为了实现盈利,12月7日,美国网约车巨头Uber及其竞争对手Aurora Innovation宣布,Uber决定将旗下自动驾驶部门ATG ...

最新文章

  1. 尖峰 mysql 源码方向_MySql轻松入门系列————第一站 从源码角度轻松认识mysql整体框架图...
  2. linux symbol文件,LINUX EXPORT_SYMBOL_GPL及EXPORT_SYMBOL导出函数
  3. C语言数据结构学习用单元测试
  4. AtCoder AGC038F Two Permutations (网络流、最小割)
  5. MySQL主键唯一键重复插入解决方法
  6. 数据库综合系列 之 存储过程
  7. java中ThreadLocalRandom的使用
  8. 【算法竞赛学习】金融风控之贷款违约预测-数据分析
  9. OpenCV3学习(11.5) FAST特征检测器FastFeatureDetector
  10. JavaScript 基本语法及面试注意点
  11. WebLogic应用部署之配置不需要应用名直接访问(配置默认应用)
  12. Android 入门篇(一)环境搭建
  13. [工具]将xml文件转换为html显示
  14. Ubuntu中eclipse端口被占
  15. python中threading中的lock类
  16. 视频教程-R语言数据挖掘-模型评估篇-大数据
  17. linux文件夹同步-文件对比工具,FreeFileSync,文件/文件夹比较和自动同步软件
  18. 学习web前端历程(十七)
  19. chrome 清理缓存
  20. 全球及中国图书出版发行业营销策略与运行前景分析报告2022版

热门文章

  1. 细菌,真菌,病毒——感染,免疫反应以及治疗用药差异
  2. GitHub统计代码量
  3. 【机器学习】西瓜书_周志华,python实现基于信息熵进行划分选择的决策树算法
  4. html5多个图片位置_Python使用标准库zipfile提取docx文档中所有图片
  5. wordpress 建站15个注意事项
  6. Workflow 几个基本的概念
  7. Linux 下配置vim
  8. 2020-04-11
  9. Vscode下载与配置(C语言)
  10. 爬取Google Play中app的用户评论(2)