旷视十年,AI三级跳
2021-03-13 12:48:12
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
旷视科技,现在是一家创办10年的公司。
它是最早在中国打响名气的AI视觉明星,是一个全新ID时代的开启者,也是同时代独角兽中最快实现规模化营收的公司。
谈到这一波AI浪潮,往往标签就是谷歌和AlphaGo,而谈到中国AI创业,似乎开口就会是旷视和Face++……
但即便如此,对于旷视的不同认知也相差甚远。
有人依然停留在天才云集、清华姚班、AI独角兽的通识印象。
也有人看到旷视“AI+IoT”的战略选择后,认定这可能不再是一家掌握“魔法”的酷公司。
更少有人能清晰表达旷视一路的“归去来兮”,理解背后运转的关键逻辑,划定关乎本质的边界与核心。
只是现在,10年一梦,连点成线。
宏观透视当前的旷视,不断升级打怪和求解的现实挑战,可以极简到3个自然数:
1、2,3……就是旷视。
1:一套核心算法
旷视是一家靠算法起家的公司。
更准确来说,可以细分为两类。
一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。
十年前,深度学习露出了快速发展的苗头,旷视抓住了这个契机,立即决定将DL和CV进行结合;于是乎,便形成了现在特征鲜明的算法能力,包括面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等。
这类算法是旷视之始,是旷视算法演进的基础。
而除了将DL与CV结合之外,旷视在它们各自能力上,也进行了相应拓展,包括更底层的DL模型,以及计算摄影、屏下指纹识别、机器人导航CV能力。
基于核心算法的突破,旷视在全球AI顶级竞赛中揽获40个世界冠军,创下了前无古人的MS COCO三连冠纪录,获誉AI领域的“中国乒乓球队”。
另一类则是行业算法 (或者叫AIoT算法)。
这类算法的最大特点,就是碎片化和个性化,这点非常好理解,毕竟“千行千面”。而旷视的DL+CV,更多的是解决数据的输入问题,但如若要形成行业数据的闭环,还需要具备数据挖掘和优化的算法能力。
旷视认为,未来十年算法将无处不在,并且成为每个行业“降本增效”最核心的引擎。因此,在明确“AI+IoT”战略方向后,旷视利用自身能力和优势,推动了行业算法的创新,以实现价值闭环。
这其中包括在多设备调度优化、数据挖掘和分析等方面,实现了多设备之间的高效协同、数据挖掘分析和形成决策。
例如,旷视推出的河图智慧物流操作系统,就是通过同构仿真和AI调度优化的能力,实现了项目规划、仿真、实施、运营等全流程的数字化和智能化。
不过,在旷视的这个1中,算法之强,本质还不在于单个模型,而是旷视规模化、批量化生产算法的能力。
即算法生产引擎Brain++。
形象化理解,如果旷视的算法是蛋,那么Brain++就是背后的鸡。
作为一个生产力工具,Brain++的形成有旷视业务需求的内因,也有当时缺乏可用开源平台的外因。
但内外因综合之下,最终使得Brain++成为了旷视工程实践和算法创新的有力支撑。
而且相比于TensorFlow等算法框架,Brain++包含了算法、数据和计算的统一。
成为了旷视数次在全球AI竞赛中击败谷歌、微软等巨头的“秘密武器”,是旷视研发不断逢山开路的保障。
所以归结起来,旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。
而所谓道生一,一生二,二生三,三生万物。
在旷视的定义里,AI是不断演进的算法能力。AI是旷视的核心能力,其后场景化落地中形成的边界感,也始终围绕这个核心。
算法就是旷视的1,有这个1才有后续落地的一切。
2:有“脑”有“躯干”,软硬结合的路径
AI浪潮,被视为智能化浪潮,是一场替代简单重复脑力劳动的革命。
而这种脑力驱动,来自算法。
但产业化落地,光有“脑”不行,必须还要有“躯干”合体。这个躯干,旷视认定是IoT。
在旷视看来,IoT是一种网络,所具备的特点就是“基于场景空间”、“以人为核心”、“软硬结合”。它是旷视AI技术落地的载体。
而所谓AI+IoT,就是将AI的能力加进IoT场景中,实现从应用、数据中台、边缘设备和终端的全面智能化。
深度学习驱动的AI复兴,本质就是对数据的物尽其用。
但在现实生产中,用数据就得先有可用的数据,用石油就得先开采和部署石油管道。
所以物联网终端执行器、传感器,最核心的价值就是数据的在线化,部署AI算法后,数据就能发挥第一层作用。
智能手机有了刷脸模组,学习了用户面部数据,接下来就能展开刷脸解锁的应用。
但是,在物联网的执行器、传感器等组网之后,还需要在这些设备与应用之间增加一个智能的“大脑”,使其具备连接、分析和协同能力,这就是旷视着力打造的“AIoT操作系统”。
此外,AI落地必须要讲场景,明确限定区域。
而不同场景有不同的IoT设备,需要配备不同的AI算法,软硬结合的落地方式,也就成了题中之义。
比如城市公共空间、建筑楼宇,以及面向工业的物流仓储空间和工厂空间等等,场景不同,需要的AI软硬件也不同,而且交付的对象也千差万别……
只有把算法、软件和硬件的各要素能力,集成固化成终端可交付产品,才能定价交付,才能实现商业化、规模化落地。
所以旷视被外界所熟知的是战略选择——AI+IoT,在消费物联网、城市物联网和供应链物联网三大场景展开落地,但易于忽略的是,这种战略选择,其路径决定于软硬结合,以及由此带来的客户价值积累。
实际上,软硬结合也是AI业内的大共识。
特斯拉自研AI算法后进一步自研打造AI硬件,依图、地平线等进军芯片也都是基于AI算法和需求的重新定义。
上一个时代的软硬结合,是基于现有硬件,打造与之匹配的算法和软件。
而在IoT时代,软件和硬件是天然结合的,需要协同设计和联合优化,其本身就是软硬一体的。
3:三大场景的“边界”
边界不是终点,边界只是意味着技术到商业是否实现了闭环,这是企业阶段性有所为有所不为的选择结果。
而旷视,在算法为核心、AI+IoT的软硬结合为落地方式之下,现阶段选择了三大场景,也暗合其商业价值增长的短期、中期和长期。
第一大场景,消费物联网。最典型如智能手机为主的消费电子上的面部识别、屏下指纹及计算摄影相关的解决方案。
AI能力应用的终端(手机)已经非常成熟,规模化起量也很快,毛利率不高但边际效应明显,对于AI能力供应商而言,被认为是十亿美元市场。
从2012年开始,旷视就开始给OEM手机厂商和App,提供解决方案。
除了最知名的刷脸、屏下指纹模组,还包括在AI降噪、多摄虚化、夜景超画质以及视频虚化等方面的计算摄影供应。
除了手机终端的应用之外,旷视还在基于Face++人工智能开放平台,为互联网金融、网约车、线上租赁平台等企业和开发者,提供数十种AI能力及SaaS产品服务。
第二大场景,城市物联网。
比如面向城市区域内的公共安全、交通管理、城市管理、楼宇园区等场景,提供智慧城市解决方案。作为城市智能化和新兴基础设施的核心组成,这被认为是百亿美元的市场。
旷视在该领域于2015年入局,推出过洞灵慧+边缘盒子、盘古九霄+新型交互设备等AIoT设备。
而2020年来,大众对于城市物联网最具感知的,可能莫过于商场、地铁站和机场等公共场景的AI识别和测温了。
第三大场景,供应链物联网。
集中体现在物流领域,相比消费和城市两大场景,旷视在这个场景入局最晚——2017年,但软硬件一体化能力也展现得最充分。
有AI算法,有软件——操作系统河图,还进一步基于AI定义硬件——打造了AMR机器人、SLAM导航智能无人叉车、智能圆盘播种机、人工智能堆垛机……
在供应链物流场景中,一方面客户可以是衣食住行用全领域,另一方面之前的“大小脑”智能化程度不高,可以全方位升级改造。这也是该场景被认为有千亿美元潜力的原因。
目前,旷视在供应链物联网领域,据称已经累计向鞋服、医药、智能制造、零售电商等不同行业提供了仓库、工厂及零售店的升级改造,客户数已近百位。
所以整体纵览之后,旷视在这三大场景的发展,有些正处于成熟期,有些尚处于发展期。三大业务板块市场成熟度、商业前景和规模,都有先后之分。
而万佛朝宗,虽然场景领域有不同,构建的闭环边界有不同,但三大业务板块的AI产业化落地的思路一以贯之:从软件到软硬结合,从AI走向AIoT。
而从AI算法→软件平台→软硬结合,也被旷视认为是AI产业落地的最小路径。
更是旷视十年摸石头过河探索出的核心经验。
如何评价?
如今,站在现在来总结梳理,自然可以把旷视以1、2,3来审视。
不过极简如斯,过程却可能并非一蹴而就,背后都是旷视从算法到硬件,从代码空间到现实场景的10年探索和求解。
而从旷视出发,作为中国AI创业的头雁代表,其发展和演进路径,也是中国原创AI一派的缩影,是前所未有的技术创新到商业模式落地的缩影。
在AI浪潮之前,中国的创业者都是基于硅谷成熟的技术创新之上的商业模式创新,于是产生规模化商业价值的时间也就更快。
但AI浪潮不同,算法的创新天然需要与行业和数据结合,而行业错综复杂,需求高度不确定,这造成AI商业价值的落地的周期相对较长。
旷视用了10年,可能就是最具代表性的说明。
此外,软硬件一体的AI时代落地趋势,一次次被强化和证明。
无论是因为自动驾驶能力而自研芯片的特斯拉,还是旷视的算法天才们下工厂、走进仓库,在物流供应链一线打造机器人……都是这个趋势的明确注脚。
向重而生、落地为王,也在成为AI价值兑现和交付的风向,也只有朝着这个方向,才能构建从技术到商业的价值闭环。
如果说,AI落地是一道摆在所有人面前的时代级应用题。
那旷视解题的过程和答案,就是这份1、2,3…数列。
— 完 —
旷视十年,AI三级跳相关推荐
- 旷视科技face++ AI工程师面经·
旷视科技面经 我是面的开发岗位 主要的语言是c++和python 一面 上午10点电话面试. 上来先是自我介绍,大概说一下学校,本硕的情况,接着是当前做过的项目和学习的技术. 接着问算法题: 第一题: ...
- 蒲月“登高”,临风眺望,旷视邀您共赴AI的下一个十年之约
未来十年,人工智能将如何发展,社会将在AI的推动下如何变革,全球需以何种姿态共同迎接智能爆炸的时代?这将是一项复杂的系统工程,对这个问题的回答需要汇聚全球产业界.学术界的力量来共同探索. 2020年6 ...
- 旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问
来源:新智元 [导读]从深度学习算法.计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家.旷视研究院院长孙剑讲给你听. 万万没想到,我和小伙伴 ...
- 旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问
万万没想到,我和小伙伴们被旷厂拿去「炼丹」了. 没错,就是这个炼丹炉! 站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐. OMG!真·颅内高潮... 业界认为「炼丹」过程正如算法研究 ...
- 旷视 AI 飞跃 | 研究生联合培养计划
2021 年伊始,旷视研究院正式推出"AI 飞跃"计划,以科技务实的精神,助推高校和旷视在 AI 领域共同成长,用人工智能造福大众,飞跃梦想,看见并释放世界的价值! 计划介绍 旷视 ...
- 旷视落子天元:深度学习框架开源,是成为伟大AI企业的第一步
"机器必须有自己独特的思考,机器必须做人类做不到的事情." 作者 / 刘亚杰 编辑 / 刘 煜 人工智能的飞速发展离不开深度学习和算法的演进.人工智能是怎样实现的?算法又是怎样产生 ...
- 2020北京智源大会|旷视的技术探索、产业实践与可持续发展 AI 的打造
导语:6月21日-6月24日,2020北京智源大会正以线上直播形式面向全球召开.来自美国.加拿大和法国的 6 位图灵奖得主,10 多位院士.上百位人工智能领袖,近 30000 名参会者,在多达 19 ...
- 旷视科技联合IDC发布AI+手机行业白皮书 人工智能引领手机“视”界革命
10月19日,IDC中国数字化转型年度盛典在北京隆重召开,大会以协作·创新·加速为主题,聚焦了业界最新热点和行业大咖共同探讨中国数字化转型之路.会上,IDC联合旷视科技发布行业首个"AI+手 ...
- 旷视推出鼻纹识别,用AI寻找丢失宠物
来源 | 转载自旷视城市大脑(ID:MEGVII_CityBrain) 导读:随着人工智能技术(AI)的大热,基于深度学习方法的人脸识别技术已成熟落地,在解锁.支付.认证.摄像等生活方方面面,各个大厂 ...
最新文章
- html代码格式化vscode,vscode 代码格式化
- 关于64位WIN7下正确建立JAVA开发环境(转
- UA PHYS515A 电磁理论V 电磁波与辐射2 电磁波的能量
- 群友福利 | 55 本《AI 嵌入式系统: 算法优化与实现》免费送
- 判断网络是否为真正的公网IP
- 在PAT上提交Java代码
- lynda ux_UX心态
- [zz]linux下DHCP服务器配置(使用Ubuntu LTS 8.04)
- java https双向验证_java https双向认证证书
- 自定义带标尺的seekbar
- TDS、NET-Library和网络协议
- 微信小游戏 - 开发工具安装 - 官方 Demo 运行
- 爱心函数可视化 python
- matlab 图片黑白图片,MATLAB读取黑白图像显示却是黑色,24位深转8位深黑白图像解决方法(示例代码)...
- python读取word指定内容_Python操作word
- 学习日记之三:RFC2198文档阅读
- Python爬虫之爬取图片
- Day82_ELK(一)
- while 和 do while 循环语句格式及用法
- 计算机的云是什么意思_什么是云计算云计算是什么意思