2021-03-13 12:48:12

金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

旷视科技,现在是一家创办10年的公司。

它是最早在中国打响名气的AI视觉明星,是一个全新ID时代的开启者,也是同时代独角兽中最快实现规模化营收的公司。

谈到这一波AI浪潮,往往标签就是谷歌和AlphaGo,而谈到中国AI创业,似乎开口就会是旷视和Face++……

但即便如此,对于旷视的不同认知也相差甚远。

有人依然停留在天才云集、清华姚班、AI独角兽的通识印象。

也有人看到旷视“AI+IoT”的战略选择后,认定这可能不再是一家掌握“魔法”的酷公司。

更少有人能清晰表达旷视一路的“归去来兮”,理解背后运转的关键逻辑,划定关乎本质的边界与核心。

只是现在,10年一梦,连点成线。

宏观透视当前的旷视,不断升级打怪和求解的现实挑战,可以极简到3个自然数

1、2,3……就是旷视。

1:一套核心算法

旷视是一家靠算法起家的公司。

更准确来说,可以细分为两类。

一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法

十年前,深度学习露出了快速发展的苗头,旷视抓住了这个契机,立即决定将DL和CV进行结合;于是乎,便形成了现在特征鲜明的算法能力,包括面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等。

这类算法是旷视之始,是旷视算法演进的基础。

而除了将DL与CV结合之外,旷视在它们各自能力上,也进行了相应拓展,包括更底层的DL模型,以及计算摄影、屏下指纹识别、机器人导航CV能力。

基于核心算法的突破,旷视在全球AI顶级竞赛中揽获40个世界冠军,创下了前无古人的MS COCO三连冠纪录,获誉AI领域的“中国乒乓球队”。

另一类则是行业算法 (或者叫AIoT算法)。

这类算法的最大特点,就是碎片化和个性化,这点非常好理解,毕竟“千行千面”。而旷视的DL+CV,更多的是解决数据的输入问题,但如若要形成行业数据的闭环,还需要具备数据挖掘和优化的算法能力。

旷视认为,未来十年算法将无处不在,并且成为每个行业“降本增效”最核心的引擎。因此,在明确“AI+IoT”战略方向后,旷视利用自身能力和优势,推动了行业算法的创新,以实现价值闭环。

这其中包括在多设备调度优化、数据挖掘和分析等方面,实现了多设备之间的高效协同、数据挖掘分析和形成决策。

例如,旷视推出的河图智慧物流操作系统,就是通过同构仿真和AI调度优化的能力,实现了项目规划、仿真、实施、运营等全流程的数字化和智能化。

不过,在旷视的这个1中,算法之强,本质还不在于单个模型,而是旷视规模化、批量化生产算法的能力。

即算法生产引擎Brain++

形象化理解,如果旷视的算法是,那么Brain++就是背后的

作为一个生产力工具,Brain++的形成有旷视业务需求的内因,也有当时缺乏可用开源平台的外因。

但内外因综合之下,最终使得Brain++成为了旷视工程实践和算法创新的有力支撑。

而且相比于TensorFlow等算法框架,Brain++包含了算法、数据和计算的统一。

成为了旷视数次在全球AI竞赛中击败谷歌、微软等巨头的“秘密武器”,是旷视研发不断逢山开路的保障。

所以归结起来,旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。

而所谓道生一,一生二,二生三,三生万物。

在旷视的定义里,AI是不断演进的算法能力。AI是旷视的核心能力,其后场景化落地中形成的边界感,也始终围绕这个核心。

算法就是旷视的1,有这个1才有后续落地的一切。

2:有“脑”有“躯干”,软硬结合的路径

AI浪潮,被视为智能化浪潮,是一场替代简单重复脑力劳动的革命。

而这种脑力驱动,来自算法。

但产业化落地,光有“脑”不行,必须还要有“躯干”合体。这个躯干,旷视认定是IoT。

在旷视看来,IoT是一种网络,所具备的特点就是“基于场景空间”、“以人为核心”、“软硬结合”。它是旷视AI技术落地的载体。

而所谓AI+IoT,就是将AI的能力加进IoT场景中,实现从应用、数据中台、边缘设备和终端的全面智能化。

深度学习驱动的AI复兴,本质就是对数据的物尽其用。

但在现实生产中,用数据就得先有可用的数据,用石油就得先开采和部署石油管道。

所以物联网终端执行器、传感器,最核心的价值就是数据的在线化,部署AI算法后,数据就能发挥第一层作用。

智能手机有了刷脸模组,学习了用户面部数据,接下来就能展开刷脸解锁的应用。

但是,在物联网的执行器、传感器等组网之后,还需要在这些设备与应用之间增加一个智能的“大脑”,使其具备连接、分析和协同能力,这就是旷视着力打造的“AIoT操作系统”。

此外,AI落地必须要讲场景,明确限定区域。

而不同场景有不同的IoT设备,需要配备不同的AI算法,软硬结合的落地方式,也就成了题中之义。

比如城市公共空间、建筑楼宇,以及面向工业的物流仓储空间和工厂空间等等,场景不同,需要的AI软硬件也不同,而且交付的对象也千差万别……

只有把算法、软件和硬件的各要素能力,集成固化成终端可交付产品,才能定价交付,才能实现商业化、规模化落地。

所以旷视被外界所熟知的是战略选择——AI+IoT,在消费物联网、城市物联网和供应链物联网三大场景展开落地,但易于忽略的是,这种战略选择,其路径决定于软硬结合,以及由此带来的客户价值积累。

实际上,软硬结合也是AI业内的大共识。

特斯拉自研AI算法后进一步自研打造AI硬件,依图、地平线等进军芯片也都是基于AI算法和需求的重新定义。

上一个时代的软硬结合,是基于现有硬件,打造与之匹配的算法和软件。

而在IoT时代,软件和硬件是天然结合的,需要协同设计和联合优化,其本身就是软硬一体的。

3:三大场景的“边界”

边界不是终点,边界只是意味着技术到商业是否实现了闭环,这是企业阶段性有所为有所不为的选择结果。

而旷视,在算法为核心、AI+IoT的软硬结合为落地方式之下,现阶段选择了三大场景,也暗合其商业价值增长的短期、中期和长期。

第一大场景,消费物联网。最典型如智能手机为主的消费电子上的面部识别、屏下指纹及计算摄影相关的解决方案。

AI能力应用的终端(手机)已经非常成熟,规模化起量也很快,毛利率不高但边际效应明显,对于AI能力供应商而言,被认为是十亿美元市场。

从2012年开始,旷视就开始给OEM手机厂商和App,提供解决方案。

除了最知名的刷脸、屏下指纹模组,还包括在AI降噪、多摄虚化、夜景超画质以及视频虚化等方面的计算摄影供应。

除了手机终端的应用之外,旷视还在基于Face++人工智能开放平台,为互联网金融、网约车、线上租赁平台等企业和开发者,提供数十种AI能力及SaaS产品服务。

第二大场景,城市物联网

比如面向城市区域内的公共安全、交通管理、城市管理、楼宇园区等场景,提供智慧城市解决方案。作为城市智能化和新兴基础设施的核心组成,这被认为是百亿美元的市场。

旷视在该领域于2015年入局,推出过洞灵慧+边缘盒子、盘古九霄+新型交互设备等AIoT设备。

而2020年来,大众对于城市物联网最具感知的,可能莫过于商场、地铁站和机场等公共场景的AI识别和测温了。

第三大场景,供应链物联网

集中体现在物流领域,相比消费和城市两大场景,旷视在这个场景入局最晚——2017年,但软硬件一体化能力也展现得最充分。

有AI算法,有软件——操作系统河图,还进一步基于AI定义硬件——打造了AMR机器人、SLAM导航智能无人叉车、智能圆盘播种机、人工智能堆垛机……

在供应链物流场景中,一方面客户可以是衣食住行用全领域,另一方面之前的“大小脑”智能化程度不高,可以全方位升级改造。这也是该场景被认为有千亿美元潜力的原因。

目前,旷视在供应链物联网领域,据称已经累计向鞋服、医药、智能制造、零售电商等不同行业提供了仓库、工厂及零售店的升级改造,客户数已近百位。

所以整体纵览之后,旷视在这三大场景的发展,有些正处于成熟期,有些尚处于发展期。三大业务板块市场成熟度、商业前景和规模,都有先后之分。

而万佛朝宗,虽然场景领域有不同,构建的闭环边界有不同,但三大业务板块的AI产业化落地的思路一以贯之:从软件到软硬结合,从AI走向AIoT。

而从AI算法→软件平台→软硬结合,也被旷视认为是AI产业落地的最小路径

更是旷视十年摸石头过河探索出的核心经验。

如何评价?

如今,站在现在来总结梳理,自然可以把旷视以1、2,3来审视。

不过极简如斯,过程却可能并非一蹴而就,背后都是旷视从算法到硬件,从代码空间到现实场景的10年探索和求解。

而从旷视出发,作为中国AI创业的头雁代表,其发展和演进路径,也是中国原创AI一派的缩影,是前所未有的技术创新到商业模式落地的缩影。

在AI浪潮之前,中国的创业者都是基于硅谷成熟的技术创新之上的商业模式创新,于是产生规模化商业价值的时间也就更快。

但AI浪潮不同,算法的创新天然需要与行业和数据结合,而行业错综复杂,需求高度不确定,这造成AI商业价值的落地的周期相对较长。

旷视用了10年,可能就是最具代表性的说明。

此外,软硬件一体的AI时代落地趋势,一次次被强化和证明。

无论是因为自动驾驶能力而自研芯片的特斯拉,还是旷视的算法天才们下工厂、走进仓库,在物流供应链一线打造机器人……都是这个趋势的明确注脚。

向重而生、落地为王,也在成为AI价值兑现和交付的风向,也只有朝着这个方向,才能构建从技术到商业的价值闭环。

如果说,AI落地是一道摆在所有人面前的时代级应用题。

那旷视解题的过程和答案,就是这份1、2,3…数列。

— 完 —

旷视十年,AI三级跳相关推荐

  1. 旷视科技face++ AI工程师面经·

    旷视科技面经 我是面的开发岗位 主要的语言是c++和python 一面 上午10点电话面试. 上来先是自我介绍,大概说一下学校,本硕的情况,接着是当前做过的项目和学习的技术. 接着问算法题: 第一题: ...

  2. 蒲月“登高”,临风眺望,旷视邀您共赴AI的下一个十年之约

    未来十年,人工智能将如何发展,社会将在AI的推动下如何变革,全球需以何种姿态共同迎接智能爆炸的时代?这将是一项复杂的系统工程,对这个问题的回答需要汇聚全球产业界.学术界的力量来共同探索. 2020年6 ...

  3. 旷视AI「炼丹房」Brain++ 再升级!首席科学家孙剑发AI「灵魂」三问

    来源:新智元 [导读]从深度学习算法.计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家.旷视研究院院长孙剑讲给你听. 万万没想到,我和小伙伴 ...

  4. 旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

    万万没想到,我和小伙伴们被旷厂拿去「炼丹」了. 没错,就是这个炼丹炉! 站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐. OMG!真·颅内高潮... 业界认为「炼丹」过程正如算法研究 ...

  5. 旷视 AI 飞跃 | 研究生联合培养计划

    2021 年伊始,旷视研究院正式推出"AI 飞跃"计划,以科技务实的精神,助推高校和旷视在 AI 领域共同成长,用人工智能造福大众,飞跃梦想,看见并释放世界的价值! 计划介绍 旷视 ...

  6. 旷视落子天元:深度学习框架开源,是成为伟大AI企业的第一步

    "机器必须有自己独特的思考,机器必须做人类做不到的事情." 作者 / 刘亚杰 编辑 / 刘 煜 人工智能的飞速发展离不开深度学习和算法的演进.人工智能是怎样实现的?算法又是怎样产生 ...

  7. 2020北京智源大会|旷视的技术探索、产业实践与可持续发展 AI 的打造

    导语:6月21日-6月24日,2020北京智源大会正以线上直播形式面向全球召开.来自美国.加拿大和法国的 6 位图灵奖得主,10 多位院士.上百位人工智能领袖,近 30000 名参会者,在多达 19 ...

  8. 旷视科技联合IDC发布AI+手机行业白皮书 人工智能引领手机“视”界革命

    10月19日,IDC中国数字化转型年度盛典在北京隆重召开,大会以协作·创新·加速为主题,聚焦了业界最新热点和行业大咖共同探讨中国数字化转型之路.会上,IDC联合旷视科技发布行业首个"AI+手 ...

  9. 旷视推出鼻纹识别,用AI寻找丢失宠物

    来源 | 转载自旷视城市大脑(ID:MEGVII_CityBrain) 导读:随着人工智能技术(AI)的大热,基于深度学习方法的人脸识别技术已成熟落地,在解锁.支付.认证.摄像等生活方方面面,各个大厂 ...

最新文章

  1. html代码格式化vscode,vscode 代码格式化
  2. 关于64位WIN7下正确建立JAVA开发环境(转
  3. UA PHYS515A 电磁理论V 电磁波与辐射2 电磁波的能量
  4. 群友福利 | 55 本《AI 嵌入式系统: 算法优化与实现》免费送
  5. 判断网络是否为真正的公网IP
  6. 在PAT上提交Java代码
  7. lynda ux_UX心态
  8. [zz]linux下DHCP服务器配置(使用Ubuntu LTS 8.04)
  9. java https双向验证_java https双向认证证书
  10. 自定义带标尺的seekbar
  11. TDS、NET-Library和网络协议
  12. 微信小游戏 - 开发工具安装 - 官方 Demo 运行
  13. 爱心函数可视化 python
  14. matlab 图片黑白图片,MATLAB读取黑白图像显示却是黑色,24位深转8位深黑白图像解决方法(示例代码)...
  15. python读取word指定内容_Python操作word
  16. 学习日记之三:RFC2198文档阅读
  17. Python爬虫之爬取图片
  18. Day82_ELK(一)
  19. while 和 do while 循环语句格式及用法
  20. 计算机的云是什么意思_什么是云计算云计算是什么意思

热门文章

  1. pdf可以转换成ppt格式吗,怎么转?
  2. 刷magisk模块后不能开机_安装Magisk模块导致手机无法正常开机,最简单的修复办法...
  3. tomcat 跑起项目报 JMX 连接器服务器通信错误:
  4. python import找不到so库的可能原因
  5. 原子力显微镜AFM仪器原理
  6. linux下 抓包工具下载,Linux下抓包工具tcpdump使用介绍
  7. 厉害了,Python画出高颜值交互股票K线图
  8. restore和recover 区别
  9. 保护数据中心的心脏:揭秘动环监控的关键利器
  10. nginx服务企业级应用