前面我们对深度相机的基本原理有了一定了解,本文相对全面的梳理一下深度相机的应用领域。深度相机的应用在智能人机交互、人脸技术、三维重建、机器人、AR等领域全面开花,目前商用深度相机最成熟的应用就是移动终端上基于人脸技术的多种有趣应用。

人脸技术

二维人脸技术发展了几十年虽然已经比较成熟,但是人脸关键点检测在各种大角度、多表情、复杂光照、面部遮挡等情况下,想要实现实时鲁棒的高精度检测仍然比较困难。

而高精度深度相机的出现极大的推动了人脸技术的发展,从二维直接跃升到三维。不得不说,iPhoneX的前置深度相机可谓是把三维人脸技术提升到了一个新的高度。它不受制于自然光照,即使前景和背景颜色相近也能实现完美的分割,在复杂头部姿态下的表现大大优于二维人脸技术。基于结构光的深度相机通过3万个红外散斑重建的三维人脸模型非常精细。

有了精细的三维人脸模型,可以发展出一系列超级实用、好玩的应用。下面的应用场景有些是刚刚商用的,有些还在萌芽状态。

1、更加精细自然的背景虚化

相比于双摄的背景虚化,深度相机能够重建高精度的三维人脸模型,虚化效果层次感更强,细节更加丰富,人像更加立体自然。

2、人像光效

人像光效的功能可以模仿专业人像摄影时的打光效果,营造出让人赞叹的影棚级效果。

3、动画表情

动画表情可以将人脸表情实时转移到玩偶上,是一个非常有趣的应用,正是得益于深度相机获取的精细的 三维人脸模型,才能实现如此精细的表情捕捉。

4、三维美颜

可以不夸张的说,三维美颜是对二维美颜的降维打击。二维美颜效果一般比较夸张,丢失了人脸本身的很多特征,导致常常“认不出来自己”的尴尬。

而三维美颜更强调真实和立体,不仅能够全面继承二维美颜的效果,还可以根据三维的脸型进行定制化“微整容”,如隆鼻、丰唇、削掉高颧骨,去掉双下巴,调整五官比例等;此外还可以增加光影效果,如增加鼻子、脸颊两侧的阴影,使得人脸看起来更有立体感和真实感。

5、三维人脸活体识别

我在《一张照片就能破解vivo x20人脸解锁?普通人也能看懂的人脸解锁专业解读在这里!》中写过,三维人脸识别是真正安全的人脸识别,可以有效的避免照片/屏显图片、换脸算法、戴面具/3D人脸模型等破解方法。非常适合于活体检测。

6、人眼视线校正

很多时候我们拍美照时并没有直视镜头,回看时懊悔不已。其实这个可以通过算法进行校正。根据人脸三维模型,结合人的面部朝向,我们可以将视线的方向调整到正对摄像头的方向,产生的视觉效果更有冲击力。

当然,这只是一个典型的应用。理论上来说,我们可以任意操纵眼球的转动,基于此可以开发一些好玩(奇怪)的应用。

智能人机交互

1、人体骨架提取和跟踪

Microsoft推出的Kinect系列深度相机就是专门为体感游戏而生的。经过多年的市场教育,相信大家都比较熟悉,不多说。


体感交互背后的关键技术就是人体骨架提取和跟踪。传统基于RGB图像的骨架提取跟踪技术在有多人交叠的情况下性能下降很快,而深度相机生成的深度图可以很方便的区分不同远近的人体和背景,这非常有利于多人交叠下不同人体骨架的提取。

2、手势识别跟踪

和人体骨架提取和跟踪类似,手势识别跟踪也属于自然肢体语言。相较于RGB相机,深度相机可以更快速更准确的实现手指关键点的提取和跟踪。


基于手势识别跟踪可以开发很多实用、有趣的应用。第一个广泛的应用就是游戏娱乐:比如在射击类游戏中,你只要把手握成手枪状,食指扣动就可以“放枪”,这种从孩童时期就很熟悉的身体语言被运用到游戏中,让用户感觉自然而亲切。第二个就是在环境苛刻或比较危险的特殊行业,有极大的应用需求:比如通过手势可以非接触式的操控无尘车间机器或者危险区域工作的设备,可以解决很多实际问题。

三维重建 & 机器人

1、三维空间测绘

深度相机本身就可以直接测距,下图是Phab2 pro手机后置TOF深度相机在三维空间测量示意图。

2、物体三维重建

以前对人体或者物体进行三维重建需要复杂的激光扫描设备,距离消费级应用还很遥远。随着技术的发展,高精度、小型化的深度相机可以方便快速的完成扫描和三维重建工作。这可以极大的促进虚拟试衣,三维打印等技术的发展。

3、大尺度三维空间地图重建

和小尺度的物体重建不同,较大尺度的三维空间地图重建难度更高,一直都是学术研究的前沿,其中关键技术称为即时定位与地图构建(SLAM,参考文章《SLAM初识》)。SLAM是智能机器人和AR的核心技术之一。基于RGB-D深度相机的SLAM也一直是研究热点,随着深度相机性能的提升及算法的迭代,高精度实时鲁棒的SLAM技术正越来越成熟。

4、机器人自主导航

深度相机的水平视场角能够直接探测障碍物的距离,垂直视场角可以探测地面凸起或者上方障碍物,这极大提升了机器人利用视觉避障的能力。

在自身定位及地图重建导航方面,三维的视觉SLAM应用明显优于二维视觉SLAM。但三维视觉SLAM距离商用还有一段路要走,主要的原因有两个:一是深度相机的远距离测量精度还不够理想,它比激光雷达测到的平面数据在精度和稳定性都要差一些;二是RGB-D SLAM的算法和应用还需进一步发展完善,其性能效果和计算资源的消耗尚无法满足成熟商用需求。

AR

AR大规模商用离我们越来越近了。想要实现实时的、身临其境的AR体验离不开高帧率、高鲁棒的深度图。AR互动核心技术之一是实时精准的SLAM技术,基于深度相机的SLAM方案是一个比较靠谱的解决方案。

总结

目前深度相机在移动端的应用需求非常强烈,但是大部分的消费级深度相机仍存在:体积较大,成本较高,精度及鲁棒性不足的问题。因此适用于移动端的深度相机模组、计算机视觉算法资源比较稀缺。不过,受苹果的影响,目前整个安卓手机产业链正在快马加鞭,快速跟进适用于手机端的深度相机解决方案。

预计未来的几年,深度相机会大量出现在智能手机、智能电视、AR/VR设备、智能穿戴设备等消费电子产品中。到时就不仅仅是全面开花,而是深度相机全面爆炸的时代了。

本文首发于微信公众号:计算机视觉life。
原文链接:https://mp.weixin.qq.com/s?__biz=MzIxOTczOTM4NA==&mid=2247484678&idx=1&sn=f38feb123918860b90d344b6e4a5e5d9&chksm=97d7e091a0a069872c0990e6b6a388d0de475f597ee9ba1fb0bef9884973cd09f0d8d3d2af73#rd

【深度相机系列七】深度相机应用全面梳理:多点开花,定点爆破相关推荐

  1. 深度学习系列:深度学习在腾讯的平台化和应用实践

    深度学习系列:深度学习在腾讯的平台化和应用实践(一) 莫扎特 2015-01-04 6:05:13 大数据技术 评论(0) 深度学习是近年机器学习领域的重大突破,有着广泛的应用前景.随着Google公 ...

  2. 【深度学习系列】——深度学习简介

    这是深度学习系列的第一篇文章,欢迎关注原创公众号 [计算机视觉联盟],第一时间阅读我的原创!回复 [西瓜书手推笔记] 还可获取我的机器学习纯手推笔记! 直达笔记地址:机器学习手推笔记(GitHub地址 ...

  3. 【深度相机系列七】深度相机的应用领域

    说明:文中所举例的产品比较早,读者把重点放在学习原理上就好. 前面我们对深度相机的基本原理有了一定了解,本文相对全面的梳理一下深度相机的应用领域.深度相机的应用在智能人机交互.人脸技术.三维重建.机器 ...

  4. 深度学习系列-前言:深度学习的好教程

    写在之前:忙忙碌碌,总是在走走停停,挤挤时间,留一个思考的机会.断断续续,研究深度学习也有段时间,从开始的小白到现在算是入门了,中途看过些许文章文献资料,也有许多的问题.高山之行才刚刚开始,本系列旨在 ...

  5. 【腾讯深度学习系列】深度学习及并行化实现概述

    [原文:http://djt.qq.com/article/view/1245] 摘要: 深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别.图像识别和检索.自然语言理解等.深层模型是包含多个 ...

  6. 【深度学习系列】——神经网络的可视化解释

    这是深度学习系列的第三篇文章,欢迎关注原创公众号 [计算机视觉联盟],第一时间阅读我的原创!回复 [西瓜书手推笔记] 还可获取我的机器学习纯手推笔记! 深度学习系列 [深度学习系列]--深度学习简介 ...

  7. 【深度相机系列六】深度相机哪家强?附详细参数对比清单

    本文首发于微信公众号:计算机视觉life. 本文的深度相机制造商涉及:Microsoft.Intel.Leap Motion.Orbbec.图漾.Occipital Structure.Stereol ...

  8. 【深度相机系列六】深度相机产品介绍

    说明:文中所举例的产品比较早,读者把重点放在学习原理上就好. 本文的深度相机制造商涉及:Microsoft.Intel.Leap Motion.Orbbec.图漾.Occipital Structur ...

  9. 【深度相机系列四】深度相机分类之结构光法

    说明:文中所举例的产品比较早,读者把重点放在学习原理上就好. 一.结构光法:为解决双目匹配问题而生 上一篇<[深度相机系列三]深度相机分类之双目立体视觉法>中提到基于双目立体视觉的深度相机 ...

最新文章

  1. 比特币现金BCH今日事件
  2. python根据2点经纬度计算距离
  3. 三个ImageView 实现无线轮播 方法
  4. MYSQL端口自动开启的问题~
  5. 用户画像之门店用户类型的体系
  6. decimal.tostring()格式
  7. 期末考试、考研、学技术
  8. VB模拟按键终极教程
  9. Eviews3种面板模型的选择-F检验操作详情
  10. IDEA必备的10款插件
  11. java jni 调用_java jni调用过程分析
  12. js跳转到新标签打开PDF文件
  13. MFC工具箱没有控件解决方法
  14. h5 字体加粗_div css布局对文字字体加粗样式设置
  15. 李沐基于Pytorch的深度学习笔记(1)
  16. 视觉伺服控制工具Visual Servoing Platform---VISP(7)----vpServo这个看懂了就会用VISP了,很简单
  17. 题解BZOJ 2563 阿狸和桃子的游戏 [贪心]
  18. POI删除Excel中数据有效性
  19. python sort多条件排序
  20. simplex法(单纯形) 并在python实现简单的应用

热门文章

  1. mysql-8.0.18-winx64免安装版本安装
  2. CCES 空格替换Tab
  3. Unicode 字符编码表|汉字Unicode编码的区间为:0x4E00→0x9FA5
  4. Flawfinder的安装及使用
  5. android:高德地图点标记与取消标记
  6. 无功补偿+APF(有源滤波)在整流设备中的应用——安科瑞潘芹
  7. 【算法竞赛入门练习题】判断给定的字符串中是否包含某个字符串
  8. 专题篇四:Linux企业级CICD持续集成交付发布(终极实战部署:gitlab++jenkins+web(tomcat)+webbook自动发布)
  9. html5test浏览器排行,热门浏览器HTML5得分比拼 谁是王者
  10. .data数据转化为.xlsx文件以及excle中多列数据的分隔