01 概述

在前面的文章介绍了环境感知中不同雷达的作用,一个标准的自动驾驶解决方案需要雷达与视觉技术的配合使用。视觉技术其实是仿生理学的解决方案,因为现实世界中司机驾驶车辆就是依靠视觉去做行车过程中的决策。

在本文会介绍下车载摄像头的基础知识以及视觉算法的基本原理,另外还会对自动驾驶视觉技术的几大经典场景做一个介绍。

02 车载摄像头介绍

从硬件成本分析,车载摄像头是技术相对成熟而成本最低的的一种方案。使用车载摄像头的缺点主要是后续数据的分析,需要依赖大量的标注数据和模型训练资源去训练成熟的用于自动驾驶的各种机器学习相关模型。

常见的车载摄像头功能如下表所示:

辅助驾驶功能 使用的摄像头类型 功能简介
车道偏离预警(LDW) 前视 车道线检测,当车行驶偏离的时候报警
前向碰撞预警(FCW) 前视 当车与前车过近时,会预警
交通标识识别(TSR) 前视、侧视 识别当前道路两侧的标识
车道保持辅助(LKA) 前视 车偏离轨道,会自动纠正方向
行人碰撞预警(PCW) 前视 当摄像头识别出行人的时候,需要预警
盲点监视(BSD) 侧视 利用侧视摄像头找到盲区影像,显示在驾驶舱屏幕
全景泊车(SVP) 前视、后视、侧视 利用车辆前后摄像头获取的影像和图像拼接技术,输出车辆周边的全景图
泊车辅助(PA) 后视 泊车时。显示倒车轨迹,方便驾驶员泊车
驾驶员注意力监测 内置 检测驾驶员闭眼等行为

(1)单目摄像头VS双目摄像头

常见的摄像头分为单目和双目两种摄像头,未来的自动驾驶技术将大概率以单目摄像头为主。

单目摄像头工作流程同样遵循图像输入、预处理、特征提取、特征分类、匹配、完成识别几个步骤,其测距原理是先匹配识别后估算距离:通过图像匹配识别出目标类别,随后根据图像大小估算距离。

单目摄像头的内容分析可以通过经典的深度学习算法实现。

双目摄像头测距原理与人眼类似,通过对图像视差进行计算,直接对前方景物进行距离测量;从视差的大小倒推出物体的距离,视差越大,距离越近;

双目测距步骤:相机标定 —— 双目校正 —— 双目匹配 —— 计算深度信息(测距)。

(2)摄像头的标定

与雷达相似,摄像头也需要做标定,需要把世界坐标系、摄像头坐标系、摄像头内的图像坐标和像素坐标做统一标定,这样识别出来的内容才可以正确的应用到自动驾驶流程中。

因为摄像头拍摄的图像是二维的,而真实世界是三维的,需要通过算法将二维空间的信息转换为三维。类似于下图这种方案:

03 视觉算法基本原理

既然摄像头识别对象是依赖深度学习算法,那么视觉相关算法的基本原理也需要大致介绍下。目前各种车载自动驾驶摄像头里面用的图像识别类算法基本上都是CNN的结构,就是卷积神经网络。

卷积神经网络在认知图像的过程其实跟人大脑认知图像的原理类似。大脑识别图像的过程其实是将图片在人脑的各级神经元抽象成各种小的元素,比如棱角、直线等等,然后将这些元素所在的神经突触激活,最终信息传导下去形成认知。卷积神经网络模仿了这种图像识别的流程,通过卷积的各层将图像全部细节元素识别出来,形成最终的认知。

一个标准的CNN的网络结构如图所示:

是由很多的层组成的,有卷积层、池化层、全连接层组成。每一层对应很多小的feature maps,feature maps有宽度和高度,可以对应到图像的宽和高。

在卷积神经网络中各个层都有不同的功能。

(1)卷积层

卷积层是CNN中的核心层,卷积层核心是一个滤波器。比如原始图像的像素是32*32,那么卷积层可以做一个5*5的滤波器,去扫描整个图像,抽取出各个原子部分的信息。

假设5*5的卷积滤波的深度是3,那么一个卷积核就包含了5*5*3=75个权重值,这些个卷积的权重值就是模型训练过程中要学习的。

(2)池化层

接下来介绍下池化层,如果没有池化层,一个5*5深度是3的卷积核,就要有75个参数,整个卷积神经网络由无数个卷积核组成,那么总的模型参数会爆炸。

在卷积层之间补充池化层的作用是减少参数的个数,另外也是减少整体训练过程中的计算量。池化的方案有很多,比如在max-pooling中可以只挑选每个2*2的小方格中最大的cell值。

(3)全连接层

全连接层的主要作用就是分类,假设知道具备猫的眼睛、尾巴这些元素就能识别出猫。

全连接层一般作为整个神经网络的最后一层,将关键要素激活,最终帮助网络判断出最终的结果。

04 视觉技术的基本场景

目前视觉技术在自动驾驶领域的识别主要分以下几个核心场景,分别是雷达云图的识别、行驶途中障碍物的识别、行驶区域的识别、交通标识的识别以及光流识别。

(1)雷达云图识别

上一篇文章介绍过,激光雷达会通过雷达波将行驶过程中道路信息的云图绘制出来。

图像识别技术可以基于这种云图找出道路轨迹、车辆等信息,从而做驾驶决策。

(2)障碍物识别

通过摄像头捕获实时视频流,然后通过CNN模型可以实时对视频流图像进行识别,然后指导驾驶决策。

(3)行驶区域识别

形势区域识别主要解决的问题是对车道线进行识别,并且标记出继续前行的方向。

(4)交通牌识别

如果说车道线识别和障碍物识别还可以通过雷达做补强,那么交通牌识别是只有视觉技术配合摄像头可以解决的问题。自动驾驶过程中需要配合摄像头找到每个标识牌的内容,比如限速、红绿灯识别、禁行标识等。

交通牌识别的技术问题是交通标识物通常并不出现在视频的主要方位,一般只在视频的边缘位置占据很小的一块区域,所以要通过特殊的图像分割技术解决。

(5)光流识别

光流指的是图像中每个像素点的二维瞬时速度,通常来讲就是图像中每个像素点在图中的移动速度。通过光流识别可以清楚的判断道路中的人、车辆的行驶速度。

光流是可以通过图像可视化的,如下图:

左边是输入的移动的图像,右边是转化为光流的表视图,可以通过不同的颜色标识不同的运动方向,通过深浅标识局部的速度。

基于光流场景有专业的FlowNet网络,也是一种基于卷积神经网络的变种。

自动驾驶技术-环境感知篇:基于视觉相关技术介绍相关推荐

  1. 自动驾驶技术-环境感知篇:激光雷达、毫米波雷达、超声波雷达相关技术介绍

    在上一篇<自动驾驶技术架构和综述>文章中我们介绍了自动驾驶三个核心环节,分别是环境感知和定位.决策规划.执行控制.接下来这章将会针对环境感知和定位展开介绍,环境感知和定位包含环境感知.定位 ...

  2. 自动驾驶技术-环境感知篇:多传感器融合技术

    传感融合技术概述 在前面几篇文章,笔者分别介绍了自动驾驶环境感知领域的一些技术,包含雷达技术.摄像头和视觉建模技术.V2X技术.无论是哪一类型的技术,都是在帮助车辆的决策系统获取车辆运行过程中的数据, ...

  3. 字体方向 道路标注_自动驾驶环境感知的“见闻色”——3D点云标注

    点开网约车App.线上报名.待审核通过后,用户就能在规定的测试路段免费呼叫自动驾驶车辆进行试乘--前不久,滴滴出行首次面向公众开放自动驾驶服务. 这次行业事件再次激发了公众对于自动驾驶的热切期待与探索 ...

  4. 聚焦自动驾驶环境感知,AVVision Special Session (ICAS'21) 征稿开启

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 编辑丨我爱计算机视觉 1.简介 作为IEEE信号处理协会Signal Processing Socie ...

  5. 亮道智能发布自动驾驶环境感知系统测试验证服务|2019 上海车展...

    4月15日上海车展前夕,第三方测试验证商亮道智能首次对外发布自动驾驶环境感知系统测试验证的完整流程.同时,亮道智能Reference System.服务于测试验证的3D激光雷达算法.标注修正工具.大数 ...

  6. [深蓝学院]自动驾驶环境感知

    自动驾驶环境感知 第一章:课程介绍 从四个方面进行讲解:1.自动驾驶和环境感知:2.传感器感知算法:3.感知得系列案例:4.课程:传感器+算法+实践. 车载传感器大致分为:毫米波雷达:摄像头:激光雷达 ...

  7. 智能会议系统(34)---Android语音通话实现方案及相关技术介绍

    Android语音通话实现方案及相关技术介绍 Android语音通话实现方案及相关技术介绍 语音通话 Step1语音采集和输出 Step2编解码方式 Step3网络传输 Step4去噪声消回音 语音通 ...

  8. Android语音通话实现方案及相关技术介绍

    Android语音通话实现方案及相关技术介绍 Android语音通话实现方案及相关技术介绍 语音通话 Step1语音采集和输出 Step2编解码方式 Step3网络传输 Step4去噪声消回音 语音通 ...

  9. 单机存储系统可靠性及相关技术介绍

    一.存储系统可靠性的影响因素 单机存储系统包括存储硬件和存储软件.存储硬件又包含存储介质.存储控制器.设备固件:存储软件栈层次则更为复杂,以Linux为例包括:存储设备驱动层. 块设备层(Block ...

  10. Frida-Dexdump 脱壳工具下载使用以及相关技术介绍

    Frida-Dexdump 脱壳工具下载使用以及相关技术介绍 文章目录 Frida-Dexdump 脱壳工具下载使用以及相关技术介绍 前言 一.查壳.反编译.APK工具推荐 二.查壳 1.方式1 2. ...

最新文章

  1. 大神总结的80个Python练手项目列表
  2. python导入json模块_Python调用json模块代码实例
  3. 使用coding.net上传项目
  4. java基础(十) 数组类型
  5. 计算机应用计算机电算化题库,2014年浙江省会计电算化客观题题库
  6. 开源 程序员清单_2015开源夏季阅读清单
  7. 一种可以解决python读取文件中文出乱码的方法
  8. 【Shell】检查字符串大小
  9. 投色子抽奖游戏 html,jQuery实现简单的抽奖游戏
  10. linux下exe软件反编译工具下载,ilspy.exe
  11. 国寿鸿寿年金保险(分红型)
  12. 机器学习实战 利用sklearn库预测科比生涯数据
  13. 离散数学及其应用 第一章习题
  14. matlab uicontrol 居中,uicontrol 用法【matlab】
  15. 把hive sql的关键字小写转大写的小程序
  16. 清除U盘内所占的隐藏空间(U盘容量突然变小了)
  17. gamemaker studio socket例子
  18. Codeforces Round #514 (Div. 2)-D. Nature Reserve
  19. plt.imshow()中cmap参数控制颜色展示
  20. Mothur1进阶_走近Mothur,探索未知

热门文章

  1. 安装kali的过程以及菜咩学到的基础知识
  2. LumaQQ.NET 试用
  3. 华三s5000配置镜像接口_H3C系列交换机端口镜像的配置
  4. 保护眼睛——设置WIN7和XP 窗体、Chrome、IE网页背景颜色
  5. CS269I:Incentives in Computer Science 学习笔记 Lecture 20: Fair Division(公平分配)(本系列完结撒花!)
  6. Android TextToSpeech(tts)语音播报(文字转语音)
  7. 分布式光伏站远程监控组网方案
  8. Handler机制原理----全解
  9. 使用golang实现对请求签名和验签
  10. ORL人脸识别tensorflow实现