image.png

感知

人类天生就配备多种传感器,眼睛可以看到周围的环境,耳朵可以用来听,鼻子可以用来嗅,也有触觉传感器,甚至还有内部传感器,可以测量肌肉的偏转。

通过这些传感器,我们可以感知到我们周围的环境。我们的大脑每分每秒都在进行数据处理,大脑的绝大部分都是用于感知。

image.png

无人驾驶车辆也在做这些事情,只不过他们用的不是眼睛而是摄像头。

他们也有雷达和激光雷达,它们可以帮忙测量原始距离,可以得到与周围环境物体的距离。

对于每个无人驾驶汽车,它的核心竞争力之一是利用海量的传感器数据,来模仿人脑理解这个世界。

计算机视觉

作为人类,我们可以自动识别图像中的物体,甚至可以推断这些物体之间的关系。

但是对于计算机而言图像只是红、绿、蓝色值的集合。无人驾驶车有四个感知世界的核心任务:

  1. 检测——指找出物体在环境中的位置;
  2. 分类——指明确对象是什么;
  3. 跟踪——指随时间的推移观察移动物体;
  4. 语义分割——将图像中的每个像素与语义类别进行匹配如道路、汽车、天空。

图像分类器是一种将图像作为输入,并输出标识该图像的标签的算法,例如交通标志分类器查看停车标志并识别它是停车标志、让路标志、限速标志、其他标志。分类其甚至可以识别行为,比如一个人是在走路还是在跑步。

分类器有很多种,但它们都包含一系列类似的步骤。首先计算机接收类似摄像头等成像设备的输入。然后通过预处理发送每个图像,预处理对每个图像进行了标准化处理,常见的预处理包括调整图像大小、旋转图像、将图像从一个色彩空间转换为另一个色彩空间,比如从全彩到灰度,处理可帮助我们的模型更快地处理和学习图像。接下来,提取特征,特征有助于计算机理解图像,例如将汽车与自行车区分开来的一些特征,汽车通常具有更大的形状并且有四个轮子而不是两个,形状和车轮将是汽车的显著特征。最后这些特征被输入到分类模型中。此步骤使用特征来选择图像类别,例如分类器可以确定图像是否包含汽车、自行车、行人、不包含这样的对象。

image.png

为了完成这些视觉任务,需要建立模型,模型是帮助计算机了解图像内容的工具。

摄像头图像

摄像头图像是最常见的计算机视觉数据。

image.png

从计算机的角度来看,图像只是一个二维网格被称为矩阵,矩阵中的每个单元格都包含一个值,数字图像全部由像素组成,其中包含非常小的颜色或强度单位,我们可以对其中的数字做出非常多的处理。

通常这些数字网格是许多图像处理技术的基础,多数颜色和形状转换都只是通过对图像进行数学运算以及逐一像素进行更改来完成。

彩色图像被构建为值的三维立方体,每个立方体都有高度、宽度和深度,深度为颜色通道数量。大多数彩色图像以三种颜色组合表示红色、绿色、蓝色,称为RGB图像。对于RGB图像来说,深度值是3,因此可用立方体来表示。

LiDAR图像

激光雷达传感器创建环境的点云表征,提供了难以通过摄像头图像获得的信息如距离和高度。

激光雷达传感器使用光线尤其是激光来测量与环境中反射该光线的物体之间的距离,激光雷达发射激光脉冲并测量物体,将每个激光脉冲反射回传感器所花费的时间。反射需要的时间越长,物体离传感器越远,激光雷达正是通过这种方式来构建世界的视觉表征。

image.png

机器学习

机器学习是使用特殊算法来训练计算机从数据中学习的计算机科学领域。通常,这种学习结果存放在一种被称为“模型”的数据结构中,有很多种模型,事实上“模型”只是一种可用于理解和预测世界的数据结构。机器学习诞生于20世纪60年代,但随着计算机的改进,在过去的20年中才真正的越来越受到欢迎。

机器学习涉及使用数据和相关的真值标记来进行模型训练,例如可能会显示车辆和行人的计算机图像以及告诉计算机哪个是哪个的标签。我们让计算机学习如何最好地区分两类图像,这类机器学习也称为监督式学习,因为模型利用了人类创造的真值标记。

image.png


http://www.taodudu.cc/news/show-3483556.html

相关文章:

  • 外卖配送“黑科技”--阿里移动感知技术应用揭秘!
  • 视觉-语言预训练模型综述
  • 感知机与多层感知机
  • 地理感知的网络
  • 预训练模型与微调
  • 基于注意力机制的多层感知机的实现
  • 感知器
  • 感知器算法例题ppt_感知器的训练算法
  • 基于STM32智能语音台灯的设计与实现
  • 物联网智能车位锁的总体设计方案​
  • 基于51单片机智能台灯pwm调光强光控方案原理图设计
  • 架构工作台:构建企业(应用)架构的数字孪生
  • 工地智能安全帽方案/设计案列/APP
  • 设计一款懂人所想的智能台灯
  • 智能家居终端控制系统毕业设计报告
  • 练手小项目:51单片机控制的智能台灯设计(自动感应调光) 电路图,测试图,源代码全技术资料
  • 2-基于51单片机的蓝牙智能台灯设计
  • 04 基于高通8155的智能座舱功能安全设计
  • 多功能智能感应台灯设计(硬件)
  • 【019】淡墨水字帖-帮家长自动生成字帖和小学算术题
  • 小米有品上新:青萍蓝牙温湿度计 电子墨水屏
  • 快速定位oracle故障-恩墨
  • 墨奇科技博客 | 理解度量学习的新姿势
  • 云和恩墨 | 全面保障某省移动核心系统高效运行
  • bzoj 2118 墨墨的等式 - 图论最短路建模
  • 苹果启用iPhone 11 Pro Max,新增墨绿色?
  • 利用python实现多元线性回归确定喷墨大师的命中方向
  • 墨天轮2021年度数据库获奖名单
  • 云和恩墨助力哈尔滨银行 为互联网金融保驾护航
  • 2022-2028全球与中国数码喷墨打印机市场现状及未来发展趋势

Apollo自动驾驶之感知相关推荐

  1. Apollo自动驾驶入门课程第⑤讲 — 感知(下)

    目录 1. 卷积神经网络 2. 检测与分类 3. 跟踪 4. 分割 5. Apollo感知 6. 传感器数据比较 7. 感知融合策略 本文转自微信公众号:Apollo开发者社区 原创: 阿波君 Apo ...

  2. Apollo自动驾驶入门课程第④讲 — 感知(上)

    目录 1. 感知的概述 2. 计算机视觉 3. 摄像头图像 4. LiDAR图像 5. 机器学习 6. 神经网络 7. 反向滤波法 本文转自微信公众号:Apollo开发者社区 原创: 阿波君 Apol ...

  3. Apollo自动驾驶入门-地图、定位、感知、预测、规划、控制

    目录 高精地图 定位 GNSS RTK定位 惯性导航定位 激光雷达定位 视觉定位 感知 检测与分类 跟踪 分割 预测 规划 路径规划 轨迹生成 Frenet坐标 路径速度解耦规划 ST 图 生成路径的 ...

  4. Apollo自动驾驶进阶课(5)——Apollo感知技术

    1.感知 机器感知系统根据各种各样的传感器来获取汽车周围的驾驶环境,包括Lidar,Camera,Radar,超声波雷达以及拾音器等.相对人类而言,机器感知是全覆盖,并且感知精度更高,能够达到厘米级别 ...

  5. 「百度@了所有车企」:Apollo自动驾驶商用上岗,欢迎上车

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 1月25日,由威马汽车主办的"WeLab威马科技开放日"在上海举行,搭载百度Apollo AVP自主泊车方案的威马W6 ...

  6. Apollo进阶课程㊲丨Apollo自动驾驶架构介绍

    原文链接:进阶课程㊲丨Apollo自动驾驶架构介绍 自动驾驶硬件架构:一般采用激光雷达作为主要感知传感器,同时结合摄像头.GPS/IMU.毫米波雷达.超声波雷达等,以NVIDIA Drive PX2 ...

  7. Apollo自动驾驶入门课程第⑧讲 — 规划(下)

    目录 1. 路径-速度解耦规划 2. 路径生成与选择 3. ST图 4. 速度规划 5. 优化 6. 路径-速度规划的轨迹生成 7. Lattice规划 8. ST轨迹的终止状态 9. SL轨迹的终止 ...

  8. Apollo自动驾驶入门课程第⑥讲 — 预测

    目录 1. 简介 2. 不同的预测方式 3. 基于车道序列的预测 4. 障碍物状态 5. 预测目标车道 6. 递归神经网络 7. 递归神经网络在目标车道预测的应用 8. 轨迹生成 本文转自微信公众号: ...

  9. Apollo自动驾驶入门课程第②讲 — 高精地图

    目录 1. 高精地图与传统地图 2. 高精地图与定位.感知规划的关系 2.1 高精地图用于定位 2.2 高精地图用于感知 2.3 高精地图用于规划 3. Apollo高精度地图与构建 3.1 Apol ...

最新文章

  1. java open_java-OpenIMAJ Jar文件
  2. spring 类型转换器_Spring中的类型转换
  3. 校验码(海明校验,CRC冗余校验,奇偶校验)
  4. lableimg闪退_CV学习笔记(二十五):数据集标注与制作
  5. Java锁的种类以及辨析
  6. 输入一个数,判断这个数的二进制有几个0,几个1(完整代码)
  7. python读取xml文件内容显示不全_python读取xml文件时的问题
  8. Python+matplotlib设置y轴标签距离、位置、竖排
  9. 关于bash中if语法结构的广泛误解(转)
  10. 在Python中从头开始模拟退火
  11. 如何在Adobe Illustrator中绘制花园里的小矮人
  12. “一人单挑 BAT”,黑客张福:我要的东西,比钱更贵
  13. 最新版Activit7从原理到项目,工作流精讲上线
  14. 30分钟内基于激光雷达的手部姿态估计
  15. Java邮件发送QQ邮箱带附件
  16. cst和ansys_HFSS -CST-FEKO
  17. teradata ttu_Teradata Studio中文乱码解决方法
  18. 标签平滑深度学习:Google Brain解释了为什么标签平滑有用以及什么时候使用它(SOTA tips)​...
  19. html怎么设计为中文字体,CSS font-family中文字体设置方法
  20. Ghost XP_SP2 新垦家园贺岁纯净版

热门文章

  1. 微信公众号如何获取手机号,H5调用小程序,小程序调用H5
  2. OKR和绩效管理应该这么做(HR强烈推荐)
  3. html css文字用省略号显示
  4. Vue过滤器(filter)
  5. Python排序算法之选择排序
  6. Markdown中插入图片
  7. 模具制造设计知识小课堂
  8. (Python入门)学习笔记一,初次接触尝试使用Python——环境搭建与配置
  9. 纸鸢| 官方的工业互联网平台评价方法
  10. 图像处理(十):傅里叶变换