本文为美国卡耐基梅隆大学(作者:Sandeep Konam)的硕士论文,共54页。

在本论文中,我们研究基于视觉的技术来支持机器人在人类环境中的移动自主性,包括理解与分类任务相关的重要图像特征。考虑基于视觉的自主性这一广泛目标,该工作将沿着三个主要方面进行。我们的第一种算法使无人机能够对地面移动机器人CoBot进行视觉定位和导航,以执行视觉搜索任务。该方法利用了CoBot强大的定位和导航能力,同时允许无人机在CoBot无法访问的位置搜索感兴趣的对象。第二,为了使用单目相机实现无人机的安全导航,我们设计了一个基于深度学习的感知系统,以实时避免障碍物。我们已经证明,使用我们设计的系统,无人机可以在各种具有挑战性的环境中安全导航。最后,我们的目标是对基于视觉的决策进行解释,提出了一种解释技术来理解基于深度学习的图像分类器预测。我们提供了一种自动补丁模式标记解释(APPLE)算法,用于分析深度网络,找出对网络分类结果“重要”的神经元,并自动标记激活这些重要神经元的输入图像的补丁。我们研究了几种对神经元重要的测量方法,并证明我们的技术可用于深入了解网络如何分解图像以进行分类,最后通过实验结果证明了这些贡献的性能。

In this thesis, we investigate vision-based techniques to support robot mobile autonomy in human environments, including also understanding the important image features with respect to a classification task. Given this wide goal of transparent vision-based autonomy, the work proceeds along three main fronts. Our first algorithm enables a UAV to visually localize and navigate with respect to CoBot, a ground mobile robot, in order to perform visual search tasks. Our approach leverages the robust localization and navigation capabilities of CoBot while allowing the UAV to search for the object of interest in locations that CoBot cannot access. Second, to enable safe UAV navigation using its monocular camera, we contribute a deep learning based perception system to avoid obstacles in real-time. We demonstrate that using our system, UAVs can navigate safely in various challenging environments. Finally, we address our goal towards justification of vision-based decisions. We investigate an explanation technique to understand the predictions of a deep learning based image classifier. We contribute the Automatic Patch Pattern Labeling for Explanation (APPLE) algorithm for analyzing a deep network to find neurons that are ‘important’ to the network classification outcome, and for automatically labeling the patches of the input image that activate these important neurons. We investigate several measures of importance for neurons and demonstrate that our technique can be used to gain insight into how a network decomposes an image to make its classification. The performance of each of these contributions is demonstrated through experimental results.

1 引言

2 室内目标搜索任务的无人机与CoBot协同工作

3 基于深度学习的无人机避障

4 自动补丁模式标记的解释(APPLE)算法

5 结论

下载英文原文地址:

http://page2.dfpan.com/fs/0ldc7j92d2d11259160/

更多精彩文章请关注微信号:

【计算机科学】【2017.05】基于视觉的自主导航与深度学习解释相关推荐

  1. HyperAttentionDTI:基于注意机制的序列深度学习改进药物-蛋白质相互作用预测

    题目: HyperAttentionDTI: improving drug–protein interaction prediction by sequence-based deep learning ...

  2. 雅虎开源CaffeOnSpark:基于Hadoop/Spark的分布式深度学习

    雅虎开源CaffeOnSpark:基于Hadoop/Spark的分布式深度学习 [日期:2016-02-26] 来源:极客头条 作者: [字体:大 中 小] 在基于Hadoop集群的大规模分布式深度学 ...

  3. 基于cuda10.0的pytorch深度学习环境配置

    基于cuda10.0的pytorch深度学习环境配置(报错解决) 1.首先查看自己nvidia 显卡的版本,一般都能适用cuda10.0: 1.打开win+s 搜索nvidia控制面版,查看系统信息 ...

  4. 文献阅读(44)—— 基于眼底照的近视深度学习算法和区块链平台,以促进人工智能医学研究:回顾性多队列研究

    基于眼底照的近视深度学习算法和区块链平台,以促进人工智能医学研究:回顾性多队列研究 Retinal photograph-based deep learning algorithms for myop ...

  5. 基于协同过滤算法和深度学习的音乐推荐

    基于协同过滤算法和深度学习的音乐推荐 协同过滤 音乐推荐 深度学习 音乐检索 文章目录 基于协同过滤算法和深度学习的音乐推荐 Github 地址 微信小程序版实现 介绍 参考项目 技术栈 Docker ...

  6. 基于多特征地图和深度学习的实时交通场景分割

    https://www.toutiao.com/a6623529829402673667/ 2018-11-14 09:58:33 Ⅰ.介绍 交通场景分割是智能车辆在检测障碍物.规划路径和自主导航中的 ...

  7. 学术篇 | 多模态fNIRS脑电分类——基于脑机接口的深度学习算法

    近年来,脑机接口(BCI)系统的发展受到神经科学家的广泛关注,脑机接口可以作为一种沟通手段,并为运动障碍患者的运动功能恢复.脑机接口(BCI)设计的一个重要部分是正确地对脑信号进行分类,这些信号过去是 ...

  8. 基于点云的3D深度学习主干网络进展综述

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文由知乎作者Slumbers授权转载,不得擅自二次转载.原文链接:https://zhuanlan. ...

  9. 基于MATLAB的计算机视觉与深度学习实战

    基于深度学习的汽车目标检测 一.项目任务 随着标记数据的积累和GPU高性能汁算技术的发展,卷积神经网络的研究和应用也不断涌现出新的成果.本项目使用己标记的小汽车样本数据训练RCNN(Regions u ...

最新文章

  1. SAP HUM 嵌套HU初探 IV
  2. 注意力机制的两种形式
  3. kafka可视化客户端工具(Kafka Tool)的基本使用
  4. Linux网络协议指令:ifconfig/netstat(net-tools)工具 .vs. iproute2
  5. selenium-03-常用操作
  6. Django常用命令
  7. Missing Push Notification Entitlement警告-----以及解决方法
  8. .net pdf转图片_pdf转图片怎么转?看了就知道啦!
  9. Android实战简易教程-第七十三枪(拨打、接听电话自动免提)
  10. 中央企业经营管理一体化总体框架
  11. 股票 - - 常用指标【上】
  12. sourcetree拉取项目时报错,解决两个冲突
  13. STM32定时器US延时
  14. hive编写自定义UDF函数
  15. 什么是云平台,云平台的分类和优势有哪些?
  16. Tengine 服务健康检查
  17. 如何下载Windows 10?Windows 10微软官方下载地址、下载官方最新的Windows 10操作系统的具体步骤
  18. LeetCode知识点总结 - 997
  19. 软件学报投稿论文格式模板
  20. 软件缺陷和软件缺陷种类

热门文章

  1. 信息安全保障人员CISAW认证基础级、专业级通用认证条件
  2. html 复选框变大,复选框字体大小如何设置 wps复选框文字大小怎么调整
  3. 双色球机选算法java实现
  4. 用云开发做的校园跑腿微信小程序(商用版、毕设版),有视频教程
  5. Win32学习笔记 第三章 HelloWin 选择自 villager 的 Blog
  6. 靶机渗透测试(covfefe)
  7. PG::Covfefe
  8. windows10驱动精灵装完驱动后重启一直诊断修复中。。。完美解决
  9. Ubuntu14.04安装原生迅雷
  10. 布鲁斯口琴进阶教程资料分享