核心思想

  该文提出一种结合模糊Q-learning算法的解耦视觉伺服方法,看着名字就知道文章中掺杂的元素有很多,首先本文的研究对象是四轴无人机的视觉伺服控制,因为无人机属于欠驱动动态系统(underactuated dynamic systems),即输入只有四个参数(四个旋翼的转速),但需要控制6个自由度。所以作者提出将无人机的俯仰和翻滚动作与其他动作进行解耦,用两个视觉伺服控制器分别控制这两组自由度。该文采用的是基于图像的视觉伺服方法,具体而言特征信息是利用图像边缘信息获取的,作者提出了一种新型的边缘特征提取方法(SIPA)。针对视觉伺服中的增益参数(该文中使用KKK,其他文章中常用λ\lambdaλ),该文提出利用Q-learning的方法,通过训练使其能够根据当前的状态自适应调整合适的增益参数,而不是像传统的视觉伺服方法中采用固定的参数。为了解决Q-learning过程中收敛速度太慢的问题,该文又结合了模糊算法,根据特征误差的变化速率来设定对应的学习率。整个算法的处理流程如下图所示

  首先利用SIPA算法从环境中获取特征信息,并与期望的特征信息对比计算差异eee。一方面差异eee和解耦后的图像雅可比矩阵JvJ_vJv​和JψJ_{\psi}Jψ​相乘作为Q-learning中的状态参数,分别输入到两个学习模型中。另一方面差异eee关于时间的导数(变化速率)e˙\dot{e}e˙输入到模糊控制器中输出对应的学习率α\alphaα,来帮助两个学习模型的训练。两个学习模型分别输出两个增益参数KVSvK_{VS}^vKVSv​和KVSψK_{VS}^{\psi}KVSψ​用于两个解耦的视觉伺服控制器计算控制律。最后两个视觉伺服控制器输出的参数,控制四轴无人机运动,形成闭环控制。

创新点

  • 提出一种新的特征提取方法SIPA
  • 提出一种解耦的视觉伺服控制器
  • 提出一种带有模糊控制器的Q-learing学习模型用于生成视觉伺服中的增益参数

算法评价

  该文将Q-learning算法和视觉伺服算法做了更深层次的融合,而不是简单拼接。利用强化学习方法来根据当前状态生成对应的增益参数,相对于固定的参数,该方法适应性更强,能使无人机更快的收敛到期望状态。这篇文章其实揭示了一个很好的将深度学习或者强化学习方法与视觉相结合的思路,视觉伺服的计算过程中有许多算法都需要人工设定或者估计,而结合学习模型可以更好的设定这部分参数。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。

论文阅读笔记《Decoupled Visual Servoing With Fuzzy Q-Learning》相关推荐

  1. 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记

    <Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...

  2. 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs

    很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...

  3. Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)

    目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...

  4. Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记

    问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...

  5. DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记

    DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...

  6. [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings

    [论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...

  7. 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

    这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机  很多机器 ...

  8. 论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》

    <a simple but tough-to-beat baseline for sentence embeddings>published at ICLR 2017. ICLR会议的论文 ...

  9. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  10. 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings

    1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...

最新文章

  1. Redis 笔记(10)— 发布订阅模式(发布订阅单个信道、订阅信道后的返回值分类、发布订阅多个信道)
  2. 【实现手机端上滑滚动加载列表】判断页面是否滚动到底部或者指定元素位置
  3. 爬取一万条b站评论看《工作细胞》
  4. flutter实现(OutlineButton)线框按钮
  5. [GWCTF 2019]pyre.pyc [CISCN2018]2ex
  6. Python爬取天气信息并定时发送给微信好友(异地恋神器)!!
  7. php tongjiapi 使用_Kayako REST API使用详解一
  8. linux c/c++ 文件是否存在
  9. 世界地球日主题班会PPT教学课件模板
  10. 为什么物联网大数据平台,使用TDengine,可不要redis, kafka, spark等软件?
  11. 索尼发布新一代 IoT 芯片,万物互联方式将改写?
  12. postgresql grant权限解释
  13. python的get和post方式请求详解
  14. Rpm另类用法加固Linux安全
  15. win7变成xp风格了怎么改回_win7桌面怎么改成xp风格
  16. vmware 删除后安装不了,‍vmware workstation.msi failed
  17. 接口测试工具--Postman安装
  18. 新鲜出炉:2021 编程语言排行榜~
  19. 微信公众号如何设置关键词回复Word/Excel/pdf/ppt等文件?
  20. Arduino Uno 火焰传感器实验

热门文章

  1. Altium高版本(19以上)Comment批量修改成Value或者MPN的方法
  2. 用户中心登录注册整理
  3. arcgis api 4.x加载天地图(经纬度和墨卡托投影)(一篇文章搞透天地图加载)
  4. html base64 img 图片显示
  5. 立体匹配算法-SAD
  6. Cargo更换国内源
  7. nginx找不到静态(css,js,html)文件404报错,root的解析
  8. uniapp 联级选择器uni-data-picker
  9. redis哨兵集群部署 docker单机模拟-六节点
  10. 大量数据进行数组操作的Redim Preserve替代方法