论文阅读笔记《Quickly Inserting Pegs into Uncertain Holes using Multi-view Images and Deep Network Trained》
核心思想
该文提出一种使用基于学习的视觉伺服方法实现插轴入孔(Peg-in-hole)操作的方法, 整个操作可以分成三个阶段:第一阶段通过视觉伺服方法引导机械手靠近洞口,第二阶段通过螺旋搜索的方法使轴与孔对齐,第三阶段使用阻抗控制把轴插入孔中,该过程如下图所示
该文主要介绍了第一阶段基于学习的视觉伺服过程。在机械手的两侧安装了两个摄像头,用于观察小孔与轴之间的相对位置,摄像头的安装位置及采集图像过程如下图所示
两侧相机分别捕捉到机械手两侧的图像,并且将其中手爪附近160 * 80像素的区域分割出来(如图b中的蓝色框),将相机2中分割出的图像经过翻转再与相机1分割出的图像进行拼接,得到最终的160 * 160像素的图像(如图d所示),图中白色的圆形表示轴所在的位置,黑色的圆形表示孔所在位置。将图像输入到一个训练好的VGG网络中,输出孔的中心与轴的中心之间的相对坐标(x,y)(x,y)(x,y)。在得到相对坐标(x,y)(x,y)(x,y)之后,并不是直接控制机械臂运动到孔的位置,而是通过符号函数(sgn)把相对坐标变成相对位置,分别是“左上”,“左下”,“右下”,“右上”,如下图所示
然后控制机械臂按照一定的步长逐步移动到小孔的附近,每次移动之后都会重新输出相对位置,移动过程如下
式中,xh[t]x_h[t]xh[t]表示ttt时刻,轴(机械手)所在的位置,x[t]x[t]x[t]表示ttt时刻网络输出的相对位置,λ[t]\lambda[t]λ[t]表示ttt时刻的移动步长,移动步长是一个随时间ttt变化的参数
式中,AAA表示最大相对移动距离,nnn表示最大移动步数。根据上式在开始移动时移动步长较大,随着轴逐渐向孔接近,移动步长也呈线性下降。
当轴移动到孔的附近之后,进入螺旋搜索的阶段,借助力-力矩传感器来对齐轴与孔。螺旋搜索类似与盲人用手摸索的过程,因为轴的一端是顶在平面上运动的,当轴和孔对齐时,沿轴方向的力会变小。而所谓的螺旋搜索就是以轴通过第一阶段视觉伺服移动的最终位置为起点,以阿基米德螺旋线的路径不断运动,直至轴与孔对齐。
螺旋线的方程如下
该文还介绍了如何利用合成数据对网络进行训练。因为该文的应用场景是在复杂的背景中寻找到小孔位置,因此作者在拼接图的基础上,融合其他的图片及增加高斯模糊的方式构成复杂背景来对网络进行训练,融合的形式如下
实现过程
网络结构
创新点f
- 提出一种基于学习的视觉伺服方法,并利用合成数据对网络进行训练
- 结合视觉伺服与螺旋搜索实现轴孔的精确定位
算法评价
该文利用深度学习模型来预测小孔与轴之间的相对位置,虽然控制律的计算过程与常见的视觉伺服并不相同,但也满足由差异驱动,逐步逼近目标位置的特点,可以看作是一种线性的视觉伺服过程。经过视觉伺服过程后,轴已经非常接近小孔位置,此时再使用螺旋搜索的方法进行对齐,将大大的缩减螺旋搜索所需要消耗的时间。
如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。
论文阅读笔记《Quickly Inserting Pegs into Uncertain Holes using Multi-view Images and Deep Network Trained》相关推荐
- 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记
<Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...
- 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs
很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...
- Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)
目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...
- Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记
问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...
- DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记
DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...
- [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings
[论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...
- 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)
这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机 很多机器 ...
- 论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》
<a simple but tough-to-beat baseline for sentence embeddings>published at ICLR 2017. ICLR会议的论文 ...
- Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记
我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...
- 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings
1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...
最新文章
- 深度学习:一文看懂CNN、RNN等七种范例
- tomcat server.xml
- 对用户输入内容进行字数提示功能
- 2.2 清除标注错误的数据-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授
- 了解mysqlpump工具
- 国内人工玻璃体和日本人工玻璃体的区别
- [html] iframe在更改了src之后,不出现后退或者前进按钮怎么解决?
- 直播丨 SQL大赛冠军怀晓明:深入解析Oracle存储过程中的性能瓶颈
- vscode退回快捷键
- 被巨头“封杀”后,中国移动互联网企业如何加速出海
- android 关闭软键盘失去焦点,Android edittext 点击其他处 失去焦点和关闭软键盘
- Nicholas C. Zakas:我得到的最佳职业生涯建议
- 大脑状态的重构与认知行为之间的映射
- H5 捕鱼游戏搭建教程
- 人工智能实战2019第六次作业 焦宇恒
- 微信扫码登陆在chrome浏览器被拦截
- 《JQuery实战之硕果》
- JavaWeb 利用poi导出下拉框excel模版
- java设计万年历_java实现万年历
- 图像增强之直方图均衡化(不用histeq)与直方图规定化