无人驾驶之概率机器人,附加部分,及强化学习试卷
注:本卷为内部用卷,供大家检验学习成果用,如需商业化请私聊我,谢谢!
注:本卷可结合博文的考纲使用
一、 填空题(60分,定义,区别2分,其他1分)
- 概率机器人与传统机器人相比的优势在于___________________________________,
________________________________。 - 概率机器人即近视醉酒倒霉机器人,近视表现为____________________________,
醉酒表现为________________________,倒霉表现为____________________________。 - 多维高斯分布表达式为___________________,其协方差表示___________________。
- 满足马尔可夫假设即________________________________________________________。
- 高斯参数滤波方法有______________, __________, __________。非参数滤波方法有
____________, ____________。 - IF算法相比KF算法的优点是________________________________________________。
- 密度树的定义是_____________________________________________________________,
- 选择更新的方法是___________________________________________________________。
- 静态二值贝叶斯滤波的表达式是______________________________,公式中各部分的意义是____________________________________________________________________,
它在建图中的应用思想是____________________________________________________。 - 三角形分布的表达式是______________________________。
- 估计一致性的定义是________________________________________________________。
- 对称环境测试是指___________________________________________________________。
- AMCL实质是__________和____________原理的叠加加上对粒子流分布的限制。
- 可以用于行为克隆的是____________模型,正演模型用MAP的原因是_________,
_________________________________________。 - Gmapping的G指的是____________, 其定位用的是_______滤波。
- Qlearning与sarsa的区别是__________________________________________________。
- 强化学习根据需要亲身经历分为__________与__________。根据更新方法分为__________与___________。根据策略是否相同分为_____________与_____________。根据时间是否同步分为_________与_________。
- sarsa的收敛条件是________________,sarsa(langda)与之的区别是__________________。
- 交叉熵的定义式是__________________,
- POMDP的定义是___________________________________________________________。
二、 应用题(170分)
21. 解释下图各个部分的意义(14分)
23.高斯滤波系的KF系在机器人定位中有着重要应用,请回答下列问题。(25分)
(1)解释2-7的意义(6分)
(2)解释2-14的意义(13分)
(3)KF,EKF,UKF的区别是什么,影响EKF,UKF的性能的主要因素分别是什么?(6分)
粒子滤波是目前比较流行滤波方法,请回答下列问题。(44分)
(1) 解释2-20的意义(19分)
(2) 解释2-20的意义(19分)
(3) 上述两者有什么区别?(6分)在机器人感知中,我们常常用到波速模型表示测量的置信分布,试回答下列问题。(16分)
(1)画出波束模型的四大组成部分及最后的综合模型并写出这5个图形的数学表达式。(10分)
(2) 如下图,圆是激光雷达,方块是障碍物,根据波束模型大致画出障碍物的似然域分布。(6分)
25. 强化学习目前结合深度学习产生了许多结合的变种,如DDPG(深度+确定+policy gradients),DQN(深度网络+Qlearning),A3C,DDPO等,请回答下列问题。(41分)
(1) 简述DQN的基本思想,其相比QLearing有哪些改进?(8分)
(2) DQN有哪些变种,其变种的改进部分及优势是?(9分)
(3) DQN估计网络与真实网络的参数如何更新?与DDPG有哪些不同?(6分)
(4) 简述PG的基本思想,其与Qlearning有哪些不同?(8分)
(5) 在AC算法中,actor指的是?critic指的是?其基本思想是?(10分)
6.Gmapping的框图如图所示,请简述gmapping的原理。(15分)
7.已知路径规划分为局部路径规划及全局路径规划,请叙述任意两种局部路径规划的方法,并说明在全局路径规划中A*相比于迪杰斯特拉算法有何改进。(15分)
三、 计算题(70分)
已知一片栅格的直方图概率分布如下,其表示置信度的预测,若P(Zt|Xt)服从均值为(0,0),方差为(1,1),ρ为0.5的二维高斯分布,求其经过直方图滤波后的置信度直方图概率分布。并简述分辨率是什么,对直方图滤波有何影响(需归一化)(12分)
已知R矩阵如下图,Q矩阵默认为0,试迭代计算10次Q矩阵。衰减系数0.2,学习率0.1(10分)
试利用迪杰斯特拉算法计算下列图1到6的最短路径(15分)
已知 ,
(1)试将其推导成下列形式(18分)
(2)试考虑激光雷达地图的影响,将其推导成下列形式(要用到近似) 。(15分)
无人驾驶之概率机器人,附加部分,及强化学习试卷相关推荐
- SAPIEN:铰接、计算机视觉、机器人操作、机器人规划、强化学习、模仿学习的仿真环境
1.官网 2.特点 SAPIEN模拟器:为机器人.刚体和关节对象提供物理模拟.纯Python接口,支持强化学习和机器人技术,支持深度图.法线图.光流.有源光和射线跟踪. 运动规划:建议在SAPIEN中 ...
- NVIDIA 自主机器人与深度强化学习PPT截图
- 花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源...
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平台: 而像这样的一只PR2,售价高达40万美元( ...
- 谷歌大脑推出机器人强化学习平台,硬件代码全开源,花最少的钱,训超6的机器人...
点击我爱计算机视觉标星,更快获取CVML新技术 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平 ...
- 深度强化学习在机器人领域的研究与应用
前言 机器学习方法主要可以分为四类,监督学习.半监督学习.无监督学习.以及强化学习.其中,强化学习不同于连接主义的监督学习方法,是智能体通过与环境的交互,观测交互结果以及获得相应的回报.这种学习的方式 ...
- 干货 | 浅谈机器人强化学习--从仿真到真机迁移
" 对于机器人的运动控制,强化学习是广受关注的方法.本期技术干货,我们邀请到了小米工程师--刘天林,为大家介绍机器人(以足式机器人为主)强化学习中的sim-to-real问题及一些主流方法. ...
- 机器学习分支之一:强化学习
强化学习的发展历史 强化学习的理论知识 强化学习的应用案例 强化学习的特点与未来 凡是过往,皆为序章. --莎士比亚<暴风雨> "知往鉴今",为了更好地学习强化学习,需 ...
- 机器学习笔记(十六)强化学习
16.强化学习 16.1任务与奖赏 强化学习(reinforcementlearning)的过程就是机器通过一系列的动作和环境交互,从而得到最佳的动作序列.图示: 强化学习任务用马尔可夫决策(Mark ...
- 《强化学习周刊》第55期:LB-SGD、MSP-DRL对抗鲁棒强化学习
No.55 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...
最新文章
- TensorFlow练习23: “恶作剧”
- 会话管理隐患与防御 总结
- 上下定高 中间自适应_移动端布局上下固定中间自适应
- python蓝牙上位机开发_python做上位机 - osc_2frv0wjp的个人空间 - OSCHINA - 中文开源技术交流社区...
- oracle10g sys密码忘记,Oracle 10g忘记system,sys密码的解决办法。
- HihoCoder - 1879 Rikka with Triangles(极角排序求所有锐角三角形的面积)
- MySQL5.7参数log_timestamps
- 高端中餐美食餐饮海报PSD模板,看着就有食欲
- hdu 1059 Dividing(多重DP)
- mysql s.`name`_MySQL的基础操作命令
- 手机号段对应地区编码_什么是编码器?了解两种类型的编码器
- webpack + react
- Android 补间动画(二)
- sns.barplot/sns.countplot/sns.boxplot参数设置
- 北京大学计算机语言学,基于认知的汉语计算语言学研究_袁毓林pdf
- IO流(包含常用IO体系图)
- 树莓派c语言百度语音识别,树莓派语音识别
- 天馈线测试仪具备什么功能
- stata豪斯曼检验报错
- 最短路径问题(图表详解迪杰斯特拉算法)