注:本卷为内部用卷,供大家检验学习成果用,如需商业化请私聊我,谢谢!

注:本卷可结合博文的考纲使用
一、 填空题(60分,定义,区别2分,其他1分)

  1. 概率机器人与传统机器人相比的优势在于___________________________________,
    ________________________________。
  2. 概率机器人即近视醉酒倒霉机器人,近视表现为____________________________,
    醉酒表现为________________________,倒霉表现为____________________________。
  3. 多维高斯分布表达式为___________________,其协方差表示___________________。
  4. 满足马尔可夫假设即________________________________________________________。
  5. 高斯参数滤波方法有______________, __________, __________。非参数滤波方法有
    ____________, ____________。
  6. IF算法相比KF算法的优点是________________________________________________。
  7. 密度树的定义是_____________________________________________________________,
  8. 选择更新的方法是___________________________________________________________。
  9. 静态二值贝叶斯滤波的表达式是______________________________,公式中各部分的意义是____________________________________________________________________,
    它在建图中的应用思想是____________________________________________________。
  10. 三角形分布的表达式是______________________________。
  11. 估计一致性的定义是________________________________________________________。
  12. 对称环境测试是指___________________________________________________________。
  13. AMCL实质是__________和____________原理的叠加加上对粒子流分布的限制。
  14. 可以用于行为克隆的是____________模型,正演模型用MAP的原因是_________,
    _________________________________________。
  15. Gmapping的G指的是____________, 其定位用的是_______滤波。
  16. Qlearning与sarsa的区别是__________________________________________________。
  17. 强化学习根据需要亲身经历分为__________与__________。根据更新方法分为__________与___________。根据策略是否相同分为_____________与_____________。根据时间是否同步分为_________与_________。
  18. sarsa的收敛条件是________________,sarsa(langda)与之的区别是__________________。
  19. 交叉熵的定义式是__________________,
  20. POMDP的定义是___________________________________________________________。

二、 应用题(170分)
21. 解释下图各个部分的意义(14分)

23.高斯滤波系的KF系在机器人定位中有着重要应用,请回答下列问题。(25分)
(1)解释2-7的意义(6分)

(2)解释2-14的意义(13分)

(3)KF,EKF,UKF的区别是什么,影响EKF,UKF的性能的主要因素分别是什么?(6分)

  1. 粒子滤波是目前比较流行滤波方法,请回答下列问题。(44分)
    (1) 解释2-20的意义(19分)

    (2) 解释2-20的意义(19分)

    (3) 上述两者有什么区别?(6分)

  2. 在机器人感知中,我们常常用到波速模型表示测量的置信分布,试回答下列问题。(16分)

(1)画出波束模型的四大组成部分及最后的综合模型并写出这5个图形的数学表达式。(10分)

(2) 如下图,圆是激光雷达,方块是障碍物,根据波束模型大致画出障碍物的似然域分布。(6分)

25. 强化学习目前结合深度学习产生了许多结合的变种,如DDPG(深度+确定+policy gradients),DQN(深度网络+Qlearning),A3C,DDPO等,请回答下列问题。(41分)
(1) 简述DQN的基本思想,其相比QLearing有哪些改进?(8分)

(2) DQN有哪些变种,其变种的改进部分及优势是?(9分)

(3) DQN估计网络与真实网络的参数如何更新?与DDPG有哪些不同?(6分)

(4) 简述PG的基本思想,其与Qlearning有哪些不同?(8分)

(5) 在AC算法中,actor指的是?critic指的是?其基本思想是?(10分)

6.Gmapping的框图如图所示,请简述gmapping的原理。(15分)

7.已知路径规划分为局部路径规划及全局路径规划,请叙述任意两种局部路径规划的方法,并说明在全局路径规划中A*相比于迪杰斯特拉算法有何改进。(15分)

三、 计算题(70分)

  1. 已知一片栅格的直方图概率分布如下,其表示置信度的预测,若P(Zt|Xt)服从均值为(0,0),方差为(1,1),ρ为0.5的二维高斯分布,求其经过直方图滤波后的置信度直方图概率分布。并简述分辨率是什么,对直方图滤波有何影响(需归一化)(12分)

  2. 已知R矩阵如下图,Q矩阵默认为0,试迭代计算10次Q矩阵。衰减系数0.2,学习率0.1(10分)

  3. 试利用迪杰斯特拉算法计算下列图1到6的最短路径(15分)

  4. 已知 ,
    (1)试将其推导成下列形式(18分)

    (2)试考虑激光雷达地图的影响,将其推导成下列形式(要用到近似) 。(15分)

无人驾驶之概率机器人,附加部分,及强化学习试卷相关推荐

  1. SAPIEN:铰接、计算机视觉、机器人操作、机器人规划、强化学习、模仿学习的仿真环境

    1.官网 2.特点 SAPIEN模拟器:为机器人.刚体和关节对象提供物理模拟.纯Python接口,支持强化学习和机器人技术,支持深度图.法线图.光流.有源光和射线跟踪. 运动规划:建议在SAPIEN中 ...

  2. NVIDIA 自主机器人与深度强化学习PPT截图

  3. 花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平台: 而像这样的一只PR2,售价高达40万美元( ...

  4. 谷歌大脑推出机器人强化学习平台,硬件代码全开源,花最少的钱,训超6的机器人...

    点击我爱计算机视觉标星,更快获取CVML新技术 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平 ...

  5. 深度强化学习在机器人领域的研究与应用

    前言 机器学习方法主要可以分为四类,监督学习.半监督学习.无监督学习.以及强化学习.其中,强化学习不同于连接主义的监督学习方法,是智能体通过与环境的交互,观测交互结果以及获得相应的回报.这种学习的方式 ...

  6. 干货 | 浅谈机器人强化学习--从仿真到真机迁移

    " 对于机器人的运动控制,强化学习是广受关注的方法.本期技术干货,我们邀请到了小米工程师--刘天林,为大家介绍机器人(以足式机器人为主)强化学习中的sim-to-real问题及一些主流方法. ...

  7. 机器学习分支之一:强化学习

    强化学习的发展历史 强化学习的理论知识 强化学习的应用案例 强化学习的特点与未来 凡是过往,皆为序章. --莎士比亚<暴风雨> "知往鉴今",为了更好地学习强化学习,需 ...

  8. 机器学习笔记(十六)强化学习

    16.强化学习 16.1任务与奖赏 强化学习(reinforcementlearning)的过程就是机器通过一系列的动作和环境交互,从而得到最佳的动作序列.图示: 强化学习任务用马尔可夫决策(Mark ...

  9. 《强化学习周刊》第55期:LB-SGD、MSP-DRL对抗鲁棒强化学习

    No.55 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...

最新文章

  1. TensorFlow练习23: “恶作剧”
  2. 会话管理隐患与防御 总结
  3. 上下定高 中间自适应_移动端布局上下固定中间自适应
  4. python蓝牙上位机开发_python做上位机 - osc_2frv0wjp的个人空间 - OSCHINA - 中文开源技术交流社区...
  5. oracle10g sys密码忘记,Oracle 10g忘记system,sys密码的解决办法。
  6. HihoCoder - 1879 Rikka with Triangles(极角排序求所有锐角三角形的面积)
  7. MySQL5.7参数log_timestamps
  8. 高端中餐美食餐饮海报PSD模板,看着就有食欲
  9. hdu 1059 Dividing(多重DP)
  10. mysql s.`name`_MySQL的基础操作命令
  11. 手机号段对应地区编码_什么是编码器?了解两种类型的编码器
  12. webpack + react
  13. Android 补间动画(二)
  14. sns.barplot/sns.countplot/sns.boxplot参数设置
  15. 北京大学计算机语言学,基于认知的汉语计算语言学研究_袁毓林pdf
  16. IO流(包含常用IO体系图)
  17. 树莓派c语言百度语音识别,树莓派语音识别
  18. 天馈线测试仪具备什么功能
  19. stata豪斯曼检验报错
  20. 最短路径问题(图表详解迪杰斯特拉算法)

热门文章

  1. 关闭CPU C State 解决卡屏死机问题
  2. 全国地图大数据采集系统
  3. 一键提升照片质量,AI 加持的软件究竟有多神奇?
  4. C语言:memcpy()---数据拷贝
  5. QQProtect.exe(QQ安全防护进程(Q盾))
  6. 下一代双因子身份认证什么样?
  7. 网站被封了?用美国空间吧
  8. Axure RP 8.1 V1.6版本授权码
  9. mysql无法在kvm虚拟机上_kvm常见故障及解决
  10. Python:rank-1 rank-5 top1 top5 mAP