#今日论文推荐# 强化学习大牛Sergey Levine新作:三个大模型教会机器人认路

内置大模型的机器人,在不看地图的情况下,学会了按照语言指令到达目的地,这项成果来自强化学习大牛 Sergey Levine 的新作。
给定一个目的地,在没有导航轨迹的情况下顺利到达,有多难?

对于方向感不好的人类来说,这个任务也是很有挑战性。但在最近的一项研究中,几位学者只用三个预训练模型就把机器人「教会了」。
我们都知道,机器人学习的核心挑战之一是使机器人能够按照人类的高级指令执行各种各样的任务。这就要求机器人能够理解人类的指令,并配备大量不同的动作,以便在现实世界中执行这些指令。
对于导航中的指令遵循任务来说,此前的工作主要集中在从带有文本指令注释的轨迹中学习。这样可能可以实现对文本指令的理解,但数据注释的成本问题阻碍了这种技术的广泛使用。另一方面,最近的工作表明,自监督训练的目标条件策略可以学习到稳健的导航。这些方法基于大型的、无标记的数据集,通过事后重新标记来训练基于视觉的控制器。这些方法具有可扩展性、通用性和稳健性,但通常需要使用基于位置或图像的笨重的目标规范机制。
在一篇最新的论文中,UC 伯克利、谷歌等机构的研究者旨在结合这两种方法的优势,使机器人导航的自监督系统能够适用于没有任何用户注释的导航数据,利用预训练模型的能力来执行自然语言指令。研究者使用这些模型来构建一个「界面」,用来向机器人传达任务。这个系统借助于预训练的语言和视觉 - 语言模型的概括能力,使机器人系统能够接受复杂的高级指令。

论文题目:LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action
详细解读:https://www.aminer.cn/research_report/62df559f7cb68b460ff4381chttps://www.aminer.cn/research_report/62df559f7cb68b460ff4381c
AMiner链接:https://www.aminer.cn/?f=cs

#今日论文推荐# 强化学习大牛Sergey Levine新作:三个大模型教会机器人认路相关推荐

  1. 强化学习大牛Sergey Levine新作:三个大模型教会机器人认路

    来源:机器之心 内置大模型的机器人,在不看地图的情况下,学会了按照语言指令到达目的地,这项成果来自强化学习大牛 Sergey Levine 的新作. 给定一个目的地,在没有导航轨迹的情况下顺利到达,有 ...

  2. 强化学习大牛Sergey Levine:将RL作为可扩展自监督学习的基础

    ©作者 | 杜伟.陈萍 来源 | 机器之心 目前,机器学习系统可以解决计算机视觉.语音识别和自然语言处理等诸多领域的一系列挑战性问题,但设计出媲美人类推理的灵活性和通用性的学习赋能(learning- ...

  3. 2021年ML和NLP学术统计:谷歌断层第一,强化学习大牛Sergey Levine位居榜首

    来源:机器之心 这有一份关于 2021 年 ML 和 NLP 出版物的统计数据,并以可视化的方式进行展现,例如最高产的作者.机构.主题等. 2021 年是自然语言处理(NLP)和机器学习(ML)非常高 ...

  4. #今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水

    #今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水 借助不同风格之间的图像转换,CMU 的研究者教会了机器人理解透明液体. 如果机器人可以倒液体,则可以帮助我们自动完 ...

  5. #今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测

    #今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测 研究表明,通过转录后 RNA 修饰进行的表观转录组调控,对于所有种类的 RNA 都是必不可少的.准确识别 RN ...

  6. #今日论文推荐# 多模态时序数据如何自监督?墨尔本理工等最新《自监督表示学习:多模态与时序数据》,全面阐述最新方法体系

    #今日论文推荐# 多模态时序数据如何自监督?墨尔本理工等最新<自监督表示学习:多模态与时序数据>,全面阐述最新方法体系 近年来,自监督表示学习(Self-Supervised Repres ...

  7. #今日论文推荐# 爱丁堡大学等首篇《移动无线网络中的深度学习》综述论文,67页pdf涵盖570篇文献阐述深度学习在移动无线网络中的应用最佳实践

    #今日论文推荐# 爱丁堡大学等首篇<移动无线网络中的深度学习>综述论文,67页pdf涵盖570篇文献阐述深度学习在移动无线网络中的应用最佳实践 移动设备的迅速普及以及移动应用和服务的日益普 ...

  8. #今日论文推荐#ACL 2022 | 引入角度margin构建对比学习目标,增强文本语义判别能力

    #今日论文推荐#ACL 2022 | 引入角度margin构建对比学习目标,增强文本语义判别能力 聚焦的问题:近年来基于对比学习的句子表示学习研究取得了较大的进展,但是大多数方法都只关注如何挑选对比学 ...

  9. #今日论文推荐#NAACL 2022 | 基于Prompt的文本生成迁移学习

    #今日论文推荐#NAACL 2022 | 基于Prompt的文本生成迁移学习 预训练语言模型(PLM)通过微调在文本生成任务方面取得了显著进展.然而,在数据稀缺的情况下,微调 PLMs 是一项挑战.因 ...

最新文章

  1. mysql是如何管理数据结构_MySQL索引背后的数据结构和原理
  2. 项目乱码 GBK转UTF-8工具
  3. 线程的状态 Thread.State||NEW,RUNNABLE,BLOCKED,WAITING,TIMED_WAITING,TERMINATED
  4. Android笔记之模拟器
  5. 2021年广东工业大学第十五届文远知行杯程序设计竞赛(同步赛)C题 图墙+拉格朗日四平方数和定理
  6. Android之Tab类总结
  7. 微信小程序底部弹框 showActionSheet
  8. 了解java虚拟机—非堆相关参数设置(4)
  9. 深入理解Java Proxy机制
  10. 揭露一种通过网络实施ATM诈骗的手段!
  11. 一题多解(八)—— 矩阵上三角(下三角)的访问
  12. 【目标跟踪】基于matlab帧差法结合卡尔曼滤波行人姿态识别【含Matlab源码 1127期】
  13. dcdc芯片效率不高的原因_影响DC-DC转换器效率的主要因素
  14. 石头机器人拖地水量调节_拖地组件再评测:正式版 家有 石头科技T4 米家一代 水箱拖地组件...
  15. 【OBS】OBS Studio 视频录制软件 的安装
  16. 2022.02.19四座楼苹果园
  17. Traceback (most recent call last):
  18. 服务器(工作站)与普通电脑的区别?
  19. 内存马涉及基础知识整理
  20. Java应届生大学四年怎么做,可以毕业就进入华为工作,致Java高级工程师的一封信

热门文章

  1. flash编程可以用c语言,C语言写的小游戏和FLASH小游戏有何区别呢-c语言编程手机软件...
  2. 实习生两分钟解决程序bug,老程序员笑笑不说话,还是太年轻?
  3. ValueError: invalid literal for int() with base 10: ',' KeyedVectors.load_word2vec_format()
  4. No bean named ‘transactionManager‘ available: No matching PlatformTransactionManager bean found for
  5. 如何在Plex上观看YouTube视频
  6. ZigBee无线通讯
  7. ext allowblank = true 不生效问题的解决方法
  8. H3C三层交换机配置IP
  9. 中国特色的免费游戏:下流下贱下作!
  10. 2022年智能车竞赛中小学国赛获奖名单