【CSDN 编者按】美国加州大学伯克利分校的研究人员制作的机器狗,无需在计算机模拟仿真中进行训练,而直接在现实世界中,利用人工智能大脑在一个小时内从晃晃悠悠翻身都困难到行动自如即使被推倒也能迅速翻身站立起来完成了巨大的转变。

原文链接:https://singularityhub.com/2022/08/08/this-robot-dog-has-an-ai-brain-and-taught-itself-to-walk-in-just-an-hour/

声明:本文为CSDN翻译,转载请注明来源。

作者 | Jason Dorrier

译者 | 陈甜静  责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

自学走路机器狗

哺乳动物出生后都会经历努力爬起来,跌倒,站立,然后再次跌倒的情况。但令人惊讶的是,在经过了这不熟练的大概十几分钟初始期后,动物们都会熟练地使用四肢做出日常跳跃等动作了。

加州大学伯克利分校丹尼尔·哈夫纳(Danijar Hafner)和同事们研制出的一只机器狗很特别,它没有通过事先设定好的程序执行任务,完全是通过自学学会了翻身以及走路。

图源:Danijar Hafner / YouTube

刚开始它先是仰卧在地上双腿不断摆动,试图想要翻过身来,经过不断尝试终于在十分钟的时候学会了翻过身变成俯趴在地上,在二十分钟的时候试图尝试站立起来,在三十分钟的时候已经站立起来但是却有些踉跄,在四十分钟的时候开始尝试着行走,但是四肢却有些不受控制。终于在一个小时后,机器狗已经可以熟练控制四肢往前行走。使用一卷纸板作为障碍物,用来试探机器狗的行动路线,没想到仅在十分钟之后,机器狗就学会了如何在障碍物的阻挡下重新翻身站立起来往前走。

图源:Danijar Hafner / YouTube

这不是机器人第一次使用人工智能来学习走路。但是,虽然以前的机器人通过无数次模拟迭代中的反复试验来学习这项技能,但这款机器狗完全是在现实世界中学习的。

图源:Danijar Hafner / YouTube

在arXiv上发表的一篇论文中,研究人员Danijar Hafner、Alejandro Escontrela和Philipp Wu表示,将在模拟中学到的算法转移到现实世界并不简单。有下面两个原因:

  • 现实世界和模拟之间的小细节和差异可能会绊倒初出茅庐的机器人。

  • 在现实世界中训练算法是不切实际的:它会花费太多时间,并且对机器人产生磨损。

Dactyl机械手

例如,四年前,OpenAI展示了一种可以操纵立方体的人工智能机械手—Dactyl机械手,它是通过机器自主学习无须太长时间,就可以通过机器自主学习的训练和基于特定的编码,实现了单手解魔方的玩法。训练和专门的编程,实现了单手解魔方。它使用了最新被称作强化学习的AI算法,但纯粹的强化学习算法需要很多反复试验学习技能,以便在现实世界中进行训练。

图源:YouTube

Dreamer算法

来自伯克利团队使用一种名为Dreamer的算法来解决这个问题。构建“世界模型”,Dreamer算法可以预测未来行动将实现其目标的概率。随着经验的积累,其预测的准确性会提高。通过提前过滤掉不太成功的动作,世界模型可以让机器人更快地找出什么是有效的。

研究人员称从过去的经验中学习世界模型使机器人能够想象潜在行动的未来结果,减少试错次数。换句话说,世界模型可以将模拟中相当于数年的训练时间减少到不超过现实世界中的一小时。

该团队还将Dreamer算法应用于拾放机械臂和轮式机器人。在这两种情况下,他们发现Dreamer可以让他们的机器人能够有效地学习相关技能,而无需模拟时间。可能在未来还会应用到自动驾驶汽车上面。

当然,仍有挑战需要解决。尽管强化学习自动化了机器人复杂的手动编码,但仍然需要工程师定义机器人的目标以及成功的要素——对于现实世界环境来说,这是一项既耗时又开放的练习。此外,在硬件上进行长时间的学习也会给机器人造成磨损,可能需要人类的干预或修复。研究人员表示,将模拟器训练与现实世界学习相结合可能会很有成效。

尽管会有一些还未解决的挑战,但Dreamer算法还是将机器人技术中的人工智能向前推进了一大步。俄勒冈州立大学的机器人学教授乔纳森·赫斯特(Jonathan Hurst)表示,“强化学习将成为机器人控制未来的基石工具”。

哈夫纳称,将来如果能教会这只机器狗理解语音指令就太好了。该团队希望将摄像头与机器狗连接起来,使其具有视觉能力。这样就能够和真实的小狗相似,可以让其帮忙在房间里寻找物品。

AIBO

在90年代时,索尼推出了一款宠物机械狗—AIBO,但后续由于种种原因导致停产了,在经过长达12年的沉淀后,索尼推出了全新的AIBO,它用了4000个零件、22个执行器并且内置多个传感器、相机等功能,使它更加趋近于真实的狗狗。

图源:索尼官网

但未来应用Dreamer算法而制作的可以自学技能的机器狗会不会更加趋近于一个真实的小狗呢?在未来或许你会想养一只不用帮它洗澡铲屎的机器狗吗?

— 推荐阅读 —

一个小时,这只机械狗“自学”会了走路!相关推荐

  1. 又一中国机械狗来了:腾跃呼啦圈、原地起跳顶飞皮球,还能自主充电

    全世界只有3.14 % 的人关注了 青少年数学之旅 哇 这是什么情况 竟然腾空后跳过了呼啦圈 这是刚刚升级的新机械狗 说起机械狗 其实浙江大学也搞了一只 名叫"绝影" 就是刚才咱们 ...

  2. 仿制斯坦福机械狗——组装与电路控制

    组装 材料清单: 主体采用框架式的结构 1.两个侧板分别安装有四个舵机,每两个舵机上安装一条腿. 2.两个侧板中间有一个连接板同时充当了电气元器件安装平台的作用.蓝色的为主控板,红色的为稳压板,绿色的 ...

  3. 机械狗首次以“军用”身份参加美国史上最大演习!多种地形巡逻,有效监控入侵者...

    来源|机器人大讲堂 文|Robospeak 最近,机械狗又有大动静了. 一只身着"军装"的机械狗竟然出现在美国空军的部队中. 士兵带着机器狗巡逻的画面,有点像科幻电影走进现实. 这 ...

  4. 快要“成精”的波士顿机械狗,开始卖了,价格不贵准备搞一只

    全世界只有3.14 % 的人关注了 爆炸吧知识 重磅消息: 这只全球著名的网红狗 终于..开!售!了! 哦,不对,放错图了! 应该是这只! 一起来看看视频介绍-- 6月17日,据科技时报(techti ...

  5. “1000瓶药水,其中至多有1瓶剧毒,小狗服完药20小时后才能判断是否中毒。现在给你10只小狗、在24小时内、通过小狗试药的方式找出哪瓶药有毒或者全部无毒”

    题目: 1000瓶药水,其中至多有1瓶剧毒,小狗服完药20小时后才能判断是否中毒. 现在给你10只小狗.在24小时内.通过小狗试药的方式找出哪瓶药有毒或者全部无毒 思路: 一."小狗服完药2 ...

  6. 每只小狗都有一个目标---毕淑敏

    有一对夫妇有两个孩子,一个叫莎拉,一个叫克里斯蒂.当孩子还小的时候,父母决定为他们养一只小狗.小狗抱回来以后,他们想请一位朋友帮忙训练这只小狗.他们搂着小狗来到朋友家,安然坐下,在第一次训练前,女驯狗 ...

  7. 算法,16瓶水,有一瓶有毒,假设一只小白鼠喝一滴水,一个小时后会死亡,一个小时找出那瓶有毒的水至少需要几只小白鼠?

    首先16瓶水,编号0000,0001-1110,1111.然后让第一只小白鼠喝最低位为1的水,第二只小白鼠喝次最低位为1的水,第三只小白鼠喝第三位为1的水,第四只小白鼠喝最高位为1的水.一个小时后看小 ...

  8. DIY一只机器狗需要多少钱?最低仅900美元,斯坦福大学出品,代码已开源

    机器之心报道 参与:蛋酱 DIY 一只四足机器狗,最低只需要 900 美元?它是斯坦福学生机器人俱乐部的新成员「Pupper」. 自从波士顿动力 Spot 机器狗开启零售以来,不知道有多少人迷上了这只 ...

  9. 论机械狗如何硬卷算法岗

    前言 本文目的有三 个人学习生涯的总结和记录 分享非科班转互联网的经验和感悟 对于转行互联网的想法 & 交流 说明:本文会将题主转码前后的心路历程详尽道来,我想有打算转行的同学应该会有类似的经 ...

最新文章

  1. 写在NOIP2018后
  2. iOS 问题整理04----Runtime
  3. .mmp怎么打开查看?
  4. mysql网页化_页面化操作数据库
  5. 谷歌称FBI监视网络 秘密要求企业提供用户数据
  6. 攻城掠地端mysql_【图片】攻城掠地单机版本服务端+攻城掠地GM工具【单兆权吧】_百度贴吧...
  7. ajax回复留言,Ajax 留言板模拟
  8. 项目中遇到一些实用/优秀的代码写法(杂烩)
  9. 【深度增强学习 初步学习总结】
  10. [Python爬虫案例]西刺免费代理IP
  11. 关于光学软件设计衍射透镜的一点总结
  12. android gpio 驱动,[RK3288][Android6.0] 调试笔记 --- 通用GPIO驱动控制LED【转】
  13. phpnow mysql_使用PHPnow搭建本地PHP环境+创建MySQL数据库
  14. JAVA8 Swing 简单的桌面精灵(踩坑点记录)
  15. 丢番图生平编程java_丢番图与麦乐鸡购买问题
  16. 电脑怎样文字转语音?给文字配音的方法其实有很多种
  17. 2021年R1快开门式压力容器操作考试资料及R1快开门式压力容器操作考试试卷
  18. 脱掉360奇虎的“加固保”壳后的发现与你的微信安全
  19. 时间类型转换为字符串
  20. RFID 动态Q静态Q是什么意思

热门文章

  1. 定义域名,之后访问不了报403
  2. linux音乐服务器mpd,ArchLinux 音乐播放客户端ncmpcpp和服务端mpd的配置
  3. 充分利用大内存提升电脑速度
  4. SQL 插入数据和查询
  5. 湖南大学python头歌实训-慕课
  6. WebWorker进阶
  7. 华为云主机 让“云”不再遥不可及
  8. 驾照还没考完,驾校倒闭了学员该怎么办
  9. 奇淫巧技的KMP算法--详解
  10. Ubuntu使用git