这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺
新智元报道
来源:B站等
编辑:Yaxin
【新智元导读】近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」!
智障AI狼最近火了!
在一个狼吃羊的AI游戏中,狼发现自己吃不到羊,而选择了「自杀」。
那么,狼为啥会选择直接撞死呢?
傻狼选择「自杀」,只因人间不值得!
近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。
在他发布的这三张聊天记录截屏中,具体介绍了这个狼抓羊的游戏机制。
从截图中可以看出,狼选择撞石的原因竟是,「自杀分数高!」
在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。
开局两只狼,还有六只羊,地图上红色带×的字符就是狼和羊随机出现的可能位置。
狼和羊前面有6根射线,是用来感知范围。当这6根线和障碍物以及地图边界碰撞,就会返回一个坐标。
那根坐标白线便是狼和离它最近羊的连接,这样狼就可以每次优先吃掉最近的那只羊。
在研究人员开始训练的最初阶段,先固定了羊的位置,让狼去学习抓羊。
在狼学会抓羊后,羊也以随机的位置出现在游戏中。
狼抓到羊,奖励10分
狼撞到障碍物,扣1分
为了节省狼抓羊的时间,每秒钟狼都会受到0.1的惩罚
其中,羊撞到石头不会死,只要存活时间长,羊就能得到高分。
如果这两只狼想要在20秒以内得到高分,需要狼吃到羊的数量越多越好,吃羊所用时间越短越好。
在研究人员进行了20W次的训练,竟发现狼抓羊的效果越来越差。
大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!
该项目的一位研究人员@Sdust星尘研表示,「之所以会自杀, 是因为狼在前几万次的训练中发现一头撞死只扣-1.1分(-1 + -0.1)。
往羊那边走两步撞死扣-1.1到-2.4分。
偶尔一次能吃到,虽然正分,但是不值得」。
狼是打工人,羊是永远达不到的升职加薪
这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。
网友们从狼抓羊的身上看到了自己。
那只狼不就是现在的我么!
狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…
还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」。
奖励机制不合理
有网友对这一项目的奖励机制设置是否合理提出了质疑。
还有网友认为,单步惩罚太大,而撞障碍物的惩罚太小,应该把奖励函数设置为,撞到障碍物的惩罚无穷大,那么狼就知道了撞石的代价,就不会轻易选择自杀了。
所以,狼选择自杀的部分原因也是奖励机制设置不合理而导致的。
星尘研在B站中的视频表示,狼自杀的错误是很多因素共同影响产生的,最主要的原因是迭代次数太少,20W次完全不够学。后面提高到100W次起步,效果直线上升。
自暴自弃的狼终于抓到了羊
训练次数从最初5W次一轮,迭代了13代。到后来改成200W一轮,迭代了5代,狼抓羊的训练效果明显提升。
在训练了300万次后,狼终于可以成功地吃到羊。
但是,游戏还是存在一定的缺陷,两只狼还是会偶尔撞石而死。
狼终于学会了抓羊~~
参考资料:
https://m.weibo.cn/6611961566/4613651452134398 https://m.weibo.cn/6611961566/4613930355525879
https://www.bilibili.com/video/BV16X4y1V7Yu?p=1
这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺相关推荐
- 本周AI热点回顾:「时空版」Transformer训练速度远超3D CNN;拒绝内卷的AI狼火了!不想抓羊只想躺!...
点击左上方蓝字关注我们 01 「时空版」Transformer训练速度远超3D CNN,提速3倍! Facebook AI推出了全新的视频理解架构TimeSform ...
- 这个拒绝内卷的狼火了!高智商却自暴自弃,不想抓羊只想躺
点击"开发者技术前线",选择"星标????" 让一部分开发者看到未来 新智元报道 来源:B站 近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自 ...
- 【拒绝内卷】狼吃羊的AI奖励机制不合理: 内卷,如何解决?
深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 本文转载自:Ai科技评论 作者 | 耳洞打三金 大 ...
- 拒绝“内卷”跃迁软件测试最大门槛,我是如何从月薪8K到15K的?
前言 最近有小伙伴私信问我,软件测试这个行业现在太卷啦!根本就找不到工作,我投递了一周上百份简历,回我的不到十个,面试邀约就俩,还没过,我要去送外卖了! 诚然,近一两年,由于现在环境不景气,加上软件测 ...
- 【⛔拒绝内卷,学会shell,走遍天下都不怕⛔】shell编程基础
shell编程基础 shell简介 属性 shell是一个命令行解释器,建立了用户和操作系统之间的接口.当我们在命令行输入一个命令后,shell会对命令进行解释,调用相应的程序去执行.shell是一种 ...
- 超硬核,拒绝内卷全靠阿里大能整理的这份 Java 核心手册,堪称强无敌,谁来不说一声牛 AC
2022 年注定是不寻常的一年,在今年因为疫情以及各大大厂纷纷传来裁员的消息,引得整个互联网圈动荡不堪.腾讯裁员 30%.京东.百度.字节等大厂都在纷纷裁员,引的这些中厂和小厂也跟风裁员. 这个时候外 ...
- 最近华为内部的这篇文章火了!社会内卷的真正原因
????????关注后回复 "进群" ,拉你进程序员交流群???????? 作 者:丘小海 来 源:华为内部论坛.昆仑策研究院 (ID:kunlunceyanjiuyuan) 内卷 ...
- 内卷的世界,我们是否可以换一种思维生活?
文 | Flood Sung 源 | 知乎 前言 今年最热门的词汇之一当属内卷了.似乎很多行业都由于份额有限而陷入内卷当中. 最火的或许是清华学生的这张图,"骑车写代码": 图片来 ...
- 社会内卷的真正原因:华为内部论坛的这篇短文讲透了
猜你喜欢 0.如果你想参与进元宇宙,究竟应该采取怎样的策略?1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统架构.算法及后台设计4.微博推荐算法实践与机器学习平台 ...
最新文章
- java中collection方法_Java 8中的Collector toCollection()方法
- 21天战拖记——Day10:“书柜整理法”再学习(2014-05-13)
- CodeForces - 1368F Lamps on a Circle(交互+贪心)
- 【Java每日一题】20161219
- java任务分支和合并_合并/分支战略
- 【Elasticsearch】es 7.8.0 唐诗三百首写入 Elasticsearch 会发生什么
- “经历”重于“技术”
- 【不积跬步,无以致千里】五个常用的Linux监控脚本代码
- XCode怎么搜索图片文件
- foxmail邮箱pop3服务器,Foxmail怎么设置POP3邮箱
- 警惕!关于5G的最新骗局!
- java编写的山寨qq_java 山寨QQ 实现(一)
- excel拆分表格之多条件拆分
- VMware 虚拟SCSI、SATA 和 NVMe 存储控制器条件、限制和兼容性
- ICO文件缩略图显示错误
- c语言程序设计分值,计算机考试题分值分布
- 「1.8W字」2020不可多得的 TS 学习指南
- 本科、硕士、博士的区别(终极版)
- 乘风广告联盟系统 v6.2
- mysql启动了但是找不到PID_mysql初始化后找不到pid 不能启动-bbotte的博客-51CTO博客...
热门文章
- python标准库math中计算平方根的函数_16 Python 标准库之 math 模块 - Python 进阶应用教程...
- 非连网环境安装cnpm
- 使用 Sandcastle 生成代码帮助文档
- SpringSecurity+OAuth2.0+JWT实现单点登录应用
- Linux系统服务 (DNS解析)
- 音频audio codec相关
- 企业在进行新闻营销时如何才能打造爆点?
- babel @babel/types API
- 【无标题】求大神教下光谱曲线相关性分析置信区间怎么算的?
- Java高并发书籍推荐