如何看待自学3天的阿法元100:0完爆阿法狗?
点击有惊喜
Deepmind在如约在Nature发布了一篇名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,在这篇重磅论文中,详细介绍了谷歌 DeepMind 团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1 打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0 打败哥哥阿法狗。他的名字叫阿法元。
阿尔法元的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。
人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero),完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,棋艺增长远超阿法狗,百战百胜,以 100-0 击溃阿法狗。
达到这样一个水准,阿法元只需要在 4 个 TPU 上,花三天时间,自己左右互搏 490 万棋局。而它的哥哥阿法狗,需要在 48 个 TPU 上,花几个月的时间,学习三千万棋局,才打败人类。
点击有惊喜
如何看待自学3天的阿法元100:0完爆阿法狗?相关推荐
- 今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0
原创 2017-10-19 知社 知社学术圈 去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此人间无敌手.他的名字叫阿法狗. 今年,他的弟弟只靠一副棋盘和 ...
- Nature重磅:人工智能从0到1, 无师自通完爆阿法狗100-0 | 深度解析
本文授权转载自知社学术圈(微信id:zhishexueshuquan) 去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此人间无敌手.他的名字叫阿法狗. 今 ...
- c语言筛选法求100之内素数,用筛选法求100之内的素数。
/*用筛选法求给出范围之内的素数.*/ #include #include int isPrime(int n){//判断素数 for(int i = 2; i < n; i ++){ if(n ...
- c语言 用筛选法求100以内的素数,使用筛选法求100以内的素数
使用筛选法求100以内的素数 筛选法介绍 先把N个自然数按次序排列起来. 1不是质数,也不是合数,划去. 第二个数2是质数留下来,而把2后面所有能被2整除的数都划去.2后面第一个没 划去的数是3,把3 ...
- 线性代数 --- Gauss消元的部分主元法和完全主元法
Gauss消元的部分主元法和完全主元法 心怀二意的人,在他一切所行的路上都没有定见.----雅各书1章8节 笔者的一些话:刚开始写这篇文章的时候,我觉得高斯消元很简单.因为,这时的我已经完成了我一直想 ...
- 母鸡3元一只 公鸡5元一只 小鸡1元3只 要求100元刚好买100只鸡的买法
列举两个计算的方法 1) /** 母鸡3元一只 公鸡5元一只 小鸡1元3只 要求100元刚好买100只鸡的买法 */ #include <stdio.h>int main(void) {i ...
- (11/∞)每日一练{1.将一张100元钞票换成等值的10元,5元,2元和1元的小钞,每次换成40张小钞,要求每一种小钞都要有,编程求出所有可能的换法总数输出并输出各换法的组合。}
/*------------------------------------------------------- 将一张100元钞票换成等值的10元,5元,2元和1元的小钞,每次换成40张小钞,要求 ...
- 完爆阿尔法狗元,DeepMind用5000台TPU训练出新算法,1天内称霸3种棋类
大数据文摘作品 作者:姜范波.Aileen.Yawei Xia.龙牧雪.魏子敏 距离阿尔法狗元版本刷屏一个多月时间,阿尔法狗又进化了,这次不光可以玩围棋,不再是"狗"了.我一点也不 ...
- 二次指数平滑法 php,二次指数平滑法摘抄_二次指数平滑法算例
二次指数平滑法摘抄_二次指数平滑法算例 指数平滑法是一种特殊的加权平均法,加权的特点是对离预测值较近的历史数据给予较大的权数,对离预测期较远的历史数据给予较小的权数,权数由近到远按指数规律递减,所以, ...
最新文章
- AI还原宋明清三朝皇帝,还找到了最匹配的明星脸,网友:四大美女安排上
- CloudStack Ctrix官网版本
- Actionscript3.0动画编程中的几种特效举例
- mysql 线上加索引_MySQL加索引都经历了什么?
- 递归实现 十进制转换其他进制(2-16)
- C语言 函数值传递和址传递 - C语言零基础入门教程
- js遍历对象、遍历数组、js数组方法大全、区分map()和forEach()以及filter()、区分for...in...和for...of...
- 线程安全的map_面试必问-几种线程安全的Map解析
- 位操作符:与,或,异或 狼羊菜
- 值计算公式_板式换热器选型,K值是关键点!
- python模拟按键_Python实现windows下模拟按键和鼠标点击的方法
- 大数据之-Hadoop之HDFS的API操作_判断是文件还是文件夹---大数据之hadoop工作笔记0062
- Linux截图工具import使用说明
- 创建 maven maven-archetype-quickstart 项目抱错问题解决方法
- selenium webdriver 右键另存为下载文件(结合robot and autoIt)
- HFSS脚本建模入门
- smartPrinter安装报错
- proc 文件的创建和读写
- Android类似钉钉类的APP 实现禁止用户虚拟定位
- 【云原生】这么火,你不来了解下?