您的位置首页百科问答

阿尔法狗再进化是怎么样的?

阿尔法狗再进化是怎么样的?

的有关信息介绍如下:

早在今年五月对弈柯洁之前,AlphaGo就已经从“狗”进化为“神”,无需依赖人类训练师,但谷歌的野心并不止步于此,Deepmind公司1/4精力已经被用于商业实践和变现

阿尔法狗再进化是怎么样的?

10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布了AlphaGo的新进步,可以在没有人类干预的情况下自我学习,新的AlphaGoZero在自我学习3天之后,就以100比0的成绩战胜了第一代AlphaGo。

自我学习能力的出现,对于人工智能和机器学习来说,是一个新的突破。“过去人们普遍认为机器学习是基于海量的大数据,但是从AlphaGoZero身上,我们发现算法比数据更重要。”AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说道。

也由于使用了更多的算法和更少的数据,所以AlphaGoZero只使用了一台计算机器和4个TPU,被它打败的一代AlphaGo则用到多台机器和48个TPU。

当人们惊讶于AlphaGoZero在围棋领域的神级水平时,对于DeepMind团队来说,这才只是刚刚开始,他们的目的是通过培养自主学习的能力,来解决更多其他领域目前无法解决的棘手问题。

阿尔法狗再进化是怎么样的?

今年5月的比赛期间,DeepMind的多位高管就已经向《财经》记者透露,Master已经实现了自我学习能力,甚至有了自己的“直觉”,“我们发现AlphaGo已经不需要依赖人类训练师了。”戴维·席尔瓦告诉《财经》记者。

与柯洁的对弈中,AlphaGo已经能下出很多人类棋手完全无法想象的路数,比赛后柯洁表示,第一代的AlphaGo还能找到破绽,Master已经实现了“从人到神”的飞跃。

阿尔法狗再进化是怎么样的?

而AlphaGoZero在“独立”上更进一步,在训练的过程中,它是自我对弈。从训练图上可以看出,由于一开始并不熟悉围棋,对弈双方的水平都很弱,但是随着时间的推进,在短短3天互相博弈490万局后,越来越强,实现了围棋水平的突破。