再放大招:AlphaGoZero无师自通完爆AlphaGo

出品:科普中国

制作:中国科学院自动化研究所

监制:中国科学院计算机网络信息中心

近日,DeepMind在Nature上公布了最新版AlphaGo论文,介绍了迄今为止最强的围棋AI——AlphaGoZero。去年,AlphaGo代表人工智能在围棋领域首次战胜了人类的世界冠军,但其棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上的,而AlphaGoZero则不需要人类的专业知识,只使用纯粹的深度强化学习技术和蒙特卡罗树搜索,经过3天自我对弈就实现了100:0击败阿法狗。 AlphaGoZero的成功证明了在没有人类指导和经验的前提下,深度强化学习方法在围棋领域里仍然能够出色的完成指定的任务,甚至于比有人类经验知识指导时,完成的更加出色。某种程度而言,AlphaGoZero展现出了机器“机智过人”的一面,因为它不再被人类认知所局限,而能够发现新知识,发展新策略,它也再度证明了深度强化学习的强大能力,这一成果也势必将推动该领域的进一步发展。

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。

本文由科普中国融合创作出品,转载请注明出处。