一鸣惊人
2017年10月,人工智能再一次吸引了人类的眼球。AlphaGo的最新版本诞生,并且以骄人成绩击败上代版本。
曾经,AlphaGo横扫棋坛无敌手,它打败了世界上最优秀的围棋棋手。先是2016年它击败了韩国围棋高手李世石,因此得名“AlphaGo高手”;而后在2017年5月稍加改进后,通过网络下棋击败了60位世界顶级棋手,也击败了围棋世界冠军柯洁,因此又得名“AlphaGo大师”。
设计师重新设计了AlphaGo,推出新版本后,它便迎来了爆炸式的成长。短短三天时间,它从围棋零基础成长到高手水平,以100比0的战绩,击败了AlphaGo高手。然后继续学习成长,不久又击败了AlphaGo大师。
短时间取得如此骄人成绩,并不是最可怕的。最可怕的是,它诞生时除了具备基本围棋规则外,其他任何关于围棋的知识、妙手、棋谱统统没有,它完全自学成才,成就了名副其实的“第一围棋手”称号。它的名字就是AlphaGo Zero。
完全自学
机器之所以智能,是因为具备了学习能力。而人工智能不论多高级、多专业,也不论在哪个领域,包括语音识别、图像分类、药物分拣等,都需要具备一定知识储备,学习该领域内已有的人类知识。
AlphaGo诞生时也是如此。它花了几个月时间,学习了三千万个棋局,几乎掌握了人类关于围棋的一切知识;它以大量的围棋棋谱为基础,不断模拟各种制胜妙手,自己给自己下棋,一步步优化自己的走棋策略。结果它学会了人类的下棋技巧,还比人类下得更好,最终赢了职业围棋高手李世石。可以说,它的实力取决于学习能力,更取决于人类提供的知识储备。
但是这种学习经历在AlphaGo Zero身上不见了。除了下棋规则之外,设计人员没有给AlphaGo Zero加载任何与围棋棋谱有关的数据,没有进行任何培训、指导。它“头脑一片空白”,完全是零基础。
它的学习方式就是左右互搏,自己跟自己下棋。刚开始,下棋全是随机的,无任何套路可言。持续下棋(学习)3天,它自己对弈了490万场比赛,并且为每场比赛的预热,它还进行了1600次模拟比赛。结果,它轻松打败了曾经打败李世石的AlphaGo高手。成长到21天,又击败AlphaGo大师;成长到40天,它已成为无可争辩的世界第一围棋高手。
技术基础
AlphaGo Zero成长为真正的围棋大师,全靠自学。这种自学基于设计师对它进行的重新设计。
在老版本AlphaGo的系统里,有三大部分,一、搜索算法,即穷尽法,在19×19围棋盘上列出可能下的每一步棋;二、蒙特卡洛模拟,即最优法,在所有可能下的棋招中计算出最有利的一步;三、两个深层神经网络,一个用来模仿现成棋谱的招数,另一个用来评估模仿的结果。而它的硬件则包括48个处理器(TPU),并使用了多台机器。TPU就是张量处理器,是谷歌专为机器学习而研发的芯片,与中央处理器(CPU)相比有更高的效能。
而AlphaGo Zero的系统里,完全没有了前两部分,只保留了最后一个,并且两个深层神经网络还合二为一。这种系统被称为“强化学习”,也就是说,它既能自己跟自己下棋,又能评估自己下棋的结果。无疑,这样效率更高,并且它只需1台机器和4个张量处理器就可以正常工作。它的世界里,只有围棋棋盘和黑白棋子。因此它自学的方式很简单,就是练习再练习,重复再重复。
高超创新
从围棋零基础成长为世界第一围棋高手,AlphaGo Zero不仅全靠自学,还学出了新花样,创造了新的下棋套路,不仅真正超越了它的前辈,还超越了人类。
它与老版本AlphaGo对弈的100场比赛,都是标准赛制,每位棋手限时2小时。比赛前期布局以及最后收官时,AlphaGo Zero走棋可圈可点,表现了高手的水准,与千百年来围棋大师们积累的妙招类似。
但是在比赛的中间环节,它的某些棋招显得十分诡异,超出了正常的围棋下法,至少是超出了现有的知识范畴,很难理解。据此科学家分析道,它可能自己研究出新的棋招,创新了围棋棋谱,这种创新与人类的下法有本质不同。不同于以往,但又更好。或许这就是人工智能青出于蓝而又胜于蓝的必然结果吧。
令人兴奋又令人脊背发凉
围棋有几千年的历史,有无数的棋谱、书籍问世。人类曾经以为,站在巨人肩膀上才能达到更高成就,但是现在人工智能改写了历史。不到两个月时间,不参考相关的人类知识,它从零基础成长为一名超级围棋棋手。而且它还能自己创新,超越人类现有的水平。
这一切都表明,人工智能是人类智慧的倍增器,它可以帮助我们从容面对那些严峻挑战,提高解决问题的效率。这种前景完全是可能的,如果AlphaGo Zero的技术应用于其他领域,比如蛋白质折叠、降低能源消耗、开发革命性新材料等,那么许多难关将会迅速突破,许多创新也会接踵而至,或许还会给社会带来巨大的革命性影响。
然而,若人工智能的创新超出了人类的掌控呢?人工智能是否会超越人类,是否会反过来控制人类?如果它能不依赖人类知识,自学并超越人类现有水平,那么这种情况还是有可能发生的,毕竟它创新出了人类无法理解的诡异棋招。
不到屈服之时
虽然人工智能在某些专业领域超越了人类,但它仍有一个致命缺陷,即常识障碍。人类用同样一个身体(硬件)和同一个头脑(软件),可以完成许多事,如做数学题、赋诗作文、打球、游泳、下围棋……而且对于许多模糊问题,人类依然能解决。但这对人工智能来说就很难,并且它很难具备这种常识,更没有标准来判定它达到什么程度才算具有常识。
当做一件事时,我们知道很多相关的其他事。下棋的时候,我们知道围棋的意义是围地占地盘,象棋的意义是打仗将军,而这些意义和区别,AlphaGo Zero却不知道。再比如玩飞盘时,我们不仅清楚该怎么玩,还知道与飞盘有关的其他事,比如我们知道三个月大的孩子不能玩飞盘,飞盘也不能吃。这些人工智能都无法区分。
另外,围棋属于一种限制性的问题,必须在遵循规则的前提下,达到某种特定条件,才能算解决问题。AlphaGo Zero所有的成就,都是在这个范畴内完成的。假若出了这个范畴,它还能应付吗?它会开车,会写小说吗?它会探索未知世界,会解决开放性问题吗?有些或许它快要会了,但这显然还不够。
据设计师证实,AlphaGo Zero还是很死板的,它根本不知变通。假如把它对弈的标准围棋棋盘变大,横竖各增加10格,变成29×29的大棋盘,那AlphaGo Zero就傻眼了。又或者缩小1格,变成18×18棋盘,它也不会下。其实,这也是人工智能极度专业化的表现之一。
因此,人类还不到屈服于人工智能的时候,而且可能永远都不会有这样的时候。
本文源自大科技〈百科新说〉 2017年第12期杂志文章