人类该向人工智能低头吗？

一鸣惊人

2017年10月，人工智能再一次吸引了人类的眼球。AlphaGo的最新版本诞生，并且以骄人成绩击败上代版本。

曾经，AlphaGo横扫棋坛无敌手，它打败了世界上最优秀的围棋棋手。先是2016年它击败了韩国围棋高手李世石，因此得名“AlphaGo高手”；而后在2017年5月稍加改进后，通过网络下棋击败了60位世界顶级棋手，也击败了围棋世界冠军柯洁，因此又得名“AlphaGo大师”。

设计师重新设计了AlphaGo，推出新版本后，它便迎来了爆炸式的成长。短短三天时间，它从围棋零基础成长到高手水平，以100比0的战绩，击败了AlphaGo高手。然后继续学习成长，不久又击败了AlphaGo大师。

短时间取得如此骄人成绩，并不是最可怕的。最可怕的是，它诞生时除了具备基本围棋规则外，其他任何关于围棋的知识、妙手、棋谱统统没有，它完全自学成才，成就了名副其实的“第一围棋手”称号。它的名字就是AlphaGo Zero。

完全自学

机器之所以智能，是因为具备了学习能力。而人工智能不论多高级、多专业，也不论在哪个领域，包括语音识别、图像分类、药物分拣等，都需要具备一定知识储备，学习该领域内已有的人类知识。

AlphaGo诞生时也是如此。它花了几个月时间，学习了三千万个棋局，几乎掌握了人类关于围棋的一切知识；它以大量的围棋棋谱为基础，不断模拟各种制胜妙手，自己给自己下棋，一步步优化自己的走棋策略。结果它学会了人类的下棋技巧，还比人类下得更好，最终赢了职业围棋高手李世石。可以说，它的实力取决于学习能力，更取决于人类提供的知识储备。

但是这种学习经历在AlphaGo Zero身上不见了。除了下棋规则之外，设计人员没有给AlphaGo Zero加载任何与围棋棋谱有关的数据，没有进行任何培训、指导。它“头脑一片空白”，完全是零基础。

它的学习方式就是左右互搏，自己跟自己下棋。刚开始，下棋全是随机的，无任何套路可言。持续下棋（学习）3天，它自己对弈了490万场比赛，并且为每场比赛的预热，它还进行了1600次模拟比赛。结果，它轻松打败了曾经打败李世石的AlphaGo高手。成长到21天，又击败AlphaGo大师；成长到40天，它已成为无可争辩的世界第一围棋高手。

技术基础

AlphaGo Zero成长为真正的围棋大师，全靠自学。这种自学基于设计师对它进行的重新设计。

在老版本AlphaGo的系统里，有三大部分，一、搜索算法，即穷尽法，在19×19围棋盘上列出可能下的每一步棋；二、蒙特卡洛模拟，即最优法，在所有可能下的棋招中计算出最有利的一步；三、两个深层神经网络，一个用来模仿现成棋谱的招数，另一个用来评估模仿的结果。而它的硬件则包括48个处理器（TPU），并使用了多台机器。TPU就是张量处理器，是谷歌专为机器学习而研发的芯片，与中央处理器（CPU）相比有更高的效能。

而AlphaGo Zero的系统里，完全没有了前两部分，只保留了最后一个，并且两个深层神经网络还合二为一。这种系统被称为“强化学习”，也就是说，它既能自己跟自己下棋，又能评估自己下棋的结果。无疑，这样效率更高，并且它只需1台机器和4个张量处理器就可以正常工作。它的世界里，只有围棋棋盘和黑白棋子。因此它自学的方式很简单，就是练习再练习，重复再重复。

高超创新

从围棋零基础成长为世界第一围棋高手，AlphaGo Zero不仅全靠自学，还学出了新花样，创造了新的下棋套路，不仅真正超越了它的前辈，还超越了人类。

它与老版本AlphaGo对弈的100场比赛，都是标准赛制，每位棋手限时2小时。比赛前期布局以及最后收官时，AlphaGo Zero走棋可圈可点，表现了高手的水准，与千百年来围棋大师们积累的妙招类似。

但是在比赛的中间环节，它的某些棋招显得十分诡异，超出了正常的围棋下法，至少是超出了现有的知识范畴，很难理解。据此科学家分析道，它可能自己研究出新的棋招，创新了围棋棋谱，这种创新与人类的下法有本质不同。不同于以往，但又更好。或许这就是人工智能青出于蓝而又胜于蓝的必然结果吧。

令人兴奋又令人脊背发凉

围棋有几千年的历史，有无数的棋谱、书籍问世。人类曾经以为，站在巨人肩膀上才能达到更高成就，但是现在人工智能改写了历史。不到两个月时间，不参考相关的人类知识，它从零基础成长为一名超级围棋棋手。而且它还能自己创新，超越人类现有的水平。

这一切都表明，人工智能是人类智慧的倍增器，它可以帮助我们从容面对那些严峻挑战，提高解决问题的效率。这种前景完全是可能的，如果AlphaGo Zero的技术应用于其他领域，比如蛋白质折叠、降低能源消耗、开发革命性新材料等，那么许多难关将会迅速突破，许多创新也会接踵而至，或许还会给社会带来巨大的革命性影响。

然而，若人工智能的创新超出了人类的掌控呢？人工智能是否会超越人类，是否会反过来控制人类？如果它能不依赖人类知识，自学并超越人类现有水平，那么这种情况还是有可能发生的，毕竟它创新出了人类无法理解的诡异棋招。

不到屈服之时

虽然人工智能在某些专业领域超越了人类，但它仍有一个致命缺陷，即常识障碍。人类用同样一个身体（硬件）和同一个头脑（软件），可以完成许多事，如做数学题、赋诗作文、打球、游泳、下围棋……而且对于许多模糊问题，人类依然能解决。但这对人工智能来说就很难，并且它很难具备这种常识，更没有标准来判定它达到什么程度才算具有常识。

当做一件事时，我们知道很多相关的其他事。下棋的时候，我们知道围棋的意义是围地占地盘，象棋的意义是打仗将军，而这些意义和区别，AlphaGo Zero却不知道。再比如玩飞盘时，我们不仅清楚该怎么玩，还知道与飞盘有关的其他事，比如我们知道三个月大的孩子不能玩飞盘，飞盘也不能吃。这些人工智能都无法区分。

另外，围棋属于一种限制性的问题，必须在遵循规则的前提下，达到某种特定条件，才能算解决问题。AlphaGo Zero所有的成就，都是在这个范畴内完成的。假若出了这个范畴，它还能应付吗？它会开车，会写小说吗？它会探索未知世界，会解决开放性问题吗？有些或许它快要会了，但这显然还不够。

据设计师证实，AlphaGo Zero还是很死板的，它根本不知变通。假如把它对弈的标准围棋棋盘变大，横竖各增加10格，变成29×29的大棋盘，那AlphaGo Zero就傻眼了。又或者缩小1格，变成18×18棋盘，它也不会下。其实，这也是人工智能极度专业化的表现之一。

因此，人类还不到屈服于人工智能的时候，而且可能永远都不会有这样的时候。

本文源自大科技〈百科新说〉 2017年第12期杂志文章