当代人能否跟上科学的进步?

艾萨克·牛顿终其一生都在开发工具,加快了科学发现的步伐

如今,科学正在发生分裂。一方面是人类思想创造的科学,它是我们所珍视的故事、理论和阐释的来源;另一方面是机器科学,它的算法具有惊人的预测能力,但内部的工作过程对人类来说是不透明的。

当人类努力去理解世界本质的时候,机器为我们提供了超越人类理解程度的量化的实际预测。“理解”满足了我们的好奇心,但“预测”满足了我们的欲望,到底哪种更为重要?哪种阻碍了科学进步?

理解与预测

直到目前,“理解”和“预测”依然还是同盟关系。弗朗西斯·培根是科学革命早期最早将两者结合的学者之一,主张科学家应该到世界上四处行走,用工具辅助思考,以免陷入思维停滞与循环论证的痛苦,而这就是学术“理解”现实的典型方法。

培根在《新工具》(1620年)一书中写到:人类探索自然的新方法……就像徒手画直线,或是画精确的圆……徒手永远比不上尺子或圆规,所以使用工具会成为我们的方法。

艾萨克·牛顿热情地采纳了培根的经验哲学。他终其一生都在开发工具:物理透镜、望远镜。所有工具都加快了科学发现的步伐,但在人类对仪器日益增长的依赖中,隐藏着一种令人不安的分歧:人类大脑可以洞察世界的隐藏原理,而工具可以测量和建模。

今天,这一鸿沟似乎已经达到了一个极限,理解和预测、原理和模型的关系,正在失去其原本的一致性。在培根和牛顿的时代,关于世界的解释还能被人类大脑驾驭,关于世界的预测还可以被理论验证,两者构成一个良性的整体。

然而,到了“大数据”时代,理解和预测之间的逻辑不再成立。现代科学已经在解释原子、光和力方面,取得了惊人的进展。如今,我们开始适应更复杂的世界—从细胞到组织、从大脑到认知偏见、从市场到气候。虽然相关的统计模型和预测卓有成效,但我们几乎不可能理解它们到底是如何做到的。

机器智能,是一种典型的工具智能,不仅对抗而且敌视人类理性。例如,基因组数据研究,可以抓取数百个参数—病人、细胞类型、疾病、基因、基因位置等,并将疾病的产生与数千个潜在的重要因素联系起来。 但是,这些“高维”数据集和它们提供的预测,在人类的理解能力之外。

这是科学理论与复杂现实之间的真实对峙所导致的分裂。一些评论家声称,这是我们所执着的人类中心主义阻碍了科学的进步,即坚持工具必须臣服于人类的智力;如果我们放弃对人类理性的执念,那么,就可以用机器来加快我们对事物的了解。

理解和预测之间的巨大分歧,呼应了巴鲁克·斯皮诺扎对历史的洞察:“分裂不是源于对真理的热爱……而是源于对至高无上地位的极致渴望。”我们面临的战斗是:大脑或算法,只有一个将拥有科学王国的主权。

鸭兔图可以看作是一只鸭子的头,也可以看作是一只兔子的头

哥本哈根量子力学学派倡导“闭嘴,计算”!

内克尔立方体的衍生品—不可能立方体

悖論与幻象

悖论和幻象这对孪生兄弟,很好地呈现了预测和理解之间的纠缠关系。

一些著名的视觉幻象,如脸-花瓶图案、鸭兔图和内克尔立方体,向我们呈现了一个自身没变,但给人的感官印象在不断切换的物体。路德维希·维特根斯坦痴迷于鸭兔图,他建议人们在对一个物体形成主要解释之后,再次审视这个物体,而不是匆匆一瞥就当即作出判断。

认知科学家理查德·格雷戈里在著作《透过幻觉看见》中,解释了这种幻象是如何发生的。人类的理解过程是由多个不同逻辑系统的预测得出的,每个逻辑系统都基于一定的背景条件。在内克尔立方体中,每种感知都与三维空间中的感知数据一致。但由于缺乏深层次的线索,我们无法确定哪种解释是正确的。因此,对于空间理解的缺失让认知在两种预测之间切换。

悖论,就像幻象一样,是直觉违背显然易见的基本事实。这种现象经常在自然科学中出现,其中最引人注目的是物理学。孪生悖论、爱因斯坦-波多尔斯基-罗森悖论(EPR悖论)和“薛定谔的猫”,都是从相对论或量子力学的基本结构中推导出来的悖论。这与观测悖论(如双缝实验中观察到的波粒二象性)不同,但这两类悖论,都源于人类理解的因果推理与实验预测结果之间的不一致。

即便机器也会受到悖论的困扰。“辛普森悖论”描述了这样的情况:在几个数据集中,分别独立出现的趋势在数据集“合并”时可能消失甚至逆转,这意味着一个数据集可以同时支持相互竞争的结论。这种情况经常发生在体育运动中—在每个既定赛季,一位球员的表现都优于其他运动员,但是,当多个赛季合并在一起时,由于一些绝对差异(如总参赛次数、击球次数等),这位球员就不再领先了。

关于悖论的最严谨的研究,也许是库尔特·哥德尔在《数学原理和相关系统原理》(1931年)中提出的:形式上不完全性定理。哥德尔发现,任何一个形式系统,只要包括了简单的初等数论描述,而且是自洽的,它必定包含某些系统内所允许的方法既不能证实也不能证伪的命题。形式系统的公理允许矛盾存在的可能性,这构成了悖论经验的基础。

悖论和幻觉向我们揭示了思想本身的局限性。正因為此,在现代科学发展之初,人类就开始积极寻求工具与技术的辅助,而每一次科学的演进,都受益于那些突破我们认知局限的技术手段的发展。

本体论与认识论

理解和预测之间的关系,可以对应本体论(洞察世界的真实本质)和认识论(获得世界知识的过程)之间的关系。

基于实验观测的知识,可以突破我们现有的理解局限,促成全新的理解;反过来,这些基本原理可以帮助科学家产生新的预测,并进行实践验证。当托勒密太阳系模型、牛顿经典力学模型,推导出错误的天文预测时,相对论诞生了,以解释大质量物体在高速运动中所发生的“反常现象”。如此,新的理论就导向了更好的预测,即:本体论产生认识论。

一旦科学进步达到一定程度,本体论和认识论就会成为敌人。量子力学的“测不准”理论表明,粒子的动量和位置不可能同时获得。在实践中,量子力学是为了预测结果而进行的理论应用,而不是为了构想出能获得结果的理论本身。换句话说,本体论被认识论吸纳了。

一定程度上,本体论消失了,就如哥本哈根量子力学学派倡导的那样:“闭嘴,计算”!也就是说,不要喋喋不休地讨论对量子运动的可能解释,那是在浪费时间。如今,有着比量子理论家多得多的现代计算机,它们从来都不说话,只是静静地做着不可捉摸的计算。

然而,很少有科学家愿意放弃理论理解。在科学中,一个好的理论,意味着它用一个简单的形式来编码真理,让人们能直观地掌握和交流,以获得一个整体的概念。在某些领域,人类理解的那个宇宙微缩模型和现实的宏观宇宙趋同;苹果和行星都遵循相同的方程式建立运动轨迹,这是体现“一致性”的令人愉快的巧合。

我们所谓的理解,只不过是关于现实的近似和不完美的表征

然而,计算机学习和翻译“自然语言”的例子,可以说明企图对科学现象进行直观描述的危险。在20世纪80年代和90年代,最成功的早期语音识别方法,是基于人类语音结构的数学模型,关注词汇的分类,以及句子的语法与语义关系。到了20世纪90年代末,人工深层神经网络出现。新算法摒弃了先前的许多语言知识,基于纯声学水平的训练自发地“转译”词句。其目的不是理解语言,而是正确地翻译,由此,这种算法变得极其有效。研究人员一旦接受算法的不透明性,这些务实的解决方案就变得非常明确。

打破科学僵局

人工神经网络,解开了当代科学所面临的束缚。反过来,人类对理解的需要,是否阻碍了科学的进步?

对于走出当前的科学僵局,哲学史提供了一些途径。

柏拉图是第一个在《泰阿泰德篇》(Theaetetus)中尝试解决“理解混乱”的人之一。这篇文章专门讨论了认识论的问题,比如苏格拉底把几何、算术和天文学,都归为“一种关于真理的信念”。

康德在《纯粹理性批判》(1781年)中,进一步发展了关于理解的理论。康德区分了物质世界和心理表征世界,即现实作为本体论,而心理知识作为认识论。对康德来说,大脑中只有世界的表象,物质世界只有通过这些表象才能被知晓。这意味着我们所谓的理解,只不过是关于现实的近似和不完美的表征。康德的论点并没有真正帮助我们区分理解和知识;相反,它将理解从一种可以被捍卫的信念,转变为一种无法被验证的内部表征。

哲学家约翰·塞尔在他的著作《头脑、大脑和科学》(1984年)中探讨了知识与理解的区别。想象一个不懂中文的人待在一个配备了翻译字典的房间里,当中文句子出现的时候,设备会将中文翻译成英语,它不需要理解中文,忠实翻译就可以了。这个中文房间是算法局限性的一种隐喻,那些可翻译网页语言的算法,都是在对内容没有做任何“理解”的情况下进行的。

数据可以在没有解释和理解的情况下获得,就像用死记硬背日期和事件的方法来学习历史一样,这是基于事实进行训练的“坏的教育”。而我们平时理解的“好的教育”,是期望他人可以向我们解释他们的方法,以及为什么这么做。如果我们将这一要求延伸到非人类设备上,那么,机器就需要解释它们的做法和动机。

对解释的需要,连接了理解与教学。“教授”,是因果逻辑关系在人际实现了有效沟通,而“学习”,是对其中因果逻辑关系的直觉性的感知。理解是知识可靠传播和文化积累的基础,而且,也是所有长期预测的基础。

作家豪尔赫·路易斯·博尔赫斯在《一个名字的历史回响》(1955年)一文中写道:“凌驾于时间和空间之上,一个神、一个梦、一个狂人,认知到这一事实,重复一个模糊的陈述。”我们可以这样理解,神是宇宙,梦是我们需要理解的渴望,机器就是那个狂人,而整合机器学习和人工智能的复杂科学,是21世纪的科学家所面临的最大挑战。

作者:Fiona

来源:看世界