伽利略在学生时代时就以成功发现了“周期”而颇有名气,当时,他在比萨大教堂里望着一盏摇摆的吊灯,用自身的脉搏对吊灯的运动进行了粗略估算,得出了“理想条件下吊灯摇摆一周所需的时间或为恒定,与摇摆的幅度无关”的结论。伽利略随后便提出,可以利用这一原理构建一台精准的时钟,但第一台以此构建的“摆钟”则在伽利略去世约 15 年后才被建成。
伽利略的“天赋聪慧”在于,他在研究事物时能够忽略与研究相关度低的次要因素,重点关注与研究相关度高的主要因素,比如在发现“周期”的过程中,他通过建立一个理想摇摆模型重点研究了吊灯摇摆的时间问题,忽略了那些如空气、温度、光线和噪音等会使问题复杂化的细节。
对许多历史学家来说,伽利略在研究中所使用的方法代表了现代科学方法的前身,经过不断的完善和演变,发明家和科学家们用同样的方法实现了飞行,发现了广义相对论和量子力学,并发明了电脑以及早期人工智能。
随着技术的不断进步,当下的人工智能系统已经能从数据中发现某种特定规律,甚至是由此发现某些物理定律,但它们仅能处理一些特殊的数据,科学家们并不能把“什么都有”的“原始数据”直接交由它们处理。可以说,目前人工智能的数据分析能力与人类从观察中发现规律的能力还相差甚远。
(来源:麻省理工科技评论)
但这也引出了一个十分有趣的问题,那就是我们是否真的能设计出一个人工智能系统,在分析时仅关注那些与研究内容相关度高的“关键因素”,模仿人类的研究方式对数据进行处理。
最近,MIT 的 Tailin Wu 和 Max Tegmark 为我们给出了答案,他们所开发的一款名为“AI 物理学家(AI Physicist)”的人工智能系统可以通过模仿人类物理学家的研究方法,对数据所描述的“陌生”环境梳理出能够描述该环境的物理法则。
Wu 和 Tegmark 所开发的系统针对的是现有 AI 所面临的最大难题之一,即无法处理庞大数据集的问题。事实上,给出描述大教堂内环境的数据,现有的任何一个 AI 系统都无法做到以此发现“周期”的存在。
为了解决这个问题,Wu 和 Tegmark 将人类物理学家在研究中经常使用的三个技巧整合到了他们所开发的系统中,即“简化问题”、“寻找更具普适性的理论”以及“尝试将过去成功过的方法套用在新系统上”。
其中,“简化问题”源于物理学家们通常会通过简化问题来研究事物,比如将宏观和微观分开来论,先开发出两套能分别描述宏观世界和微观世界的理论,再设法进行整合,现在的广义相对论和量子力学的诞生便是得益于这种思维方式。
“寻找更具普适性的理论”源于物理学家们通常认为一个理论能解释的情况越多,该理论也就越完善。虽然一个最终的“究极理论”是否存在还不是定数,但这种思维方式在现代科学的许多研究中都发挥了重要作用。
“尝试将过去成功过的方法套用在新系统上”源于物理学研究中的一种“终身学习”概念,物理学家们通常会尝试将过去成功过的分析方法套用在新的系统上进行研究,如果适用则意味着该方法具有一定的普适性,不适用则说明该方法需要针对新系统进行改进或新系统需要一个全新的理论来对其进行描述。
在将以上这三种人类物理学家常用的研究技巧整合到 AI 系统后,Wu 和 Tegmark 设计了由不同物理法则所支配的 40 个不同宇宙,比如同样一个小球的运动在 A 宇宙内受重力支配,在 B 宇宙内受电磁力支配,在 C 宇宙内受谐波势(harmonic potential)支配,并以此对他们所开发的“AI 物理学家”进行了测试。
在测试中 Wu 和 Tegmark 对“‘AI 物理学家’能否通过观察小球的运动来发现与该运动相符的物理定律”,和“不包含‘终身学习’技巧的系统(用以模拟刚进入物理学研究领域新人)与整合了全部三个技巧的系统(用于模拟经验丰富的老物理学家)在表现上有何差异”这两个问题进行了研究。
测试结果表明,不包含“终身学习”机制的系统(在研究中被称为“物理新人”)和整合了全部研究技巧的系统(即“AI 物理学家”)最终都能成功发现相应宇宙中的相应物理法则,两种系统解决设定问题的能力都达到了 90% 以上。
但“AI 物理学家”相对于“物理新人”来说可以使用较少的数据进行更快地学习。Wu 和 Tegmark 说:“这与经验丰富的老学者能通过其知识储备比初学者更快地解决新问题很像。”
研究结果还表明“新物理学家”的表现要明显优于传统的神经网络设计。Wu 和 Tegmark 说:“我们所开发的系统在多数情况下学得更快,计算上的出错概率约为传统神经网络设计的十亿分之一。”
虽然这项研究并没有在真正意义上将 AI 系统置身于一个包含各自信息的“松散”数据集中,但其结果证明了 AI 系统确实具有这种潜力。
如果未来真的有人开发出了真正意义上的“AI 物理学家”,其历史意义或许能与伽利略开发出“科学方法”的前身相比。但就目前来说,这项研究,以及未来可能由这项研究所带来的更多技术进步对人类来说究竟意味着什么还是一个未知数。