我们“看”到的东西来源于我们的想象？视觉过程的数学“神还原”

人类视觉是一个庞大的谜题：世界似栩栩如生的画像，呈现在我们眼前，而大脑的视觉系统从世界本身获得的信息却十分有限。大多我们“看”到的东西来源于我们的想象。

“很多你以为亲眼所见的东西，都来源于自己的想象。”纽约大学的数学家杨丽笙（Lai-Sang Young）表示，“实际上你并没有看见它们。”

但是大脑一定是位创造视觉世界的行家，否则我们将时常跌跌撞撞。遗憾的是，仅依靠解剖学来揭示大脑创造视觉图像的机制，就好比盯着汽车引擎来试图破解热力学定律一样困难。

一项新研究表明，数学是解决这一问题的关键。在过去的数年中，杨丽笙和纽约大学的同事们，神经学家罗伯特·沙普利（Robert Shapley）和数学家洛根·夏利克（Logan Chariker），参与到了一项前所未有的合作中。他们正在构建一座能整合多年来生物实验成果的数学模型，以此诠释大脑是如何通过有限的视觉信息精致地再现世界样貌的。

_{纽约大学数学家杨丽笙（左）和神经学家罗伯特·沙普利（右）}

_{图片来源：Courtesy of NYU Photo Bureau; Paul Lee, Center for Neural Science, NYU}

“在我看来，理论家的职责在于通过零碎的知识把握全局，”杨丽笙表示，“实验本身并不能解释一个机制的工作原理。”

杨丽笙和她的合作伙伴们正逐步建立他们的模型，将基本的视觉元素逐个融入其中。他们已经成功解释了视觉皮层的神经元如何相互作用，从而探测物体的边缘以及对比度的变化。目前，他们在探究大脑感知物体移动方向的机制。

这一研究尚属首例。为了模拟人类视觉，更早的模型对视觉皮层作出了各种一厢情愿的假设。然而杨丽笙、沙普利和夏利克的模型并不避讳视觉皮层严苛且非直观的生物学特点，在此基础之上理解视觉的形成方式。

“他们的模型真正地基于大脑真实的生理结构，是一大突破。他们希望这一模型从生物学角度来看，是正确、可行的。”犹他大学的神经学家亚历山德拉·安杰露奇（Alessandra Angelucci）评论道。

层层堆积

我们对视觉并非一无所知。

我们的眼睛如同镜头，接受外界的光线，将视野等比例地投射在眼睛背后的视网膜上。视网膜与大脑后部的视觉皮层相连。

但是，视网膜与视觉皮层之间的连接非常有限。为了看到四分之一个满月大小的视觉范围，大脑只提供了区区10个左右的神经细胞将视网膜信息传递到视觉皮层。许多这样的细胞组成了LGN——外侧膝状体（lateral geniculate nucleus）。它构成了视觉信息从外界传进大脑的必经之路。

LGN细胞不仅数量稀少，作用也不大。当它们探测到视野中微小区域的明暗变化，LGN细胞就会向视觉皮层发送一个脉冲，仅此而已。视网膜承受着来自光明世界的信息轰炸，大脑却只能依靠来自极少量LGN细胞的微弱信号作出判断。这样凭借极少的信息重建视觉世界，好比借助餐巾纸上的短笺还原《白鲸记》（Mody-Dick）之类的长篇小说。

—Davidope.

“你可能以为，大脑完好无损地捕捉了我们所见的一切，”杨丽笙指出，“但是真正捕捉视觉信息的是视网膜，而不是大脑，并且视网膜只将零碎的信息传递给视觉皮层。”

接下来就是视觉皮层大显身手的时候了。即使视觉皮层与视网膜仅以少量神经元相连，皮层本身却聚集着大量的神经细胞。每10个与视网膜相连的LGN神经元，就有4000个视觉皮层的初始“输入层”神经元与之对应。除此之外，视觉皮层的其他区域还有更多的神经元。这一差异意味着大脑会对其接收的少量视觉信息进行深入的处理。

沙普利表示：“视觉皮层仿佛有它自己的思想。”

对杨丽笙、沙普利、夏利克等科研人员而言，解读视觉皮层的“思想”正是挑战所在。

视觉环线

视觉的生物基础引人深思。它的神奇之处有如一个力拔千钧的小人，让人不禁好奇它如何依靠有限的线索实现强大的功能。

早在杨丽笙、沙普利和夏利克之前就有人尝试用数学模型解释视觉，但他们无一例外预设了对自己更有利的条件，即视网膜传送给视觉皮层的信息比实际的更多。这样一来，视觉皮层对刺激的反应更容易解释。

沙普利指出：“大家还没有清楚地意识到计算模型所暗示的生物学条件。”

数学家们向来擅长为富于变化的现象建立模型，上至台球的移动，下至时空的演变。这些现象都属于“动态系统”，遵循固定的规律，随着时间推移产生变化。大脑中被激发的神经元之间相互作用也属于一种动态系统，不过其作用极其微妙，而且很难用一套精准的规则来描述。

LGN细胞向皮层发出的一连串电脉冲只有十分之一伏特，持续约1毫秒，却可以在神经元间引发瀑布般规模的相互作用。杨丽笙指出，与我们更为熟悉的物理系统相比，这些相互作用所遵循的规则“无可比拟地复杂”。

_{—Stephan Schmitz}

每个神经元同时接收来自数百个神经元的信号。这些信号中，有的促使它被激发，有的则抑制它的活动。当神经元接收到来自这些或兴奋性或抑制性神经元的电脉冲时，其细胞膜上的电压便会产生波动。只有当这一电压——即“膜电位”——超过某一阈值时，神经元才会被激发。我们无法预测这一切将在何时发生。

“如果你着眼于单个神经元的膜电位，你会发现它的上下起伏非常大，”杨丽笙说，“我们没有办法判断它什么时候会发出脉冲。”

实际情况更为扑朔迷离。还记得那些和单个神经元相连的数百个神经元吗？它们又各自接收着来自其他数百个神经元的信号。正是这样层层叠叠、环环相扣的反馈循环组成了视觉皮层。

沙普利指出：“这种结构有太多可动部件，也正是难题所在。”

早期的视觉皮层模型往往忽视了这个特征。这些模型默认信息的流动方向是单一的，即从眼睛前方到视网膜，再到皮层，最后在末端形成视觉，干净利落得像流水线上零件的制造过程一样。这些“前馈”模型更容易创建，但它们忽略了解剖学的发现——“反馈”循环对皮层来说必定是不可或缺的。

_{—James Round}

“想要模拟反馈循环十分困难，因为信息不断地回流，从而引发改变、产生影响，”杨丽笙说，“反馈循环在大脑中无处不在，却极少有人将它纳入模型中。”

杨丽笙、沙普利和夏利克在2016年发表了第一篇有关于此的论文，开始重视这些反馈循环。他们的模型中，反馈循环引发了类似蝴蝶效应的反应：来自LGN的信号中产生的微小变化经过多轮反馈循环被放大。这一过程又被称为“反复激活”，可以解释模型最终产生的视觉表征中的巨大变化。

杨丽笙、沙普利和夏利克还证明，他们的模型可以利用大量反馈，仅凭LGN输入信号中的细小变化，来重现物体边缘的朝向，不论垂直还是水平，乃至任何介于两者之间的方向。

“也就是说，区区几个与其他神经元相连的神经元就足以辨别视觉范围中的所有方向。”安杰露奇表示。

诚然，边缘检测只是构成视觉的一小部分，这篇2016年的论文也只是一支序曲。接下来的挑战在于将更多视觉的组成部分纳入模型，同时保证边缘检测这一部分的准确性。

视觉之潮

在实验室环境中，科研人员往往会向灵长类动物展示简单的视觉刺激——黑白图案。这些黑白图案的对比度和朝向都不尽相同。通过植入动物视觉皮层的电极，科研人员得以追踪响应视觉刺激的神经脉冲。一个令人满意的模型应当能在相同的视觉刺激面前重现这样的神经脉冲。

“我们从灵长类动物的行为得知它们对某些图像的反应。根据这些信息，我们再实施反向工程，倒推大脑的工作机制。”杨丽笙指出。

2018年，这三位科研学家发表了第二篇论文，证明了他们的模型不仅可以实现边缘检测，在不修改模型的条件下，还可以再现皮层中脉冲活动的整体模式，即伽马节律。（大批萤火虫在共同发光时所展现的群体模式与之类似。）

他们的第三篇论文正在审核中，主要解释视觉皮层如何感知对比度的变化。他们提出的解释涉及一个重要的机制：兴奋性神经元会强化彼此的活跃性，如同舞会上热烈的气氛，随着更多人的加入而愈发高涨。对视觉皮层来说，为了通过稀疏的输入信息创建出完整的图像，这种机制是不可或缺的。

_{—James Round}

目前，杨丽笙、沙普利和夏利克正着手于将定向灵敏度纳入他们的模型，从而解释视觉皮层如何重现物体在视野中的移动方向。接下来，他们将尝试理解视觉皮层如何识别视觉刺激所包含的时间模式。举例来说，我们可以察觉到交通灯闪烁的灯光，却不会注意到电影中逐帧播放的画面。这正是科学家们想要解读的现象。

即便如此，他们的模型也十分简单，只能解释六层视觉皮层中一层的活动，即建立视觉印象的粗略轮廓的一层。另外的五层负责更为复杂的视觉处理，但无法用他们的模型解释。这套模型也无法解释视觉皮层如何区分颜色，因为它涉及另一条完全不同，并且更加难懂的神经通路。

“路漫漫其修远兮，但他们做出的努力不可忽视。”安杰露奇评论道，“这必然是一项艰巨而费时的任务。”

虽然他们的模型远不足以完全揭开视觉的面纱，但已经迈出了正确的一步。这是第一个在尊重生物学原理的前提下，试图破译视觉密码的模型。

康奈尔大学的神经科学家乔纳森·维克托（Jonathan Victor）表示：“过去，人们对待生物学原则总是虚张声势。证明模型和生物学确实可以兼容是件可喜可贺的事情。”

_{翻译：amecolli 审校：阿莫東森编辑：小葵花}