《自私的基因》作者理查德道金斯曾经写过一本行为领域的经典之作《合作的进化》,作者以组织的两轮“重复囚徒困境”竞赛作为研究对象,发现即使计算机算法发明了看似更聪明更复杂的策略,也依然比不过人类一直以来采用的“一报还一报”策略。最近,来自哈佛大学的Ziv Williams研究组发表了一篇有趣的论文,用猕猴作为实验对象重现了博弈论的精华。
实验设计是这样的:一位科(shua)学(hou)家(ren)安排三只猴同坐一个圆桌,每一次试验都有一只猴被随机指定作为分发食物的猴(actor),它有权决定转动圆桌把食物分给另外两只猴中的任意一只(recipient)。为了排除其他时空因素的干扰,圆桌的转动方向会在实验中改变,这三只猴也需要在每天中场休息时变换座次,这样一来,猴就会更加纯粹地依赖社会因素而不是空间位置偏好来做出决策。当然,科学家在耍猴的同时并没有忘记给其中一只猴的背内侧前额叶皮层(dorsomedial prefrontal cortex,dmPFC)区域插入了电极,用来记录这个特殊的群体社交实验中神经元的放电情况。
-Báez-Mendoza et al。,Nature-
科学家发现,猴子的行为跟人类惊人相似:不论是哪一只猴,它们都更倾向于“报答”前一次试验中给它分发食物的猴,比如第一次猴A给猴B分发了食物,第二次如果轮到猴B做决定,它会更多地把食物分给猴A而不是猴C。但如果前一次猴A分发食物给猴C了,接下来如果是猴B做决定,猴B就会“报复”猴A,转而把食物分给猴C(此处猴C非常开心地坐享渔翁之利)。更有意思的是,猴子们还会根据另外两只猴的“名声”来做决定,比如在以往的经验中,其中一只更可能出现报答行为,那么决策者这次就更愿意把食物分给它,这样自己下一次试验吃到食物的概率就会更大。猴子们的这种行为和人类的以眼还眼、以牙还牙(tit-for-tat)策略如出一辙,说明猴不仅能记住自己和谁“交手”过,而且还能记住交手过程中对方到底是友善还是心怀恶意。
-Báez-Mendoza et al。,Nature-
那么,这种行为背后的神经基础是什么呢?科学家在猴子的dmPFC电极记录时找到了不同类型的神经元,其中一类神经元在自己得到食物时会放电,或者在任意一只猴得到食物时就会放电,但他们还发现了一类神经元,独独只在特定一只猴得到食物时才会放电。不仅如此,不论一次试验中谁是分发食物者、谁是享受食物者,总有一部分神经元能特异性地响应特定的猴(自己或是猴B或是猴C),而且这些神经元“敌我分明”,响应自己的和响应他人的神经元基本上没有重合。
那么,既然找到了dmPFC编码不同身份的神经元,是否可以通过机器学习的方法解码出猴子的决策呢?答案是肯定的。科学家发现,如果应用多类分类解码器(multiclass decoder)来预测分配食物的是哪一只猴,其准确率可以高达81.7%,而如果在分配食物的猴下定决心之后、做出行动之前预测谁会得到食物,解码器的准确率也可以高达70.1%,这说明dmPFC神经元包含了丰富的猴子身份信息。不仅如此,科学家还能基于另外两只猴的历史表现,通过神经元群体放电信息来预测这只猴下一次试验的决定:到底是投之以桃,报之以李,还是以眼还眼,以牙还牙。
-Báez-Mendoza et al。,Nature-
是否有办法让喜欢报复的猴“放下屠刀“,变成一只善良的猴呢?遗憾的是,科学家试图在试验中给dmPFC加入电刺激,结果发现电刺激丝毫不能影响猴子报复别人的行为,更杯具的是,电刺激不仅没能让爱报复的猴“改过自新”,反倒让猴忘记了别人的善意,不再愿意报答其他猴了。
虽然本文最后是一个悲伤的故事,但笔者认为故事的本身精彩无比,可谓是“以猴为镜,可以识人心”~
来源:神经现实
文献:Báez-Mendoza, Raymundo, et al。 “Social agent identity cells in the prefrontal cortex of interacting groups of primates。”Science374.6566 (2021): eabb4149。
DOI:https://doi.org/10.1126/science.abb4149
作者:Veronica|封面:Leonard Furuberg