《科学》：报答或报复，猴子的世界就如此简单

《自私的基因》作者理查德道金斯曾经写过一本行为领域的经典之作《合作的进化》，作者以组织的两轮“重复囚徒困境”竞赛作为研究对象，发现即使计算机算法发明了看似更聪明更复杂的策略，也依然比不过人类一直以来采用的“一报还一报”策略。最近，来自哈佛大学的Ziv Williams研究组发表了一篇有趣的论文，用猕猴作为实验对象重现了博弈论的精华。

实验设计是这样的：一位科（shua）学（hou）家（ren）安排三只猴同坐一个圆桌，每一次试验都有一只猴被随机指定作为分发食物的猴（actor），它有权决定转动圆桌把食物分给另外两只猴中的任意一只（recipient）。为了排除其他时空因素的干扰，圆桌的转动方向会在实验中改变，这三只猴也需要在每天中场休息时变换座次，这样一来，猴就会更加纯粹地依赖社会因素而不是空间位置偏好来做出决策。当然，科学家在耍猴的同时并没有忘记给其中一只猴的背内侧前额叶皮层（dorsomedial prefrontal cortex，dmPFC）区域插入了电极，用来记录这个特殊的群体社交实验中神经元的放电情况。

-Báez-Mendoza et al。，Nature-

科学家发现，猴子的行为跟人类惊人相似：不论是哪一只猴，它们都更倾向于“报答”前一次试验中给它分发食物的猴，比如第一次猴A给猴B分发了食物，第二次如果轮到猴B做决定，它会更多地把食物分给猴A而不是猴C。但如果前一次猴A分发食物给猴C了，接下来如果是猴B做决定，猴B就会“报复”猴A，转而把食物分给猴C（此处猴C非常开心地坐享渔翁之利）。更有意思的是，猴子们还会根据另外两只猴的“名声”来做决定，比如在以往的经验中，其中一只更可能出现报答行为，那么决策者这次就更愿意把食物分给它，这样自己下一次试验吃到食物的概率就会更大。猴子们的这种行为和人类的以眼还眼、以牙还牙（tit-for-tat）策略如出一辙，说明猴不仅能记住自己和谁“交手”过，而且还能记住交手过程中对方到底是友善还是心怀恶意。

-Báez-Mendoza et al。，Nature-

那么，这种行为背后的神经基础是什么呢？科学家在猴子的dmPFC电极记录时找到了不同类型的神经元，其中一类神经元在自己得到食物时会放电，或者在任意一只猴得到食物时就会放电，但他们还发现了一类神经元，独独只在特定一只猴得到食物时才会放电。不仅如此，不论一次试验中谁是分发食物者、谁是享受食物者，总有一部分神经元能特异性地响应特定的猴（自己或是猴B或是猴C），而且这些神经元“敌我分明”，响应自己的和响应他人的神经元基本上没有重合。

那么，既然找到了dmPFC编码不同身份的神经元，是否可以通过机器学习的方法解码出猴子的决策呢？答案是肯定的。科学家发现，如果应用多类分类解码器（multiclass decoder）来预测分配食物的是哪一只猴，其准确率可以高达81.7%，而如果在分配食物的猴下定决心之后、做出行动之前预测谁会得到食物，解码器的准确率也可以高达70.1%，这说明dmPFC神经元包含了丰富的猴子身份信息。不仅如此，科学家还能基于另外两只猴的历史表现，通过神经元群体放电信息来预测这只猴下一次试验的决定：到底是投之以桃，报之以李，还是以眼还眼，以牙还牙。

-Báez-Mendoza et al。，Nature-

是否有办法让喜欢报复的猴“放下屠刀“，变成一只善良的猴呢？遗憾的是，科学家试图在试验中给dmPFC加入电刺激，结果发现电刺激丝毫不能影响猴子报复别人的行为，更杯具的是，电刺激不仅没能让爱报复的猴“改过自新”，反倒让猴忘记了别人的善意，不再愿意报答其他猴了。

虽然本文最后是一个悲伤的故事，但笔者认为故事的本身精彩无比，可谓是“以猴为镜，可以识人心”~

来源：神经现实

文献：Báez-Mendoza， Raymundo， et al。 “Social agent identity cells in the prefrontal cortex of interacting groups of primates。”Science374.6566 （2021）： eabb4149。

DOI：https：//doi.org/10.1126/science.abb4149

作者：Veronica|封面：Leonard Furuberg