利用深度行为绘像技术揭示前边缘皮层参与操作性学习的神经集群
文章概述
认知是个体行为产生的基础,对单个个体而言,即使一个最简单行为的执行,也要求具备多种认知需求,这个过程涉及到大脑的多个区域。以往的研究证实,在不同物种中,前额叶皮层(Prefrontal Cortex, PFC)与个体的高级执行功能具有密切的联系,包括行为执行过程中的行动选择和行为组织。在mPFC中,前边缘皮层(Prelimbic Cortex, PrL)参与了动物操作性行为的组织过程,能够控制行为执行策略的选择,但是在纵向时间尺度上,PrL的神经活动与操作性学习和表现的关系尚不明确。2021年12月17日,美国国立卫生研究院的研究人员在《Neruon》杂志上发表题为“Detailed mapping of behavior reveals the formation of prelimbic neural ensembles across operant learning”的文章。在该研究中,研究人员采用一种全新的深度行为绘像(Deep Behavior Mapping, DBM)技术来追踪并分析小鼠在操作性实验条件下的微观行为,并结合活体钙成像技术,共同揭示了PrL神经元的动态活动变化与小鼠操作性学习和表现之间的联系。
核心观点
1. PrL神经元能够编码学习任务相关和非任务相关的行为;
2. PrL中重叠的神经集群可以驱动序列行为的每个步骤;
3. 与行为相关性较弱或不稳定的神经元能够被募集来编码新的行为。
研究结果分析
1. 小鼠PrL神经元的活动受到操作性学习的调控
为了观察小鼠在食物自我管理的学习任务中PrL相关神经元的动态变化,研究者采用头戴式的微型显微镜来对PrL中神经元的钙活动进行了长达46天的监测,以此可以确定事件相关的神经活动(如压杆等)。在最初的训练阶段,小鼠每天进行60次试验,每次试验持续110s并以室内灯光作为提示。每次试验中,在经过5s的声光提示后,小鼠会获得20mg食物的奖励。在随后的食物自我管理训练阶段,室内灯光亮起10s后会呈现一个压杆,在这之后会出现一个5s的声光提示,小鼠此时按压压杆可以获得食物奖励。小鼠在成功完成至少10%压杆测试后的第6天开始表现稳定。
2. 利用DBM可以识别小鼠行为的多个微观状态
操作性行为对于研究影响行为的因素非常有用,但是这种方法无法识别操作行为中所有连续的行为联系,因此难以解释PrL神经集群活动与操作性行为之间的关系。为此研究者开发了DBM,一种从行为记录视频中提取小鼠行为进行详细表征的方法。研究者首先通过视频对小鼠的位置和姿势进行追踪来对小鼠的行为(杠杆互动、奖励获取、运动等)进行标记。随后研究者通过输入小鼠姿势数据序列,训练一个带有10个节点的长短期记忆(Long Short-Term Memory, LSTM)层的人工神经网络来预测这些标记的行为。利用该人工神经网络可以将小鼠的行为绘像成50个微观状态,小鼠每一帧的姿势可以归类到这50个微观状态的其中1个。这些行为微观状态中,与学习任务相关的有11个,其中4个与压杆有关、4个与获得食物奖励有关、还有3个与进食阶段有关。非任务相关的行为微观状态主要涉及直立、移动、攀爬墙壁、以及梳理毛发等行为。
3. 利用DBM识别的行为微观状态可以确定PrL中相关的神经集群
利用DBM提供的行为微观状态的详细表征,可以对微观状态相关的PrL神经元活动进行量化。研究者首先确定了能够可靠预测神经元活动增加的行为微观状态,并计算了用于描述神经元的平均活动的微观状态活动系数。大多数神经元表现出较弱的与行为相关的活动,但也有一小部分神经元表现出较强的与行为相关的活动。随后,研究者确定了PrL中与任务相关的神经集群。研究者先通过相关相似度计算了活跃神经元之间的轮廓相似度得分,然后根据神经元活动与行为微观状态的联系分配到对应的神经集群中,分类后的神经集群保存了神经元之间的相似关系。对所有检测到的 PrL神经元分类后,研究者观察到27.2%的神经元与任何特定微观状态均不相关,48.3%的神经元与非任务的微观状态相关,10.0%的神经元与压杆微观状态相关,14.5%神经元与食物奖励检索/消费微观状态有关。特定微观状态相关的神经集群的比例占所有检测到神经元的1%~4%不等,并且不依赖于微观状态发生的频率。在与任务相关的神经集群中,神经元的峰值活动覆盖了任务中连续的时间范围,所有与任务相关的神经集群一起覆盖了整个任务的行为序列,展示了小鼠在食物自我管理学习任务中行为微观状态之间的顺序关系。
4. 操作性学习能够塑造与任务相关的神经集群
接下来,研究者分析了小鼠食物自我管理行为的出现,以及压杆和获得食物奖励等行为序列的稳定性。小鼠的行为轨迹在训练期间更加无序,在获得食物自我管理期间逐渐变得有组织性。然后,研究者分析了PrL中与任务相关的神经集群的动态变化。根据行为的微观状态可以将神经元分为非任务相关、压杆相关、以及奖励获取相关三类。随后追溯这些神经元从试验开始到结束的整个过程中它们的动态变化。结果表明,对于不同类别行为的调节,神经元对最终行为调节出现的时间是不同的。在训练阶段,压杆相关神经元比其它类别的神经元更不接近它们的最终状态。在行为习得之前阶段,压杆和奖励获取相关神经元与它们的最终状态相比,都表现出更低的相似性,但在行为早期习得阶段,这种差异已经消失。在状态调整过程中,这些神经元如果在初始时与某个微观状态存在联系,那么在行为习得后最有可能获得相同类型的稳定联系。并且这种调整在早期会有一定的偏差,但是一旦形成就相对稳定。
总结
亮点研究方法