快捷分类

基于学习的多目标脑决策模型研究*

更新时间：2016-07-05

引言

在多个目标中进行决策是一项重要的脑认知活动.这类多目标脑决策过程非常复杂,不仅包括感觉信号输入的处理和运动信号的输出,还需要其它信息的处理与积累[1,2]. 大量的实验研究已经揭示了许多类型的信息如过去的经验,新的规则,奖励与惩罚等都会影响大脑在目标选择中的决策[3-7]. 这些信息的处理使得大脑能够根据不同情况做出相应的决策. 正是基于这种灵活性,人类与其它生物才能以不同的方式对某一特定刺激做出反应[8,9].

目前,脑决策研究主要利用一些眼跳运动相关的选择任务来进行,如反向眼跳任务,no-go任务和non-choice任务等[10-12]. 这是因为一次眼跳运动可以看作一次决策的结果,且眼球从一个点到另一个点的转动能较容易地捕捉. 眼跳相关的选择任务的目的是让测试对象根据给定的视觉刺激进行反应,并执行计划的眼跳运动. 若测试对象做出正确的决策则会收到奖励. 这些奖励引导测试对象学习正确的视觉-运动映射并抑制错误的决策[13,14]. 换言之,大脑会在奖励的指导下重新建立感觉信号与行为动作之间的联系[15,16]. 在与眼跳运动有关的脑区中,额叶视区(frontal eye field, FEF)接收和处理来自视觉通路的信息,并将处理后的神经信号传递到额叶与上丘等脑区,其作用非常关键. 神经元生理实验和病变研究均证实额叶视区在眼跳运动过程中的视觉信息输入处理,视觉运动的计划以及视觉注意力分配等功能中起着极其关键的作用[17,18]. 此外,近年来的实验研究证实了眼跳运动的选择与额叶视区的突触可塑性有关,使得视觉选择任务中的多目标决策过程可以用大脑学习的相关机制来解析[19-23].这些证据为额叶视区通过学习来控制多目标决策任务中的视觉-运动映射重建提供了实验和理论的支持.尽管生理实验和行为实验在脑决策机制的研究中有显著的进展,但实验的困难使得模型理论研究成为实验之外最有效的脑决策机制研究手段.本文主要研究学习在多目标脑决策中的作用机制,基于一个改进的额叶视区模型,对多目标决策任务non-choice任务进行仿真研究.

1 模型的改进与任务仿真

1.1 额叶视区网络模型的改进

本研究将Heinzle等[24]提出的额叶视区层级模型修改为一个基于学习的模型,主要包括以下三方面:

(1)模型中的识别模块和第6层级被移除,修改后的模型只能产生正向眼跳.

(2)除了注视输入层,第4层级,第2/3层级和第5层级中的每个神经元群体都加入了方向偏好特性,即神经元群体对来自特定方向的刺激所产生的神经元活动会比其他群体的更强烈[25-30].

(3)增加了从第4层级的兴奋性神经元群体(E4)到第2/3层级的抑制性神经元群体(I23)的连接. 此外,从第4层级到第2/3层级的所有突触连接都具有突出可塑性,可以通过学习来改变对应的连接情况[31-38].

改进后的额叶视区网络模型的结构如图1(a)所示. 模型有四个层级,它们有着不同的作用: 第4层级(L4)处理视觉输入,第2/3层级(L23)分配注意力,注视输入层(FIX)处理注视信息和第5层级(L5)输出运动信号.

图1 额叶视区网络模型的结构示意图 Fig.1 Structure of FEF neural network model

除FIX外,每一层都有13个有各自方向偏好的视网膜位点. 在不同的神经元层级中,每一个视网膜位点由不同数量的神经元组成. L4和L23的每一个视网膜位点包含100个兴奋性神经元和25个抑制性神经元,而L5R和L5B的视网膜位点则由40个兴奋性神经元和25个抑制性神经元组成. FIX有100个抑制性神经元.

1.2 改进后的额叶视区网络的数学模型

改进的额叶视区网络模型的神经元都采用整合发放模型,其描述如下:

(1)

其中,V是膜电位,τm代表时间常数,在兴奋性神经元中τm=20 ms,在抑制性神经元中τm=12 ms,而Ve=74 mV,Vi=-10 mV分别定义了兴奋性和抑制性突触的反转电位. 电位阈值Vth是20 mV,而重设电位Vreset是10mV. 兴奋性和抑制性神经元的不应期分别是1.8 ms和1.2 ms.

额叶视区网络模型在初始状态下的决策行为有两个特点: (1) 只产生正向眼跳,即当视觉目标出现在某一方向时,眼睛眼跳到该目标的方向; (2) 整体上不偏好于产生某一方向的眼跳. 图2中的两个子图分别展示了起始状态的两个特点.

其中χ(t)满足N(0,1)正态分布. μe,i是平均外部输入. 时间常数τnoise=3 ms,而外部权重在兴奋性突触中为we=0.02,在抑制性突触中为wi=0.02.

(1)突触电导ge,i满足如下方程:

(2)

其中se,i是激活变量,τe,i是时间常数. τe,i在不同的连接中有不同的值:在连接E5R→E5R中τe,i=50 ms,在连接E23→E23,I5B→E5R中τe,i=10 ms,而在其他连接中τe,i=5 ms. gkj表示对方向θk和θj有偏好的神经元之间的方向偏好因子[39]:

(3)

其中σ=18°. E4与I23之间的ga等于0.01,表示其连接是弱连接,其他连接中ga=1.0. 对于视网膜中心点,与其他视网膜位点间的gkj为gkj(30°).

王树林停好车，并没有马上下车，他掏出手机看了一下，确定没有任何消息后，就将铃声调到了静音。关车门的时候他看到了辛娜那辆红色的Q Q，辛娜一直没有换车，从这一点看，辛娜的市侩俗念里还存着某些念旧的朴素品质，这让王树林莫衷一是慨喟良多。再抬眼就看见辛娜隔着玻璃朝他招手。雨下得细小，满脸凉意。辛娜是站着朝他招手的，时尚不减的辛娜穿着短裙，一瞬间，王树林的脑海里就充塞了关于辛娜两条白腿的所有记忆。

(2)噪声输入gnoise模拟大脑的背景噪声[40-44],其满足:

(4)

四季风速相差不大(图6b),春、夏季风速稍大(4.6 m/s),秋、冬季风速稍小(4.1 m/s)。风速随海拔都表现为先减小后增大,640 m实验林场是风速变化的转折点,640 m以下风速递减率较小,随海拔每升高100 m,风速下降0.1 m/s(冬、春季)～0.2 m/s(夏、秋季);640 m以上风速随海拔快速递增,每升高100 m,风速约增加1.0 m/s(冬季)～1.3 m/s(夏季)。随着海拔的增加,风速受下垫面的影响减小,风速增加也较为明显。

(3)可塑性连接可能处于增强状态和减弱状态. 为了方便叙述,我们将E4→ E23和E4→I23的可塑性突触分别命名为兴奋性可塑性突触和抑制性可塑性突触. 它们满足以下方程[31-33]:

(5)

其中gp=1.0,ckj是可塑性输入强度. 在每次训练之后,突触前和突触后的神经元活性将决定可塑性突触会增强或减弱,并根据一个基于奖励的Hebbian学习机制来更新可塑性输入强度. 突触的增强由以下方程决定:

c→ c+qQ(Smax)(1-c)

(6)

而突触的减弱要经历以下过程:

Non-choice任务并没有预先设定某一个特定的眼跳目标,测试对象需要根据最终决策所得到的不同奖励来调节它的决策. 在本研究中,Non-choice任务需要对神经网络进行5000次训练. 在每一次训练中,神经网络模型在注视中心点一段时间后会同时接收四种不同的方向偏好刺激,模型需要在这些方向中做出选择并输出眼跳运动信号.这四个方向的眼跳分别对应不同大小的奖励,当网络模型产生某一方向的眼跳输出后会得到对应的奖励[45],并根据得到的奖励更新可塑性连接的状态. 这个状态会一直保持直到下一次更新.在任务的最后,我们期望网络模型能做出与最大奖励相关联的决策.

其中τrise=1ms,τdecay=10ms.

(7)

其中q是奖励因子. 可塑性率Q(Smax)依赖于突触前神经元的最大发放率Smax:

其中群体发放率S(t)在下文描述,S0=60Hz和σq=5Hz.

本次会议由中国腐植酸工业协会和山东省土壤肥料工作总站联合主办、山东农大肥业科技有限公司协办。国务院国资委行业办宋光兰处长、山东省土壤肥料工作总站高瑞杰站长等嘉宾应邀出席，会议吸引了来自全国各地腐植酸同仁以及腐植酸肥料基层推广代表500余人参加。

更大的新型宿主潜艇09852型“别尔哥罗德”号将在未来几年加入舰队，替代09786型BS-136“奥仑堡”号(“德尔塔”-Ⅲ改装)。

(8)

其中Im=0.056nA,σs=15°,而θp表示偏好的方向.

1.3 Non-choice任务过程

表1显示，深圳市高新技术企业的研发能力存在较大差距，而不同优惠形式所产生的税收减免也显著不同，且样本数据显示企业规模和盈利能力千差万别，有利于对税收优惠的激励效应进行全面的分析。

在Non-choice任务中,我们用两类发放率来描述网络模型的表现: 神经元发放率以及群体发放率 [46,47]. 神经元发放率由单个神经元的膜电位决定:

(9)

其中β=2.0,γ=16.5. 群体发放率是通过数1 ms内单个神经元群体产生峰发放的个数来计算且由S(t)平滑:

(10)

c→ c-qQ(Smax)c

Iext是输入到L4神经元的外部刺激,其同样有方向偏好特性的:

此外,根据non-choice任务的特点,我们设计了调节率指标来定量地表示两种可塑性突触的平均调节作用:

〈〉

(11)

其中k和j分别代表突触连接的起始和目标位点. Me和Mi分别是兴奋性和抑制性调节率. 运算<a>表示任务中a的5次重复试验的平均值. 调节率的应用是为了估计突触强度的变化并且避免一些突触强度接近零而出现的差异较大的情况.

模型的数值模拟是用步长为0.1ms的欧拉方法在Matlab中进行.

2 结果

2.1 额叶视区网络模型的初始状态

在公式(1)中,电导gexc和ginh均由三部分组成: ge,i,gnoise和gplastic,分别是突触电导(e代表兴奋性,i代表抑制性),噪声输入和可塑性电导.

图2 额叶视区网络模型的起始状态示例图中颜色代表神经元发放率 Fig.2 Two example the FEF neural network he colors represent the neuronal firing rate

在图2(a)中,模型首先注视中心点400 ms,然后视觉目标先后在90°,270°和150° 方向出现,它们都能引起E4 中相应的方向偏好神经元的持续活动,并将神经冲动经由其他层级传到E5B. 当E5B中方向偏好神经元群体的发放率达到了阈值时,模型就会产生眼跳. 最后的结果显示这三个方向偏好刺激全都引起了相应的正向眼跳.

图2(b)展示了当视觉输入同时出现在0°,90°,180°,270°四个方向时模型的活动. E4中0°,90°,180°,270°这四类方向偏好神经元都产生了持续的感觉信息处理活动,表明其同时处理来自四个方向的视觉输入. 从图2(b)的下图可以观察到模型先是眼跳到270°方向,然后是90°,之后分别是0°,180°,0°和90°. 眼跳的位置可以落在四个视觉目标中的任意一个,没有任何一个目标有足够的吸引力让模型一直注视着它. 结果表明模型整体上不偏好于产生某一方向的眼跳.

就目前建筑行业的发展来讲，建筑工程在施工过程中造成工程造价超预算的原因有很多，但在编制过程中出现的错误占的比重较大。在建筑工程设计图设计好之后，预算相关工作人员开始对整个项目进行预算，但是由于相关人员的专业水平有限，相关经验较少对预算编制的具体内容考虑的不全面，造成很多成本并没有算到整个预算当中，进而导致后期施工时，使用的成本远远超过预算。

2.2 额叶视区网络模型的训练过程

Non-choice任务并没有一个特定的眼跳目标,影响训练结果的主要因素是奖励的大小. 事实上,近年来的一些实验成果已经表明了不同的决策-奖励关联会引导动物根据不同的奖励差异来做出相应决策[45,48-51]. 目前的问题是改进后的额叶视区网络模型是否能够根据奖励的差异来做出最佳的选择. 本次训练任务仍用0°,90°,180°,270°四个方向的目标同时刺激网络模型,并将0°,90°,180°,270°方向的眼跳分别以从多到少地与不同的奖励相关联. 为了更好地捕捉训练过程中的一些性质,我们设定一个包含50次试验的窗口,将5000次训练分成100个试验窗口. 首先,我们计算每个实验窗口中E5R的平均群体发放率,其代表神经网络在这段时期所做出的决策分布. 图3显示了E5R中的0°,90°,180°,270°偏好群体的平均群体发放率变化. 通过对比可以看出,在早期的试验窗口中,这四个群体的活动分布比较平均,并没有哪个群体的活动占主要优势,表明模型并没有选定最终的决策目标. 随着实验窗口的增加,0°偏好群体的平均发放率逐渐增强,表现出较其他群体更强的活动,并在训练的后期变为主要的活动,而90°,180°,270°偏好群体的响应下降到一个相对较低的水平,表明神经网络在这时期主要的眼跳决策集中在与最大的奖励相关的0° 方向上. 其次,更精细的训练过程可以用眼跳百分比(saccade percent probability,SPP). SPP的定义是一个窗口中正确试验的次数和全部试验次数的比值. 图4(a)中的结果为这四个方向的决策之间的竞争提供了一个更直观的说明. 根据SPP的变化可以把训练过程分为三个阶段. 第一个阶段是试验窗口0-20,四个方向偏好群体的SPP保持在15%到25%之间,四类决策相互竞争,但是没有其中一个成为胜者. 第二个阶段是20-35试验窗口. 此时,180°,270°偏好群体的SPP呈下降趋势,并少于0°,90°偏好群体的SPP. 这个阶段表现为0°与90°眼跳决策的竞争,而180°,270°决策已经成为败者. 第三个阶段是35-100试验窗口,0°偏好群体的SPP迅速上升,而90° 偏好群体的SPP开始逐渐下降,0°眼跳决策成为最终胜者. 这三个阶段的形成是由于与决策相关联的梯度奖励对L4和L23之间的连接产生了不同的兴奋性可塑性调节(图4(b)). 通过积累这些不平衡的兴奋性调节使得与最大奖励相关的决策渐渐地赢得了竞争,变为主要的决策,而相对较低的奖励关联的决策最终输掉了竞争. 值得注意的是,90°,180°,270°眼跳决策在竞争中落败的顺序也与关联奖励的大小相关. 一个决策关联的奖励越少,在竞争中输的越快. 最后,我们用与图2(b)相同的试验流程来验证训练后的模型的任务表现. 从图4(c)可以看出,当0°,90°,180°,270°方向同时出现视觉刺激时,模型不再随意选择眼跳方向,而是只眼跳到0°方向的目标,证明训练成功地将眼跳集中在与最大奖励关联的目标.

图3 神经网络模型在训练过程中的平均群体发放率变化从上到下分别指的是E5R中的0°,90°,180°,270° 偏好群体 Fig. 3 Average population firing rate of different populations in the training process top to down are 0°,90°,180°,270° preferred populations of E5R

图4 (a) 0°,90°,180°,270° 方向的眼跳百分比随着试验窗口的变化, (b) 连接着两类可塑性突触的不同方向偏好神经元群体的调节率, (c) 一个例子显示训练后的网络模型已经形成了与最大奖励相关的决策偏好. Fig.4 (a) Variation of SPP in 0°,90°,180°,270° directions, (b) Modulaiton rate of different plastic synapses, (c) An example the activities of the trained network

2.3 奖励差别对任务决策过程的影响

在non-choice 任务中,一个非常关键的问题是决策之间的奖励差别是如何影响决策过程的. 为了定量地回答这个问题,我们将奖励因子设为qi=q0+kiRD. 其中,i为受刺激目标0°,90°,180°,270°,对应的ki 分别为3,2,1,0,q0=0.0002而RD代表奖励差. 我们共进行20次任务训练,每次训练测试不同的RD下网络模型的决策情况. 在这些训练中,我们仍然将实验分为100个窗口,并计算每个窗口中不同眼跳的SPP. 一旦其中一个决策的SPP超过80%,该决策就成为胜者,网络就被认定为偏好于做出这一决策; 当SPP低于5%,相应的决策就认为是败者. SPP超过80%或低于5%时所处于的试验窗口就是决策窗口(decision bins ,DB). 奖励差与DB之间的关系描述在图5中,值得注意的是20次训练中胜者都是与最大奖励关联的0°方向决策. 图5的结果显示,不管是决策中的胜者或是败者,它们的决策窗口都随着奖励差的增加而逐渐提前,表明决策之间的奖励差形成一种驱动力并控制着学习的速度,奖励差越大学习速度越快. 根据图5中的曲线,我们能从中总结出由不同奖励差所形成的两个学习阶段:慢速学习阶段(0.00005≤RD<0.00025)和快速学习阶段(0.00025≤RD≤0.001). 胜者决策在快速学习阶段的平均决策窗口要比慢速学习阶段的少69.8%. 此外,网络模型在这些训练中的表现显示non-choice任务中还有两方面是值得我们注意的. 第一,当RD较少时,DB的误差非常大,说明较低的RD并没有形成足够强大的驱动力使得模型能稳定地做出决策. 第二,0°和90°方向的决策窗口非常地接近,表明多个选择中的胜者和最后一位败者在较接近的训练阶段中出现,此后模型已经掌握了通过奖励差别引导的决策规则.

图5 0°,90°,180°,270°决策在不同的奖励差下对应的决策试验窗口(DB) Fig.5 Corresponding decision bins at different amount of reward in 0°,90°,180°,270° decision

3 总结

本研究将一个经典的额叶视区神经网络模型改进为基于学习的模型,并用于研究大脑中的多目标决策机制. 模型一开始只能产生反射性眼跳,且对任何一个方向都没有偏好. 经过训练后,模型能成功地完成一个经典的认知决策任务——non-choice任务,将眼跳目标集中在与最大奖励关联的眼跳决策中. 这个过程是由于训练过程中奖励对网络模型的兴奋性调节作用所决定的. 此外,不同决策间的奖励差对决策过程也有非常重要的影响. 但这种作用并不是线性的,不同关联奖励差能使模型进入两种学习阶段:快速学习阶段和慢速学习阶段. 这些结果仍需在真实的生物实验中作进一步的验证.

术后1年随访未出现不融合的情况，腰背痛VAS评分、腰痛JOA评分及ODI功能评分显著低于术前，获得较好的融合和临床疗效。术中采用1枚拉力螺钉固定对侧，降低了耗材费用。因此，该术式具有切口小、创伤小、半坚强固定、并发症少、融合率高、临床效果好、费用少等优点。

性状:加工品呈长椭圆形,有的已压扁,与天麻很相似。长4-9cm,直径1.5-2.5cm。去皮的表面灰棕色,半透明,未去皮的棕黄色,环节明显,有不规则沟纹及皱纹;并有须根痕。顶端有残留的茎基,下端略尖细。质坚硬,不易折断,断面灰白色或黄白色,半角质样。气微,味微甜。

参考文献

1Salinas E. Context-dependent selection of visuomotor maps. BMC Neuroscience, 2004,5:47～69

当时的中国没有保税区，中国第一个保税区出现在上海——浦东外高桥保税区，后来辐射到深圳等五大特区和沿海地区，到2005年全国一共形成了13个保税区和15个保税港区，进一步到2017年国务院共批准各类海关特殊监管区域138个，主要有保税区、保税物流园区、出口加工区、保税港区、综合保税区和跨境工业园区等六种类型。

陆徵祥遵循孔孟之道并始终不断地汲取儒家的智慧与教义，包括对上天的祭礼、孝顺父母和行善举。他独特的成长坏境及其深刻的思想渊源，使得他能以儒家的思想去看待基督教的优势。而他本身从一个新教徒到天主教徒的转变则因两个方面的缘由。其中，先是源于他恩师许景澄的影响，其后由于他太太培德的原因。

2Noorani I. LATER models of neural decision behavior in choice tasks. Frontiers in Integrative Neuroscience, 2014,8:67～76

3Drugowitsch J,Moreno-Bote R,Churchland A K,et al. The cost of accumulating evidence in perceptual decision making. Journal of Neuroscience, 2012,32(11):3612～3628

4Cutsuridis V,Kumari V,Ettinger U. Antisaccade performance in schizophrenia: a neural model of decision making in the superior colliculus. Frontiers in Neuroscience, 2014,8:13～26

5Pleger B,Ruff C C,Blankenburg F,et al. Neural coding of tactile decisions in the human prefrontal cortex. Journal of Neuroscience, 2006,26(48):12596～12601

6Chaumon M,Kveraga K,Barrett L F,et al. Visual predictions in the orbitofrontal cortex rely on associative content. Cerebral Cortex, 2014,24(11):2899～2907

用紫外-可见分光光度计对10种酚类物质标准溶液从200～400 nm进行扫描，发现最大紫外吸收波长均在280 nm外，在此波长下测定灵敏度高，峰形好，因此本实验采用检测波长为280 nm。

7Kan J Y,Niel U,Dorris M C. Evidence for a link between the experiential allocation of saccade preparation and visuospatial attention. Journal of Neurophysiology, 2012,107(5):1413～1420

8Drea C M,Wallen K,Low-status monkeys “play dumb” when learning in mixed social groups. Proceedings of the National Academy of Sciences of the United States of America, 1999,96(22):12965～12969

9Platt M L,Glimcher P W. Neural correlates of decision variables in parietal cortex. Nature, 1999,400(6741):233～238

10 Schlag Rey M,Amador N,Sanchez H,et al. Antisaccade performance predicted by neuronal activity in the supplementary eye field. Nature, 1997,390(6658):398～401

11 Hutton S B. Cognitive control of saccadic eye movements. Brain Cogn, 2008,68(3):327～340

12 Bell A,Everling S,Munoz D. Influence of stimulus eccentricity and direction on characteristics of pro-and antisaccades in non-human primates. Journal of Neurophysiology, 2000,84(5):2595～2604

13 Munoz D P,Everling S. Look away: the anti-saccade task and the voluntary control of eye movement. Nature Reviews Neuroscience, 2004,5(3):218～228

14 Baldassarre G,Mannella F,Fiore V G,et al. Intrinsically motivated action-outcome learning and goal-based action recall: a system-level bio-constrained computational model. Neural Networks, 2013,41:168～187

15 Brown J W,Bullock D,Grossberg S. How laminar frontal cortex and basal ganglia circuits interact to control planned and reactive saccades. Neural Networks, 2004,17(4):471～510

16 Luhmann C C,Chun M M,Yi D J,et al. Neural Dissociation of Delay and Uncertainty in Intertemporal Choice. Journal of Neuroscience, 2008,28(53):14459～14466

17 Bizzi E. Discharge of frontal eye field neurons during eye movements in unanesthetized monkeys. Science, 1967,157(3796):1588～1590

18 Dias E C,Segraves M A. Muscimol-induced inactivation of monkey frontal eye field: effects on visually and memory-guided saccades. Journal of Neurophysiology, 1999,81(5):2191～2214

19 Bichot N P,Schall J D,Thompson K G. Visual feature selectivity in frontal eye fields induced by experience in mature macaques. Nature,1996,381:697～699

20 Chen L L,Wise S P. Neuronal activity in the supplementary eye field during acquisition of conditional oculomotor associations. Journal of Neurophysiology, 1995,73(3):1101～1121

21 Tseng P,Chang C F,Chiau H Y,et al. The dorsal attentional system in oculomotor learning of predictive information. Frontiers in Human Neuroscience, 2013,7:404～412

22 Lewis C M,Baldassarre A,Committeri G,et al. Learning sculpts the spontaneous activity of the resting human brain. Proceedings of the National Academy of Sciences, 2009,106(41):17558～17563

23 Lee K M,Keller E L. Neural activity in the frontal eye fields modulated by the number of alternatives in target choice. Journal of Neuroscience, 2008,28(9):2242～2251

24 Heinzle J,Hepp K,Martin K A. A microcircuit model of the frontal eye fields. Journal of Neuroscience, 2007,27(35):9341～9353

25 Douglas R J,Martin K A,Whitteridge D. An intracellular analysis of the visual responses of neurones in cat visual cortex. The Journal of Physiology, 1991,440:659～696

26 Li C Y,Creutzfeldt O. The representation of contrast and other stimulus parameters by single neurons in area 17 of the cat. Pflugers Archiv: European journal of Physiology, 1984,401(3):304～314

27 Schiller P H,Finlay B L,Volman S F. Quantitative studies of single-cell properties in monkey striate cortex. I. Spatiotemporal organization of receptive fields. Journal of Neurophysiology, 1976,39(6):1288～1319

28 Ringach D L,Shapley R M,Hawken M J. Orientation selectivity in macaque V1: Diversity and Laminar dependence. Journal of Neuroscience, 2002,22(13):5639～5651

29 Nowak L G,Sanchez-Vives M V,McCormick D A. Lack of orientation and direction selectivity in a subgroup of fast-spiking inhibitory interneurons: cellular and synaptic mechanisms and comparison with other electrophysiological cell types. Cerebral Cortex, 2008,18(5):1058～1078

30 Hansel D,van Vreeswijk C. The mechanism of orientation selectivity in primary visual cortex without a functional map. Journal of Neuroscience, 2012,32(12):4049～4064

31 Pfeiffer M,Nessler B,Douglas R J,et al. Reward-Modulated Hebbian learning of decision making. Neural Computation, 2010,22(6):1399～1444

32 Engel T A,Wang X J. Same or different? A neural circuit mechanism of similarity-based pattern match decision making. Journal of Neuroscience, 2011,31(19): 6982～6996

33 Ardid S,Wang X J. A tweaking principle for executive control: neuronal circuit mechanism for rule-based task switching and conflict resolution. Journal of Neuroscience, 2013,33(50):19504～19517

34 Gottlieb J,Hayhoe M,Hikosaka O,et al. Attention,reward,and information seeking. Journal of Neuroscience, 2014,34(46):15497～15504

35 Gold J I,Shadlen M N. Banburismus and the brain: decoding the relationship between sensory stimuli,decisions,and reward. Neuron, 2002,36(2):299～308

36 Gold J I,Shadlen M N. The influence of behavioral context on the representation of a perceptual decision in developing oculomotor commands. The Journal of Neuroscience, 2003,23(2):632～651

37 Law C T,Gold J I. Reinforcement learning can account for associative and perceptual learning on a visual-decision task. Nature Neuroscience, 2009,12(5):655～663

38 Connolly P M,Bennur S,Gold J I. Correlates of perceptual learning in an oculomotor decision variable. Journal of Neuroscience, 2009,29(7):2136～2150

39 Ardid S,Wang X J,Compte A. An integrated microcircuit model of attentional processing in the neocortex. Journal of Neuroscience, 2007,27(32):8486～8495

40 Destexhe A,Rudolph M,Fellous J M,et al. Fluctuating synaptic conductances recreate in vivo-like activity in neocortical neurons. Neuroscience, 2001,107(1):13～24

41 Salinas E. Background synaptic activity as a switch between dynamical states in a network. Neural Computation,2003,15(7):1439～1475

42 Moreno-Bote R,Parga N. Role of synaptic filtering on the firing response of simple model neurons. Physical Review Letters, 2004,92(2):028102

43 Moreno-Bote R,Parga N. Response of integrate-and-fire neurons to noisy inputs filtered by synapses with arbitrary timescales: Firing rate and correlations. Neural Computation, 2010,22(6):1528～1572

44 Ye W,Liu S,Liu X,et al. A neural model of the frontal eye fields with reward-based learning. Neural Networks, 2016,81:39～51

45 Levy I,Lazzaro S C,Rutledge R B,et al. Choice from non-choice: predicting consumer preferences from blood oxygenation level-dependent signals obtained during passive viewing. Journal of Neuroscience, 2011,31(1):118～125

46 王如彬,张志康,谢智刚等. 多个神经振子群网络的相位动力学编码. 动力学与控制学报, 2009,7(3):217～225 (Wang R B,Zhang Z K,Xie Z G,et al. Dynamic coding of phase on multi populations of neural oscillators. Journal of Dynamics and Control, 2009,7(3):217～225 (in Chinese))

47 徐旭颖,王如彬. 神经元高低状态切换发放的神经动力学. 动力学与控制学报, 2015,13(1):62～67 (Xu X Y,Wang R B. Neurodynamics of up and down transitions. Journal of Dynamics and Control, 2015,13(1):62～67 (in Chinese))

48 So N Y,Stuphorn V. Supplementary eye field encodes option and action value for saccades with variable reward. Journal of Neurophysiology, 2010,104(5):2634～2653

49 van der Togt C, Stănior L, Pooresmaeili A, et al, Learning a new selection rule in visual and frontal cortex. Cerebral Cortex, 2016,26(8):3611～3626

50 Costello M G, Zhu D, May P J, et al, Task dependence of decision-and choice-related activity in monkey oculomotor thalamus. Journal of Neurophysiology, 2016,115(1):581～601

51 Schiffer A M, Muller T, Yeung N, et al. Reward activates stimulus-specific and task-dependent representations in visual association cortices. Journal of Neuroscience, 2014,34(47):15610～15620

作者

叶伟杰，刘深泉

出处

《动力学与控制学报》 2018年第01期

上一篇：时滞切换不确定神经网络系统的指数稳定性*

下一篇：基于噪声的非线性多智能体系统的均方一致性*

《动力学与控制学报》2018年第01期文献

Mathews-Lakshmanan振子方程的分析力学解法* 作者：李京颍，丁光涛

1:1内共振情况下轻质材料层合板动力学的奇异性分析* 作者：郭宇红，张伟，杨晓东

机电系统的尼尔森方程* 作者：崔新斌，傅景礼

基于多项式展开的三角平动点垂直周期轨道解析构建方法研究* 作者：翟冠峤，张伟，钱霙婧

Willamowski-Rössler系统混沌行为的数值仿真及控制与同步研究* 作者：孙伟鹏，王贺元，阚猛

带边角裂纹悬臂Mindlin板的振动特性研究* 作者：陈丽华，薛坚，张伟

特征模态函数缺失和等比例缩小对系统非线性特征影响* 作者：黄巍，杨永锋

微尺度悬臂管颤振的研究* 作者：郭勇，谢建华

时滞切换不确定神经网络系统的指数稳定性* 作者：薛焕斌，张继业

基于学习的多目标脑决策模型研究* 作者：叶伟杰，刘深泉

基于噪声的非线性多智能体系统的均方一致性* 作者：邱丽，过榴晓，刘佳

舰载机着舰下滑段飞行员操纵策略研究* 作者：刘嘉，向锦武，张颖，甄冲

杂志信息网