快捷分类

基于非经典感受野动态特性的轮廓检测模型

更新时间：2009-03-28

0 引言

在杂乱的环境中分离背景纹理与目标轮廓一直是计算机视觉中一项重要的任务，轮廓检测需要消除背景纹理及噪声的影响从而提取图像中的目标轮廓，成为图像分割、目标轮廓提取［1-2］等问题的重要基础技术.

大量视觉生理研究表明，初级视皮层（V1区）的神经元在从视觉场景中提取目标轮廓信息中扮演着重要的角色，是近年来轮廓检测的主要研究对象.普遍认为V1区神经元的每个感受野都有它自己的一个小的兴奋区域，该区域被称作经典感受野（Classical Receptive Field，CRF），而周边广大区域则是其相邻单元所产生的抑制区，该区域被称作非经典感受野（non-Classical Receptive Field，nCRF）.其中，神经元的活动被邻近单元所施加的抑制所减弱，这种相互影响的侧抑制作用在机器视觉研究中受到越来越多的关注.2003年Grigorescu等［3］采用Gabor模型模拟经典感受野的输出，并利用非经典感受野的抑制特性，提出圆环形抑制区域采用高斯差分（Difference of Gaussian，DoG）模型来模拟其距离权值.基于该模型，不少研究者在非经典感受野对视觉刺激响应的抑制作用方面进行了相应的改进.2007年Sang等［4-5］根据初级视皮层循环抑制特性建立了一种基于侧抑制区的抑制模型，其通过抑制机制消除了背景中大量繁杂的纹理所产生的局部有向边缘.但侧抑制机制的引入导致部分检测到的轮廓断裂，在一定程度上降低了边缘响应.2009年杜晓凤等［6］为了弥补侧抑制机制对弱轮廓区域的损坏，引入了去抑制机制，使得较弱的轮廓区域得以保存，提取轮廓的整体性得到了进一步的加强.2011年Zeng等［7-8］提出了蝶形抑制区域模型以及一种中心周边相互作用的自适应抑制方法，较好地去除了背景纹理产生的边缘.Yang等［9］通过上下文调制结合视觉系统中的线索来调制最终的神经元周边抑制，通过结合不同的视觉特征来加强抑制作用的性能.在之前的研究成果中［10］，课题组模拟V1神经元相互抑制机制提出了一种基于空间总和特性的轮廓检测模型，有效地降低了背景纹理对于轮廓的负面影响.

然而上述轮廓检测模型在模拟感受野的响应计算中设定了全局尺度（定值），即每个像素点对应的尺度因子均相同，导致目标轮廓的信息不能被完整地提取.2014年Wei等［11］模拟神经节细胞的自适应机制，通过动态的尺度信息来自适应地表达图像，说明感受野尺度在表达图像局部信息中起到重要作用.而本文着重关注动态尺度信息对于后续轮廓提取的调制作用.人类的感知机制能够迅速地提取视野之中的目标物体，是由于各视皮层中多种神经元机制相互作用，只依赖一种类型神经元的响应很难实现提取最优化.根据文献［12］描述的人类视觉系统中视网膜——外膝体——初级视皮层（V1区）这一视觉通路，视网膜神经节细胞的感受野动态特性会对V1区中经典感受野响应与非经典感受野的抑制效应造成影响，这也是本文实现的理论基础.单一空间频率尺度下的经典感受野响应仅仅能表现出一定程度下的目标轮廓提取细节，而单尺度下的感受野尺度模板是不足以完全表现不同空间频率尺度下图像的各种细节.本文基于以上生理学依据提出基于非经典感受野动态特性的轮廓检测模型，引入尺度判断这一处理机制，通过修正的sigmoid激活函数对像素点对应的感受野模板尺度进行判断，并得到每个像素点的局部尺度.将判断后得到的尺度信息用于经典感受野响应的计算，同时用提取的尺度矩阵对周边抑制进行调制从而得到最优轮廓检测结果.实验结果表明，本文的轮廓检测模型较同类模型，获得了较高的性能评测指数，有效地提高了轮廓检测的性能.

图1 轮廓检测模型的总体框架Fig.1 The framework of the contour detection model

1 基于感受野动态特性的轮廓检测模型

1.1 轮廓检测总体模型

本文提出的基于非经典感受野动态特性轮廓检测模型总体框架如图1所示.

其中，FR(x,y)代表最终的轮廓响应，由V1神经元经典感受野响应减去n CRF抑制得到；E^(x,y,λ,σ(x,y))表示V1神经元的经典感受野响应，σ(x,y)为局部最优尺度信息，λ参数为波长；sup(x,y)表示V1神经元的非经典感受野抑制，α是抑制系数，其表示神经元在CRF和n CRF之间的连接强度，h(z)如式（2）所示确保响应非负：

上述可见，自先秦原始儒家就开始的把“拙”与人之“质朴”“原始”的本性相联系的做法，为后世所继承和发扬，这自然对于后世直接把“拙”与“德”相联系有很大启发。这是因为，按照《中庸》来讲，“天命谓之性”[11](P17)，这个“性”就是人之所以为人的规定性的属性。而按照宋代理学来讲，很多理学家认为，“天命”“性”“道”“德”只不过是同物而异名，是天地万物规律性和本质性的属性在不同事物以及同一事物不同角度的特性。至此，有关于“拙”与“德”的义理联系，得到了合理解决。因此，宋代周敦颐以“拙”为成就“德”的途径、方法，就顺乎自然而呼之欲出了。

1.2 局部尺度计算方法

另一些有大理想的人则攻破一堵一堵的墙闯了进来，走到这个院落中心，在不知不觉中就变为这里的一分子，然后用那双毁墙的手，拾起满地散落的砖头，把墙重新垒起来，而且砌得又厚又高。

以功率80 ～ 140 W的激光进行刻型能一次刻透化铣保护胶层，对铝合金基材力学性能的影响甚微，且表面无烧焦、划痕等质量问题，微观上也未见明显的烧蚀和划伤缺陷，满足后续化铣的要求。

其中，σ是初始化尺度，卷积结果如下所示：

每个尺度对应一组神经元感受野大小，不同的感受野大小的神经节细胞存在不同尺度下的特性［13］.如图2所示展示了不同尺度下的gabor能量表示经典感受野响应，可以发现大尺度下的响应能够体现轮廓的整体情况，而小尺度下的响应则突出了图像更多的细节.本文定义一个高斯差分算子DoGσ(x,y)来对输入图像进行卷积计算作为尺度判断的输入.

其中，n(DoGσ(x,y))表示分别对DoGσ(x,y)的正响应和负响应进行归一化处理，∗表示卷积运算， ||s表示对s取绝对值.本文引入一种判断机制，通过向一个激活函数sigmoid输入高斯差分算子与输入图像I(x,y)的卷积结果来判断每个像素点对应的局部尺度，经过上述的判断过程后最终得到图像的最优尺度表达σ(x,y)，描述如下：

教师在教育教学过程中，通过学习小组的构建，调动学生内在的学习动力，完成学习任务，通过自主合作等学习形式的融入，提高学生的学习能力，也增强了他们对知识内容的理解深度。如今课堂上的小组合作，真正发展了以往的小组合作，不仅重形式，更注重内容和质量。课堂变为学堂，学生的主体地位得到充分尊重，学生合理安排时间，分工合作，交流探讨。因此，作为教师，首先要认识到学习小组创建的重要作用和价值，并且在教学实践工作中结合具体的教学内容和目标进行学习小组的组建和学习内容的安排布置工作。

其中Sig(z)是判断算子，该判断算子是一个修正sigmoid函数，描述如下：

“这么老旧的小区，竟然只有一个出入口，可以想象当年设计者也有防盗的理念。”当我把着方向盘，准备把车开入小区的大门时，脑子里突然蹦出这个近乎有些穿越意味的念头来。

图2 不同尺度下的Gabor能量响应Fig.2 Gabor energy responseswith different scales

1.3 经典感受野响应

文中对于方向选择性的V1神经元模型，使用二维Gabor函数描述它们对CRF中刺激响应的特性［15-16］，其描述如下：

其中：x～=x cos(θ)+y sin(θ)；y～=-x sin(θ)+y cos(θ)，γ——椭圆形感受野长短轴比例的常数(γ=0.5)；参数λ——波长；σ——高斯函数中的标准偏差，也被称为尺度因子，它决定了感受野的大小；1λ——余弦函数的空间频率，σλ——空间频率的带宽（σλ=0.56）；φ是相角参数（φ∈( ]-π,π）；θ--Gabor函数的方向参数（θ∈[ )0,π）.

经典感受野响应在孤立的边缘和纹理上的响应都很强烈，不足以区分这两种模式.相比之下抑制项对背景纹理的响应要高于独立的边缘，所以当经典感受野响应减去非经典感受野抑制的时候，最终响应就只会在独立的边缘上响应强烈.对于输入图像中的某个像素点来说，抑制项通过经典感受野周边的圆环形区域计算得到.用标准化权重函数wσ(x,y)描述非经典感受野［3］：

本文也通过该数据库下的100幅图像对提出的模型进行定量评测，该数据库包括200张训练图像和100张测试图像.每一个图像都对应有5～10幅由不同人员绘制的真实轮廓图.文献［18］中用精确度-回归度（覆盖率）框架（precision-recall framework）来评价轮廓检测性能的高低.当对轮廓检测模型进行评价时，有几个重要的检测量需要注意：1）True Positives—TP：正确检测出轮廓的样本数；2）False Positives—FP：错误检测出的轮廓的样本数，比如将背景误检测为轮廓输出；3）False Negatives—FN：漏检样本，即实际上是轮廓的区域被检测成背景区域的样本.于是评价方式为：精确度-回归度（覆盖率）曲线，这是一个包含阈值参数的曲线并且权衡了精确性和噪声，在这条曲线中F值最大的点即为该算法的最优性能指数.精确度（P）是P=TP/（TP+FP）；回归度是R=TP/（TP+FN），即真实轮廓中轮廓的覆盖率（R）.

复杂细胞模型的响应由Gabor能量来模拟，其是一对相位差为π2的简单细胞相应的结合：

其中，

定义Nθ为方向参数的个数，其值为12.

LUO Cui-song, LIN Yun, LI Lin-tao, ZHOU Min, JIANG Xing-xing, SHI Jun

那么在12个方向下的最大能量响应为：

每个像素点在最大能量下的最优方向表示如下：

其中，k为各个方向参数的编号.

1.4 非经典感受野响应

简单细胞的响应由输入图像与Gabor函数卷积而成，描述如下：

其中，c1、c2分别是两个尺度调制系数用于限定输出尺度的范围，阈值t和输入系数η用来控制Sig(z)函数的陡峭程度和水平位移.sigmoid函数是能够很好地用于描述兴奋性细胞的激活函数［14］，其通常被用于神经网络中，而本文利用其激活特性来判断输入图像每个像素点的局部尺度.在输入系数η足够大时，当输入小于t时则该点的尺度趋近于c2；反之当输入大于t时则该点的尺度趋近于c1.

在硬件平台CPU为Intel（R）core（TM）i3-4130，主频为3.4 GHz，内存为8 GB的计算机上，使用MATLAB 2016a仿真软件对各项同性模型［3］、蝶形抑制模型［7］、自适应抑制模型［8］、多线索抑制调制模型［9］、文献［10］中的轮廓检测模型、Canny轮廓检测模型［17］以及本文提出的检测模型进行仿真实验.同时使用标准评价指数F［18］对所有模型得到的图像数据结果进行评测.

2 实验结果与讨论分析

其中，‖‖1是L1范数，h(z)同式（2）确保算子非负，DoGσ(x,y)为如下描述的高斯差分函数同式（3）.接着，采用文献［3］中的各向同性抑制，用经典感受野最大能量响应与wσ(x,y)卷积得到抑制项，并且用式（5）中的最优尺度对抑制项进行调制得到新的抑制项：

为测试本文检测模型性能，分别从定性和定量两个方面进行实验来论证本文模型的有效性：1）基于RuG40数据库［3］，给出一个与同类模型的比较来说明本文的轮廓提取结果在抑制背景纹理方面得到了提高；2）基于伯克利数据库BSDS300［18］，将本文模型得出的轮廓检测结果与数据库中给出的真实轮廓做定量比较来全面评测本文轮廓检测的性能.表1给出了主要参数设置情况.

表1 参数设定及意义Tab.1 Setting and significance of parameters

参数σ t c1取值2 0.03 c2 η描述判断过程中的初始化尺度sigmoid函数中的阈值调制系数调制系数sigmoid函数的输入系数2 4 200

2.1 基于RuG数据库的实验结果及分析

图3显示的是基于RuG40数据库的两种模型的抑制效果比较，分别是本文模型与各向同性抑制模型（Isotropic Inhibition，ISO）［3］.其中图3（a）是原始输入图像，图3（b）为经过1.2小节判断之后得到的局部尺度信息，图3（c）是经局部尺度调制后得到的CRF响应，图3（d）是经局部尺度调制后得到的n CRF抑制项，图3（e）是图3（c）减去图3（d）后再经过非极大值抑制和滞后阈值处理［17］后得到的二值轮廓图像，图3（f）是ISO各项同性模型中提出的CRF响应，图3（g）是ISO中提出的n CRF响应，图3（h）是图3（f）减去图3（d）后再经过非极大值抑制和滞后阈值处理后得到的二值轮廓图像.通过图3（e）和图3（h）的对比可以看出本文检测模型的优势之处：1）调制后的CRF的响应使得图3（e）保留了更完整的轮廓信息；2）调制后的n CRF响应使得图像的背景纹理得到了有效的抑制，可以清楚的看到就图像下半部分的背景区域来说图3（e）中的噪点要远少于图3（h），这说明输入图像中多余的背景杂草部分通过本文方法检测后大部分都得以消除.

双及物构式(双宾构式)是指在句法层面的动词能同时携带间接宾语和直接宾语的语言形式，其结构可以码化为［NSVN1N2］。双及物构式的基本意义可以表述为“客体实际的、成功的转移”，也就是“客体从初始领有者被传递给最终领有者的过程”。这就要求进入双及物构式的动词必须具有“给予”义，必须能支配三个名词性成分，动词后的“N1”应该是有生命的。但是我们发现，许多非“给予”类、非“三价”动词也能进入双及物构式；处于“N1”位置上的名词也并非都是有生命的，这其中一定有什么因素在起作用，本小节就拟探讨这个问题。

图3 基于RuG40数据库的抑制效果比较Fig.3 Comparison of inhibition effects based on RuG40 database

2.2 基于BSDS300数据库的实验结果及分析

基于表1中的参数设置，在伯克利图像数据库BSDS300［18］中测试轮廓提取模型的性能，图4给出了几种轮廓检测模型经过非极大值抑制［17］后的轮廓比较.其中第一列和第二列分别是数据库给出的自然图像以及人工绘制的边界图像，第三列是各向同性抑制模型ISO［3］的实验结果，第四列是自适应抑制模型［8］的实验结果，最后一列是本文模型的实验结果.通过横向比较可以发现我们的检测模型对轮廓边缘的还原度最高，并且在抑制背景纹理方面优于其他两种模型.

其中，I——输入图像，∗——卷积运算符.

评价标准为F指数，其定义如下：

F指数为P和R的调和平均，其代表着模型的检测结果与人类观察轮廓的相似度.

表2中列出了一些优秀检测模型的F值结果，可以看到在最近几年的仿生类轮廓检测模型中，本文的方法达到了0.63，高于蝶形方法［7］、多线索抑制调制模型（Multi⁃ple-Cue Inhibition，MCI）［9］等.为了更加直观地比较本方法与其他同类检测方法的性能，用图5中的PR曲线图展示本文检测模型同其他检测模型的精准度-回归度走势.由于F值表示精准度和回归度的调和平均，可以看到随着精准度降低，回归度升高，最终本文的F指数都高于其他方法.

表2 不同检测模型基于BSDS300数据库的F值Tab.2 The F-score of different contour detection modelsbased on BSDS300

模型F值本文提出的模型多线索抑制调制模型［9］自适应抑制模型［8］各项同性模型［3］蝶形抑制模型［7］Canny轮廓检测模型［17］轮廓检测模型［10］0.63 0.62 0.60 0.60 0.59 0.59 0.58

图4 各模型检测效果图Fig.4 Thecontour detection resultsof different models

图5 各轮廓检测模型的PR曲线Fig.5 The PR curvesof different models

2.3 对n CRF抑制调制的实验结果

为了表现不同尺度下的局部图像信息，用提取的尺度信息对经典感受野响应进行计算；为了增强n CRF抑制项的抑制效果，又用局部尺度对n CRF抑制项进行调制，目的是为了突出背景响应，减弱边缘响应，这样经典感受野响应减去该调制的抑制项后就能抑制掉更多的背景噪点，从而突出轮廓信息.

免费医学生也称农村订单式定向医学生，根据国家发展和改革委员会、原卫生部、教育部等部门在2010 年印发《关于印发开展农村订单定向医学生免费培养工作实施意见的通知》，免费医学生在入学前必须与培养学校和当地县级卫生行政部门签署定向就业协议，毕业后需要到相应的基层医疗机构服务满6年，入学后免收学费、住宿费并有一定的生活补助。而普通医学生毕业后需要进行双向选择就业，在校期间也没有相应的助学金政策[3]。

为了验证这一步骤，本文基于BSDS300数据库进一步实验在无抑制调制的情况下，轮廓响应的结果.PR曲线结果如图6所示，本文的轮廓检测算法在无抑制调制的情况下评价指数F值只能达到0.60，但是在进行抑制调制过后评价指数F值达到了0.63，这充分说明了本文的抑制调制方法使得模型整体的轮廓检测性能得到了提高.

同时本文选取了5幅实验结果图像用于对比有抑制调制和无抑制调制下的轮廓检测结果，如图7所示，可以看出抑制调制能够有效地抑制图像背景中多余的噪点使提取的轮廓更加完整.

图6 抑制调制的PR曲线结果对比Fig.6 The PR curvesof themodelswith and without inhibition modulation

图7 有抑制调制和无抑制调制下的轮廓检测对比Fig.7 Thecontour detection resultsof themodelswith and without inhibition modulation

3 结论

近年来，有许多生理学和神经物理学方面的研究都主要关注于神经视皮层V1区的周边抑制现象，受到这些研究的启发，不少提取目标轮廓的计算模型相继被提出.尽管这些方法中的一部分在提高检测轮廓成功率方面取得了不小进步，然而很少有利用图像的尺度信息对CRF响应和n CRF抑制进行调制.针对该问题，提出了一种基于感受野尺度调制的轮廓检测模型：将尺度信息融入到传统的基于V1区神经元感受野特性的轮廓检测中.后续对于实验结果的分析也说明本文的模型能够在保留轮廓完整性的基础上最大限度地抑制背景纹理.今后工作的重点是进一步研究尺度线索能否与其他线索相结合对基于非经典感受野的检测模型进行改进，如何更有效地利用局部最优尺度也将会成为轮廓提取的重点.

Current–voltage characteristics were described by the thermionic emission theory[20]

参考文献

［1］闫夏，谭光兴，林川．基于免疫聚类算法的MRI膝关节图像分割［J］.广西科技大学学报，2015，26（1）：70－74．

［2］俞昊，林川，谭光兴，等.视觉注意机制与Canny算子结合的目标轮廓检测方法［J］.广西科技大学学报，2016，27（2）：87-92，99.

［3］ GRIGORESCU C，PETKOV N，WESTENBERG M A.Contour detection based on nonclassical receptive field inhibition［J］.IEEETransactionson Image Processinga Publication of the IEEESignal Processing Society，2003，12（7）：729-739.

［4］SANGN，LIH，PENGWX，et al.Knowledge-based adaptivethresholdingsegmentation of digital subtraction angiography im⁃ages［J］.Image&Vision Computing，2007，25（8）：1263-1270.

［5］ NONGS，TANGQL，ZHANGTX.Contour detection based on inhibition of primary visual cortex［J］.Journal of Infrared&Mil⁃limeter Waves，2007，26（1）：47-14.

［6］杜晓凤，李翠华，李晶.基于复合感受野的轮廓检测算法［J］.电子与信息学报，2009，31（7）：1630-1634.

［7］ZENGC，LIY，YANGK，et al.Contour detection based on a non-classical receptivefield model with butterfly-shaped inhibi⁃tion subregions［J］.Neurocomputing，2011，74（10）：1527-1534.

［8］ ZENGC，LI Y，LI C.Center-surround interaction with adaptive inhibition：a computational model for contour detection［J］.Neuroimage，2011，55（1）：49-66.

［9］ YANG K F，LI CY，LI Y J.Multifeature-based surround inhibition improves contour detection in natural images［J］.IEEE Transactionson Image Processa Publication of the IEEESignal Processing Society，2014，23（12）：5020-5032.

［10］LIN C，XU G，CAOY，et al.Improved contour detection model with spatial summation properties based on nonclassical re⁃ceptivefield［J］.Journal of Electronic Imaging，2016，25（4）：043018.

［11］WEIH，LANGB，ZUOQS.An imagerepresentation of infrastructure based on non-classical receptive field［J］.Soft Comput⁃ing，2014，18（1）：109-123.

［12］寿天德.视觉信息处理的脑机制［M］.中国科学技术大学出版社，2010.

［13］LINDEBERGT.Scale-spacetheory in computer vision［M］.Kluwer Academic，1994.

［14］RINGACH D L，SHAPLEY R M，HAWKEN M J.Orientation selectivity in macaque V1：diversity and laminar dependence［J］.Journal of Neurosciencethe Official Journal of the Society for Neuroscience，2002，22（13）：5639-5651.

［15］YANGK F，GAOSB，LICY，et al.Efficient color boundary detection with color-opponent mechanisms［C］//Computer Vi⁃sion and Pattern Recognition.IEEE，2013，9（4）：2810-2817.

［16］ SPRATLINGM W.Image segmentation using a sparse coding model of cortical area V1［J］.IEEE Transactions on Image Pro⁃cessinga Publication of the IEEESignal Processing Society，2013，22（4）：1631-1643.

［17］CANNY J.Acomputational approach toedgedetection［M］.Washington DC：IEEEComputer Society，1986.

［18］MARTIN D，FOWLKESC，TAL D，et al.A database of human segmented natural images and its application to evaluating segmentation algorithms and measuring ecological statistics［C］//IEEE International Conference on Computer Vision.IEEE，2002，2（11）：416-423.

作者

潘亦坚，林川，郭越，吴艳

出处

《广西科技师范学院学报》 2018年第02期

上一篇：草图和数据驱动的三维服装设计方法研究

下一篇：脂肪酶Lip2在蚕丝表面交联固定及其催化性质

《广西科技师范学院学报》2018年第02期文献

响应面优化α-细辛脑前体脂质体的制备及体外释放度研究作者：冯学珍，韦啓球，李曼丽，何世洁，罗富娣

水力空化及其在生物资源领域中的应用研究进展作者：张昆明，陆小菊，黄永春，杨锋，黄承都，任仙娥，黄琼

复合型外加剂对碱式硫酸镁水泥强度研究作者：孙航，黄世麟，李青，李利军

粘弹性材料降噪性能的圆柱壳体噪声实验与仿真作者：秦文东，林贤坤，琚林锋

侧风下汽车会车气动特性数值分析作者：罗建斌，吴量，苗明达，黄煜

气门重叠角对天然气掺氢发动机性能的计算分析作者：李春青，姜峰，陈乾，莫清烈，曾维铨

汽车排气系统振动特性分析研究作者：谢义杰，黄昶春，范健文

板式制动器松闸扳手扁管成形工艺的仿真分析作者：张豫宁，李健，苗明达

具有较高谐振电路品质因数的磁耦合谐振式无线电能传输系统研制作者：莫云杰，罗文广，谢广明

C和Nb添加对金属注射成形420不锈钢组织及性能的影响作者：安传锋，何浩，李益民，尹健，娄嘉，余勇

草图和数据驱动的三维服装设计方法研究作者：李威龙

基于非经典感受野动态特性的轮廓检测模型作者：潘亦坚，林川，郭越，吴艳

脂肪酶Lip2在蚕丝表面交联固定及其催化性质作者：邓冬梅，潘淑兰，劳振华，孙宇飞

逆流法提取百香果果皮中总黄酮的工艺研究作者：廖兰，吴俊良

掺硫酸渣粉水泥砂浆的抗硫酸盐侵蚀性能作者：王旭，黄小青，江英

红米花色苷的制备及对胆固醇消化吸收的影响作者：玉万国，陈云芳，黎华圣，王梓成，卢玉双，唐小杨

六参数实用粘弹性阻尼器单自由度减震系统非平稳响应分析作者：李创第，刘鹏，葛新广，柏大炼

河源市流通业发展实证分析作者：叶影霞

基于DEA方法的跨境电商企业经营绩效评价作者：张倩

非仿射随机波动率的欧式回望期权定价作者：温鲜

杂志信息网