更全的杂志信息网

基于改进词包模型的车型识别算法∗

更新时间:2009-03-28

1 引言

车型识别技术一直是智能交通领域研究的一个重要课题,其主要任务是对特定地点和时间的车辆进行识别和分类,并以之作为交通管理、收费、调度、统计的依据。目前已有的车型识别方法主要有电子标签识别法、电磁感应线圈识别法、车牌识别法、基于图像的车型识别法等。近年来,基于图像的车型识别方法[2~4]发展迅速,它是通过对车辆图像进行特征提取,然后送入分类器进行分类,进而识别出车辆的类型。

词包模型(Bag-of-Words,BoW)[1]最初应用于文本检索和文本分类领域,后来计算机视觉领域的研究人员将其扩展到图像处理领域,得到了广泛应用,其中之一就是将词包模型应用于基于图像的车型识别领域。Li等[2]引入原始词包模型,在提取车辆图像的SIFT特征和SURF特征后使用矢量量化(Vector Quantization,VQ)编码算法对两种特征分别进行编码,然后使用线性核SVM(Support Vector Machine)分类器进行车型识别,基于SIFT特征的词包模型识别率相对较高但速度较慢,而基于SURF特征的词包模型速度相对较快但识别率较低。Lazebnik 等[3]对 词 包 模 型 进 行 改 进 ,提 取 了Dense-SIFT特征,特征提取速度加快,然后使用空间金字塔匹配(Spatial Pyramid Matching,SPM)和相交核进行识别,识别率较高,但是该算法达不到实时性要求。Jang等[4]在提取SURF特征后将词汇树(Vocabulary Trees,VT)用于量化编码,并使用RBF核SVM分类器进识别,识别率和速度较原始词包模型均有提高。

针对传统车型识别算法识别速度慢、识别率低的问题,本文提出了一种基于改进词包模型的车型识别算法。首先,使用Dense-SURF特征代替原始词包模型中的SURF(Speeded Up Robust Feature)特征,并通过改进稠密采样策略对Dense-SURF特征的提取过程进行加速,设置稠密采样步长等于与子区域边长相等,在子区域中提取36维改进Dense-SURF特征向量,减少了Haar小波响应求和次数,提高了特征提取速度;然后,将特征的空间位置作为上下文信息并与矢量量化编码结合,提出特征上下文—矢量量化(Feature Context-Vector Quantization,FC-VQ)编码算法,使用FC-VQ算法对改进的Dense-SURF特征向量进行编码,生成包含空间信息的FC-VQ特征向量,弥补了空间信息缺失,从而提高识别率;最后,使用特征向量构建直方图相交核作为核函数,将编码后的特征送入SVM分类器进行训练和识别,进一步提高了识别效率。仿真实验结果表明,本文提出的算法具有较高的识别率,同时识别速度较快,基本满足实时性要求。

2 基于改进词包模型的车型识别算法

2.1 改进的词包模型

词包模型的流程主要分为两大步骤:1)提取图像的特征;2)对提取的特征进行编码,将特征量化为若干视觉单词。在特征方面,传统的词包模型常使用SIFT或SURF作为图像特征,但是两种特征的提取速度不够快,无法满足实时性要求,因此本文使用Dense-SURF特征来表示图像,并通过改进稠密采样策略进一步提高特征提取速度。在编码方面,传统的词包模型常使用矢量量化(VQ)编码算法,但是VQ编码方式简单,忽略了图像特征的空间位置信息,导致对图像的描述性较差。为了解决这个问题,本文提出了一种特征上下文—矢量量化(FC-VQ)编码算法。

2.1.1 Dense-SURF的原理及改进

3)将特征的空间位置作为上下文信息,使用FC改进VQ编码,得到FC-VQ编码算法,并用其对改进的Dense-SURF特征进行编码,得到FC-VQ特征向量。

  

图1 原始Dense-SURF特征提取过程

首先采用稠密采样的方式,在边界框内将矩形窗口以一定的步长在图像上从左到右、从上到下进行遍历,获得多个像素块,然后将每个像素块划分为4×4个子区域,在每个子区域中使用积分图像计算像素点的一阶Haar小波响应dx和dy,将子区域内dx、dy、 ||dx、 ||dy分别求和,得到一个4维特征向量:

 

再将4×4个子区域的特征向量进行连接,归一化得到一个4×4×4=64维的Dense-SURF特征向量,像素块中间像素的位置即为Dense-SURF特征向量的空间位置。

京津冀高校师资培训中心间具有同源性,都是依托政府教育主管部门,挂靠在地方高校,相同的工作职能和相似的工作内容,是三地间高校师资培训一体化的基础。在京津冀教育协同发展的背景下,应有大局意识,用协同创新的视角,建立一体化发展的机制,可先在以下三个方面实现突破。

5)输入测试车辆图像,快速提取36维改进Dense-SURF特征向量。

综上,为了进一步提高特征提取速度,本文改进了Dense-SURF提取过程中的稠密采样策略,将稠密采样步长设置为矩形窗口边长的1/3来遍历图像得到像素块,并将像素块划分为3×3个子区域,即令采样步长等于子区域的边长,同时考虑到特征点的个数要适中,本文将此值设置为5个像素点,在子区域内提取36维改进的Dense-SURF特征向量。

2.1.2 FC-VQ编码算法原理

VQ编码[1]的大致过程为:首先使用k-means聚类算法[8]将训练样本生成的特征向量进行聚类,生成N个聚类中心(称为码字),N个码字构成了码本。然后计算测试样本生成的特征向量与各个码字之间的欧氏距离,将特征向量映射到距离最小的码字。最后统计属于各个码字的特征向量个数,作为编码后的向量。VQ编码的过程简单,但忽略了特征的空间位置信息,导致识别率较低。

Raven和李笑都给记者算了一笔账。一辆小黄车日均单(一日平均收入)是2.5元左右,这意味着每天每辆车的成本控制在3元以内,才有不亏损的可能。但实际成本非常高,即使除去车辆成本,实际的运维成本也远高于这个数字。运维成本主要是四个部分,即仓储、物流、投放、修理,以北京为例,北京大概有150万辆单车,每天仅投放调度(如调往地铁站)的支出就近200万元。

针对这个问题,本文提出了FC-VQ编码算法。先将提取的特征的空间位置作为上下文信息,然后使用特征上下文(FC)[9]改进矢量量化编码(VQ)。通过FC-VQ算法对提取的Dense-SURF特征向量值和空间位置进行编码,得到编码后的FC-VQ特征向量。

对于一幅给定的图像I,令Z={z1,…,zL}表示Dense-SURF特征点的位置,示Dense-SURF特征向量,p是图像I中一个参考点的位置。为了更好地描述特征点的位置分布,先在图像I中建立对数极坐标系,并将参考点 p的附近区域在极坐标系中划分为多个子区域,记为(r=1,…,R),本文中 R=12。每个子区域中的Dense-SURF特征向量集合可表示为

 

为实现内部市场化运作,2016 年集团公司推出了炼销两个板块汽、柴油交货的基础量、额外量概念。所谓基础量是指参考零售量、按照官方出厂价交接的汽柴油量,而额外量则是指按照市场批发价交接的剩余汽柴油量。设定基础量、额外量的出发点是:

假设第r个子区域中有M个特征向量,W(r)中的第m个特征向量Wm与第n个码字cn之间的欧氏距离为

 

苗木高度是每年新梢高的累积,地径是每年径向生长量的累积,因此本文采用苗木新梢高和地径的数据作为考量因素,对苗木的生长情况加以分析。2016年12月分别用钢尺测定苗木的新梢高、用卡尺测定地径生长量。

参考点p所对应的FC-VQ特征向量则为其附近子区域内映射于各个码字的Dense-SURF特征向量的个数,即:

系统煤耗降指的是通过优化改造降低发电厂的煤耗率,600MW直接空冷机组加装干式间接蓄冷式空气冷却系统,折合到全年平均煤耗降为4.98g/kWh。

 

式中:dmi={dmi};count用于统计符合条件的m值总数;argmini∈{1,…,N}dmi表示当 dmi取最小值时 i的取值。FC-VQ特征向量生成示意图如图2所示。

  

图2 FC-VQ特征向量生成示意图

为了使特征点的空间位置更加明确,本文使用了多个参考点,记为同时为了减少运算量,本文先计算特征点与各个参考点之间的距离并选取距离最近的参考点作为式(4)中的参考点。根据距离的大小大致将特征点的位置分成K块,分别对应于K个参考点,避免了重复判断特征点与每个参考点附近子区域的位置,降低了计算复杂度。K个参考点对应的FC-VQ特征向量则表示为

 

2.2 基于快速直方图相交核的SVM分类器

SVM分类器在基于词包模型的车型识别方法中得到了广泛应用,其核函数的选择对识别性能有较大影响,相交核函数在众多核函数中性能较好,但是计算速度较慢。因此,本文使用快速直方图相交核[10~11]作为SVM的核函数,来提高识别效率。

以学生为中心的教育理念,强调学生身上都有可挖掘的宝贵资源。在面对一个问题时学生从不同的角度都有自己的发现和想法,因此用合作探究的模式,可以更好地发挥学生各自的优势,提高学生合作学习的效果。所以在学生具备一定的基础的前提下,教师要充分相信学生,把一定的问题解决任务交给学生,让学生在各自的小组中能够通过合理的分工,高效完成问题解决的任务。

直方图相交核函数的计算公式为

 

使用直方图相交核的SVM分类函数则为

 

其中 x={x1,…,xk}为输入向量,zj={z1j,…,zkj}表示第 j个支持向量,αj和tj={+1,-1}分别是第 j个支持向量的权重和标签,m是支持向量的个数。对于固定的i值,将zij的值按升序排序,记为z͂ij,此时 αj和 tj分别表示成 ᾶj和 t͂j,令 r 表示满足z͂ir≤xi最大的整数。则式(7)可改写为

式中:m=1,…,M ;n=1,…,N ;U=36(改进的Dense-SURF特征向量的维数)。

 

式(8)即为基于快速直方图核函数的SVM分类函数。对于每一个i值,可以预先计算的值,这是由于其不随 xi 而改变。因此计算分类器的输出值则相当于为每一个维度i找到合适的r值,时间复杂度为O(logm)。则使用快速直方图相交核函数的总时间复杂度为O(klogm),与常见的基于距离的核函数的时间复杂度O(km)相比,时间复杂度降低,从而提高了识别效率。

3 算法实现步骤

基于改进词包模型的车型识别算法流程图如图3所示。

具体实现步骤如下:

式中:l=1,…,L,L为特征点(或特征向量)的总个数;表示区域的半径为s的圆形邻域,它使得区域边界附近的点可能属于多个区域,弥补了局部描述子的空间不确定性。

盐城金鹰综合体项目位于盐城市城南新区,总建筑面积3.7×105m2。工程包括商业、酒店、办公、住宅等,分南区、北区2个地块。南区主要为小型商业用房、高度小于100m的挑高办公和住宅;北区包括6层大型商业用房和31层的酒店及办公,地下室2层,其中地下1层为商业用房,地下2层为车库和设备用房。北区塔楼建筑高度为136.50m,属超高层建筑。

1)读取训练车辆图像,将矩形窗口大小设置为15×15并划分为3×3个子区域,设置稠密采样的步长与子区域的边长相等(5个像素点),在3×3个子区域中计算Haar小波响应和,得到36维改进Dense-SURF特征向量。

2)使用k-means算法对训练样本的Dense-SURF特征进行聚类,得到100个聚类中心(码字),构成码本。

SURF特征[5]的构建主要包括特征点检测和特征点描述两个过程,而 Dense-SURF[6~7]只使用了特征点描述部分,从而速度较快。Dense-SURF特征提取过程由图1所示。

4)将训练样本的特征向量送入快速直方图相交核SVM分类器进行训练,得到训练模型。

在Dense-SURF的提取过程中,由于采用稠密采样策略,获得的像素块数量较多且在每个像素块都提取64维的特征向量,使得表示每幅图像的向量维数过高。因此,本文对64维特征向量进行降维,将上述的像素块划分为3×3个子区域,得到一个 3×3×4=36维的Dense-SURF特征向量。Dense-SURF特征向量的维数减少,使得下文欧氏距离计算复杂度降低。Dense-SURF特征的数量与像素块数量一致,由稠密采样的步长与像素块的大小共同决定。由图1的提取过程可知,若将稠密采样的步长与像素块中每个子区域的边长设为相同值,则在计算其它像素块的特征向量时可以重复使用之前子区域的特征向量,避免在子区域内重复进行Haar响应求和计算。

  

图3 基于改进词包模型的车型识别算法流程图

6)使用FC-VQ对改进的Dense-SURF特征向量进行编码,得到测试车辆图像的FC-VQ特征向量。

7)加载训练好的模型,将测试样本的特征向量送入快速直方图相交核SVM分类器进行识别,得到测试车辆图像的车型识别结果。

4 实验结果与分析

实验硬件环境为Intel Core i5-3470处理器、4G内存,软件环境为Windows7系统、Matlab R2012a软件。数据集选取文献[12]中提供的BIT数据集,该数据集是在交通卡口拍摄的车辆正面图像,包含一些复杂环境,如光照的变化、雨天的影响和不同颜色的车辆,车辆类型分为五类:大型客车、小型客车、大型货车、小型货车、轿车(含普通轿车和SUV,本文不作区分)。数据集标注了车辆的位置信息,本文根据车辆的位置信息将车辆单独分割出来,部分分割出的车辆图像如图4所示。将分割出来的车辆图像作为训练和测试样本,并使用双三次插值方法将样本统一采样到400×400像素大小。对于每一类车,随机选取400张图像进行训练,200张图像进行测试。

大数据对政府传统管理理念形成挑战,全面树立大数据意识是政府提高大数据管理能力的关键,是推进政府治理创新的重要条件,当前政府管理部门大数据意识的缺乏,社会公众对大数据认识不足,影响了数据资源的创新应用。①要加强大数据宣传力度,在全社会传播普及大数据知识,自上而下全面提高大数据素养,将大数据理念渗透人们的思想之中,促使社会公众与政府共同树立大数据意识。②要提高大数据培训力度,重点要加强对政府工作人员培训,转变他们传统政府治理观念,培育大数据思维意识,树立科学的大数据治理理念,促进政府治理能力的提升。

  

图4 BIT数据集实例

本文使用识别率P以及每幅图的平均特征提取时间Te、平均特征编码时间Tc、平均识别时间Tr作为评价指标。

图5是参考点的个数与对应的编码时间和识别率之间的关系图,每个点从左到右依次代表1、2、4、9个参考点。由图5可以看出,参考点的个数在1~4之间时,随着个数的增加,识别率也在提高,但参考点的数目增加到9时,识别率反而降低。这是因为参考点数目过多,使得图像的表示过于具体,以至于对同类型车辆之间的差异也较为敏感。因此,综合考虑编码时间和识别率两方面因素,本文选择4个参考点进行编码。

● 误食强酸、强碱物质:如漂白剂、清洁剂、去污剂、电池、普通干燥剂(硅胶对人体没有毒性,可经由粪便排出)等。不可给予清水及催吐,立即给予牛奶(或豆浆、蛋清)服下,紧急就医。因为催吐强酸、强碱溶液,会造成食道反复灼伤。

  

图5 参考点个数与编码时间和识别率关系

图6 是使用本文算法进行车型识别所得到的混淆矩阵。从混淆矩阵中可以看出,大型客车、大型货车和轿车取得了较好的识别结果,而小型客车和小型货车识别率相对较低。这是由于在此数据集中小型客车和轿车在外观上有一定的相似性,小型货车和大型货车也具有相似性,容易误分。

  

图6 车型识别混淆矩阵

为了进一步验证本文算法的有效性,本文首先进行了纵向对比实验,分别与原始Dense-SURF+FC-VQ+hist核函数、改进Dense-SURF+VQ+hist核函数、改进Dense-SURF+FC-VQ+RBF核函数进行对比,hist核函数表示直方图相交核函数,实验结果见表1。然后本文进行了横向对比实验,分别与文献[2]中算法(原始词包模型)、文献[3]中算法、文献[4]中算法进行对比,实验结果见表2。

由表1可以看出,在特征提取方面,本文改进的Dense-SURF与原始Dense-SURF相比,特征提取速度加快,提取时间仅占原始的36.4%,而且对识别率几乎无影响;在编码方面,本文提出的FC-VQ编码与VQ编码相比,虽然编码速度相对较慢,但是识别率大幅提高,高出9.4%;在分类器方面,与RBF核SVM相比,本章使用的快速直方图相交核SVM取得了更高的识别率和识别速度,识别率高出1.7%,总体识别时间占其73.9%。由表2可以看出,与文献[2]中算法(原始词包模型)相比,在识别速度和识别率上都大幅提升,识别时间仅占其23.6%,识别率高出7.9%。与文献[3]中算法相比,识别速度较快,识别时间仅占其50.0%,且识别率高出1.5%。与文献[4]中相比,识别率高出5.7%,识别时间仅占其32.1%。综上,与其它三种算法相比,本文算法检测速度更快,且具有更高的识别率。

以SPSS19.0软件验证涉及的临床数据,以率(%)的形式阐述计数资料,予以χ2检验,以(均数±标准差)形式阐述计量资料,予以t检验,P<0.05,统计学展现对比差异。

(2)试验区周围必须设保护带,玉米、大豆保护行不少于4行,保护头不少于3米;小麦保护行不少于6行,保护头不少于3米;水稻保护行不少于6行,不设保护头。

 

表1 本文算法与其它算法的纵向对比结果

  

方法本文算法原始Dense-SURF+FC-VQ+hist改进Dense-SURF+VQ+hist改进Dense-SURF+FC-VQ+RBF识别率(P)94.6%94.8%特征提取时间(Te)0.04s 0.11s特征编码时间(Tc)0.11s 0.15s识别时间(Tr)0.17s 0.28s 85.2%0.04s 0.03s 0.08s 92.9%0.04s 0.11s 0.23s

 

表2 本文算法与其它算法的横向对比结果

  

方法本文算法文献[2]中算法文献[3]中算法文献[4]中算法车辆总数1000 1000 1000 1000识别正确的车辆数目946 867 931 889识别率(P)94.6%86.7%93.1%88.9%识别时间(Tr)0.17s 0.72s 0.34s 0.53s

5 结语

本文针对传统车型识别算法识别速度慢、识别率低的问题,提出了一种基于改进词包模型的车型识别算法。首先通过改进稠密采样策略快速提取36维Dense-SURF特征,然后提出FC-VQ编码算法,对提取的特征进行编码,最后将编码后的特征向量送入快速直方图相交核SVM分类器进行识别。为了验证本文算法的有效性,在BIT车辆图像数据集上进行了实验,通过实验对本文的车型识别算法和其它算法进行了横向和纵向对比分析。实验结果表明:本文算法与其它车型识别算法相比,识别率更高,且识别速度更快。

参考文献

[1]G Csurka,C Dance,L Fan,et al.Visual categorization with bags of keypoints[C]//Workshop on statistical learning in computer vision,ECCV,2004,1(1-22):1-2.

[2]LI Q W,CHENG H S,ZHOU Y,et al.Road vehicle monitoring system based on intelligent visual internet of things[J].Journal of Sensors,2015:1-16.

[3]S Lazebnik,C Schmid,J Ponce.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2006(2):2169-2178.

[4]D M Jang,M Turk.Car-Rec:A real time car recognition system[C]//IEEE Workshop on applications of computer vision(WACV),2011:599-605.

[5]H Bay,A Ess,T Tuytelaars,et al.Speeded-up robust features(SURF)[J].Computer vision and image understanding,2008,110(3):346-359.

[6]J R R Uijlings,A W M Smeulders,R J H Scha.Real-time visual concept classification[J].IEEE Transactions on Multimedia,2010,12(7):665-681.

[7]J R R Uijlings,A W M Smeulders,R J H Scha.Real-time bag of words,approximately[C]//Proceedings of the ACM international Conference on Image and Video Retrieval,2009:6.

[8]A K Jain.Data clustering:50 years beyond K-means[J].Pattern recognition letters,2010,31(8):651-666.

[9]XING-GANG WANG,XIANG BAI,WEN-YU LIU,et al.Feature context for image classification and object detection[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2011:961-968.

[10]S Maji,A C Berg,J Malik.Classification using intersection kernel support vector machines is efficient[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2008:1-8.

[11]JIAN-XIN WU,J M Rehg.Beyond the euclidean distance:Creating effective visual codebooks using the histogram intersection kernel[C]//Proceedings of the 12th IEEE International Conference on Computer Vision,2009:630-637.

[12]ZHEN DONG,YUNDE JIA.Vehicle type classification using distributions of structural and appearance-based features[C]//Proceedings of the 20th IEEE International Conference on Image Processing(ICIP) ,2013:4321-4324.

 
康珮珮,于凤芹,陈莹
《计算机与数字工程》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号