更全的杂志信息网

基于颜色特征和SVM的自然图像分类标注算法

更新时间:2009-03-28

0 引言

随着数字媒体技术与移动互联网技术的迅猛发展,人类已经步入“互联网+”和 “大数据”的时代,人们获取信息的种类和手段越来越多,而图像信息因其直观、生动且携带信息量大等特点,成为人们获取信息的主要手段.数字图书馆、医疗图像管理、交通检测、视频监控、遥感遥测等领域,每天都有大量图像数据不断的产生和更新,人们的日常工作、生活和娱乐都离不开图像信息,心理学研究表明人类通过视觉获取外界信息量达到总信息量的83%[1].互联网是一个异质的、非结构的、庞大的图像数据库[2],为了方便用户浏览、查询、获取图像信息,必须对大规模图像数据库进行合理的组织与管理[3],图像分类检索技术应运而生,成为模式识别、计算机视觉研究的一个热点[4],具有巨大的应用价值.

堂吉诃德和桑丘两人虽然是主仆关系,但在情感上他们是平等的,在游侠途中他们时常展开平等又有趣的对话。两种视角的对话从二元对立发展为对立统一关系,另外小说从第一部到第二部实现了“堂吉诃德的桑丘化”和“桑丘的堂吉诃德化”①,人物的变化过程同样是双重视角的融合过程。堂吉诃德听了桑丘的解释后明白了原来现实的棍棒抽到脊背上的疼痛是魔法师也没法减轻的,而桑丘在苟且中看到主人的诗和理想也崇拜不已,于是在心里种下了成为海岛总督的理想种子。

图像分类标注技术主要是根据用户给出的检索词提取图像数据库中相关图像特征信息并与提取的待处理图像特征进行匹配,以确定图像类别,实现关键字的标注和存储[5],为用户检索做出支持.颜色作为图像最直观、最主要的特征,往往蕴含大量语义信息,而自然图像具有颜色丰富、色彩鲜明等特点,因此文章主要研究基于SVM和HSV颜色特征的自然图像快速分类与标注算法.例如,草地和树木主色调为绿色,辅以树干和土地的褐色;朝阳和晚霞图像主色调为红色和橙色,辅以蓝天和大海的蓝色;海滩图像主色调为蓝色,辅以沙滩的淡黄色.传统的基于颜色特征图像分类技术存在颜色特征维数高,颜色特征易受光照影响,不能区分相近颜色等问题[6],因此本文提出了基于彩色空间量化直方图和图像分块操作的的SVM自然图像分类标注系统,根据其原理用Matlab编程实验,证明了算法的正确性与有效性.

1 系统设计

系统处理对象为自然图像,对其无序、庞大的图像集进行分类标注[7].首先,对图像数据库中的样本图像进行量化处理并提取其颜色特征,创建图像特征数据库;用户检索时,用相同的方法提取待处理图像特征信息;然后将图像特征库中的特征与待处理图像特征进行匹配,筛选出和待处理图像相似度最高的图像库,将其写入对应图像库实现图像自动分类,最后根据相似度大小标注并提供给用户,其工作过程如图1所示.

  

图1 系统框图Fig.1 Diagram of system

2 颜色直方图

颜色直方图在图像发生几何变换后基本保持不变,因此常常用于图像分类检索中[2],是基于颜色特征图像分类的主要方法,当选用不同的颜色空间或对直方图进行不同处理操作时,又得到不同的基于颜色特征的图像分类方法.

2.1 颜色空间

其中,C表示惩罚系数,γ为径向基核函数的参数,它们的选择直接影响分类器的性能.系统对每个(Cγ)参数对进行网格搜索,最终采用交叉确认准确率最高的(Cγ)作为支持向量机参数.

  

图2 RGB彩色模型Fig.2 SchematicofRGBcolorcube图3 HSV彩色模型Fig.3 SchematicofHSVcolormodel

2.2 色彩空间量化

其中,k为图像分块的编号,I为图像的颜色分量,H(Ik)为第k个分块的直方图.

 

缓冲孔:孔径90mm、间排距2.5m×2.3m,单耗0.25g/m3,堵塞长度 2.5m,单孔装药量 22kg。

  

图4 HSV量化直方图Fig.4 Histogram of the quantized HSV

3 颜色特征提取

k=1,2,…,9I=1,2,…,71

  

图5 图像分块算法Fig.5 Algorithm of image block

图像分块后按照上节方法计算各分块的特征向量,各个特征向量加权求和后得到整幅图像的加权颜色直方图H(I),计算公式如下:

传统的全局颜色直方图未保留像素的空间位置信息,因此很难分辨外观不同而颜色相同的两幅图像.事实上,一幅图像中大部分信息集中在中心位置,而边缘位置通常作为背景,而且根据视觉特性,人们对图像中心的关注度明显高于对图像边缘的关注度[9],对图像左侧的关注度高于对右侧的关注度,为此在颜色量化的基础上对图像做分块处理,均匀划分为9块如图5所示,不同分块分配不同的加权系数.图中子块5位于图像中心包含最多图像信息,分配最大的权重;子块2、4、6、8位于中心左右包含较少信息,分配较小的权重;子块1、3、7、9位于图像边缘包含最少信息,给予最小的权重;所有权重累加和为1[10].

传统彩色图像颜色特征维数高,以24位真彩色图像为例,共有1677万种不同的颜色,数据量巨大,计算复杂.因此,在计算直方图前先对HSV颜色空间进行非均匀量化[8].色调、色饱和度、亮度分别量化为QH=8级、QS=3级、QV=3级,将颜色特征量化为72种不同颜色.系统采用的量化方法如下:

4 SVM学习算法进行图像分类

采用LibSVM软件包作为分类器训练平台.训练分类器的过程主要调用三个函数实现,Svmscale将输入向量数值归一化到[0,1]范围;Svmtrain根据输入向量与指定分类训练建模;Svmpredict使用已有模型进行预测分类.分类器训练过程中选用当下流行的径向基核函数:K(x,xi)=exp(-γ|x-xi|2)

Step 1:提取颜色直方图.Step 2:提取图像特征向量color_ip.Step3:将color_ip作为SVM的输入向量,将对应分类的类标签train_labels作为输出.Step4:选取三类图像中前60幅图像作为样本图像训练对应分类器,输入不同特征向量都将获得其对应的图像类别.Step5:把训练好的分类器作为有效分类工具,对图像数据库中后40幅待处理图像进行相应的分类.

基于范例学习的算法[11],与特征相关的样本在重建中提供更多有用信息[12],并不是图像数据库越大、样本空间越大得到的重建效果越好,因为系统选用小样本学习能力较强的SVM(支持向量机)作为分类器,同时采用基于颜色特征分类学习的重构算法来提高重构的能力.其实现步骤如下:

公式G=HQVQS+SQS+V将H、S、V分量直方图加权求和构造彩色空间量化直方图,获得图像的一维特征向量.利用该算法对自然图像数据库中各图像进行处理,实验结果如图4所示.

图像处理学科常用RGB和HSV颜色模型.其中,RGB颜色模型中各颜色分布于单位立方体的表面及内部.该模型符合人眼的三色刺激理论,可以描述较广泛的颜色范围,被广泛应用于图像的显示和存取中,如图2所示.HSV颜色模型中H、S、V三分量分别对应用于人眼识别和理解色彩信息的色调、色饱和度和亮度,且亮度值与色彩信息无关,各颜色分布于倒立的圆锥体表面及内部.故HSV颜色空间更适合于表达颜色的相似性,多用于彩色图像处理中,如图3所示.

过了立秋以后,全国的气温已不再火热,复合肥市场也平稳度过“避暑”阶段,之所以说复合肥市场过去是在避暑,是因为今年的夏季肥销量不佳,并没有达到预期效果。目前已进入秋季,秋季是一年中最后的一个用肥旺季,所以秋肥市场也是各大企业的“兵家”必争之地。目前主流厂商出厂报价:45%氯基复合肥报价在2100-2200元/吨,45%硫基复合肥报价在2250-2350元/吨。

5 实验数据与分析

通过百度搜索引擎查找草地和树木、朝阳和晚霞及海滩三类真彩色图像,经过筛选共得到300张符合内容规范的图像,构成自然图像数据库.其中,每类图像各100幅,以3:2的比例作为训练样本和待处理样本.由SVM分类器处理后图像自动分类结果如表1所示,图像自动标注结果如图6所示.实验结果表明基于分块加权直方图和支持向量机的自然图像分类标注算法中,图像分类、识别的正确率比较高,同时执行速度也得到改善.

治疗组,50例患者,2例发生不良反应,1例为头痛,1例为口干,发生率为4%(2/50),对照组,50例患者,8例发生不良反应,5例为口干,1例为头晕,1例食欲不佳,1例恶心,发生率为16%(8/50),组间结果比较,有明显差异,存在统计学意义(c2=8.000,P=0.004)。

 

表1 分类结果Tab.1 Results ofclassification

  

图像类别数据库图像数目待处理图像数正确分类数错误分类数正确率/%草地与树木1006039197.5朝阳与晚霞1006035587.5海滩1006038295.0

  

图6 图像自动标注Fig.6 Result of automatic image annotation

6 结束语

系统设计软件采用Matlab,它为开发人员提供了丰富的图像处理函数,结合LibSVM软件包编程实现.通过彩色空间量化直方图和图像分块操作提取图像颜色特征向量,并以该一维特征向量作为支持向量机的输入,实现图像数据库中待处理图像的匹配、分类和标注.实验结果表明该算法解决了全局直方图中丢失空间位置信息的问题,同时加大图像中心位置权重,有效提高了图像的匹配度,提高了用户检索的满意度.不足之处在于未能实现大量图像的分类标注,下一步工作准备在颜色特征的基础上融入空间、轮廓等其他特征,以实现更高的分类精度,并建立图形用户界面(GUI),向用户提供更加舒适、自然的体验.

海拉尔盆地某水平井自斜深2 550m进入水平段,水平段全长为500m,全井综合解释411m/24层,含油井段占水平段的82.2%。根据现场地质录井资料,两次提出有可能钻遇非储层或钻出油气层的提示,并建议调整相应的钻井轨迹。

参考文献

[1] 王惠锋,孙正兴,王箭.语义图像检索研究进展[J].计算机研究与发展,2002,39(5):513-522.

[2] 周云蕾,朱蓉,郭洁畅.颜色直方图与相似性度量的自然图像分类研究[J].现代计算机,2014,25(1):3-6.

[3] 苏佩娟,刘桢.基于K一近邻法的不等样分类[J].绵阳师范学院学报,2016,35(11):13-16.

[4] 孙亚杰,张永宏,季赛.无方向数据采集的相控阵结构健康监测研究[J].数据采集与处理,2014(6):1023-1029.

[5] 陆伟艳,郑鑫.基于MATLAB/GUI的图像语义自动标注系统[J].软件,2017,38(4):99-103.

[6] 江启伟.图像直方图特征及其应用研究[D].合肥:中国科学技术大学,2014.

[7] 钱晶,高月松.图像检索系统中的CBIR技术研究[J].人工智能及识别技术,2011,2(7):415-417.

[8] 王彦林.基于HSV颜色特征图像检索算法在Matlab中的实现[J].电脑编程技巧与维护,2013(16):87-87.

[9] 张锡英,车鑫.图像颜色特征提取及其分类研究[J].安徽农业科学,2014,42(7):2196-2198.

[10] 杨传慧,吉根林,章志刚.基于分块加权颜色直方图的图像聚类算法研究[J].南京师范大学学报,2013,13(1):40-44.

[11] FREEMAN W T,JONES T R,PASZTOR E C.Example-based super-resolution[J].IEEE Computer Graphics and Applications,2002,22(2):56-65.

[12] 汤嘉立,左健民,黄陈蓉.基于SVM预分类学习的图像超分辨率重建算法[J].计算机应用研究,2012,29(8):3151-3153.

 
仲会娟
《绵阳师范学院学报》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号