更全的杂志信息网

基于字典学习的马铃薯叶片病害图像识别算法

更新时间:2009-03-28

压缩感知理论打破了传统奈奎斯特采样定律的约束,指出在一定条件下可以利用少量观测值重构信号[1-2],是近年来信息处理领域的研究热点之一,在机器视觉、模式识别等领域引起了广泛的关注。应用压缩感知理论,Wright等[3]学者提出采用稀疏表示分类器(Sparse representation classifier,SRC)进行人脸识别研究,取得了很好的效果,但受限于字典构造算法,求解出的系数矩阵包含很多的小值非零解,影响了图像表示的稀疏度,导致计算复杂度太高。Li等[4]在此基础上提出局部稀疏表示的分类算法,在小范围局部求解,降低计算复杂度。陈才扣等[5]延续这一思想,在人脸识别中,采用数据剪辑思想,构造较小的超完备字典,进一步降低算法复杂度。由此看出,字典学习在压缩感知分类中起到决定性的作用。字典学习方法应用于图像分类有2种方式,一种方式利用字典本身的判别性区分样本,另一种方式是利用重构系数矩阵差异进行分类[6]。在稀疏表示字典构造研究中,有解析法和学习法。解析法利用数学工具来构造,如离散余弦、小波相关变换以及参数化字典等[6-7]。在农、林业工程领域,韩安太等[8]提取农业害虫图像的几何、颜色特征参数,构造了解析参数化字典,求解测试样本的重构系数矩阵,利用系数矩阵差异对害虫图像分类。李超等[9]采用解析方法,通过对木材缺陷表面图像做3级双树复小波分解,结合粒子群算法提取低频子带、高频子带、熵等20维特征生成解析字典,利用重构向量的残差对活结、死结等4类常见木材缺陷进行分类,取得较好的效果。学习法构造字典最著名的是Olshausen等[10]学者在《Nature》上提出的Sparsenet字典学习算法,奠定了字典学习的理论基础。之后,Engan等[11]提出了最优方向法(Method of optimal direction,MOD)算法,该算法利用零范数约束稀疏性,采用交替优化方法求解字典。Aharon等[12]提出K-奇异值分解算法(K-singular value decomposition,K-SVD),该算法利用奇异值分解方式迭代更新字典和系数矩阵,简化了字典求解过程,在字典学习领域得到了广泛应用。

YOLO模型的检测速度相当快,不同于滑动窗口区域提取与选择性区域提取方法,YOLO在训练和预测过程中利用全图信息作为网络的输入,经过一次回归便完成了位置和类别的判定,因而YOLO相比其他目标检测算法达到了一个更加快速的检测效果。同时,YOLO能够学习到更加泛化的特征,例如各种遮挡情况下的人脸检测等任务。

针对马铃薯叶片病害图像的分类问题,本研究采用K-SVD算法为每类病害图像构造字典,利用正交匹配追踪算法(Orthogonal matching pursuit,OMP)[13]重构测试图像,并计算均方根重构误差,由于各类字典本身的判别性,同一样本在不同字典下的重构误差不同,最小误差所对应的字典即为测试样本所属种类。这一方法有效克服了特征提取对分类效果的影响,具有相对较小的运算复杂度。

1 材料和方法

1.1 试验材料

本研究以马铃薯病害图像为识别对象,所有原始数据均采集于内蒙古中部周边马铃薯种植区。从马铃薯早疫病、晚疫病、灰霉病3类病害图像样本中各随机选取100张,共300张,图片大小均为128像素×128像素,如图1所示。

  

第1行:早疫病;第2行:晚疫病;第3行:灰霉病

 

图1 马铃薯3种病害图像样本

先将病害图片转换成灰度图像,平均切割成64块大小为16像素×16像素的图像块,之后将每个图像块按列展开,依从左到右、从上到下的顺序排列,得到一个图像样本矩阵,大小为64×256,过程如图2所示。本研究中字典学习、图像重构及分类均采用样本矩阵所示的格式。

1.2 分类算法

每种马铃薯病害随机选取50张128像素×128像素的图片作为训练样本,通过1.1所述的方法,构成训练样本数据集Y。根据文献[12]中推荐,字典第1列参与字典更新,但值保持不变,其他列在迭代中均值保持为0。迭代次数为50次,稀疏度为5,生成的字典矩阵D大小为64×128。马铃薯早疫病、晚疫病、灰霉病样本字典如图4—6所示。图中每小块大小为8像素×8像素,展成1列即为1个字典原子。

  

图2 马铃薯病害图像预处理结果

其中,dj为字典D的原子,为系数矩阵的第j行,差项误差矩阵Ek为字典D的第k个原子缺失所造成的表示误差。为了在式(3)优化求解过程中增加稀疏条件约束,K-SVD不直接对Ek进行奇异值分解,而是通过构造矩阵Ωk压缩Ek只保留中的非零系数作用下的部分。Ωk的大小为N×|ωk|,其中ωk是由中非零值位置索引组成的一维向量,Ωk在[ωk(i),i]处为1,其余位置为0。经过上述变换,问题最终编程如下形式:

 

学校应该建立科学、公正、公开的教学督导评价系统,使广大教师不断提升教育教学能力。通过教学督导,学校可以了解每位教师的教学过程和教学效果,及时发现教师在教学过程中存在的不足,帮助其总结经验,进而提高教学水平。建立科学的评价体系,如以学生为主体、以项目为载体、以能力为目标等,对提高教师教学水平有积极的引导和促进作用。

(1)

程序设计主要分析研究运用TMS320F2812芯片通过配置寄存器等内部资源产生SPWM波形,在CCSv5软件上运用C语言编写程序配置寄存器及三相异步电动机控制算法,并对该硬件设计的可靠性进行测试。

首先进行稀疏编码,假定字典D给定,优化搜索稀疏表示稀疏矩阵X,常用方法有匹配追踪算法(Matching pursuit,MP)[15]和OMP算法[13],以及欠定系统局域解法(Focal underdetermined system solver,FOCUSS)[16-17]等。本研究选用OMP算法进行稀疏编码,该算法将系数编码问题分解为式(2)的优化问题:

 

(2)

在稀疏表示中,OMP算法是求解上述非确定性多项式困难(NP-hard)问题的一种经典贪婪算法[18],基本思想为:通过y与字典D中原子逐一做内积,选取内积最大的原子作为最匹配的原子,经过在该原子方向的正交投影构建一个稀疏逼近,并求出信号残差,然后按照上述方法继续选择与信号残差最匹配的原子,反复迭代,当残差值满足精度要求或稀疏度限制(即迭代次数大于稀疏度),停止迭代,信号y表示为上述匹配原子的线性组合。OMP算法中,每次分解均对匹配原子组进行正交化处理,增加了算法的收敛速度。

subject to ∀i,‖xi0T0

K-SVD算法第2个步骤为字典更新过程,式(1)中系数矩阵X由OMP算法求解给定,通过K次SVD分解逐列、逐行更新字典和非零系数。基本思想是将式(1)中DX分解为K个秩为1的矩阵之和,形式如下:

 

(3)

K-SVD算法受启发于K均值聚类算法,K均值聚类算法相当于K-SVD的特殊形式,即只能有一个字典原子参与重构,而且重构系数为1。学习字典问题可归结为求解式(1)的优化问题:

 

(4)

字典学习中,迭代次数影响生成字典的重构效果,以马铃薯早疫病字典学习为例,早疫病图片样本字典学习重构误差与迭代次数的关系如图7所示。从图7可看出,当迭代到40次以上时,重构误差RMSE已经稳定在0.018 6左右,说明K-SVD算法具有较好的收敛性和较强的稀疏表示能力。

本研究通过上述方法学习生成马铃薯早疫病、晚疫病、灰霉病图像的过完备字典D1、D2、D3,待分类测试样本采用OMP算法分别用D1、D2、D3重构,重构误差用均方根误差RMSE表示,由于3种病害字典本身的差异性,最小的重构误差所对应的字典类别即为分类结果,算法结构如图3所示。

  

图3 马铃薯病害分类算法结构

2 结果与分析

2.1 字典学习结果分析

基于稀疏表示的分类器SRC是最早使用字典进行识别的模型,该模型认为测试样本在重构时,非零系数集中于同类样本的字典原子,其他原子系数为零,并利用这一差异进行分类[14]。基于这一思想,本研究采用K-SVD算法,每类病害随机抽取50个样本训练,学习得到早疫病、晚疫病和灰霉病各自的过完备字典,字典矩阵的大小为64×128。

  

为了增强可视化效果,图中对字典非零元素进行了标度缩放,下同

 

图4 马铃薯早疫病字典D1

  

图5 马铃薯晚疫病字典D2

在式(4)中,对进行奇异值分解得到U的第一列作为更新后的字典原子的第一列与Δ(1,1)的乘积近似为系数向量按照上述方法,经过K次奇异值分解,可得到更新后的字典D。交替重复OMP稀疏编码和K-SVD字典更新过程,直到重构误差精度符合要求或达到设定的迭代次数,停止迭代过程,学习得到过完备字典D

其中,Y表示训练样本集为字典,X为系数矩阵为系数矩阵X的稀疏度(即信号重构时所需原子数目或系数中非零元素个数),当采用λ0-范数时,T0xi中非零元素个数最大值,K-SVD算法将求解式(1)的优化问题分解为稀疏编码和字典更新2个步骤,交替优化求解系数矩阵X和字典D

  

图6 马铃薯灰霉病字典D3

  

图7 字典重构误差与迭代次数的关系

OMP算法在图像重构过程中,系数稀疏度(即信号重构时所用字典中原子个数)参数的选择对重构效果有较大影响,随着参与重构系数个数的增加,即稀疏度数值增加,重构误差逐渐减小,以马铃薯早疫病样本为例,从未参与字典学习的早疫病图片中任选一个样本进行重构,图8描述了系数稀疏度与重构误差的关系,稀疏度数值越大,即重构使用的原子越多,重构误差越小,当稀疏度达到6时,RMSE已经小于0.02。图9显示了不同稀疏度下的重构效果,当稀疏度为1时,重构图像块效应显著、严重失真(图9b),稀疏度增大到5时(图9d),重构图像的细节相比于稀疏度3(图9c)更为清晰,当稀疏度增加到8(图9e)、10(图9f)时,图像重构误差下降明显。

本研究从每类样本中分别选择10张未参与字典学习的样本,采用OMP算法进行重构,兼顾数据压缩效率及分类要求,稀疏度设置为5,早疫病、晚疫病、灰霉病平均重构误差分别为0.023、0.021、0.019,能够满足本研究的分类要求。

  

图8 字典重构误差与稀疏度的关系

  

图9 不同稀疏度下的重构效果对比

2.2 分类结果分析

字典学习方法应用于图像分类核心思想是利用字典本身的判别性区分样本或利用重构系数矩阵差异进行分类,本研究利用3类病害字典本身的差异性,将待测样本(未参与字典学习的病害图片)用OMP算法分别在3个字典上单独重构,重构误差小的字典对应的类别定义为待测样本类别。以早疫病样本为例,测试样本在不同稀疏度设定条件下采用不同字典重构的误差如图10所示。从图10可以看出,早疫病样本在稀疏度大于3以后,采用早疫病字典D1重构的误差RMSE明显小于采用晚疫病、灰霉病字典,在稀疏度为5时,3个字典作用下的重构误差的差距尤为明显,对分类效果影响最为显著。因此,本研究中稀疏度参数设置为5。此外,图11、12分别给出了晚疫病、灰霉病样本在不同字典下的重构误差。

  

图10 马铃薯早疫病测试样本在不同字典下重构误差与稀疏度的关系

  

图11 马铃薯晚疫病测试样本在不同字典下重构误差与稀疏度的关系

  

图12 马铃薯灰霉病测试样本在不同字典下重构误差与稀疏度的关系

本研究通过将每类病害样本中50个测试样本构成数据集进行分类测试,每类病害分类准确率如表1所示,平均正确率达到95.33%。

 

表1 马铃薯病害分类准确率 %

  

判定结果测试样本早疫病晚疫病灰霉病早疫病9610晚疫病4955灰霉病0495错误率455

同时,还提取病害图片的颜色特征,病斑的形状、纹理特征,包括R、G、B均值,病斑周长,面积比,圆形度以及能量、熵、反差度等特征参数,利用支持向量机分类器进行病害识别,识别准确率达到92%,低于本研究所用算法的识别准确率。而且,基于人工特征提取的方法,识别准确率严重受限于特征选择,病斑的分割、平移、缩放、光照干扰等会严重影响特征值的计算。本研究采用的基于字典学习的分类方法,自学习图像特征,有效避免了人工特征提取对分类结果带来的不确定性。

3 结论与讨论

本研究基于字典学习方法,采用K-SVD算法学习马铃薯分类病害字典,根据字典本身的差异,应用OMP算法重构病害图片,计算重构均方根误差,重构误差最小的字典所属类别判定为样本类别,通过试验看出,该方法具有较高的分类准确率和可靠性,平均正确率为95.33%。基于K-SVD算法的字典学习在Intel Core i5 CPU上进行运算,2.3 GHz,内存4 G,50张128像素×128像素的图像样本组成训练集,迭代50次大概用时10 min,重构算法用时较少。由于字典学习在建模时进行,分类识别过程中只需重构待分类样本,求解比较均方根误差就能完成,算法具有较好的时效性。

说明 设计上述两问的积极意义在于全面揭示构造直角三角形的不同视角和结合条件进行优化选择的思维方式,减少作垂线的盲目性与随意性.

然而,马铃薯病害种类多,叶片、茎、块茎等部位均有病害症状,病害除本研究列出的早疫病、晚疫病、灰霉病,还包括炭疽病、小叶病、青枯病、叶斑病、病毒病,块茎部位还有癌肿、根腐、黑痣、疮痂病等,随着病害种类增加,在算法测试中笔者发现存在如下问题。

在泛雅平台中将传统的“课堂教学结合多媒体”教学模式,过渡到“MOOC—学生自主学习—开放式自学方式”的模式。将学生转移为教学中心的指导思想,通过平台实施“学+做”模式。通过“精讲多练”的形式调动学生对学习的积极性,提高教学效率且强化实践教学、提高教学质量。即上课实验合并在富媒体教学中同步进行,增加基于网络信息传播的自主教学。[4]

首先,K-SVD算法学习字典结构性不强[19],冗余度较高,原子之间的相关性较高,随着病害种类增多,不同字典间的相关性也会增加,导致重构误差区分度有所下降。针对这一问题,笔者正在尝试采用改进的K-SVD算法降低重构字典原子之间以及不同字典之间的相关性[20],提高不同字典重构误差的区分度,改善分类效果。

维宁尔(veoneer)的前身是全球汽车安全领域的领导者瑞典奥托立夫(Autoliv)公司的电子事业部。维宁尔(中国)电子有限公司专注于汽车安全电子及自动驾驶等新兴市场业务,维宁尔的目标是成为高级驾驶辅助系统(ADAS)和自动驾驶系统的领先供应商。维宁尔(中国)电子有限公司积极顺应市场需求,着力研发相关产品,以期成为汽车安全电子产品市场的领导者。

其次,本研究提出的分类算法,计算时间集中在样本重构运算,由于测试样本需要同每一个原子进行重构,导致计算时间随字典数量增加而线性增长,虽然在本研究中对时效性要求较低,但大大限制了该算法在大数据集分类中的应用。针对这一问题,笔者正开展构建单个低相关性综合字典的研究,利用重构系数的差异进行分类识别。

气缸是实现键槽凸模间歇工作、换位的动力元件,其作用是保证模具的正常换位而不影响其他各部分元件的正常工作。在试验时,上模座按图3示意安装放置,气缸在推进过程中,克服斜楔自重和压簧压力产生的摩擦阻力,达到最大行程。

参考文献:

[1] Donoho D L.Compressed sensing [J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.

[2] Candes E J,Tao T.Near optimal signal recovery from random projections: Universal encoding strategies[J].IEEE Transactions on Information Theory,2006,52(12):5406-5425.

[3] Wright J,Yang A Y,Ganesh A,et al.Robust face recognition via sparse representation[J].Pattern Analysis and Machine Intelligence,2009,31(2):210-227.

[4] Li C G,Guo J,Zhang H G.Local sparse representation based classification [C]//The 20th international conference on pattern recognition.Istanbul:IEEE,2010:649-652.

[5] 陈才扣,喻以明,史俊.一种快速的基于稀疏表示分类器[J].南京大学学报(自然科学版),2012,48(1):70-76.

[6] 练秋生,石保顺,陈书贞.字典学习模型、算法及其应用研究进展[J].自动化学报,2015,41(2):240-260.

[7] 练秋生,韩冬梅.基于卷积稀疏编码和K-SVD联合字典的稀疏表示[J].系统工程与电子技术,2012,34(7):1493-1498.

[8] 韩安太,郭小华,廖忠,等.基于压缩感知理论的农业害虫分类方法[J].农业工程学报,2011,27(6):203-207.

[9] 李超,张怡卓,刘思佳,等.基于PSO优选特征的实木板材缺陷的压缩感知分选方法[J].北京林业大学学报,2015,37(7):117-122.

[10] Olshausen B A,Field D J.Emergency of simple-cell receptive field properties by learning a sparse code for natural images[J].Nature,1996,6583(381):607-609.

[11] Engan K,Aase S O,Husoy J H.Method of optimal directions for frame design [C]// Proceedings of the 1999 IEEE international conference on acoustics,speech,and signal processing. Phoenix AZ:IEEE,1999:2443-2446.

[12] Aharon M,Elad M,Bruckstein A M.The K-SVD: An algorithm for designing of overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.

[13] Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Transactions on Information Theory,2007,53(12):4655-4666.

[14] 张善文,孔韦韦,王震.基于稀疏表示字典学习的植物分类方法[J].浙江农业学报,2017,29(2):338-344.

[15] Mallat S,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.

[16] Gorodnitsky I F,Rao B D.Sparse signal reconstruction from limited data using FOCUSS:A re-weighted minimum norm algorithm[J].IEEE Transactions on Signal Processing,1997,45(3):600-616.

[17] 杨鹏,闫飞,张胜辉,等.基于FOCUSS算法的稀疏阵列综合[J].电子科技大学学报,2014,43(2):203-206.

[18] 赵知劲,张鹏,王海泉,等.基于OMP算法的宽带频谱感知[J].信号处理,2012,28(5):723-728.

[19] 何小卫,张莉.基于稀疏表示的图像分类字典学习[J].浙江师范大学学报(自然科学版),2015,38(4):402-409.

[20] Ramirez I,Sprechmann P,Sapiro G.Classification and clustering via dictionary learning with structured incoherence and shared features[C]//Proceedings of the 2010 IEEE conference on computer vision and pattern recognition.San Francisco,USA:IEEE,2010:3501-3508.

 
赵建敏,芦建文
《河南农业科学》 2018年第04期
《河南农业科学》2018年第04期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号