更全的杂志信息网

EM算法在极化合成孔径雷达影像分类中的应用

更新时间:2016-07-05

1

极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,POLSAR)是获取遥感信息的一种新型技术平台。目前常用的极化方式有四种,分别是HH、HV、VH、VV。通过这四个极化通道获取的地物信息比原来单极化合成孔径雷达更加丰富、全面。极化合成孔径雷达的显著优势是它能获得目标的全极化散射特性[1],而目标的全极化散射特性又与目标本身的形状结构、物理属性之间有着本质的联系,这为图像解译提供了丰富的信息。

目前,国内外学者已经就极化SAR影像分类做了一系列的研究。在进行SAR影像分类时,往往需要提取目标的散射特性[2]。因此,许多分类方法都是在极化分解的基础上进行的,比如采用由散射矩阵分解出的协方差矩阵或相干矩阵作为参数进行分类[3]。1997年,Cloude等人提出了一种基于部分相关目标分解的H-α分类。该方法将极化散射特性用由Hα组成的分类平面上的某一点位置来描述。但由于物体散射机理与地物目标并不是一一对应的关系,所以H-α分类结果存在地物类别模糊的问题[4]。目前主要有两种途径来弥补这一问题,一是引入其他参数,二是Hα与其他分类算法相结合[5]。引入恰当的其他参数与算法结合也能弥补H-α分类的不足[6]。2007年,曹芳、Kimura等人尝试着用总功率SPAN、极化熵H、各向异性度A和散射角α这四个参数进行全极化SAR影像的分类研究[7],取得了较好的分类效果。该方法分类取得了一定的效果,但仍然存在海洋和植被等地物易出现错分类的现象,而且其地物细致结构也不够清晰。此外,各参数与数学算法的结合能弥补H-α分类的不足,可以尝试将各参数与FCM算法、EM算法等结合进行极化SAR影像分类。其中,EM算法是一种在缺失数据情况下对未知数据进行估计的算法,具有简单,易实现,稳定的特点[8]

本文在H-α平面划分的基础上,引入HαASPAN参数,与EM算法结合进行极化SAR影像分类研究。

2 基本原理

2.1 EM算法原理

期望最大化(Expectation-Maximization,EM)算法是一种在数据缺失的情况下,对缺失数据进行估值的一种算法。EM算法假设数据符合某种分布,利用已知数据和最大似然方法对该分布的参数期望值进行估计,进而估计出缺失数据。

假设X为已知数据,Y是丢失数据,为分布参数。可定义函数期望似然值函数Q为:

首届中国国际进口博览会于11月10日闭幕,当日召开的闭幕新闻通气会上透露,本届进口博览会交易采购成果丰硕,按一年计,累计成交578.3亿美元。本届进博会共吸引了172个国家、地区和国际组织参会,3600多家企业参展。

(1)

式(1)中,i为第i次估值过程中的分布参数,E表示期望值,Q为数据的期望似然值。EM算法的核心思想就是通过不断地迭代,使Q最大化,以达到收敛,实现参数和丢失数据的精确估值。EM算法主要包含了两个步骤:

E步:估计参数和未知数据,计算p(Y|Xθi-1)和期望似然值;

(3)利用H-α的平面分布将影像初步分为八类,获得初始化的聚类中心和相关模型参数(均值μ,方差σ);

散名之在人者:生之所以然者谓之性。性之和所生,精合感应,不事而自然谓之性。性之好、恶、喜、怒、哀、乐谓之情。情然而心为之择谓之虑。心虑而能为之动谓之伪。虑积焉,能习焉而后成谓之伪。正利而为谓之事。正义而为谓之行。所以知之在人者谓之知。知有所合谓之智。所以能之在人者谓之能。能有所合谓之能。性伤谓之病。节遇谓之命。

作为一个在含有隐含变量的模型中常用的估值算法,最常见的是用于高斯混合模型(Mixtures of Gaussians)下的聚类。EM算法实现简单,数值计算稳定,占资源较少,并具有良好的全局收敛性,用于图像分类已被验证能达到良好的效果[9]

课堂里,应该要有思想碰撞、有答辩、有争先恐后的提问。师生在上课,同时又是在享受上课。情情相融、心心相印;每一个人都会彻底打开自己的生命,让生命中的每一个细胞、每一寸肌肤去感受、去触摸、去体认课堂中的每一个当下;率性而为,一起欢笑、一起流泪、一起沉思、一起震撼……

2.2 H/α/A/SPAN参数

散射矩阵S描述了地物目标的散射特性。在互易情况下,多视数据的S矩阵经过Pauli基分解得出一种散射矢量k,由散射矢量k进行相干统计平均,便可得出相干矩阵T

Cloude等人根据特征和散射机理,定义出地物目标的极化熵H和散射角α。其定义表达式如下:

(2)

式(2)中的上标“T”表示转置。

鉴于参赛果农的热情,当天大赛的开始时间不得已后延了一个多小时。最后,安庆杰宣布威县首届特色果品品牌文化节暨“根力多杯”梨王&葡萄王争霸赛正式拉开帷幕。

(3)

式(3)中,N为视数,H为共轭转置。

易知,T为3×3的半正定Hermit复矩阵。则矩阵T必有三个特征值,分别为λ1λ2λ3,其中λ1>λ2>λ3。与λi对应,T有三个特征向量:

ui=ei[cosαi,sinαicos βiei,sinαisin βiei]T

(4)

其中αi表示目标散射类型。

分别取支护结构表面、截面中心和围岩交界面作为关键点,分析支护结构施工2 d的温度变化过程,该阶段由于围岩源源不断向支护结构传递热量,支护结构在靠近围岩侧温度不断上升;而支护结构表面温度随环境温度变化,温度变化相对较小。由此造成随着时间延长内外温差不断加大的趋势,在施工初期的支护结构内外温差为0℃,12 h达到了31.79℃,24 h为48.15℃,48 h为52.86℃;12h内温差升高了31.79℃,平均温差速率为2.65℃/h,是温差快速形成期;12~24 h之间平均温差速率为1.36℃/h,24~48 h之间平均温差速率为0.20℃/h。

目标极化熵H描述了地物目标散射的无序程度,散射角α则描述了地物目标的平均散射机制。极化熵和散射角的组合成的H-α分布可以描述地物目标的基本散射机制[5]。将H-α分布显示在二维平面内,该特征平面可以划分成8个有效区域,如图1所示。

1 H-α平面

利用H-α平面可以对SAR影像进行初步的分类,该分类方法简单,容易实现,但其分类结果往往无法清晰地区分地物,所以该方法通常作为一种快速初分类的方法。

(6)判断是否满足终止条件,即是否达到最大循环次数或者似然值变化幅度是否小于阈值。若不满足,则循环进行E步、M步;若满足终止条件,则退出迭代;

注意睡姿:身睡如弓效果好,向右侧卧负担轻。由于人体的心脏多在身体左侧,向右侧卧可以减轻心脏承受的压力,同时双手尽量不要放在心脏附近,避免因为噩梦而惊醒。此外不要蒙头大睡或张大嘴巴,睡觉时用被子捂住面部会使人呼吸困难,导致身体缺氧;而张嘴吸入的冷空气和灰尘入会伤及肺部,胃部也会受凉。

极化熵H能反映小范围内的总体散射极值的信息,但对于熵值较小时,散射熵无法反映两个较小特征值λ2λ3的关系,所以Cloude等人定义反熵A来反映λ2λ3的关系。此外,总功率SPAN能反映不同地物的散射强度,有利于区分地物的纹理和边缘特征。

(5)

SPAN=λ1+λ2+λ3

(6)

本文利用H-α对SAR影像进行初分类,然后结合HαASPAN四个参数,采用EM算法对极化SAR影像进行精细地分类。

Q(θiθi-1)=E[logP(XY|θi)|Xθi-1]

3 基于EM算法的极化SAR影像分类流程

本文将高斯模型下的EM算法结合HαASPAN四个参数应用于极化SAR影像分类。高斯模型的主要参数包括均值μ,方差σ。分类流程如图2所示。

2 EM算法分类流程

②渡槽槽身渗漏严重,钢筋多处暴露且严重锈蚀;隧洞衬砌拱顶渗漏溶蚀较严重;水闸启闭设备老化严重甚至缺失;10余座桥梁因损坏需拆除重建。

(1)采用Lee滤波法3×3的窗口对SAR影像进行滤波;

本文的EM算法分类的实验步骤如下:

(2)提取滤波后影像的极化熵H、散射角α、反熵A和功率SPAN四个参数;

M步:使期望似然值更新为最大值,即取θi=argmaxθQ(θiθi-1)。

在实际的变电运维过程中,其复杂性特点决定了设备发生故障和事故的频繁性,从而导致了需要经常对设备进行检修,也即其频繁性。

(4)进行E步,重新估计各个模型参数;

(5)进行M步,计算当前模型参数下的似然值,与原来模型对应的似然值进行比较,将最大值赋予;

在学生进入校园的第4周数学拓展课上,笔者带去了一个自制的超级大的魔方。在学生的众目睽睽之下,笔者麻利地进行了魔方六面还原。在六面还原的刹那,他们情不自禁地鼓起掌来。从学生的表现来看,他们对魔方已经有了兴趣。之后,笔者告诉他们,只要不断去实践探索,也能像老师那样厉害,而且一定会有人最后比老师还厉害。学生跃跃欲试,心中已经播下“魔方很有趣、很神奇”的种子。以魔方材料为中心的任务性学习也由此展开。

(7)根据最终估算出的模型参数对影像进行判别归类。

4 实验结果分析

为验证本文所研究方法的效果,选取了NASA-JPL AIRSAR于1992年在美国加州旧金山海湾(San Francisco Bay)获取的全极化SAR影像进行实验。实验数据的大小为650×600像素。该区域主要包括城区、山区、海洋、植被、金门大桥等地物目标。图3为实验区的Pauli合成图。

施工采取“一炮一喷锚,短开挖快封闭支护”的措施,有效地控制了围岩松动、岩石掉落等失稳现象的发生。特别是桩号8+530~8+640段短时间内频繁掉块,后加强一次支护,采用I18工字钢间距0.8 m,共138榀,Φ8网格0.2 m×0.2 m双层钢筋网,C25喷射混凝土24 cm厚,Φ22锚杆深入基岩2 m,间距1 m排距0.8 m成梅花状布设,连接筋采用Φ22,间距1 m,保证了工程质量、进度和安全。

3 Pauli合成图

如图4所示,可以看出该方法对地物的细节描述比较模糊,尤其是城区和森林等部分,纹理信息缺失严重,边缘不清晰。这是因为海洋表面的极化熵值绝大部分属于中低熵值,且海洋表面相对简单平坦,其散射机制多为单次散射。而森林与城区的地表情况比较复杂,这些地区的极化熵则多属于中高熵,散射机制多是二次散射或多次散射。

4 H-α初分类图

Paul R,J.S Lee等人根据H-α对极化SAR影像的初分类结果,采用协方差矩阵与EM结合进行再分类,其结果如图5所示。这种分类方法取得了一定的效果。但是可以发现,采用该方法,海洋、山区和植被三类地物出现较严重的错分类现象,马球场等草地有许多误分类斑点,城区地物的纹理和细节也不够清晰。

5 EM算法结合协方差矩阵分类图

为了进一步改善分类精度,本文采用散射熵H,散射角α,反熵A和功率SPAN四个参数与EM算法结合进行分类。因为反熵A反映了T3矩阵3个特征值中λ2λ3的相对关系,而且当熵值较高时,反熵发挥的作用更明显。基于这个特点能更好地区分城区、植被等地物。功率SPAN反映地物目标的散射强度,通过SPAN图可以看出地物的明亮程度。将地物的物理散射机理和极化SAR影像中的空间纹理信息结合起来,能够更为细致地描述目标,获取更多的地物细节,从而有利于不同地物的区分[10]。从图5、图6的对比分析可以看出,EM算法结合H/α/A/SPAN参数的分类效果优于EM算法与协方差矩阵结合的分类效果,能够更好地区分海洋、山区和植被,错分类现象较少,如马球场等草地植被出现的错分类斑点较少,城区地物的细节和纹理也较为清晰。

6 EM算法结合H/α/A/SPAN分类图

本文根据地物目标的实际情况,将已分的8类地物合并成4类:人工建筑、高层植被、海洋、草地和低矮植被。合并后的分类图如图7、图8所示。

7 EM算法结合协方差矩阵分类图

8 EM算法结合协方差矩阵分类图

不同方法的分类精度对比(%) 1

分类方法分类精度人工建筑高层植被海洋草地和低矮植被总体精度Kappa系数EM算法结合协方差矩阵89.8976.9187.5185.0887.930.80EM算法结合H/α/A/SPAN87.3097.8099.1379.3192.840.90

从表1可以看出,EM算法结合H/α/A/SPAN参数的分类结果总体精度和Kappa系数都高于EM算法与协方差矩阵结合的分类结果。

5

本文将EM算法结合散射熵H,散射角α,反熵A和功率SPAN这四个参数进行极化SAR影像分类。实验结果表明EM算法与H/α/A/SPAN参数结合比与协方差矩阵结合能更好地区分地物类别,改善分类精度。

参考文献

[1] 宋才秀. 基于地物散射特性分析的机载极化SAR分类研究[D]. 长沙:中南大学,2012.

[2] 何楚,刘明,许连玉等. 利用特征选择自适应决策树的层次SAR图像分类[J]. 武汉大学学报,2012,37(1):46~49.

[3] 赵伟颖. 极化SAR监督分类方法对植被分类效果比较分析[C]. 第九届长三角科技论·测绘分论坛,2012:117~120.

[4] 姜媛. 极化SAR图像特征提取与分类方法研究[D]. 成都:电子科技大学,2016.

[5] 周晓光,匡纲要,万建伟. 极化SAR图像分类综述[J]. 信号处理,2008,29(5):806~811.

[6] 吕宏昌. 极化SAR图像分类研究[D]. 西安:西安电子科技大学,2015.

[7] 曹芳,洪文,吴一戎. 基于Cloude-Pottier 目标分解和聚合的层次聚类算法的全极化SAR数据的非监督分类算法研究[J]. 电子学报,2007,36(3):543~546.

[8] 安永辉. EM算法的研究及其在文本处理中的应用[J]. 现代计算机,2013,4(上):3~8.

[9] 邱浩. 基于EM算法的医学影像数据的分类研究[D]. 长沙:湖南师范大学,2016.

[10] 付仲良,张文元,孟庆祥. 灰度和纹理特征组合的SAR影像SVM分类[J]. 应用科学学报,2012,30(5):498~504.

隋克林
《城市勘测》 2018年第2期
《城市勘测》2018年第2期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号