更全的杂志信息网

基于地理加权回归模型的水深反演算法研究

更新时间:2009-03-28

0 引言

精准的水深信息对于水下地形和沉积物运动的监测、水上航运等有着至关重要的作用[1]。传统水深测量方法以船载声呐进行测深为主,其精度高,技术较为成熟,但作业耗时、耗力,相对成本较高且对于危险海域及存在争议复杂区域,无法适用。多光谱遥感水深反演技术通过建立实测水深和水底反射能量之间的关系,对未知水深进行反演,具有覆盖面广、实效性强、经济性好等特点,从而一定程度上弥补了传统方法的不足[2]

基于多光谱数据的水深反演研究最早起源于20世纪60年代末,POLCYN et al[3]建立基于底部反射率的水深反演模型,提出遥感器接收的经大气和水体的水底反射辐射能量与水深成反比,奠定了遥感水深反演的理论基础。MUELLER et al[4] 在假设研究区海底底质反射率一致及水体衰减系数相同前提下,利用单波段模型进行了水深反演。LYZENGA[5-6]在光随水深呈指数递减、水质均匀的假设条件下,提出了线性回归模型。遥感水深反演的关键在于处理水质、底质以及大气条件带来的影响,其中大气问题目前可通过大气校正的方法解决,因此消弱水深反演中的水质和底质差异的影响成为热点。闫峰 等[7] 将泥沙因子引入水体遥感反演模型中,建立的水深反演模型削弱了悬沙的影响。DONG et al[8]采用主成分分析的方法对底质进行分类,使不同底质拥有不同的反演参数,提高了反演精度。DOXANI et al[9]根据研究区水底海草的生长情况将研究区分类,在各区域分别建立模型,也获得较好的反演结果。王艳娇 等 [10]建立的BP人工神经网络模型,较好地反演出长江口南港河段的水深分布情况。张鹰[11]针对影响水深反演因素提出“水深综合影响因子”概念,利用研究成果进行水下地形和冲淤变化分析。党福星 等[12]对多波段水深遥感进行了研究,并应用于我国南海岛礁的水深计算,通过采用划分底质类型的方法来提高模型反演水深的精度,对浅海水深地形研究有很好的应用价值。陈鸣 等[13]结合长江口水域的水沙特性,建立了长江口遥感水深的分段模型。

不同地理位置水质和底质差异的问题导致水深和水底反射率构成的线性关系不成立,这种现象,在空间分析上称之为空间非平稳性(spatial nonstationary),实际应用中发现,各种非线性模型更加适用于水深反演。地理加权回归(Geographically Weighted Regression, GWR)模型将空间结构嵌入到线性回归模型中,相比于线性回归模型,地理加权回归模型更适宜处理空间非平稳性问题。SU et al[14] 分别在Kauai 和Barbuda岛近海水域应用GWR模型进行水深反演都得到较好的结果。但在GWR模型中采用自定义的方法确定带宽,在实际操作中,在不同研究区域带宽往往不同,很难取到合适参数。覃文忠[15] 研究发现GWR模型对带宽较为敏感,带宽较大,模型过于光滑,导致整个研究区模型参数趋于近似,回归参数估计的偏差较大;带宽较小使模型过于不光滑,局部样点之间不存在相互影响,导致回归参数估计的方差过大。本文使用GWR模型,研究不同海底底质和水质影响下提高水深反演精度的方法,以及GWR模型中的最佳带宽确定模型,使用永兴岛和甘泉岛的遥感和水深数据,对该方法进行了验证。

1 地理加权回归模型

1.1 基本模型

LYZENGA[5]结合光辐射在水体传输的特点,在前人模型基础上提出多波段线性回归模型,数学表达式为:

 

(1)

其中:为模型拟合水深,z为参考水深值;v为随机误差;为模型参数;Lw(λi)为遥感器接收到的波段λi的离水反射辐亮度;L(λi)为深水区反射率。

多波段线性回归模型在整个研究区域回归系数恒定不变。GWR模型的回归系数通过对邻近样本数据进行局部加权回归得到,随着空间位置变化而变化。GWR模型数学表示如下[14]

 

(2)

GWR模型要先确定带宽,结合样本点数,设置带宽范围在2~200区间,步长为1,计算对应的CV值,选取CV值最小对应的带宽作为最佳带宽,得出永兴岛研究区最佳带宽为24,甘泉岛研究区最佳带宽为37。为验证交叉验证模型确定带宽的准确性,选取14组带宽(b=10,15,20,25,30,35,40,45,50,55,60,100,150,200)进行对比实验,精度评价结果如图4和图5所示。从综合反演结果的RMSER2来看,永兴岛和甘泉岛研究区误差最大的情况均出现在带宽b=10处,RMSE分别为2.371 m和2.815 m,R2分别为0.751 4和0.785 0。误差最小值出现在b=25和b=35处,对应RMSE分别为1.889 m和1.620 m,R2分别为0.822和0.927,与交叉验证结果得到最佳带宽基本一致。同时,结果显示当带宽小于最佳带宽时,随着带宽增加,两区域反演结果误差缩减均较为明显,而当带宽大于最佳带宽时,随着带宽增加,两区域误差均有增大趋势,甘泉岛研究区误差增幅一直较低,永兴岛带宽在25~60区间误差增幅较低,而在100~200区间增幅较为明显。

zj+v=α0j+α1jw1j+α2jw2j+…+αNjwNj

(3)

图6和图7反映了两种模型反演水深结果与参考水深偏离情况,4组数据水深点整体均匀分布在趋势线两侧,永兴岛研究区GWR模型判定系数(R2)为0.821 9,比线性回归模型提高了46%;甘泉岛研究区GWR模型判定系数(R2)为0.926 6,比线性回归模型提高了1.2%,两个岛屿GWR模型(图7)判定系数均高于线性回归模型(图6)。表2统计了两种模型的误差情况:永兴岛研究区GWR模型均方根误差为1.889 m,较线性回归模型误差降低了36.05%;甘泉岛研究区GWR模型均方根误差为1.558 m,误差降低了8.08%;GWR模型RMSE均小于线性回归模型。

 

(4)

以活化后的目的菌株菌落为模板,细菌按照DP302试剂盒提取DNA,进行PCR扩增16S rDNA片段,引物为细菌16S rDNA通用引物,引物序列如下:

 

(5)

求得所有模型参数:

 

(6)

1.2 权重函数

式中: zi为(xi,yi)处的参考水深值;为去掉zi后,利用加权最小二乘法求得的在(xi,yi)处的反演水深值。选择b0,使得:

式中:

 

(7)

由式(7)可知,b较大时,权重随距离增长衰减的速度减慢,由于子集区域设置过大,导致与反演点处底质和水质不同的水深点也对回归系数的估计造成影响,并且与反演点处底质和水质较为接近处的水深点对系数估计影响减弱;反之,b较小时,权重随距离增加衰减的速度加快,此时,子集区域设置较小,导致与反演点环境接近的水深点未能全部参与回归系数估计,从而影响最终反演结果。因此,合适的带宽对于GWR模型极为重要。交叉验证(Cross Validation,CV)方法是CLEVELAND[16]于1979年提出的用于局域回归分析的方法,该方法表达为:对于带宽为b的模型,CV值为:

根据图2,对水库大坝而言,宜按3 000人作为重大事件,作为后果分类标准Ⅱ类的下限。当风险人口超过30 000人时,应为特别重大事件,作为后果分类标准Ⅰ类的下限。而300~3 000人之间是多发事件所对应的转移人口数量,可考虑作为后果分类标准Ⅲ类。低于300人时可作为一般事件,作为后果分类标准Ⅳ类。综合考虑采用上述风险转移人口分级标准是基本合适的。最终确定的小型水库后果分类标准见表2。

1.3 带宽的确定

式中:dij 为水深样本点间距离,b 为带宽,具体表现为反演点周围的样本数,db 为反演点到第b 个最近邻点的距离。利用bi-square权重函数,GWR模型可以根据带宽b将研究区分为若干子区域,样本点间距离越小,赋予权重也越大。另外,采集的水深样本不能保证分布足够均匀,带宽b为样本点数,可以防止反演点周围样本过多或过少的情况出现。

企业的最核心对象是个人。不管在一个小团队还是一个大企业当中,都需要大家的共同努力、配合,才能实现最终的目标!一个企业想要更好的发展和创造出更多的财富还需取决于管理制度是否合理完善,更重要的是能否充分发挥个人的创造性和主动性。企业“精细管理、以人为本”本质上是以塑造员工个人的主动性、创造性及积极性的管理,需将员工的全面发展作为经济活动的最高目标。一个持久健康发展的企业需要有以人为主体的前提和“精、细、准、严”的精细化管理举措。

 

(8)

GWR模型的核心是权重函数。空间分析中认为距离回归点越近的观测值对其回归系数估计影响越大,而对于水深反演,水深样本点间距离越近,底质和水质差异性也越小,因此应该优先考虑离反演点较近水深点的影响。在实际中最常采用的是bi-square函数作为权重函数,具体公式如下:

CV(b0)=min [CV(b)]

(9)

b0即为交叉验证方法确定的最佳带宽,实际操作中选用一系列b值计算相应CV值,选取CV值最小时对应的b值。交叉验证法将每个样本单独作为测试集,剩余的n-1个样本作为训练集,得到n个模型,计算这n个模型的误差平方和的平均值作为衡量带宽优度的指标,由于几乎所有的样本都被用来训练模型,理论上交叉验证模型确定的最佳带宽较为可靠。

西南联大时期,大家生活都很困难,难以为继。梅贻琦校长千辛万苦向教育部要来一笔学生补助金,按规定,他家四个孩子都有资格申请,可是他却一个不准沾边,就是为了避嫌,不让人说闲话。其实,那个时候他的家用相当拮据,早已捉襟见肘,寅吃卯粮,可他宁肯举债,变卖家产,或让夫人磨米粉,做米糕,提篮小卖去补贴家用,也不涉“瓜田李下”之地。因而他在师生中享有崇高威望,带领大家共度时艰,培养了大批优秀人才,铸就了中国教育的一段辉煌历史。

1.4 精度评价

为定量比较两种模型反演效果,选择判定系数(R2)和均方根误差(RMSE)两个统计参数来进行评估。具体公式如下:

由图1可以看出,混交度的分布频率随着混交等级的增高而增大。从表1可以看出,全林分的平均混交度是0.7676,属强度混交向极强混交过渡状态,其中极强混交占48.4%,强度混交占24.4%,两者合计占72.8%,处于零度混交和弱度混交的林木相对较少,两者之和约10%,说明整体林分处于高度混交状态。

 

(10)

 

(11)

式中:yi 为反演水深值, 为参考水深值, 为反演水深的平均值,n为水深点数。R2反映的是反演结果与实际水深的拟合程度,R2越大,拟合程度越高,模型效果越好。 RMSE反映反演结果与实际值的偏离程度,其值越小,模型效果越好。

2 实验及结果分析

2.1 研究区概况及数据准备

本文选取中国南海海域的永兴岛和甘泉岛作为研究区,永兴岛海域研究区面积约为12 km2,平均水深10.1 m;甘泉岛海域研究区面积约1.5 km2,平均水深8.2 m。两区域水质均较为清晰,适于进行水深反演实验。遥感数据选用WorldView-2影像的蓝、绿、红 和近红外四个波段数据,永兴岛水深数据来自Navionics网站web电子海图(图1),甘泉岛水深数据来自LiDAR,具体数据信息见表1。

利用ENVI软件对遥感影像进行辐射定标和大气校正等预处理,消除大气、光照等引起的噪声影响。对于海图数据,借助ArcGIS软件,在岛上选取4个特征点作为控制点,实现遥感影像与海图的地理配准。最后提取水深数据和相同地理位置上的影像辐亮度,两区域均选取500个样本点,其中300个样本作为模型训练样本,200个样本作为检查样本。水深样点分布情况见图2和图3。

2.2 实验结果与分析

以WorldView-2四个波段灰度值(以B1、B2、B3和B4分别表示蓝、绿、红和近红外波段灰度值)的对数为自变量,利用训练样本点水深数据及相应影像辐亮度分别建立多波段线性回归模型和GWR模型,利用检查样本对模型精度进行分析。

  

图1 永兴岛海域海图Fig.1 Woody Island chart

  

图2 永兴岛海域水深样本点分布Fig.2 Spatial distribution of depth points in Woody Island

  

图3 甘泉岛海域水深样本点分布Fig.3 Spatial distribution of depth points in Ganquan Island

 

表1 数据信息情况Tab.1 Data information

  

研究区域遥感影像时间分辨率研究范围验证数据永兴岛海域WorldView-22011-08-122 m16°31'25″N,111°34'45.5″E至16°29'55.3″N,111°35'40.4″E海图Navionics,精度未知甘泉岛海域WorldView-22014-04-022 m16°51'14″N,112°19'9.5″E至16°47'28.4″N,112°23'6.7″ESHOALS-3000 LiDAR数据,水平精度2.5 m,水深精度0.25 m

2.2.1 带宽对结果的影响分析

区别于(1)式,(xj,yj)为第j个样本点的空间坐标,为第j个样本点上的第i个参数,是带有空间信息的函数。设wij=ln [Lj(λi)-L(λi)],则式(2)又可以表达为:

2.2.2 线性模型与GWR模型结果对比分析

由加权最小二乘法,得到第j个样本点的参数:

  

图4 带宽变化对均方根误差的影响Fig.4 Effect of bandwidth change on RMSE

  

图5 带宽变化对判定系数的影响Fig.5 Effect of bandwidth change on R2

  

图6 线性回归模型反演水深和参考水深对比散点图Fig.6 Scatter plot of estimated depths from liner regression models versus reference depths

  

图7 GWR模型反演水深和参考水深对比散点图Fig.7 Scatter plot of estimated depths from GWR model versus reference depths

将水深分成0~5,5~10,10~15和15~20 m四个区间进行研究(图8和图9),永兴岛研究区各水深区间GWR模型反演结果的RMSE分别为1.699,1.472,1.972和2.369 m,较线性回归模型结果,精度分别提升了49.46%,39.97%,12.36%和49.68%;甘泉岛研究区各水深区间GWR模型反演结果的RMSE分别为0.971,1.161,1.490和2.647 m,较线性回归模型,精度分别提升了12.05%,16.23%,4.49%和12.23%。在5~20 m区间,随着水深增加,误差呈逐渐增加趋势。永兴岛0~5 m误差较大,分析原因可能为0~5 m区域段水深采样点主要位于岛礁附近,水质较差,另外,海图匹配误差也是造成该处反演精度较低的原因。GWR模型在各分区间反演精度相对于线性回归模型都有所提高,但各区间提高幅度不一,永兴岛研究区在0~5 m和15~20 m区间精度提高较为明显;甘泉岛研究区则在5~10 m和15~20 m区间精度提升较为明显,但总体甘泉岛研究区精度提高没有永兴岛研究区程度明显。同时,两处研究区在10~15 m区间精度提高幅度最小,因为GWR模型能够降低空间异质性,使各区间水深反演精度差别减小,而线性模型在这个区间反演精度已经比较理想,因此GWR模型对该区间水深反演精度影响较小。综合以上两种评价指标,得出GWR模型可以应用于遥感水深反演,且在一定程度上可以提高反演精度。

 

表2 甘泉岛和永兴岛研究区水深精度Tab.2 The overall accuracy of depths in research areas of Ganquan Island and Woody Island

  

岛屿RMSE/m线性回归模型GWR模型精度提升(%)永兴岛2.9541.88936.05甘泉岛1.6951.558 8.08

  

图8 永兴岛两种模型不同水深区间反演结果RMSE对比Fig.8 RMSE comparison of inversion results of different water depth intervals in two models of Woody Island

  

图9 甘泉岛两种模型不同水深区间反演结果RMSE对比Fig.9 RMSE comparison of inversion results of different water depth intervals in two models of Ganquan Island

3 结论

本文利用WorldView-2卫星多光谱数据4个波段,分别使用多波段回归模型和基于地理加权回归模型对永兴岛和甘泉岛海域进行水深反演对比实验研究,得到以下结论:

教师应更多地采取赞许、表扬和鼓励、给予信任性委托等措施来培养他们的自尊心,使其自尊自立、自爱自强,并且在此基础上,培养学生的集体荣誉感。

(1)文中利用交叉验证模型确定了永兴岛研究区最佳带宽为24,甘泉岛研究区最佳带宽为37,与本文使用枚举法验证结果基本一致。

至此,故障点已明确:EVAP系统及相关管路。检查EVAP系统管路,当拔下炭罐到发动机舱这段管路时,流出了大量汽油。由此可见发动机熄火是由EVAP系统溢油引起的。但溢油从何而来?考虑到此车为事故车,接下来又检查了油箱,发现油箱底部有拖伤痕迹,且位置正好在汽油滤清器附近。另外,该车碳灌与汽油滤清器集成在一起,很可能是炭罐和汽油滤清器同时受到损伤。拆下汽油滤清器后发现,由于外力作用,炭罐已经严重破损,汽油直接进入了回收管路。

(1)聚类挖掘算法,聚类分析是一种典型的统计学方法,是一种同数据库技术相结合形成的现代化数据挖掘最为常用的技术之一。其主要的思想是在给定的是一个初始化数据集中,搜索数据对象之间是否存在有价值联系。在电子商务活动中,可以利用聚类分析算法来发现客户群中不同特点的群组,从而针对不同的特征群组来优化商品上下架、推广的时间和位置,已提高商品销售量。

(2)本实验中考虑研究区底质和水质差异问题构建的GWR模型水深反演性能优于多波段回归模型,永兴岛研究区精度提高了36.05%,甘泉岛研究区精度提高了8.08%。

(3)带宽过小和过大都会造成反演结果精度降低,但带宽过小造成影响更为突出,在一定范围内,带宽过大对结果造成影响不大,对于永兴岛研究区在100~200带宽范围内,精度发生急剧变化,推测与研究区范围有关。

参考文献(References):

[1] JAWAK S D, VADLAMANI S S, LUIS A J. A synoptic review on deriving bathymetry information using remote sensing technologies: Models, methods and comparisons[J]. Advances in Remote Sensing, 2015, 4(2):147-162.

[2] WANG Yan-jiao, DONG Wen-jie, ZHANG Pei-qun, et al.Progress in water depth mapping from visible remote sensing data[J].Marine Science Bulletin,2007,26(5):92-101.

王艳姣, 董文杰, 张培群,等. 水深可见光遥感方法研究进展[J]. 海洋通报, 2007, 26(5):92-101.

[3] POLCYN F C, BROWN W L, SATTINGER I J. The measurement of water depth by remote sensing techniques[R].Michigan:The University of Michigan, 1970.

[4] MUELLER P W, HOFFER R M, JACOBSON J E. Evaluation of Landsat Thematic Mapper data for classifying forest lands[J]. Ultrasonics, 1985, 11(1):46.

[5] LYZENGA D R. Passive remote sensing techniques for mapping water depth and bottom features[J].Applied Optics,1978,17(3):379-383.

[6] LYZENGA D R. Remote sensing of bottom reflectance and water attenuation parameters in shallow water using aircraft and LANDSAT data[J]. International Journal of Remote Sensing, 1981, 2(1): 71-82.

[7] YAN Feng, WANG Yan-jiao. Water depth retrieval models with remote sensing sediment parameter[J]. Journal of Lake Sciences,2008, 20(5):655-661.

闫峰, 王艳姣. 基于泥沙因子的水深遥感反演模型[J]. 湖泊科学, 2008, 20(5):655-661.

[8] DONG Wen-qing, PENG Lei, YAN Qin, et al. PCA based on bottom classification applied in remote sensing bathymetry of shallow seawater[J/OL].1996[2018-04-18].http://www.isprs.org/proceedings/XXXVI/part7/PDF/196.pdf.

[9] DOXANI G, PAPADOPOULOU M, LAFAZANI P, et al. Shallow-water bathymetry over variable bottom types using multispectral WorldView-2 image[J]. ISPRS-International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2012, XXXIX-B8:159-164.

[10] WANG Yan-jiao, ZHANG Ying. Study on remote sensing of water depth based on BP artificial neural networks[J]. The Ocean Engineering,2005,23(4):37-42.

王艳姣,张鹰. 基于BP人工神经网络的水体遥感测深方法研究[J].海洋工程,2005,23(4):37-42.

[11] ZHANG Ying. Study of fathoming method by RS technology[J].Journal of Hohai University, 1998,26(6):68-72.

张鹰.水深遥感方法研究[J].河海大学学报,1998,26(6):68-72.

[12] DANG Fu-xing, DING Qian. A technique for extracting water depth information from multispectral scanner data in the South China Sea[J]. Marine Science Bulletin,2003,22(3): 55-59.

党福星,丁谦.利用多波段卫星数据进行浅海水深反演方法研究[J].海洋通报,2003,22(3): 55-59.

[13] CHEN Ming, LI Shi-hong, KONG Qing-fen. Fathoming method by satellite remote sensing for the Yangtze River estuary water body[J]. Hydro Science and Engineering, 2003(2):61-64.

陈鸣, 李士鸿, 孔庆芬. 卫星遥感长江口水域水深[J]. 水利水运工程学报,2003(2):61-64.

[14] SU H, LIU H, WANG L, et al. Geographically adaptive inversion model for improving bathymetric retrieval from satellite multispectral imagery[J]. IEEE Transactions on Geoscience & Remote Sensing, 2013, 52(1):465-476.

[15] QIN Wen-zhong.The basic theoretics and application research on geographically weighted regression[D].Shanghai: Tongji University,2007.

覃文忠. 地理加权回归基本理论与应用研究[D]. 上海:同济大学, 2007.

[16] CLEVELAND W. Robust locally weighted regression and smoothing scatterplots[J]. Publications of the American Statistical Association, 1979, 74(368):829-836.

 
刘源,邱振戈,栾奎峰,侍炯,朱卫东,刘鲁燕,沈蔚,曹彬才
《海洋学研究》 2018年第04期
《海洋学研究》2018年第04期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号