更全的杂志信息网

基于协同克里金插值法的土壤锰元素含量预测

更新时间:2016-07-05

0 引言

锰元素是植物生长的必要营养元素,能促进植物的光合作用[1]及新陈代谢,增强磷和钙的吸收,提高植物的呼吸强度,但锰含量过多会导致土壤重金属污染[2]。因此,对锰元素含量的预测研究和空间制图具有重要的理论和现实意义。

对土壤重金属含量分析和预测有多种方法[3-7],但对其空间相关性和其他因素的影响考虑较少。然而,通过采样点只能获取有限的点尺度上的土壤重金属信息,且成本较高;目前,空间插值法广泛用于土壤重金属元素的空间分布和制图研究[8-10],该方法通过对样本点数据进行处理可获得空间连续的土壤重金属数据,但插值结果受制于样本点数据的稀疏程度和空间分布,具有不确定性、离散性高的特点,难以得到精确的插值效果;而且多数研究中往往不重视空间数据分析、插值方法的筛选和插值参数的优化,导致插值结果发生偏差甚至错误,使得数据潜在的空间变化趋势难以辨别[11]

方成80多岁时,还骑自行车到处开会。90多岁时,还在广州亚运会中山站和周笔畅、古巨基等人一起跑步传送火炬,还用电脑写作、为人作序,还应承各方约稿。他曾说:“我长寿的秘诀就一个字,就是‘忙’,忙得忘记了身体,忘记了休息,忘记了一切,甚至忘记了死亡。”

实际工作中,有很多变量之间存在一定的相关性,如果能用已知变量提高未知变量的估值精度,必将节约不必要的投入。协同克里金法利用单一变量或者多变量作为辅助变量提高精度估值,可高效地解决此类问题[12-14]。由于受到同样的空间过程或者区域化条件的影响,土壤重金属的取样数据之间存在自相关和互相关的特征,可以通过插值方法内插或外推未知点的数值及总体空间分布趋势。张鹏岩等[15]采用普通克里金法研究了土壤重金属含量的特征。在地形多变、耕地类型较多的情况下,直接利用普通克里金法预测精度不高,而协同克里金法是利用可靠的辅助变量对目标变量进行估值,方学燕等[16]对茎柔鱼的空间分布进行分析,表明运用协同克里金插值法的可取性。赵业婷等[17]采用协同克里金法和普通克里金法对耕层土壤全氮的研究结果表明,协同克里金法比普通克里金法精确度高。庞夙等[18]采用普通克里金法和协同克里金法对县域尺度农田土壤重金属铜含量进行研究,结果表明协同克里金法比普通克里金插值法更加精确和经济。苏晓燕等[19]采用协同克里金插值方法对土壤有机质含量进行空间预测和分析,结果也表明协同克里金法提高了有机质含量空间预测的精度。以上研究表明,协同克里金插值法可以提高插值的精度。

然而,协同克里金插值方法多用于空气湿度[20]、降水量[21]等研究,关于土壤锰元素含量分布的研究相对较少,且一般都是从单一辅助变量进行研究分析。鉴于此,本文选取北京市房山区果园地、菜地、水浇地、灌溉水田和旱地5种耕地类型,以土壤重金属锰含量为主变量,以锌、铁和铜含量共同作为辅助变量,在每种耕地类型下,利用协同克里金插值法对土壤锰含量进行插值分析和空间制图。

式中:c为偏基台值,表示变异函数在h大于变程时的值;a为变程,表示区域化变量在空间上相关性的范围;h为模型计算滞后系数。

1 研究区与数据

为检验锰含量预测值的准确性,采用随机抽样方式,用80%的样本点作为训练集、20%的样本点数据作为测试集,用交叉验证方法[18] 对模型的精度(锰含量的实测值与预测值之间的误差)进行检验。本文采用的精度评价指标为:1)平均误差(ME),表示评价结果的无偏性,其值越接近0越好;2)均方根误差(RMSE),用于度量估值方法的精确性,其值越小越好;3)标准化均方根误差(RMSSE),其值越接近1越好,其值小于1,说明预测值高于真实值,大于1,说明预测值低于真实值。各指标计算公式如下:

2 研究方法

2.1 方差分析

本文使用方差分析法[22-24],以果园地、菜地、水浇地、灌溉水田和旱地5种地类为自变量(分类型变量),以重金属锌、铁、铜、锰、硼、硫的含量为因变量(数值型变量),探讨耕地类型对土壤重金属含量的影响。

2.2 协同克里金插值法

本文使用普通协同克里金插值法[25-27](Cokriging)预测土壤重金属锰的含量。该方法是建立在协同区域化变量理论基础之上,利用多个区域化变量之间的互相关性,通过建立变异函数模型和趋势移除,利用主变量自相关性和主变量与所有其他变量类型间的互相关性进行更好的预测。土壤属性可以用作协同区域化变量,提高其他属性的空间预测精度[13,15,28-32]。由于其他重金属与锰含量存在不同程度的空间相关性,因此可以用作预测土壤重金属空间分布的协同区域化变量。重点对研究区域土壤锰含量以及其他辅助变量进行地统计学分析,并比较不同的半方差函数模拟模型和预测方法。

式中:cij=c(0)-γ(h)(i,j=1,2,…,n),c(0)为基台值,表示变异函数在h大于变程时的值,是块金值c0和提高的和,提高表示在取得有用数据标准上时,可观测得到的变异幅度大小;块金值c0表示在很短距离内有较大的空间变异性,不论h多小,两个随机变量之间不相关为0时的值。由式(6)可得到一组权重系数λi值,进而估算出Z*(l,k)0

2013年,天津水务在部党组可持续发展治水思路的指引下,不断加快水务改革发展步伐,全力推进民生水务工程建设,全年各项目标任务圆满完成,确保了城乡防汛和供水安全,呈现出水务投入稳定增长、保障能力显著提升、发展活力持续增强的良好态势,为经济社会发展提供了坚实保障。

Fi=a1iZn+a2iFe+a3iCu

(1)

Y=∑λiFi

(2)

式中: Fi为第i主成分变量;aji(j=1,2,3) 分别为第i主成分对应原始变量ZnFeCu的系数,度量了相应原始变量对Fi的重要性;ZnFeCu分别表示锌、铁、铜的含量;Y为综合因子;λi为主成分的贡献率。

(3)

式中:Z*(l,k)0为(l,k)0处土壤重金属锰含量的估值;nm为主变量和辅助变量的采样点数; Z1(l,k)1i为各点土壤重金属锰的含量;λi为各点土壤重金属锰含量的权重系数,且∑λi=1;Z2(l,k)2j为各点土壤综合重金属含量;λj为各点综合土壤重金属含量的权重系数。

(2)ArcGIS 10.2:用于地统计学分析(构建变异函数、Cokriging插值)。

(4)

(5)

排除标准:①缺失疗效和毒副作用研究数据;②基于重复患者样本的研究;③个案研究、综述、摘要及会议报告;④非临床随机对照试验。

根据无偏最优估计和∑λi=1可得:

(6)

为解决协同克里金插值时土壤重金属锌(Zn)、铁(Fe)、铜(Cu)这3个辅助变量的权重问题,使用主成分分析法(PCA)[24,31,33]将这3个存在相关性的变量通过降维技术转换为一个综合因子(式(1)和式(2)),然后将该综合因子作为辅助变量对主变量锰进行协同克里金插值(式(3))。

2.3 估值验证及精度评价

北京市房山区(115°25′~116°15′E,39°30′~39°55′N)属于暖温带半湿润季风大陆性气候区,境内地貌较为复杂,山区与平原之间相对高差较大,气候也有明显的差异。由于经常受到强烈的人为活动和自然生态过程的影响,区域内土壤有较强的空间变异。全区主要有菜地、果园地、旱地、水浇地和灌溉水田5种地类。本研究收集了房山区1 497个样本点,其中果园地390个,水浇地755个,菜地53个,灌溉水田21个,旱地278个,样本点数据包括样本点的经/纬度以及土壤锌、铁、铜、锰、硼和硫的含量。

(7)

式中:Z(xi)为实测值;Z(xoi)为预测值;n为检验样本的数量;σ(xi)为xi处的方差平方根。

2.4 软件平台

用PCA方法分别提取房山区5种地类中土壤重金属Zn、Fe、Cu变量的主成分,用综合重金属变量解决协同克里金法插值时多因子辅助变量权重的“黑匣子效应”,得到各耕地类型的主成分构成如下:

y(默认补偿)=-4.859+3.224x1-2.633x2+2.018x3+2.723z1-0.982z2+0.375z3+

本文主要采用球形计算模型(式(4))和指数计算模型(式(5))求解式(3)。

3 结果与分析

3.1 土壤重金属统计特征

房山区5种地类土壤重金属锰含量的统计特征值如表1所示,其中,旱地锰元素含量的平均值最大,为4.94 mg/kg,灌溉水田锰元素含量的平均值最小,为2.96 mg/kg。从均值看,各地类的锰含量均属于低含量。灌溉水田的变异系数为0.619,属于强变异系数;果园地与水浇地变异系数相差不大,均属于中强度变异系数;菜地与旱地变异系数相差不大,属于稍强度变异系数。

耕地类型最大值(mg/kg)最小值(mg/kg)平均值(mg/kg)标准差(mg/kg)变异系数K⁃S检验果园地11.80.1663.691.380.3740.21水浇地11.90.1383.301.180.3590.18菜地11.90.6334.091.190.2930.19灌溉水田8.110.4492.961.830.6190.09旱地12.00.1164.941.360.2740.30

3.2 耕地类型对土壤重金属元素含量的影响

人类活动对土壤重金属元素含量有着显著影响[34]。用方差分析法得到5种地类对土壤重金属元素的影响(表2),结果表明:耕地类型对土壤重金属锰和铁含量有显著影响(P<0.01),对土壤锰元素影响最大,然后依次为铁>锌>铜,对硼、硫没有显著影响(P>0.01)。本研究重点分析北京市房山区5种地类中的锰元素含量。

ZnFeCuMnBSP值0.0770.0010.0910.000.4260.451

3.3 主成分分析的综合因子

(1)R 3.3.1:用于基本统计分析、正态性检验(果园地、旱地、水浇地土壤重金属锰含量的最优正态分布经Box-Cox数据变换的拟合参数λ分别为0.36、0.23和0.3;灌溉水田、菜地土壤重金属锰含量数据经log转换为最优正态分布)、方差分析、相关性分析和主成分分析。

(8)

3.4 协同克里金预测结果与分析

3.4.1 土壤重金属锰含量的空间变异特征 以重金属含量的综合因子为辅助变量和以单变量因子为辅助变量的交互变量最优变异函数参数如表3所示,果园地、菜地、水浇地和旱地土壤重金属锰的最优模型为指数模型,灌溉水田的最优模型为球形模型。以综合因子作为辅助变量时,除灌溉水田的块金系数为0.24,其余耕地类型的块金系数都在0.63~0.75之间,均为中等强度的空间相关性,表明土壤重金属锰的空间变异性受结构性因素和随机因素共同作用,且综合因子作为辅助变量的模型比单一辅助变量的模型拟合精度要高。

目前测绘档案的数字化整理利用工作有很大的挑战,因为数字测绘档案的数据量大、专业性强、数据格式多样化。目前数字测绘档案管理不能满足数字测绘档案的需求,因为其现在缺乏统一的标准和规范,整个整理组卷工作还需要继续探索。管理时混杂保管数字测绘档案和传统载体测绘档案也降低了数据管理的安全性,不能保障载体的安全。测绘档案的馆藏保管环境与保管需求有一定差距,存储载体划痕、病毒、损坏情况严重,很多数据的入库工作不到位,没有在资料入库前进行必要的数据检查,这都与人力物力投入不足、数据专业性太强等原因有关。

涛声悠长,莅临的夏汛使汉江的江面格外开阔。夕阳映照延绵悠长的江水仿佛像一条闪着斑斓色彩的纽带肆意抖动变幻莫测的光彩。萧飞羽瞅着东去的江水缓缓推动左腕上的银亮钢环,神情静谧宛若出尘似的飘逸。他身后是铁卫、刀手、剑士、武成龙、只手拿云,以及大幻剑和魔刀。没有人知道萧飞羽为何将众人带到长江之滨的龟山脚下荒芜得似乎从无人涉足的地方。

耕地类型模型变程(m)块金值c0偏基台值c块金系数c0/(c+c0)模型拟合精度MERMSERMSSE果园地E926.7(909.2)0.47(0.45)0.16(0.23)0.75(0.66) 0.0046(-0.0065)2.289(2.418)1.072(1.084)菜地E1027.2(1275.4)1.90(1.05)0.65(0.67)0.75(0.62)-0.012(-0.023) 2.843(2.853)1.126(1.235)水浇地E1435.6(1584.2)0.60(0.25)0.33(0.17)0.64(0.59)0.0003(0.0016)2.356(2.368)0.978(0.965)灌溉水田Sph297.4(254.6)0.14(0.23)0.44(0.56)0.24(0.29)0.0113(0.033) 3.079(3.125)0.835(0.775)旱地E629.8(615.2)0.93(0.74)0.54(0.48)0.63(0.60)0.0087(0.0126)2.375(2.879)0.979(0.960)

注:E表示指数模型,Sph表示球形模型,()内数值表示单变量辅助插值结果,且选择的是结果精度最高的单变量。

3.4.2 土壤重金属锰含量的协同克里金插值 运用R软件计算5种地类土壤锰元素含量与其他元素含量的皮尔森相关系数[35](表4)。由表4可知,果园地Mn与Fe、Cu和综合因子(Y)具有很强的正相关性,相关系数分别为0.233(P<0.05)、0.24(P<0.01)和0.283(P<0.01),且与Y的相关性最高;菜地Mn与Fe、Cu和Y呈显著的正相关性;旱地Mn与Zn、Cu和Y呈显著正相关性;灌溉水田Mn与Zn、Fe和Y呈显著负相关性,且负相关性值Y>Zn>Fe;水浇地Mn与Fe呈极显著正相关性,与Y呈显著正相关性。整体而言,综合后的变量Y均与Mn含量显著相关,可见通过主成分分析整合的综合重金属变量对土壤重金属锰进行协同克里金插值,可解决协同克里金插值时多辅助变量权重的“黑匣子效应”。

进一步利用协同克里金插值法预测北京市房山区5种地类的重金属锰含量。从插值结果(图1)看,预测结果较为真实地反映了土壤重金属锰的实际含量。果园地锰含量较高(9.4~11.8 mg/kg),位于房山区中西部和东南部,西部和中部锰含量较低(0.166~0.758 mg/kg)(图1a);菜地锰含量较高(9.71~11.9 mg/kg),位于房山区中东部和西部,南部锰含量较低(0.633~1.25 mg/kg)(图1b);房山区西南部水浇地锰含量较高(9.42~11.9 mg/kg),中部水浇地锰含量较低(0.138~0.855 mg/kg)(图1c);灌溉水田的锰含量较高(7.23~8.11 mg/kg),位于房山区西南部(图1d);房山区中部的旱地锰含量较高(9.65~12 mg/kg)之间,边缘地区的旱地锰含量较低(图1e)。

耕地类型ZnFeCuY 果园地0.146∗0.233∗0.24∗∗0.283∗∗ 菜地0.0120.166∗∗0.10∗∗0.111∗∗ 旱地0.23∗-0.0090.50∗∗0.186∗∗ 灌溉水田-0.546∗∗-0.517∗∗0.066-0.632∗∗ 水浇地-0.1370.553∗∗0.0160.293∗∗

注:*、**分别表示P<0.05、P<0.01的极显著水平。

3.4.3 精度验证 由协同克里金插值精度验证结果(表3)可知,将多变量通过主成分分析法整合的综合因子作为辅助变量比单变量作为辅助变量的协同克里金插值精度稍高。果园地、水浇地、旱地的协同克里金插值法效果较好,灌溉水田和菜地较差,主要与采样点较少有关。果园地、菜地、水浇地、旱地的ME分别为0.0046、-0.012、0.0003和0.0087,说明菜地的平均预测结果稍低于真实观测值,果园地、水浇地和旱地的平均预测结果稍高于真实观测值。果园地的RMSE值(2.289)最小,表明预测精度最高,灌溉水田RMSE值(3.079)最大,表明预测精度最低。而从RMSSE值看,较接近1的是果园地、水浇地、旱地,且果园地为1.072(大于1),说明高估了预测值的不确定性;而水浇地和旱地分别为0.978、0.979(都小于1),说明低估了预测值的不确定性。菜地和灌溉水田的RMSSE值与1的差值分别为0.126、-0.165,其绝对值都大于0.1,说明二者的预测精度较差。

4 结论与讨论

本文选取北京市房山区果园地、水浇地、菜地、灌溉水田和旱地5种地类,首先利用方差分析法解析不同耕地类型对土壤锰元素含量是否有影响,然后运用普通协同克里金插值法对土壤锰元素含量进行预测,结果表明:1) 土壤中锰元素含量有中等的空间自相关性,且土壤各金属元素间存在空间互相关性。2) 不同耕地类型对土壤锰元素含量有显著影响。3) 基于与预测变量相关的多辅助变量的普通协同克里金方法可以提高预测变量的精度,稍高于单辅助变量插值精度。4)果园地、水浇地、旱地的土壤锰含量预测精度较高,菜地和灌溉水田由于采样点较少,导致其预测精度较差。5)果园地锰含量较高,位于房山区中西部和东南部;水浇地和菜地的分布较相似,与当地的菜地偏潮湿有关,但水浇地锰含量高低较分散,而菜地锰含量较集中;灌溉水田的锰含量较高,位于房山区西南部;旱地锰含量较高,位于房山区的中部。因此,可以根据锰元素的预测含量判断耕地的适种作物以提高产量。

采用SPSS 23.0统计学软件进行数据分析,计数资料用[n(%)]表示,采用 χ2检验,用(±s)表示计量资料,采用t检验,P<0.05为差异有统计学意义。

考虑到不同地类的协同克里金插值预测结果不同,本文重点运用协同克里金插值法对不同地类的土壤锰含量进行预测,而没有在同种地类下对不同样本容量进行插值结果分析。另外,协同克里金插值法的预测精度与样本数量存在一定关系,如何选取一个最适合的样本容量,在保持精度不变的同时,也可以保证采样成本最小,将是下一步研究的重点。

参考文献

[1] 凌丽俐,彭良志,王男麒,等.缺锰胁迫对纽荷尔脐橙叶绿素荧光特性的影响[J].生态学报,2013,33(1):71-78.

[2] 张照伟,李文渊,郭周平,等.青海省阿什贡含镍矿镁铁-超镁铁岩体形成时代及其对成矿机制的启示[J].地球学报,2014,35(1):59-66.

[3] 张小敏,张秀英,钟太洋,等.中国农田土壤重金属富集状况及其空间分布研究[J].环境科学,2014,35(2):692-703.

[4] 杨军,郑袁明,陈同斌,等.北京市凉凤灌区土壤重金属的积累及其变化趋势[J].环境科学学报,2005,25(9):1175-1181.

[5] 蒋红群,王彬武,刘晓娜,等.北京市土壤重金属潜在风险预警管理研究[J].土壤学报,2015,52(4):731-746.

[6] 于洋,高宏超,马俊花,等.密云县境内潮河流域土壤重金属分析评价[J].环境科学,2013,34(9):3572-3577.

[7] 宋玉,塔西甫拉提·特依拜,李崇博,等.基于偏最小二乘法的土壤汞含量高光谱反演[J].地理与地理信息科学,2015,31(3):44-47.

[8] LI Y.Can the spatial prediction of soil organic matter contents at sampling scales be improved by using regression kriging with auxiliary information[J].Geoderma,2010,159(1-2):63-75.

[9] 郑永红,张治国,姚多喜,等.煤矿复垦区土壤重金属含量时空分布及富集特征研究[J].煤炭学报,2013,38(8):1476-1483.

[10] 张海平,周星星,代文.空间插值方法的适用性分析初探[J].地理与地理信息科学,2017,33(6):14-18.

[11] 文雯,周宝同,汪亚峰,等.基于辅助环境变量的土壤有机碳空间插值—以黄土丘陵区小流域为例[J].生态学报,2013,33(19):6389-6397.

[12] PANG S,LI T X,WANG Y D,et al. Spatial interpolation and sample size optimization for soil copper (Cu) investigation in cropland soil at county scale using CoKriging[J].Agricultural Sciences in China,2009,8(11):1369-1377.

[13] 胡克林,李保国,陈德立,等.农田土壤水分和盐分的空间变异性及其协同克立格估值[J].水科学进展,2001,12(4):460-466.

[14] TAVARES M T,SOUSA A J,ABREU M M.Ordinary kriging and indicator kriging in the cartography of trace elements contamination in Sao Domingos mining site (Alentejo,Portugal)[J].Journal of Geochemical Exploration,2008,98 (1-2):43-56.

[15] 张鹏岩,秦明周,闫江虹,等.黄河下游滩区开封段土壤重金属空间分异规律[J].地球研究,2013,32(3):421-429.

[16] 方学燕,陈新军,冯永玖,等.基于综合环境因子的协同克里金法分析茎柔鱼资源丰度空间分布[J].海洋学报,2017,39(2):62-71.

[17] 赵业婷,常庆瑞,李志鹏,等.基于Cokriging的耕层土壤全氮空间特征及采样数量优化研究[J].土壤学报,2014,51(2):415-422.

[18] 庞夙,李廷轩,王永东,等.县域农田土壤铜含量的协同克里格插值及采样数量优化[J].中国农业科学,2009,42(8):2828-2836.

[19] 苏晓燕,赵永存,杨浩,等.不同采样点数量下土壤有机质含量空间预测方法对比[J].地学前缘,2011,18(6):35-39.

[20] 胡丹桂,舒红.基于协同克里金空气湿度空间插值研究[J].湖北农业科学,2014,53(9):2045-2049.

[21] 李艳,朱军,胡亚,等.不同插值方法模拟四川省逐月降水量的对比分析[J].水土保持研究,2017,24(1):151-160.

[22] ZHAO J L,XUE Y A,YANG H,et al.Evaluating and classifying field-scale soil nutrient status in Beijing using 3S technology[J].International Journal of Agriculture & Biology,2012,14(5):689-696.

[23] 方匡南,朱建平,姜叶飞.R数据分析[M].北京:电子工业出版社,2014.170-174.

[24] 孙义豪,李秋燕,丁岩,等.基于主成分分析及系统聚类的县域电网综合评价方法[J].电力系统保护与控制,2017,45(8):30-36.

[25] 吴宗敏.散乱数据拟合的模型、方法和理论[M].北京:科学出版社,2006.45-59.

[26] 马欢,岳德鹏,黄元,等.基于数据同化的地下水埋深插值研究[J].农业机械学报,2017,48(4):206-214.

[27] 徐爱萍,胡力,舒红.空间克里金插值的时空扩展与实现[J].计算机应用,2011,31(1):273-276.

[28] 赵玲芝,谷跃民,张建中.多信息融合的近地表速度建模技术及应用[J].石油地球物理勘探,2017,52(1):34-41.

[29] SUMFLETH K,DUTTMANN R.Prediction of soil property distribution in paddy soil landscapes using terrain data and satellite information as indicators[J].Ecological Indicators,2008,8(5):485-501.

[30] QUEIROZ J C B,STURARO J R,SARAIVA A C F,et al.Geochemical characterization of heavy metal contaminated area using multivariate factorial kriging[J].Environmental Geology,2008,55:95-105.

[31] MABIT L,BEMARD C.Spatial distribution and content of soil organic matter in an agricultural field in eastern Canada,as estimated from geostatistical tools[J].Earth Surface Processes and Landforms,2010,35(3):278-283.

[32] LI Q Q,YUE T X,WANG C Q,et al.Spatially distributed modeling of soil organic matter across China:An application of artificial neural network approach[J].Catena,2012,104:210-218.

[33] 于化龙.主成分分析应用研究综述[J].经营管理者,2013(3):9-10.

[34] 李兵.胶东山区不同土地利用方式对土壤重金属分布的影响研究[D].泰安:山东农业大学,2017.

[35] 陈晨,程林,修春亮.沈阳市中心城区交通网络中心性及其与第三产业经济密度空间分布的关系[J].地理科学进展,2013,32(11):1612-1621.

高文武,姜燕,赵晋陵
《地理与地理信息科学》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号