更全的杂志信息网

化探数据处理提取多层次信息的数据挖掘方法

更新时间:2016-07-05

0 引言

无论何种目的的地球化学勘查工作,通常都包括立项、设计编写、野外调查、样品分析与测试、数据处理与综合研究以及成果报告编写等多个工作阶段。在数据处理与综合研究阶段运用多种数据挖掘与数理统计方法或方法组合,充分而深入地进行多层次信息提取,是最大限度的研究资料,保障勘查工作成果的一个十分重要的工作环节,本文以新疆天山某勘查区多金属矿地球化学详查为例,简述这些方法的综合运用及其处理效果。

例 4:“William the Conqueror,whose cause was favored by the pope,was soon submitted to by the English,who wanted leaders,and had been of late much accustomed to usurpation and conquest.”

1 勘查项目概况

该详查区域为一东西方向长6.2km,南北方向宽3.7km,面积22.94km2的矩形区域(见图1)。

区内出露地层有奥陶系中上统大柳沟组玄武安山岩、英安岩、火山角砾岩、沉积凝灰岩;奥陶系中上统庙尔沟组粉砂岩、泥质粉砂岩、沉积凝灰岩;泥盆系下统大南湖组一段凝灰质细砂岩、含碳粉砂岩、凝灰质长石岩屑砂岩;第四系更新-全新统砾石、沙土及亚砂土等。

岩浆岩有石英闪长岩、花岗闪长岩、中细粒二长花岗岩及钾长花岗岩等,多呈岩株产出,具有一定规模。

区域内见有多处Cu及Ag、Pb、Zn、Au等多元素综合异常。

中位数12.4,下节点7.18,上节点21.5,内散度14.32,异常下限参考值28.64(实际可以采用30.0)。色阶划分及各色区样品所占百分比见表6。

图1 新疆天山某详查区地质矿产图 Fig.1 Geological and mineral map of a detailed survey area in Tianshan, Xinjiang

2 数据挖掘与数理统计方法的综合运用

2.1 数据预处理

数据预处理是对实验室提供的分析数据进行预处理,形成可用于统计分析及编图的数据文件。最终数据文件中不应有空白值、不确定值及其它错误数值,每个数值均应大于0,也尽量不要有特别“离群”的特高或特低值。

不确定值的处理:如果分析结果中有小于分析检出限的不确定值,建议用检出限值代替之;有大于分析方法最高检出限的值,建议用最高检出限值的1.5倍代替之。如果不确定值过多,例如超过了某元素总数据量的10%,建议改变分析方法重新分析样品。

中国进入新时代,对党建工作也提出了新要求,为了贯彻习近平总书记“组织引导老同志讲好中国故事、弘扬中国精神、传播中国好声音”重要讲话精神,长沙市雨花军队离休退休干部休养所党委发挥军队离退休党员独特的政治、经验、学术优势,以所离退休党员为骨干成立了社会公益组织“老首长”工作室,打造群众宣传思想平台,为党和人民事业增添正能量。

空白值的处理:如果出现空白值,建议用相邻样品分析值或若干个相邻样品分析平均值代替之。如果空白值过多或连续出现多个空白值,建议实验室重新制样后重新分析。

2.2 地球化学参数统计

其中,Yi代表三类村镇银行不同的预期收益率,R代表村镇银行的贷款利率水平,R0代表无风险利率水平。Yi满足Yi≥0的条件,否则在追求利润最大化的条件下,主发起行不会发起设立村镇银行。

经过统计分析可以得到的各元素地球化学参数有:最大值、最小值、中位数、平均值、标准离差、变异系数、逐步剔除特异值前后的样品数、逐步剔除特异值后的背景值、标准离差、变异系数及异常下限等,同时得到的还有频率分布直方图的分组参数及经柯-斯准则检验的分布型式,见表1~表2所列,表中Au、Ag含量单位为10-9,其它元素为10-6,后文皆同。

国民在畜禽产品消费成本方面普遍不高,这得益于国内廉价的饲料与劳动力,但在推进畜牧业现代化发展中,这种观念可能成为一种主观障碍。为有效解决问题,需进一步加快物联网技术在畜牧业发展中的应用。另外,在将RFID物联网技术等应用服务于现代畜牧业发展中,不可避免地会出现一些行业类似的问题,如标准制定问题、成本控制问题以及信息安全问题等。但随着现代技术的进步、政府的有效引导以及市场的不断完善,此类问题必将迎刃而解。

也可以采用稳健统计学的EDA法确定各元素色阶值及异常下限,以Cu为例统计结果如下:

本详查区以10种元素为变量,用全部数据做了R型因子分析,得到的结果有:相关系数、特征值、公因子方差、初始及正交因子载荷、斜交因子相关、结构及模型矩阵、正交及斜交因子得分等,限于篇幅在此不逐一列出,表7中列出了正交因子载荷。

表1 各元素未经过剔除特异值的地球化学参数 Table 1 Geochemical parameters of each element without removing outliers

元素 最大值 最小值 中位数 平均值 标准离差 变异系数 样品数 分布型式Au 70.7 0.3 0.50 0.67 1.713 2.557 2976 正向偏斜Cu 2623 2.76 12.4 20.6 61.377 2.977 2976 正向偏斜Ag 3200 38 65.5 111.6 231.758 2.076 2976 正向偏斜Pb 6545 3.51 17.1 29.7 140.444 4.73 2976 正向偏斜Zn 2243 7.73 79.25 103.2 111.984 1.086 2976 正向偏斜W 25.3 0.39 1.42 1.621 0.971 0.599 2976 正向偏斜Sn 100 0.74 1.72 2.352 3.749 1.594 2976 正向偏斜Mo 100 0.22 0.49 0.92 2.935 3.177 2976 正向偏斜As 437 0.68 2.55 5.33 13.987 2.625 2976 正向偏斜Sb 7.46 0.09 0.49 0.60 0.489 0.816 2976 对数正态

表2 各元素剔除特异值后的地球化学参数 Table 2 Geochemical parameters of each element after removing outliers

元素 背景值 标准离差 变异系数 样品数 异常下限Au 0.55 0.137 0.25 2854 0.82 Cu 13.8 8.605 0.622 2762 31.0 Ag 66.5 19.171 0.288 2528 104.8 Pb 18.1 8.477 0.468 2721 35.1 Zn 82.8 37.105 0.448 2764 157.0 W 1.48 0.564 0.381 2845 2.6 Sn 1.77 0.486 0.275 2735 2.7 Mo 0.5 0.145 0.29 2606 0.79 As 2.47 1.062 0.431 2396 4.6 Sb 0.52 0.279 0.54 2818 1.08

多元统计分析方法主要有因子分析、聚类分析、对应分析及模糊聚类等。为研究揭示元素间共生组合关系,通常采用一种或多种方法组合,在此基础上进行更深层次的数据挖掘,例如:用衬度累加值和因子得分甚至用衬度累加值及因子得分的趋势面分析结果做成等值线图,提取更深层次的信息,研究元素共生组合关系,编制综合异常及成矿远景预测图等成果图件。

还可以得到将原始数据转换成对数以后,逐步剔除特异值前后的地球化学参数等(见表3)。分别统计各元素按照对数0.1的间隔进行分组的频率分布直方图分组参数,据此可用Grapher 10绘图软件做出各元素含量频率分布直方图(图2)。以元素Ag为例,其分组参数列于表4。

1∶1万地球化学详查按照200m×40m的规则网布置采样点2976个,分析了Au、Cu、Ag、Pb、Zn、W、Sn、Mo、As、Sb等10种元素。

经过数据预处理后得到的数据文件就可以用“多元素地球化学参数统计及分布型式检验程序”来进行地球化学参数统计了,这是一项很重要的基础工作,据地球化学参数统计结果可划分色阶,编制地球化学图。

2.3 多元统计分析方法的运用

地球化学参数统计提取了丰富的地球化学信息,充分研究各元素的分布特征可以确定其地球化学图上的色阶值,用Surfer14绘图软件制作各元素地球化学图,主要成矿元素的色阶值见表5。各含量区间在地球化学图上对应的颜色分别是:低值区-深蓝色(Electric Blue)、低背景区-浅蓝色(Pastel Blue)、背景区-淡黄色(Chalk)、高背景区-深黄色(Light Yellow)、异常外带-浅粉色(Soft Pink)、异常中带-深粉色(Hot Pink)、异常内带-红色(Neon Red)、异常强内带-深红色(Brick Red)。Cu、Pb、Zn、Ag等4种主要成矿元素地球化学图见图3~图6。

表3 各元素剔除特异值前后的地球化学参数对数值 Table 3 Logarithmic values of geochemical parameters before and after removal of outliers for each element

元素 逐步剔除特异值前 剔除特异值后平均值 标准离差 变异系数 样品数 背景值 标准离差 变异系数 样品数Au -0.254 0.1687 -0.665 2976 -0.2716 0.1115 -0.410 2898 Cu 1.1141 0.3486 0.313 2976 1.0964 0.3155 0.288 2935 Ag 1.8949 0.2646 0.140 2976 1.8406 0.1557 0.0846 2774 Pb 1.2726 0.3020 0.237 2976 1.2442 0.2449 0.197 2897 Zn 1.9150 0.2686 0.140 2976 1.9041 0.2290 0.120 2897 W 0.1596 0.1982 1.242 2976 0.1541 0.1885 1.223 2953 Sn 0.2793 0.2120 0.759 2976 0.2429 0.129 0.531 2827 Mo -0.236 0.2796 -1.184 2976 -0.3005 0.1395 -0.464 2745 As 0.4973 0.3591 0.722 2976 0.4593 0.2967 0.646 2877 Sb -0.321 0.2878 -0.895 2976 -0.326 0.2810 -0.863 2963

图2 主要成矿元素含量频率分布直方图 Fig.2 Histogram of frequency distribution of contents of main metallogenic elements

表4 Ag的频率直方图分组参数 Table 4 Frequency histogram grouping parameters of Ag

组端值 频数 累计频数 频率(%) 累计频率(%)1.57-1.67 199 199 6.687 6.687 1.67-1.77 893 1092 30.007 36.694 1.77-1.87 768 1860 25.806 62.5 1.87-1.97 369 2229 12.399 74.899 1.97-2.07 253 2482 8.501 83.401 2.07-2.17 155 2637 5.208 88.609 2.17-2.27 104 2741 3.495 92.103 2.27-2.37 69 2810 2.319 94.422 2.37-2.47 47 2857 1.579 96.001 2.47-2.57 30 2887 1.008 97.009 2.57-2.67 24 2911 0.806 97.816 2.67-2.77 9 2920 0.302 98.118 2.77-2.87 12 2932 0.403 98.522 2.87-2.97 14 2946 0.47 98.992 2.97-3.07 7 2953 0.235 99.227 3.07-3.17 3 2956 0.101 99.328 3.17-3.27 7 2963 0.235 99.563 3.27-3.37 1 2964 0.034 99.597 3.37-3.47 3 2967 0.101 99.698 3.47-3.57 9 2976 0.302 100.000

随后几天,这个问题一直困扰着我。后来,我无意中在网上看到一个视频,“孩子给妈妈的打分”,令我感动的同时,一个念头闪过脑际。我想,可以把这份感动与家长分享,让他们体验一下,亲子之间不只有学习,还有温情。

图3 详查区Cu地球化学图 Fig.3 Geochemical map of Cu in the survey area

从正交因子载荷所揭示的元素共生组合关系看,F1因子反映了详查区最主要的多金属矿化Pb-Zn-Ag组合;F2因子反映了W-Sn元素组合;Cu、Au、Mo、As及Sb等均为单独因子。

根据元素共生组合关系可知,用F1因子得分等值线图能较好地反映Pb-Zn-Ag综合异常(图7),将密切相关的三种元素衬度值累加,做成衬度累加值等值线图也可以作为Pb-Zn-Ag综合异常(图8),二者具有相似的应用效果。

二是定期召开联席会议,深化拓展联动执法。组织太湖流域江苏、浙江、上海两省一市水行政主管部门召开专项执法联席会议,《太湖流域管理条例》贯彻实施监督检查座谈会、推进会及案件处理等各类专题会议,分别与江苏、浙江水行政执法队伍合作开展了地方性法规规章与《太湖流域管理条例》适应性分析、太湖流域(江苏省)“一湖两河”联合巡查制度后评估等重点河湖及省际边界等特殊问题专项研究,总结经验和成效,不断深化执法合作,营造流域团结治水的良好氛围。同时将联合巡查制度向省际边界地区拓展,与苏州、嘉兴、青浦支队签订了联动执法及联席会议制度,为相关区县搭建了平台,建立起沟通协调机制。

表5 主要成矿元素的色阶上限值 Table 5 Upper limit of color gradation of major metallogenic elements

元素 低值区 低背景区 背景区 高背景区 异常外带 异常中带 异常内带 异常强内带Au 0.4 0.5 0.8 1.5 3.0 6.0 12.0 >12.0 Ag 50 60 120 200 400 800 1600 >1600 Cu 8 10 20 30 60 120 250 >250 Pb 10 12 25 40 80 160 320 >320 Zn 50 60 100 150 300 600 1000 >1000

图4 详查区Pb地球化学图 Fig.4 Geochemical map of Pb in the survey area

图5 详查区Zn地球化学图 Fig.5 Geochemical map of Zn in the survey area

图6 详查区Ag地球化学图 Fig.6 .Geochemical map of Ag in the survey area

图7 详查区F1因子得分(PbZnAg)等值线图 Fig.7 Contour map of F1 factor score (PbZnAg) in the survey area

表6 稳健统计得到的Cu的色阶上限值 Table 6 Upper limit of color gradation of Cu obtained by robust statistics

Cu 低值区低背景区背景区高背景区异常外带异常中带异常内带异常强内带色阶值 7.5 10.2 20.5 30 60 120 250 >250样品数 784 412 986 401 292 61 30 10频率(%) 26.34 13.84 33.14 13.47 9.81 2.05 1.01 0.34

详查区主要矿化或指示元素大致可以分成4组,据此可编制出各元素组合异常图(见图9)。

表7 详查区R型因子分析正交因子载荷 Table 7 .R-type factor analysis of orthogonal factor loading for the survey area

元素因子 F1 F2 F3 F4 F5 F6 F7 Cu -0.1317 -0.0255 -0.0226 0.9593 0.0729 0.0464 0.1166 Zn -0.7637 -0.1007 -0.1970 0.2533 -0.0986 -0.0019 -0.080 Ag -0.6005 -0.2618 0.0960 0.2148 0.0639 0.3087 0.3608 Sn -0.0727 -0.8191 0.1068 0.0547 -0.1104 0.0584 0.2094 Mo -0.0675 -0.1260 -0.0121 0.1008 0.0484 0.0440 0.9528 Pb -0.8560 -0.0276 0.0094 -0.1024 0.2452 0.0166 0.0874 As -0.0690 -0.0480 -0.1389 0.0388 0.0225 0.9683 0.0500 Sb -0.0844 -0.0762 -0.9540 0.0234 0.0134 0.1318 0.0048 W-0.1184 -0.8003 -0.2281 -0.0144 0.1756 0.0148 -0.0312 Au -0.1164 -0.0423 -0.0139 0.0710 0.9598 0.0252 0.0491

3 结论

在勘查地球化学数据处理过程中,根据研究工作的需要,运用多种数理统计方法或方法组合,并在此基础上进行深层数据挖掘,提取更多的信息,编制各类成果图件是十分必要且有效的。

图8 详查区PbZnAg衬度累加值等值线图 Fig.8 Contour map of accumulated contrast values of PbZnAg in the survey area

图9 详查区元素组合异常图 Fig.9 Element association anomaly in the survey area

在实际工作中经常会遇到什么是更好的数据处理方法的困惑,在此要说明的是没有更好的方法,只有更合适的方法,应根据不同的工作目的和研究区大小,灵活选择或实验对比运用各种数据处理方法,以期取得更好的数据处理、综合研究及成果图件编制效果,进而提交高质量的成果报告,更好地完成各类勘查工作任务。

本文简述了多种数据处理方法的综合运用及其取得的效果,作者并结合工作实际编写了这些方法的计算机程序,希望能对同行们有所帮助与启发,文中不妥之处还请同行们批评指正。

参考文献:

[1]谢学锦.勘查地球化学的现状与未来展望[J].地质论评,1996,42(4)346~355.

[2]谢学锦.进入21世纪的勘查地球化学[J],中国地质,2001,28(4):11~18.

[3]左仁广.勘查地球化学数据处理方法研究进展[J].地质论评,2013(4).

[4]程正发.大量数据排序算法的优化设计[J].物探化探计算技术,1996(2):125~129.

[5]赵丕忠,程正发,等.大兴安岭成矿带北段化探方法组合与找矿突破[J].物探与化探,2014(3):471~477.

[6]李伟.勘查地球化学数据处理的新方法[J],中国科技纵横,2013(1).

[7]Yu Bo chang and Xie Xue jing.Fuzzy Cluster Analysis in Geochemical Exploration[J].J.Geochem.Explor .,1984(23):281~291.

[8]XieXuejing and Yang Bingzhong.Application of Multiparametric Geochemical Methods in the Search for Oil in the Qinggang Region near Daqing Oil Field[J].J.Geochem.Explor.,1989(33):202~213.

程正发
《安徽地质》 2018年第4期
《安徽地质》2018年第4期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号