更全的杂志信息网

深度学习在地质学上的应用

更新时间:2016-07-05

0 引 言

深度学习始于20世纪60年代对人工神经网络的研究。人工神经网络受到了1959年诺贝尔奖得主David H.Hubel和Torsten N.Wiesel提出的理论启发,他们发现在大脑的初级皮层上有2种细胞,即简单细胞和复杂细胞,这2种细胞承担不同层次的视觉感知功能。由此,Ivakhnenko等(1966)提出了用于前馈的多层深度感知器。虽然对理论的研究从20世纪60年代就开始了,但是对深度学习的应用则始于1989年,Lecun等(1989)将标准反向传播算法应用于深度神经网络,目的是识别邮件上手写的邮政编码,该算法取得了很好的效果,但训练该深度神经网络需3天时间,所以在当时使用该算法来进行商业级应用或者工业级应用都是不现实的。因此,直至2006年,目标转向了对其他机器学习算法,如SVM(Support Vector Machine, 支持向量机)等。

但Hinton等(2006)对深度学习的提出以及模型训练方法的改进打破了神经网络发展的瓶颈。他们提出了2个观点:① 多层人工神经网络模型有很强的特征学习能力,深度学习模型学习得到的特征数据对原始数据有更本质的代表性,这将大大便于分类和可视化问题;② 对于深度神经网络很难训练达到最优的问题,可以采用逐层训练的方法解决,即将上层训练好的结果作为下层训练的初始参数。由于数据量的增加和计算性能的大幅提升,深度学习的发展迎来了黄金时代,并在许多领域取得了显著进步。其中,在2012年,也是深度学习发展的标志性的一年,Hinton的研究小组利用基于CNN(卷积神经网络)的图像分类模型“AlexNet”赢得了ImageNet图像分类比赛的冠军,错误率(loss值)约为15.3%,第二名之后所用的方法都是基于传统的机器学习方法,Hinton团队的方法要比后面的组高出至少10%(Krizhevsky et al.,2012)。此后,“AlexNet”在各种各样的计算机视觉应用上取得了成功,比如图像中的对象检测、图像分割、人体姿态估计、对象跟踪和视频分类等。

我国对深度学习的研究尚处于起步阶段,此领域的文献多为应用类。其中在地质领域中的应用有以下2个方面。① 基于深度学习算法的图像识别。如基于卷积神经网络的不良地质体识别与分类,该方法以新疆慰梨县为研究区域,针对典型不良地质体遥感影像特征,运用卷积神经网络的方法对其进行识别与分类,在数据集足够大的情况下,取得了良好的效果(陈冠宇等,2016);程国建等(2016)应用深度信念网络和卷积神经网络对岩石的薄片数据进行处理,分析这2种算法操作的可能性与优势。② 另一个应用领域是应用深度学习算法对矿产资源以及能源进行预测,如段友祥等(2016)应用卷积神经网络来处理地质储层参数并得到了良好的效果。所以在大数据时代下,深度学习也会在地质领域有着各种各样的应用。

“对这样的一些老人来说,也许那就是生命本身。也许那就是可以放心地去触摸的生命。”将面临死亡的老人与生命灿烂的少女置于一起,耄耋之年的老人们从这些少女身上,感受到了生命的存在,触摸到了生的脉搏,可以嗅到生的气息。也正是这些即将触摸死亡的老人,才能在这房间中真切地体会到生命宽广的内涵。《睡美人》中,川端康成运用了大量的笔墨对作品中的六位处女作了细致入微的描写,作者用审美的眼光进行描述,不仅将女性的外在美展示出来,还将这些女孩当作是精神寄托对象,充分展现她们的内在美,让其变成承载人类美好希望的载体。因此,这些睡美人也具有了相应的象征意义,代表了人类顽强的生命意识以及救赎意义。

1 深度学习的概念

1.1 深度

所谓的深度学习(Deep Learning),是与浅层学习区别开来的一个概念。想要了解什么是深度,首先要了解神经元的概念。神经元由4个基本元素组成(图1)。

图1 神经元示意图 Fig.1 Schematic of neurons

从技术上来看,卷积神经网络(CNN)是在神经网络的基础之上发展而来的,若要建立一个完整的卷积神经网络,需要包含卷积层、池化层、1个全连接层以及1个激活函数层。卷积神经网络的提出是受了生物学研究的影响的,1968年,1篇公开发表的文献详细介绍了猴子纹状皮层,主要内容是沿着垂直方向延伸的细胞组是如何被整合而与视觉特征匹配的,这个研究对CNN的理论的发展起到了非常重要的作用。

(2) 加法器。其作用是将输入信号xi与其对应的权重Wki相乘后再相加。

据调查显示,43%的学生每天的英语课外阅读时间不足10分钟。高中生对英语阅读缺乏兴趣,其阅读来源多为课本和习题,如完形填空、阅读理解等,多出于应试目的,很少迎合学生自身的兴趣。

输入信息相乘再相加:

由此,图1的计算过程为:

(4) 外部偏差。用bk表示。

DBN模型可以看成由多个RBM结构和1个BP(Back Propagation, 多层前馈神经网络)层组成,其训练过程也是从前到后逐步训练每一个RBM结构,使得每一个RBM的隐层达到最优,从而最优化整体网络(图5)。值得注意的是,在DBN的结构中,只有最后2层之间是无向连接的,其余层之间均具有方向性。

(1)

将输出值yk计算为netk值的某个函数:

yk=f(netk)

(2)

式(2)中,f被称为激活函数。事实上可以定义多种多样的激活函数,常用的激活函数有Softmax函数、Sigmoid函数、ReLU函数等。

深度学习的神经网络结构都是由若干个神经元构成的(图2)。由图2可以明显看到,1个完整的神经网络图由4种要素组成,即输入信号、隐含层神经元、输出神经元和输出信号,其中隐含层神经元不止1层。

(3) 激活函数f。在输入信号xi和权重Wki通过加法器后,得到1个线性结果。但如果要使神经元更接近于自然神经元,需将加法器的结果变为非线性的,这就需要激活函数f,其作用是限制神经元输出值yk的幅度。

图2 神经网络示意简图 Fig.2 Schematic of simple neuron networks

由此可以定义深度的概念为从一个输入到一个输出的最长路径的长度。而深度是影响深度学习模型一个重要因素之一。从深度上来看,浅层学习算法(或者说传统的机器学习算法)往往只有1层结构或者2层结构。而现今的深度学习模型中,其层数为几十层甚至上百层,这也是浅层学习与深度学习最大的差别之一。

1934年,美国著名学者杜威在《我们如何思维》中创造性提出了“反思性教学”理念,随后便引起了学术界的广泛重视。唐纳德·舍恩在《反思性实践者》中首次进行了反思性教学实践,并引发了世界各国的教学改革热潮。上世纪80年代,美国、澳大利亚、加拿大等发达国家先后进行了大量反思性教学实践活动,各国学术界也对反思性教学理论进行了深入研究。上世纪90年代,我国正式引入了反思性教学理论,并将其作为教学改革的重要指导。沃丽思(1991)在《反思性教学理念在外语教师培训中的运用》中详细剖析了教育专业化反思模式,为外语教师专业化发展中反思性教育理念的运用提供了重要指导。

1.2 学习

学习是人类具有的一种智能行为,但究竟什么是学习,长期以来众说纷纭。要明确什么是学习,首先要明确一个概念,什么是知识?知识的一般性定义为人或机器储存起来以备使用的信息或模型,用来对外部世界作出解释、预测和适当的反应。从而可对学习来做一个简单的定义,学习就是获取新知识的一种行为。在深度学习中,学习的定义与机器学习一致,均指研究机器获取新知识和新技能并识别现有知识的学问。从神经网络来看,学习指的是为神经网络选择一个合适的结构,输入层的源节点数与输入数据的数目一样,输出层的神经元个数为类别个数,利用合适的算法,以样本的一个子集来训练网路,这个网络设计阶段即为学习。

1.3 监督学习与无监督学习

监督学习也称为有教师学习(图3)。从概念上讲,可以认为教师具有对周围环境的知识,这些知识被表达为一系列的输入-输出样本。然而深度学习网络却对周围环境一无所知。现假设给教师和深度学习网络提供从同样环境中提取出来的训练向量,教师可以通过自身掌握的一些知识来为深度学习网络提供对训练向量的预期响应。事实上,预期响应一般都代表着神经网络完成的最优动作。神经网络的参数可以在训练向量和误差信号的综合影响下进行调整。误差信号的定义为神经网络的实际响应和预期响应之差。这种调整可以逐步而又反复地进行,其最终目的就是要让神经网络模拟教师,利用这种手段,教师所掌握的关于环境的知识就可以通过训练过程最大限度地传授给神经网络。这样的过程称为监督学习。

②州城即山阴县城,秦始皇改大越为山阴县,属会稽郡。南朝宋在会稽郡置东扬州,齐、梁、陈因裘,州治设在山阴县城,故山阴城也称州城。

图3 监督学习示意图 Fig.3 Schematic of supervised learning

图4 无监督学习示意图 Fig.4 Schematic of unsupervised learning

图4所示为在无监督学习中,没有外部的教师来监督学习的过程。而且,必须提供任务独立度量来度量网络的表达质量,让网络学习该度量而且根据该度量来最优化网络自由参数。对一个特定的任务独立度量来说,一旦深度学习网络能够与输入数据的统计规律相一致,那么网络将会发展其形成输入数据编码特征的内部表示的能力,从而自动创造新的类别。

The one who got slapped was hurt, but without saying anything, he wrote in the sand, “Today my best friend slapped me in the face.”

2 常见的深度学习网络结构

2.1 深度信念网络(DBN)

深度信念网络(Deep Belief Networks, DBN)是一种基于受限制的玻尔兹曼机(Restricted Boltzmann Machine)模型建立的一种无监督的深度学习网络结构。受限玻尔兹曼机是玻尔兹曼机的一种特殊结构,由1个可见神经元层和1个隐层神经元层组成,由于隐层神经元之间没有互相连接,且隐层神经元独立于给定的训练样本,这使得直接计算依赖数据的期望变得容易,可见层神经元之间也没有相互连接,通过从训练样本得到的隐层神经元状态上执行马尔科夫链抽样过程,来估计独立于数据的期望值,并行交替更新所有可见层神经元和隐层神经元的值。

netk=x1Wk1+x2Wk2+…+xiWki+bk

农业灌溉水有效利用系数 农业灌溉水有效利用系数指在一次灌水期间被农作物利用的净水量与水源渠首处总引进水量的比值,是衡量灌区从水源引水到田间作物吸收利用水的过程中灌溉水利用程度的重要指标。

简单地说,人格是指一个现实的人。人格的心理特征主要包括三个方面:能力、气质和性格。通常来说人格具有整体性、稳定性、可塑性、独特性以及复杂性等特征。随着微传播时代的来临,越来越多的网络使用者利用手机上网,手机网民人数和上网时间有逐年增长的趋势[1]。伴随着网络技术的发展和人们网络交往的增加,众多大学生沉迷于网络,在网络环境交往过程中形成了相对稳定的网络人格。网络人格和现实人格的结合成为大学生群体相对稳定的个性特征。

图5 深度信念网络示意图 Fig.5 Schematic of Deep Belief Networks

2.2 卷积神经网络

(1) 输入信号及权重。输入信号指的是图中的xi,将各个输入信号xi与加法器连接线上的Wki称为权重。

打开主图,拖到新建的联系表上面,它会成为一个新的图层。把这个图层的混合模式改为强光,就可以了。如果你想进一步调整,可以使用曲线或加深与减淡工具,直到效果满意为止。

CNN遵循了简化的信息匹配过程,这与猴子纹状皮层的细胞布局结构非常类似。当信号经过猴子的纹状皮层时,如果得到某种视觉模式的刺激,某些层便会释放信号。CNN中也会出现类似的行为,即某些神经元构成的簇会依据从训练中学习到的模式而激活。1个完整的卷积神经网络至少包括1个卷积层(Convolutions)、1个池化层(Pooling)或者说子抽样层(Subsampling)、全连接层(Full connection)和激活函数层(图6)。

图6 卷积神经网络示意图 (LeCun et al.,1998) Fig.6 Schematic of Convolutional Neural Networks

2.2.1 卷积层 在介绍卷积层之前,首先要介绍一下卷积操作。卷积的目的是将卷积核(滤波器)应用到某个张量的所有点上,并通过将卷积核在输入张量上滑动而生成经过滤波器处理过的特征。卷积操作如图7所示,其中的示意图是指卷积核与一个5×5的方阵中的第一个3×3的值对应相乘再相加之后得到的结果。这种由卷积操作构成的层叫做卷积层。

图7 卷积操作示意图 Fig.7 Operation chart of convolution

图8 池化示意图 Fig.8 Pooling schematic

2.2.2 池化层 卷积之后会获得若干个特征,通常来说,在图像分类工作,可以使用这些特征(例如使用Softmax分类器),但是这面临着计算量的挑战,训练1个存在着近百万个特征来作为输入的分类器十分不便,而且很容易过拟合,因此需要对特征进行进一步的降维处理。卷积后的特征具有“静态性”的属性,即一个图像的区域特征有很大的可能性在另一个区域中同样适用,所以选用卷积后的特征。因此,可以对不同位置的特征进行聚合统计来描述大图像,例如可以计算图像中的某个特定特征的最大值(称为最大池化过程)或者平均值(称为平均池化过程)(图8)。这些概要统计不仅可以有效地降低维度(相较于使用提取的所有特征),还可以改善图像分类的效果,有效地解决过拟合的问题。从数学形式上定义,在获取卷积特征后,要确定池化区域m×n,来对特征进行池化操作,将这些特征划分到若干个不相交区域中,并用这些区域的平均值或最大特征值来计算池化后的特征。

2.2.3 全连接层 经过多个卷积层和多个池化层的传递,卷积神经网络(CNN)依靠全连接层来对提取的特征进行分类,从而可以得到基于输入的概率分布Y,其计算公式(李彦冬等,2016)为:

Y(i)=P(L=li|H0;(W,b))

(3)

2.2.4 激活函数层 事实上,卷积过程和池化过程得到的特征都是线性的,这就需要一个激活函数层,使得特征值有一个非线性的特点,这样卷积神经网络(CNN)模型会更加接近灵长类动物大脑处理视觉信号的方式。

3 深度学习模型与地质学的结合

自2012年Hinton带领的小组获得ImageNet图像分类比赛的冠军以来,深度学习在目标检测、图像分割、对象跟踪以及视频分类等计算机视觉领域也取得了很大的发展。通过对计算机视觉的应用,深度学习被用在了医疗行业,2017年,Kaggle机器学习竞赛平台上举办了一场识别CT图像检测肺癌的比赛,这实际上是对目标检测的一个应用;同样在2017年,斯坦福大学的吴恩达带领的机器学习小组基于卷积神经网络提出了一种新的深度学习模型,可以诊断14种类型的心率失常,经实验证明,判断的准确率要高于人类(Rajpurkar et al.,2017)。类比上述2个案例,可以从2个方向来处理地质数据。

3.1 计算机视觉在地质工作中的应用

类比第一个案例,可以将深度学习应用于处理遥感图像中。其中一个设想是通过深度学习的方法判断出遥感异常存在的区域,从而通过遥感异常圈定成矿靶区的所在位置。国内也已经开始使用卷积神经网络算法来处理遥感图像数据并取得了一定的效果,但是通过深度学习算法来寻找遥感异常,国内暂时没有文献对此方向进行过描述。对此工作,可以分别通过监督学习和非监督学习2种方式进行:监督学习需要人工在遥感图像中圈定出遥感异常区域,通过对遥感异常图像数据的训练,从而对未知的遥感图像进行判断;非监督学习则只需将遥感数据输入到深度学习模型中,通过对图像信息进行聚类,由此来圈定遥感异常区域。

第二个设想是通过深度学习算法对岩石样本数据进行分类。通过卷积神经网络算法,可以先从三大岩——岩浆岩、变质岩、沉积岩入手。首先从收集数据开始,其次要构建以卷积神经网络为主的深度学习模型,利用图像数据对深度学习模型进行训练,利用生成的模型文件对模型进行检测。若检测效果良好,可以将模型文件投入使用;若效果一般,则需对模型重新进行设计。

第三个设想是通过深度学习算法对岩石薄片数据进行描述。事实上,如今的工作是,通过对岩石薄片镜下图像展示的具体信息来对岩石进行鉴定工作(图9)。通过对图中的具体信息进行提取,运用监督学习的方法,将信息输入到深度学习模型中,通过对模型的使用来确定薄片中包含哪些信息,并聚合信息,从而对岩石薄片进行鉴定。

图9 岩石薄片镜下鉴定 Fig.9 Microscopic identification of rock thin sections

3.2 通过深度学习处理地质异常数据

传统的地质找矿过程中,在成矿靶区的圈定工作中,重要的一点就是要寻找地质、地球化学、地球物理和遥感异常。其中,重磁异常是很重要的一种地球物理异常,对重磁数据的处理分为2个阶段,首先是对重磁异常的滤波和增强,其次是对重磁数据进行反演。在重磁反演技术中,常用的方法分为2大类,即线性反演的迭代优化方法和全局随机优化的非线性反演算法(柳建新等,2016)。线性反演的迭代优化有着收敛速度快的特点,但是容易陷入局部极小。所以,全局随机优化的非线性反演算法被引入到地球物理反演中,并取得了成功。从本质上讲,深度学习常用的算法也属于全局随机优化的非线性反演算法,相较于BP神经网络等浅层算法,深度学习算法在应用领域有着收敛性更好、精度更高的特点。所以在重磁异常的地球物理反演中,可以将深度学习算法引用其中。

3.3 通过深度学习处理地震波数据

吴恩达等利用的ECG(心电图)数据本质上是一种波形数据,将波形数据进行分类从而得出心率异常。在地质学当中,与波形数据密切相关的便是地震波数据。事实上,国外已经开始将深度学习算法应用于地震波数据处理中,其中的一个做法是训练一种机器学习算法,让算法仅依靠由压力所产生的声音,去观察实验室地震即将发生的现象(Rouet-Leduc et al., 2017),通过听取实验室地震发出的声信号,机器学习可以很好地预测地震之前的剩余时间。但这些预测仅仅基于声学信号的物理特性,该方式目前仅在实验室模拟的地震中证实有效,在实际地震发生时尚未证实其效果如何。

4 结 论

(1) 随着大数据时代的来临以及计算机硬件能力的提升,深度学习已经发展到了一个新的阶段。深度学习的发展为地质信息化应用提供了一个新的解决方案。通过对深度学习理论的介绍,明确深度学习的能力及擅长方向。

(2) 在深度学习与地质结合的现有工作基础上,以及深度学习在医学上的成功案例,提出了深度学习应用在地质上的3方面可能性:① 将计算机视觉的成功案例应用在遥感图像的识别以及岩石薄片数据的目标检测中;② 使深度学习相比于整理好的数据更擅于处理原始数据,通过对原始地物化遥数据的分析,可以将原始数据进行聚类分析,对聚成的类进行定性分析,确定地物化遥异常,从而圈定成矿靶区;③ 处理地震中出现的声信号数据,从而判断出地震发生之前的剩余时间。

四个年轻人骑行到市郊,休息片刻,合影。合影时楚墨非常想把手搭上静秋的肩膀,跟静秋商量,静秋二目圆瞪:“你敢?”楚墨当然不敢。四个人继续前行,至一条偏僻的土路,一辆农用三轮车如螃蟹般横行过来。三轮车在驶近他们的时候彻底失去控制,楚墨听到静秋高喊一声“妈啊”,回头看,静秋已经长出翅膀,飞落路边阴沟。阴沟里有污水,有石头,静秋栽在里面,不再发出任何声音。楚墨扔掉自行车,抱起静秋,一路狂奔。他一边跑一边哭,一边哭一边跑,后来阿芳说,她从未见过一个男人有如此之多的眼泪。

参考文献

陈冠宇,安凯,李向,2016.基于卷积神经网络的不良地质体识别与分类[J].地质科技情报,35(1):205-211.

程国建,刘丽婷,2016.深度学习算法应用于岩石图像处理的可行性研究[J].软件导刊,15(9):163-166.

段友祥,李根田,孙歧峰,2016.卷积神经网络在储层预测中的应用研究[J].通信学报,37(增刊1):1-9.

李彦冬,郝宗波,雷航,2016.卷积神经网络研究综述[J].计算机应用,36(9):2508-2515.

柳建新,孙欢乐,陈波,等,2016.重磁方法在国内外金属矿中的研究进展[J].地球物理学进展,31(2):713-722.

周永章,黎培兴,王树功,等,2017.矿床大数据及智能矿床模型研究背景与进展[J].矿物岩石地球化学通报,36(2):327-331.

CARREIRA J, LI Fuxin, SMINCHISESCU C, 2012.Object recognition by sequential figure-ground ranking [J].International Journal of Computer Vision, 98(3): 243-262.

GIRSHICK R, DONAHUE J, DARRELL T, et al., 2014.Rich feature hierarchies for accurate object detection and semantic segmentation [C]//2014 IEEE Conference on Computer Vision and Pattern Recognition.Columbus, OH, USA: IEEE, 580-587.

HINTON G E, SALAKHUTDINOV R R, 2006.Rreducing the dimensionality of data with neural networks [J].Science, 313(5786): 504-507.

HINTON G E, SRIVASTAVE N, KRIZHEVSKY A, et al., 2012.Improving neural net-works by preventing co-adaptation of feature detectors[J].Computer Science, 3(4): 212-223.

HOWARD A G, 2013-12-19.Some improvements on deep convolutional neural network based image classification[J/OL].Compter Science, https://arxiv.org/abs/1312.5402.

IVAKHNENKO A G, LAPA V G, 1966.Cybernetic Predicting Devices [R].Indiana, USA: Purdue University.

KRIZHEVSKY A, SUTSKEVER I, HINTON G E, 2012.ImageNet classification with deep convolutional neural networks [C]// PEREIRA F, BURGES C J C, BOTTOU L, et al.Advances in Neural Information Processing Systems 25.Lake Tahoe, USA: Neural Information Processing Systems Foundation, 1097-1105.

LECUN Y, BOSER B, DENKER J S, et al., 1989.Backpropagation applied to handwritten zip code recognition [J].Neural Computation, 1(4): 541-551.

LECUN Y, BOTTOU L, BENGIO Y, et al., 1998.Gradient-based learning applied to document recognition [J].Proceedings of the IEEE, 86(11): 2278-2324.

RAJPURKAR P, HANNUN A Y, HAGHPANAHI M, et al..2017-07-06.Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks [J/OL].Computer Science.https://arxiv.org/abs/1707.01836v1.

ROUET-LEDUC B, HULBERT C L, LUBBERS N, et al., 2017.Machine Learning predicts laboratory earthquakes [J].Geophysical Research Letters, 44(18): 9276-9282.

SZEGEDY C, TOSHEV A, ERHAN D, 2013.Deep neural networks for object detection [C]//BURGES C J C, BOTTOU L, GHAHRAMANI Z, et al.Advances in Neural Information Processing Systems 26.Lake Tahoe, USA: Neural Information Processing Systems Foundation.2553-2561.

李苍柏,范建福,宋相龙
《地质学刊》 2018年第01期
《地质学刊》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号