更全的杂志信息网

应用PCA和多元非线性回归快速预测储层敏感性

更新时间:2016-07-05

0 引言

敏感性研究是分析储层损害机理的前提,能为钻井液、完井液的优化设计提供重要依据,对于制定系统的油气层保护技术方案也具有重要意义。敏感性实验是敏感性分析的常用方法,该方法所需岩心数量大,耗时久,岩心钻取切割与烘干过程中易受损害,造成实验结果误差大[1-2]

近年来发展了许多预测储层敏感性的新方法[3],如模式识别法、回归分析法、神经网络法等。这些方法可通过一定量的样本数据预测储层敏感性,耗时短,并节省大量的人力物力。模式识别法是把敏感性与特征已知的样品按敏感性数值分不同等级,分别建立各等级样品的隶属函数,通过计算预测对象与均值样本的距离,预测储层的敏感性[4-6]。该方法原理简单,操作方便,无人为因素干扰,结果客观,但只能预测储层损害等级,精度低。回归分析法是根据已有样本建立数学模型,定量预测未知储层敏感性[7-9]。该方法原理简单,预测速度快,但模型选择易受人为因素影响,准确率低,泛化能力弱。神经网络法模拟人脑,自动提供复杂的非线性函数,依据样本数据建立模型,定量预测储层敏感性,预测精度高[10-13]。但该算法程序复杂,泛化能力弱,收敛速度慢,限制了它的广泛使用。

本文在分析现有储层敏感性预测方法的基础上,结合前人研究的成果,提出了一种耦合PCA与多元非线性回归分析预测储层敏感性的新方法,并通过精度检验提高其泛化能力。经拟合发现,该方法预测速度快,准确率高。

核医学检查显示:单纯FT3显著升高且摄碘率降低14例;单纯FT4显著升高且摄碘率降低10例;FT3、FT4升高且摄碘率降低30例,共计阳性患者54例,阳性率为90%;超声检查阳性患者45例,阳性率为75.0%,核医学检查与超声检查联合显示阳性患者60例,阳性率为100.0%。

1 基本原理

首先对样本进行PCA降维处理,降维后得到的特征彼此之间相互独立,不存在线性相关的关系,便于探索特征值与预测值之间的数学关系;再用最小二乘法对各组样本数据综合分析,找出特征值与预测值之间的数学模型;最后用检验样本对模型进行精度检验。

1.1 PCA降维

PCA是一种对数据进行降维的数学方法,该方法把数据投射到样本散布最开的正交向量上,使投射平均均方误差尽可能小。使用投影的方式压缩数据,最大程度保存了原有数据信息,不舍弃任何特征。且该方法在计算过程中无需人为干预,计算结果只与数据本身相关。

PCA处理不但能减少每组样本的特征个数,而且确保这些特征相互独立,使样本规律更清晰,便于回归模型的挑选,并加快算法速度。

式中:X0为原始样本矩阵。

式中:为矩阵 X0中每列数据的平均值;Var(xj)为矩阵X0中每列数据的方差。

PCA降维的步骤为:

绩效考核的重要原则之一是:为了使评估真正地客观有效,评估结果必须及时地反馈给被评估者本人。显然,互联网企业的绩效考核人员缺乏这种及时反馈结果的意识。首先,他们不了解及时反馈评估结果的重要性,尤其是对员工的激励教育。其次,绩效考核人员担心员工在第一时间获取绩效考核结果后,会造成其情绪上的不满,降低其工作的积极性。

该样本共有n条数据、p个影响因素。

多元非线性回归就是寻找能表示特征值x1,x2,…,xn和预测值yi之间的非线性函数关系式:

试验结果表明:一是地膜种植,尤其是可降解地膜(白地膜)种植能够起到增温保湿作用,提前了马铃薯的生育进程,增强了马铃薯的田间长势,提高了产量、平均商品率,增加了产值,在作物后期严重干旱的情况下地膜种植有利于提高产量。降解地膜在作物开花后开始降解,保湿作用不明显,但地温低,有利于块茎膨大。二是秸秆覆盖带状种植在马铃薯苗期到开花期有利于作物生长,但在严重干旱时不具有保湿作用。建议在今后的马铃薯生产中将地面全膜种植作为陇西县马铃薯增产技术之一大力推广。

1)建立原始样本矩阵。

3)计算样本相关系数矩阵。假设进行数据标准化处理的样本矩阵为X,则X的相关系数矩阵为

式中:rij为矩阵X中第i列方差与第j列方差的协方差;R为矩阵X的相关系数矩阵。

4)计算相关系数矩阵的特征值和相应的特征向量,得到特征值 λ=(λ1,λ2,…,λp),特征向量 ai=(a1,a2,…,ap)。

1.写作兴趣不浓。教育心理学的角度来说,学习兴趣是一个人倾向于认识、研究获得某种知识的心理特征,是可以推动人们求知的一种内在力量。常言道:“兴趣是最好的老师,是入门的向导。”是推动学生写作的一种有效地内在动力,学生如果没有写作兴趣,写不出好的作文,所写之文不过是东平西凑,生拉硬拽。

5)根据影响因素累积贡献大小选择前k个因素。计算累积贡献率的公式为

式中:λi为矩阵R的特征值;η为累积贡献率。

造成电缆损坏的原因是多方面的,其中也来自于电缆线自身。比如,有的电缆线质量不够好,一些电缆的制造商在制作电缆的过程中没有严格按照工艺与流程,这样就会直接导致电缆的生产质量不达标,在使用的过程更容易发生损坏,不仅影响了电网的运行,还极大地浪费了能源。另外,电缆线是有使用年限的,随着使用时间的不断增长,电缆线本身也会逐渐老化,如果不能及时检查或者更换,就会很容易发生安全故障。其次,很多电缆损坏与其材料有关,在一些气候变化明显的地区,电缆的老化程度会加剧,很容易出现安全故障,也导致电缆运行出现很多问题,甚至一些电缆的绝缘层和沿面也会放电,这就直接导致了电缆故障的发生。

通常,当累积贡献率达到85%以上时,即认为前k个影响因素已包含数据的原始信息。前k个特征向量组成的矩阵U,即样本降维矩阵。

槐生一天天长大,屋里慢慢儿恢复了一些生气。看他咿呀学语,满地乱跑,我的心里又涌出了喜悦——这样的感觉只在六七年前才有过。槐生困着了,我长久地瞄着他的小鼻子小眼儿,总也看不够。只是一闭上眼,还是爱想起我的狼剩儿,想起夭折的大女儿,和那个冇来得及出世的毛毛。有一天夜夕,我又到厨屋给狼剩儿叫魂儿,槐生跟着进来,一脸稚气地问我,妈妈,狼剩儿是哪个啊?我把槐生搂进怀里,望着缸里漂动的灯盏说,这狼剩儿啊,是你的大哥。他要是冇丢啊,比这水缸还要高。他比你大整整十岁呢。缸里水映着灯亮,空明澄碧,像是盛满了月光。我趴在缸沿儿,好像看到我的狼剩儿正穿过月光,摇摇晃晃地向我走来,整个世界眨眼间都亮堂起来!

涌流理论为我们提供了研究译员译时体验的工具。在该理论视角下,口译研究可具体分为两个方向:译员译时心理体验分析;涌流与口译教学。

式中:U为样本降维矩阵。

6)利用式(6),将p个影响因素降维成k个影响因素,即:

通窍冲洗方对慢性鼻-鼻窦炎Fess术后恢复的疗效观察(张健 王丽华 沙志荣 郭裕 茅金金 王媚 陆双燕)5∶372

式中:X′为降维后的样本矩阵。

1.2 多元非线性回归

回归分析是对具有相关关系的2个或2个以上变量数量变化的一般关系进行测定,它主要是研究变量之间的相互关系,建立变量之间的经验公式,以便达到预测或控制的目的[8-9]

2)对原始数据进行标准化处理。

首先,利用PCA对样本降维、去噪,使其规律更明显;其次,采用回归分析法寻找合适的模型,定量预测储层敏感性;最后,检验模型预测精度,若精度低于85%,重新挑选训练样本重复前2步建立新模型,即可解决回归分析因受人为干预影响造成的误差与泛化能力差的问题。

通过最小二乘法可求得模型中相应的参数。

结合表3可以看出,于七律、七绝之上除高山仰止的杜甫、李白外,最为推崇的当属李商隐(七绝中与王昌龄选数差距不大,可并列)。

1.3 二者结合预测储层敏感性

PCA能解决因多重共线问题导致的解空间不稳定性问题,除去噪声使数据更易显示其内在规律,但它不能明确特征向量与预测值之间的具体关系。

回归分析能明确特征向量与预测值之间的数学关系模型[9],得到敏感性损害程度的具体数值,但模型的选取受人为因素干扰较大。当选取的模型不适当时,预测结果可能与实际相差较大。且模型选定后,参数固定导致其泛化能力弱。

式中:yi为预测值;x1,x2,…,xn为特征值。

2 盐敏预测模型的建立

盐敏是指当含盐度不同于地层水矿化度的流体进入储层时,引起黏土矿物的物理和化学变化,堵塞孔喉而造成渗透率下降的现象[1,14]。当高于地层水矿化度的工作液滤液进入油气层后,可能引起黏土的收缩、失稳、脱落;当低于地层水矿化度的工作液滤液进入油气层后,则可能引起黏土的膨胀和分散。黏土矿物质量分数是影响储层盐敏大小的重要因素[15]

在借鉴国内外流域管理联席会议制度成功经验的基础上,提出了汉江流域水资源管理与保护联席会议制度方案,包括联席会议的成员单位、主要任务、运行机制等内容。初步考虑,联席会议召集单位为长江水利委员会,成员单位包括流域内各省级行政区政府及相关部门、重要水利水电工程管理部门以及电网调度运行管理部门。

塔里木油田轮古井区三叠系油藏具有异常丰富的黏土矿物[16-17],其中以高岭石、伊利石、伊/蒙混层、绿泥石为主。该井区的矿物成分以石英和岩屑为主,长石次之。碳酸盐胶结物主要是方解石与白云石。

根据塔里木油田储层敏感性与储层物性、岩石结构、孔隙结构、岩石矿物组成及地层流体的密切关系[18],收集薄片、粒度、压汞、扫描电镜等实验资料,并结合大量相关文献资料,确定14个影响储层敏感性的主要特征参数:伊/蒙混层质量分数、伊利石质量分数、高岭石质量分数、绿泥石质量分数、黏土矿物质量分数、石英质量分数、钾长石质量分数、斜长石质量分数、方解石质量分数、黄铁矿质量分数、菱铁矿质量分数、白云石质量分数、气测渗透率与孔隙度。

首先,利用Python对90个样本进行PCA分析,通过奇异值分解求得的降维矩阵U为

其次,由式(7)将14维的特征向量降低为8维(以第1组数据变换为例):

再次,对敏感性已知的储层样本中的80%的训练数据进行回归分析,根据最小二乘法建立定量反映储层敏感性与8个特征的预测模型:

式中:y 为储层盐敏损害指数;x1,x2,…,x8为储层盐敏损害程度的影响因素;a为回归参数。

最后,通过样本中20%的数据进行精度检验,若精度低于85%,重新选择训练数据重复前2步,构建新的预测模型。

图1为所有样本数据的新方法预测结果。由图1可知,盐敏损害指数为0.2~0.9的样本预测结果较好,高于0.9或低于0.2的误差较大,因为该数据段样本较少,规律不明显。统计量0.87,说明该程序可快速、准确预测储层的敏感性,样本量越多,预测误差越小。

图1 塔里木油田轮古井区盐敏损害指数预测与实测结果

由表1可知,新方法准确率的平均值为95.7%,神经网络法准确率的平均值为94.9%,直接回归法准确率的平均值为86.4%。新方法与直接回归法相比,可大幅度提高预测值的准确率。与神经网络法相比,两者预测精准性相近,但神经网络法原理复杂,收敛速度慢,新方法可大大提高预测速度。

表1 塔里木油田轮古井区盐敏损害指数预测值与实际值结果对比

井号 层位 预测值新方法 神经网络法 直接回归法 实际值 预测准确率/%新方法 神经网络法 直接回归法MN1 J1a1 0.529 0.534 0.399 0.513 96.9 95.9 77.796 8 MN1 J1a4 0.645 0.649 0.551 0.643 99.7 99.1 85.661 1 MN1 J1a2 0.477 0.415 0.531 0.486 98.1 85.4 90.784 4 MN1 J1a4 0.645 0.665 0.583 0.641 99.4 96.2 90.957 9 MN1 J1a2 0.482 0.455 0.491 0.453 93.6 99.5 91.598 3 MN1 J1a4 0.647 0.662 0.675 0.645 99.6 97.3 95.288 8 MN1 J1a2 0.478 0.568 0.459 0.490 97.5 84.2 93.608 7 MN1 J1a4 0.640 0.660 0.671 0.632 98.7 95.5 93.788 2 MN1 J1a4 0.641 0.653 0.660 0.634 98.9 97.0 95.904 8 TZ2 J1a4 0.749 0.711 0.512 0.765 97.9 92.9 66.901 5 TZ2 J1a4 0.738 0.725 0.613 0.747 98.8 97.1 82.092 7 TZ2 J1a4 0.739 0.722 0.619 0.748 98.8 96.5 82.750 4 TZ2 J1a4 0.745 0.742 0.599 0.762 97.8 97.4 78.616 6 YN2C J1a1 0.937 0.938 0.679 0.839 88.3 88.2 80.940 8 YN2C J1a1 0.923 0.924 0.819 0.915 99.1 99.0 89.525 7 YN2C J1a1 0.953 0.979 0.820 0.949 67.7 96.9 86.374 8

3 结论

1)利用耦合PCA与多元非线性回归的算法建立了预测储层敏感性的新模型,在塔里木油田试验后发现预测准确率的平均值在95%以上。

此后许多年,釜溪河上出现了一个被时间遗忘的摆渡人。他刚到那里的时候,就像在一幅乡村画上突然坠落一滴墨,大家千方百计想把它擦除,但在所有努力都宣告失败以后,人们对此也就习以为常,久而久之,那粒飞来之墨也成了画的一部分。

2)利用PCA方法投影降维,保证样本的最小损失;利用模型中的精度检验环节,增加其泛化能力:因此,新模型能快速、准确地预测储层敏感性。

3)新模型预测准确率与样本量有关。样本量较少时,预测结果误差较大。

参考文献

[1]单华生,周锋德.伊通盆地鹿乡断陷低渗储层敏感性机理分析及分布预测[J].地球科学,2012,37(4):719-727.

[2]何永宏.鄂尔多斯盆地姬塬油田长8储层敏感性研究[J].断块油气田,2014,21(1): 87-91.

[3]李海斌.计算机技术在储层敏感性预测中的应用[J].计算机光盘软件与应用,2012(3):12-12.

[4]蒋官澄,王晓军,吴雄军,等.模式识别在储层敏感性预测中的应用[J].油气地质与采收率,2010,17(5):61-64.

[5]刘子雄,李敬松,黄子俊,等.利用模式识别方法预测低渗气井压裂产能[J].断块油气田,2015,22(4):505-507.

[6]王清华.改进的灰色模型在储层敏感性预测中的应用[J].钻井液与完井液,2008,25(4):31-33.

[7]范雯.逐步回归分析方法在储层参数预测中的应用[J].西安科技大学学报,2014,34(3):350-355.

[8]唐杰,林志扬,莫莉.多项式回归与一致性研究:应用及分析[J].心理学报,2011,43(12):1454-1461.

[9]张洁,陈文,康晓娜,等.玻璃微珠目数与砂床特征的回归分析模型[J].断块油气田,2015,22(2):270-272.

[10]江厚顺,孟宝锋,孙珀,等.基于Matlab下神经网络技术预测储层敏感性[J].西部探矿工程,2007,19(9):68-69.

[11]吴雄军,蒋官澄,赵琳,等.径向基神经网络优化及在储层敏感性定量预测中的应用[J].油气地质与采收率,2012,19(1):107-110.

[12]叶正荣,樊世忠,杨普华.综合运用BP网络和优化算法建立储层敏感性预测模型[J].钻井液与完井液,2000,17(3):9-13.

[13]夏文鹤,潘硕,孟英峰,等.基于音频信号的气体钻井返出岩屑量监测方法研究[J].石油钻探技术,2017,45(3):121-126.

[14]吴小斌,王志峰,崔智林,等.镇北地区超低渗储层敏感性评价及机理探讨[J].断块油气田,2013,20(2): 196-200.

[15]康毅力,罗平亚.黏土矿物对砂岩储层损害的影响:回顾与展望[J].钻井液与完井液,2000,17(5):36-40.

[16]贾进华,申银民.塔里木盆地东河砂岩段准层序组特征及岩相古地理与砂体分布[J].石油学报,2017,38(2):135-149.

[17]欧阳传湘,邓志颖,张伟.轮古7井区三叠系砂岩储层黏土矿物特征及敏感性损害研究[J].岩性油气藏,2011,23(5):111-114.

[18]原宏壮,孙建孟,肖承文,等.塔北地区储层敏感性综合预测[J].油气地质与采收率,2006,13(5):53-55.

王沛,欧阳传湘,陈宏生,陈向军
《断块油气田》 2018年第02期
《断块油气田》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号