更全的杂志信息网

柴油硫含量中红外光谱SPA-PLS快速检测研究*

更新时间:2009-03-28

柴油中的硫及硫化物使用过程中会对发动机、气缸和曲轴箱内壁造成不同程度的腐蚀,燃烧排放后形成二氧化硫或三氧化硫,致使大气受到污染,因此测定柴油的硫含量,对于正确评价柴油品质具有很重要意义[1-2]。传统的柴油硫含量检测方法,主要有燃灯法、X射线荧光光谱法、氧化微库仑法、紫外荧光法以及气相色谱法,这些方法要么分析速度慢,要么重复性较差,且都是单项目分析,不能够满足快速、实时、多指标的测试需求。近年来,光谱检测技术因其原位检测、低成本、环境友好、快速和多项目同时检测等特点,在柴油硫含量检测研究领域得到了快速发展[3]

周扬等[4]对柴油的沸点、密度、芳烃总量进行了近红外光谱定量检测,其预测模型的相关系数R达到了98.91%、99.68%和99.43%,均方根误差RMSEP分别为:2.84、0.88×10-3和0.59。闻环等[5]采用Nicolet6700型傅立叶变换中红外光谱仪对柴油样本进行了光谱采集,结合TQAnalyst EZ Edition(Nicolet)分析软件对柴油中芳烃含量进行了定量分析,结果表明,中红外光谱法在重现性方面比固相萃取-气相色谱法更好。王少军等[6]对柴油中的芳烃含量进行中红外光谱定量检测,与传统柱色谱法比较结果证明,应用中红外光谱技术测定柴油中芳烃含量是可行的,并且具有简便、快速、绿色环保等优点。许家胜[6]等探讨了利用近红外光谱法对柴油硫含量进行测定的可行性,选用100个柴油样品,采用多元线性回归法建立校正模型,模型相关系数达到0.998。

上述研究验证了柴油光谱检测的可行性,在检测柴油烃类含量等方面开展了广泛的研究,但在柴油硫含量报道并不多,而且目前研究大多采用的是全谱输入,计算量巨大,并不能适合边防检测或便携式仪器开发等快速测量的现实需求,因此,本文分别利用回归系数分析法(Regression Coefficient Analysis,RCA)、连续投影算法(Successive Projections Algorithm,SPA)和遗传算法(Genetic Algorithm,GA)对柴油全谱选取特征波长,作为PLS和MLR线性及LS-SVM非线性预测模型的输入变量,在不损失太多检测精度下,尽可能压缩减小光谱冗余信息,减少计算量,为实现柴油硫含量快速测量开辟途径。

基于这个概念,其他学者陆续凝练提出了“搭脚手架教学”理念,在“最近发展区”内通过有效的指导培养孩子的能力。在教育过程中提供指导,随着孩子能力的增加而逐步减少指导。这个指导过程跟建筑中搭建脚手架有两点重要相似之处:①在建筑任务完成后拆除;②拆除不影响已建成房屋的稳固性。

雄性C57BL/6小鼠,8~10周龄,质量28±1 g,饲养于SPF级动物房,温度22±2°C,湿度50%~60%.所有操作均依照美国国立卫生院(National Institutes of Health,NIH)的相关规定.

1 材料和方法

1.1 收集样本

分别对原始光谱进行标准正态变量变换(SNV)、基线校正(Baseline)、一阶微分(SG+1st derivative)、二阶微分(SG+2st derivative)、多元散射校正(MSC)预处理,从而确定较优的光谱预处理方法。采用PLS建模方法对这些预处理后的光谱进行建模分析,模型评价指标有剩余预测偏差(RPD)、决定系数(R2)和均方根预测误差(RMSEP)。结果详见表2,通过比较,采用原始光谱建模结果最优,说明原始光谱数据采集时没有受环境光的污染,散射影响小,故后面的算法分析以原始光谱为基础进行。

 

表1 建模集和预测集柴油硫含量(%)统计分析Table 1 Statistics of sulfur contents (%)

  

DatasetsSamplenumberMaximumMinimumMeanStandarddeviationCalibration20020781770192400604Prediction7819971811199100560All27820781770198500592

1.2 中红外光谱数据采集

从表4结果分析,对相同的特征波长而言,PLS、MLR和LS-SVM模型精度非常接近,如比较RCA选取的7个特征波长,输入至三种模型:PLS、MLR和LS-SVM模型得到的RPD值分别为1.99、1.99、1.98,RMSEP值分别为0.0281、0.0281、0.0283。另外,从表4可以得出,输入相同的特征波长,PLS、MLR线性模型的结果却优于LS-SVM非线性模型的结果,说明选择出的特征波长光谱共线性好,而LS-SVM模型处理非线性信息的输入变量更有优势。三种模型中,精度最高的是RPD为1.99,RMSEP为为0.91。

2 结果与讨论

2.1 光谱预处理

本研究采集的柴油样本来自于台州市质量技术监督研究院,样本取自台州地区各市区县加油网点。柴油类型为5#柴油、0#柴油、—10#柴油各102个样本,有硫含量基础数据的样本共278个样本,将柴油样本随机被分为两组,一组数量为200个样本,用于校正集,另一组数量为78个样本。

 

表2 柴油样本PLS模型光谱不同预处理结果Table 2 Comparison of pretreatments between full MIR spectra and wavelength reduction MIR spectra by PLS

  

PretreatmentVariablenumberCalibrationLatentvariablesCalibrationPredictionrcal2RMSECrpre2RMSEPRPDraw2002PLS40920028209100281199SGsmoothing2002PLS40920028309100281199SNV2002PLS110890034908900346162MSC2002PLS608800347089003671521stD2002PLS608200356083003581562ndD2002PLS60800036408000369151Baseline2002PLS40840034208300353158

2.2 特征波长提取

原始光谱数据波长点多,计算量大,掺杂大量冗余信息。本文分别选用RCA、SPA、GA进行特征波长的选择。

为了评价RCA、SPA和GA选取特征波长的有效性,建立PLS[9]、MLR[10]和LS-SVM[10-11]的模型,并将三者选取的特征波长分别作为输入得到的建模结果如表4所示。优秀的模型,RPD和r2值越高越好,RMSEC 和RMSEP值要接近且越小越好,避免出现共线性和过拟合,使模型有较高的预测精度。

  

图1 PLS模型回归系数图Fig.1 Wavenumber-RCA plot acquired by PLS

GA选择的变量有16个,建模结果没有SPA建模结果好,说明GA选择的变量信息还存在无用信息,选择的变量冗余信息多,而SPA选择的变量冗余信息少,RCA选择的变量为5个时,模型的运算结果不是很理想,而且采用RCA选择特征波长,存在人为挑选主观性大的缺陷。

遗传算法是通过某一波长被选取建模的频率值来确定建模变量的数量[7-8],图4表示中横线表示设定的变量阈值,横线上方表示保留变量,横线下方变量的被选频率不够,将不用于建模分析。阈值设定为3时,选择的波长分别为:6000nm、6048nm、7540nm、8556nm、8612nm、9028nm、9268nm、9404nm、9772nm、9836nm、12028nm、12476nm、12812nm、12924nm、13748nm、14500nm。运行遗传算法得到的方差与response(% C.V. variance)和预测误差RMSEC如图5所示,选择16个变量建模时,RMSEP值达到稳定。

  

图2 SPA提取特征波长Fig.2 Wavelengths selected by SPA

  

图3 SPA运算得到的RMSE随因子数变化而变化的值Fig.3 RMSE value result by SPA

  

图4 运行遗传算法挑选特征波长的频率值Fig.4 Frequency of selection with number of variables by GA

汪曾祺有一首诗,柔软得像春风十里:“如果你来访我,我不在,请和我门外的花坐一会儿,它们很温暖。我只记花开不记人,你在花里,如花在风中。”反复咀嚼,这首诗趣味盎然。客人来访,主人不在,会心生些许不悦,不过没关系,门外的花儿会陪着你,它们会如同好客的主人一样,给你宾至如归的感觉。见花如面,那些花是主人给予客人的精神喂养。

  

图5 运行遗传算法得到的response(% C.V. variance)和预测误差RMSECFig.5 RMSEC and response value with number of variables by GA

 

表3 采用RCASPA和GA提取特征波长Table 3 Sensitive wavelengths (shown as wavenumbers) selected by RCASPAGA

  

SelectionMethodssensitivewavelengthsWavelengths/nmRCA(00003)77492,7532,9020,12460,12908,13756,15500RCA(00005)57492,7532,9020,12460,12908SPA87372,7532,12004,12460,12804,12908,13732,14492GA166000,6048,7540,8556,8612,9028,9268,9404,9772,9836,12028,12476,12812,12924,13748,14500

2.3 建模分析

回归系数分析(RCA)是基于PLS模型提取特征波长的一种常用方法,理论上讲,回归系数波峰或者波谷的绝对值越大,该点对应的波长对建模贡献越大。通过柴油光谱偏最小二乘(PLS)模型得到的回归曲线,如图1所示,通过人为设置阈值的方法来筛选特征波长,当回归系数阈值设置为0.0003时,提取了7个特征波长,分别为7492nm、7532nm、9020nm、12460nm、12908nm、13756nm、15500nm。当阈值设置为0.0005时,提取了5个特征波长,分别为7492nm、7532nm、9020nm、12460nm、12908nm。

 

表4 基于RCASPA和GA选取特征波长的PLSMLR和LS-SVM模型结果Table 4 Results of PLSMLRLS-SVM combined with selected sensitive wavelengths

  

MethodsSensitivewavelengthsCalibrationPredictionrcal2RMSECrpre2RMSEPRPDRCA⁃PLS70920028009100281199RCA⁃PLS50820035608300358156RCA⁃MLR70920028109100281199

 

续表4

  

MethodsSensitivewavelengthsCalibrationPredictionrcal2RMSECrpre2RMSEPRPDRCA⁃MLR50810035908000368152RCA⁃LS⁃SVM70910028209000283198RCA⁃LS⁃SVM50800036108000368152SPA⁃PLS80920028109100281199SPA⁃MLR80920028009100281199SPA⁃LS⁃SVM80910028209000283198GA⁃PLS160890028808800286195GA⁃MLR160880028908700287195GA⁃LS⁃SVM160870028908600289193

本实验中红外光谱检测仪器选用WQF-510A中红外光谱仪,该光谱仪具备积分时间可调、增益自动设定和波长可校准等功能,仪器的积分时间可以由软件设置调整,光源探头和光谱仪通过光纤连接,光源发出的光经柴油透射进入到光谱仪,软件把光谱仪采集到的透射率值以txt文件保存下来,文件包括两项内容,一是各个波长点的波长数值,二是每个波长点的透射值,形成一条完整光谱(2500nm~16594nm),波长点间隔为2nm。采集柴油光谱数据前,打开光源预热至少15min~30min,以保证光源更加稳定,然后将柴油倒入圆形玻璃培养皿中。为了尽量减小环境光和仪器本身等因素影响,每个样本采集10条光谱取平均作为这个样本的光谱数据。

SPA是一种减小冗余信息、筛选重要波长点的特征波长选择方法,这种算法是解决线性问题颇为有效的方法,波长数量的减小、冗余信息的减少无疑大大提高了模型的运算速度和效率[5-6]。SPA选取的特征波长点:7372nm、7532nm、12004nm、12460nm、12804nm、12908nm、13732nm、14492nm,分布如图2所示,图3为光谱变量数与模型RMSEP值的关系图,当采用8个变量建模时,RMSEP值趋于稳定。

贞观二十年,玄奘回到了阔别已久的长安城。他登上白鹿原,远眺长安城,回忆着此生种种,顿悟便在一瞬间,所谓宿命,所谓轮回,所谓经历,便是如此。

3 结论

应用中红外光谱分析技术检测柴油硫含量,比对分析了RCA、SPA和GA的变量选择方法的优劣,并将三种方法选取的特征波长输入至PLS和MLR线性模型及LS-SVM非线性模型,结果表明:相同的柴油光谱变量输入,PLS和MLR线性模型优于非线性模型,由于LS-SVM非线性模型增加了模型的复杂度,而采集的柴油光谱共线性较好。

RCA算法得到的7个变量少于SPA算法得到的8个变量,SPA和RCA算法得到的特征变量代表性好于GA算法得到的特征变量代表性,RCA方法人为主观性大,需要手动挑选特征波长。本文建议SPA算法得到的变量代表性最好,建模结果最优,可以用来建立柴油硫含量预测模型。

参考文献

[1] Kordulis C,Bourikas K,Gousi M,et al. Development of nickel based catalysts for the transformation of natural triglycerides and related compounds into green diesel:a critical review[J].Applied Catalysis B:Environmental,2016,181:156-196.

[2] Alves J C L,Poppi R J. Quantification of conventional and advanced biofuels contents in diesel fuel blends using near-infrared spectroscopy and multivariate calibration[J]. Fuel,2016,165:379-388.

[3] 李敬岩,安晓春,田松柏,等. 柴油十六烷值快速分析技术研究[J].石油炼制与化工,2016(05):101-107.

[4] 周扬,戴曙光,葛丁飞. 近红外光谱稀疏分量分析检测柴油品质参数[J]. 光学精密工程,2014,22(2):296-303.

[5] 闻环,胡江涌,徐玲. 中红外光谱吸收法快速检测柴油中的芳烃含量[J]. 西部大开发旬刊,2010(4):47-48.

[6] 王少军,吴洪新,凌凤香. 中红外光谱法快速测定柴油芳烃含量[C].第七届全国青年分析测试学术报告会. 2002:437-438.

[7] Cheng J,Sun D,Pu H. Combining the genetic algorithm and successive projection algorithm for the selection of feature wavelengths to evaluate exudative characteristics in frozen-thawed fish muscle[J]. Food Chemistry,2016,197,Part A:855-863.

[8] Ribeiro L D A,Soares A D S,Lima T W D,et al. Multi-objective Genetic Algorithm for Variable Selection in Multivariate Classification Problems:A Case Study in Verification of Biodiesel Adulteration[J]. Procedia Computer Science,2015,51:346-355.

[9] Li X,Sun C,Luo L,et al. High-Throughput Sequencing Identifies Novel and Conserved Cucumber (Cucumis sativus L.) microRNAs in Response to Cucumber Green Mottle Mosaic Virus Infection[J]. Computers and Electronics in Agriculture,2015,112:28.

[10] Insausti M,Romano C,Pistonesi M F,et al. Simultaneous determination of quality parameters in biodiesel/diesel blends using synchronous fluorescence and multivariate analysis[J]. Microchemical Journal,2013,108:32-37.

[11] Cheng J,Sun D. Data fusion and hyperspectral imaging in tandem with least squares-support vector machine for prediction of sensory quality index scores of fish fillet[J]. LWT-Food Science and Technology,2015,63(2):892-898.

笔者在课堂教学中还有一个很大的困惑就是“老师讲过很多遍的知识,学生仍然出错”,针对此困惑也开展了相关的专题式阅读,在期刊阅读过程中郑学涛老师刊发于《中学数学杂志》、《中学数学教学参考(中旬)》、《中学数学(下半月)》等专业期刊的《平方根计算失误分析及教学建议》、《寻找学生的解题困惑———对一道课本例题的教学分析与启示》、《有理数加法法则应用失败分析及教学建议》一组文章引发了笔者的浓厚兴趣,三篇文章一口气读下来,让笔者对学生的出错有了更为清晰、深刻的认识,也让自己的解题教学有了更大的进步.

 
吴意囡,詹白勺
《合成材料老化与应用》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号