更全的杂志信息网

基于主成分回归的颜色与物质浓度辨识的研究

更新时间:2009-03-28

0 引言

颜色与物质浓度辨识的方法一般是把待测物质制备成溶液后滴在特定的白色试纸表面,等其充分反应以后获得一张有颜色的试纸,再把该颜色试纸与一个标准比色卡进行对比,就可以确定待测物质的浓度档位,即比色法[1]。比色法虽然比较方便,但在精度上会受到观测误差的影响,因此,不能满足照相技术等相关行业的要求。人们希望知道颜色读数就能很快地获得待测物质的浓度,这就需要建立一个合理的物质浓度和颜色读数的数学模型,即只要输入给定物质的颜色读数就可获得待测物质的浓度。

已有研究表明,通过多元线性回归、多元非线性回归、插值以及拟合等[2-6]方法建立的数学模型能较好地解决颜色读数与物质浓度辨识的问题。但在数据量较少的情况下,这些方法较难建立合理的物质浓度和颜色读数的数学模型。本文运用主成分分析,通过降维技术,选取合适的主成分,从而建立主成分回归模型。该模型可很好地建立物质浓度和颜色读数之间的数量关系,也为现实的物质浓度辨识问题提供理论依据。

1 数据来源与分析

本研究选取2017年“高教社杯”全国大学生数学建模竞赛[7]C题问题1的数据作为研究对象。问题1中有5组数据,本文以组胺的数据为例建立数学模型,其他组数据可做类似建模。表1是组胺浓度和颜色读数的原始数据。表1中的浓度单位为ppm,B表示蓝色颜色读数,G表示绿色颜色读数,R表示红色颜色读数,H表示色调读数,S表示饱和度读数。

某厂6台干式变均已进行了方案一的改造,效果显著,将干式变最高运行温度降低了40~50℃。但由于干式变温度仍比较高,风机需要连续长周期运行,风机容易出现故障。风机装在干式变内部,在不停机的情况下,无法进行修理更换。目前采用质量较好的风扇,且每次在机组停机时对所有风扇进行检查,能满足长时间运行的要求。

由于组胺浓度与颜色读数单位不一致,可先对原始数据进行标准化处理。z-score标准化[8]处理方法如下:

 

经标准化处理后组胺浓度与颜色读数的相关系数如表2所示。由表2知,组胺浓度与各颜色读数的相关系数的绝对值均大于0.9,因此,可认为组胺浓度受B、G、R、H和S五个变量的影响。

 

表1 组胺浓度与颜色读数的原始数据

  

0 100 50 25 12.5 0 100 50 25 12.5 68 37 46 62 66 65 35 46 60 64 110 66 87 99 102 110 64 87 99 101 121 110 117 120 118 120 109 118 120 118 23 12 16 19 20 24 11 16 19 20 111 169 155 122 112 115 172 153 126 115

 

表2 组胺浓度与颜色读数的相关系数

  

2 多元线性回归模型的建立

2.1 模型建立

根据组胺浓度和颜色读数的相关性分析,可建立如下的五元线性回归模型:

 

其中变量x1x2x3x4x5分别表示B、G、R、H和S的读数,变量y表示组胺浓度。b0b1b2b3b4b5表示回归系数,ε表示随机误差变量。

利用EViews软件作最小二乘的计算结果如表3所示。由表3知,判定系数R2=0.9996,调整的判定系数R2=0.9991,F检验的p<0.0001,说明模型是极显著的,但不能说明模型中的每一项是显著的。表3中的常数项和x5t检验对应的p值均大于显著性水平0.05,说明这两项是不显著的,模型可能存在多重共线性。

 

表3 参数估计与方差分析

  

b0 x1 x2 x3 x4 x5 R-squared 0.9996 Mean dependent var 37.5 Adjusted R-squared 0.9991 S.D.dependent var 37.2678 S.E.of regression 1.1455 Akaike info criterion 3.3933 Sum squared resid 5.2486 Schwarz criterion 3.5748 Log likelihood -10.9663 Hannan-Quinn criter.3.1941 F-statistic 1904.461 Durbin-Watson stat 1.8069 Prob(F-statistic) 0.0000-212.765 2.854827-4.487319 2.321337 4.593245 1.141519 84.17136 0.908932 0.446983 0.653328 0.866299 0.42983-2.52776 3.14086-10.03912 3.553097 5.302146 2.655748 0.0648 0.0348 0.0006 0.0237 0.0061 0.0566

2.2 多重共线性诊断

多重共线性可通过各解释变量之间的相关系数和方差扩大因子VIFi来诊断。第i个解释变量的方差扩大因子[8]定义为:

 

其中,表示以xi为被解释变量对其余解释变量作回归的判定系数。越大,VIFi就越大,多重共线性就越严重。一般认为,VIFi≥10存在着严重的多重共线性,且严重影响最小二乘的估计。

[1]白玉琴,刘宏,王焕芸.两种比色法测定荞麦降糖颗粒中总黄酮的含量[J]. 内蒙古医科大学学报,2017,39(1):30-33,40.

由表4可看出,各解释变量之间的相关系数的绝对值都在0.8以上,表明存在多重共线性。进一步做辅助回归,可得到各解释变量的方差扩大因子VIFi,如表4所示。表4中各解释变量的方差扩大因子均远大于10,说明模型确实存在着严重的多重共线性。

对于|n|=|m|+1的情况,则取三种不同的链路电缆长度,按照图4的测量流程分别获取三个稳定的测量值,再按照4.2.2的方法计算发射机的互调发射电平.

3 主成分回归分析

主成分回归是通过降维技术把多个解释变量转化为少数几个主成分再做回归分析的方法,因此,主成分回归可有效地降低多重共线性带来的影响[9-10]。各解释变量的相关矩阵的特征值及累积贡献率如表5所示。表5中,第一个主成分的累积贡献率就达到了94.846%,表明第一个主成分里就包含了原始数据94.846%的信息量,因此,可选取第一个主成分。第一个主成分的表达式如下:

 

表4 变量的相关系数矩阵及方差扩大因子VIFi

  

x1 x2 x3 x4 x5 1 VIFi 0.9684 0.8705 0.9516-0.9979 900.9198 0.9684 1 0.9446 0.9844-0.9556 370.6863 0.8705 0.9446 1 0.892-0.8428 51.6893 0.9516 0.9844 0.892 1-0.9422 93.7981-0.9979-0.9556-0.8428-0.9422 1 760.8914

 
 

表5 相关矩阵的特征值及贡献率

  

4.7423 0.19371 0.06137 0.00202 0.0006 4.5486 0.13234 0.05934 0.00142 94.846 3.8741 1.22737 0.04049 0.01203 94.846 98.7201 99.9475 99.988 100

[2]丁海霞,张秉森,张永昌.多元回归分析在织物染色计算机配色中的应用[J].青岛大学学报(工程技术版),2010,25(4):33-37,41.

 

利用普通最小二乘法即可得到方程(5)的参数估计如下:

 

由方差分析表6知,F的值为351.69,对应的p<0.0001,判定系数R2=0.9901,调整的判定系数R2=0.9873,说明模型是极显著的。将方程(4)中的z代回方程(6)可得标准化的主成分回归方程。图1是主成分回归的拟合图,图2是主成分回归的残差图,通过拟合图和残差图可看出主成分回归拟合较好。

 

表6 方差分析

  

回归残差Root MSE 0.1126 R-Square 0.9901 Depentdent Mean 0.0000 Adj R-Sq 0.9873 8.9113 0.0887 4.4557 0.0127 351.690

  

图1组胺原始数据散点和主成分回归的拟合图

  

图2组胺主成分回归的残差图

4 结语

本研究依据组胺浓度与颜色读数的数据,首先建立五元线性回归模型,通过多重共线性的诊断,判断五元线性回归模型存在严重的多重共线性。其次运用主成分分析,通过有效的降维,建立了主成分回归模型,从而有效地降低了模型的多重共线性。最后通过方差分析和拟合图说明主成分回归模型拟合效果较好。因此,该模型对实际的物质浓度与颜色读数的辨识问题的研究具有较好的实用价值和理论指导意义。

[6]李晓康.基于非线性回归的极值模型参数估计[J].廊坊师范学院学报(自然科学版),2014,14(3):8-11,14.

1.5 统计学处理 采用SPSS 20.0进行数据处理,计量与计数资料分别行t与χ2检验;采用多因素回归分析对各脑叶CT值与临床特征的相关性进行分析。P<0.05为差异有统计学意义。

下面用y对主成分z做回归,构造主成分回归方程如下:

[5]刘军丽,王 超.基于多元线性回归的日用陶瓷铅镉溶出量测定方法研究[J].廊坊师范学院学报(自然科学版),2013,13(3):11-13,21.

关心下一代工作,关键是要赢得青年,坚定他们走中国特色社会主义道路的决心。而要赢得青年,核心是要关工委工作取得实效,让广大青年看到关工委工作让自己能力得到了提升。老同志心怀“中国故事、学校故事、学院故事”,老同志最能讲好努力奋斗,老同志最能体现奉献责任和历史使命,他们就是活的学以致用的教科书,更是实现“中国梦”、伟大复兴的奠基者。在这一点上,应有组织地发挥“五老”的政治、经验、威望、时空、亲情优势,在现有工作渠道外,对关注青年、关爱青年、关心青年的工作及时补给,急党政所急,想青年所想,尽关工委所能。

[3]李楠,张秉森.多元非线性回归在织物染色计算机配色中的研究[J].青岛大学学报(工程技术版),2013,28(4):62-67.

[参考文献]

[4]韩蔚,张秉森.插值和拟合方法在织物染色配色问题中的具体应用研究[J]. 印染助剂,2009,26(6):39-43.

[7]2017年全国大学生数学建模竞赛试题[EB/OL].http://mcm.ustc.edu.cn/ahmcm/,2017-11-10.

[8]卓金武.MATLAB在数学建模中的应用(第2版)[M].北京:北京航空航天大学出版社,2014.

如今,鄌郚镇的电声乐器生产水准已经居于国际领先地位。经过几十年的发展,到目前鄌郚镇已拥有乐器及其配件生产企业超过80家,从业人员四千多人,产品包括电吉他、电贝司、木吉他、木贝司、音箱和乐器配件等6大系列,近400个花色品种,年产乐器300万把,产值达15亿元,产品主要销往韩国、日本、美国、澳大利亚等30多个国家和地区。全镇乐器企业拥有“雅特”、“仙乐”、“feeling”、“大树”等近40个品牌。其中“feeling”、“仙乐”电吉他被评为“山东名牌产品”和“山东著名商标”。鄌郚镇已成为山东大学、山东师范大学、山东艺术学院等高校的实践教学基地,也是中国电声乐器产业基地。

[9]刘天龙.基于主成分分析的造纸污水处理过程故障诊断系统研究[D].广州:华南理工大学,2012.

明治时期是日本从封建社会步入近代社会的开端,更是国家在科学技术、社会文化、思想意识等经济基础和上层建筑两方面获得急速发展的时期,对明治文学的研究,不但可以使我们进一步明晰明治文学的本质,通过文学进一步了解日本近代政治思想体系和历史文化变迁乃至近代国家的发展脉络。对明治的借鉴可以使我们从多角度思考本国乃至世界文化的发展,为人类共同体的构建提供可行的思路。因此,明治文学研究很有必要。

[10]董小刚,赵浪,林诗明,等.岭回归和主成分回归下的农业总产值因素分析[J]. 长春工业大学学报,2017,38(1):1-7.

作为一个有着50年历史的大型豪华轿车家族,捷豹XJ已经成为英国汽车工业,甚至豪华轿车领域的一个文化符号。捷豹XJ也和其他知名的“英国制造”一样,有着鲜明的英国文化象征意味。如詹姆斯·邦德系列电影、《真爱至上》等知名影视剧作品中,总少不了捷豹XJ家族成员的身影。

 
丁学利,曹文康,李玉叶
《廊坊师范学院学报(自然科学版)》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号