朱增伟,程明霄,张 亮,孔德鸿
(南京工业大学自动化与电气工程学院,南京210009)
喇曼光谱仪测定芳烃装置中各组分含量的研究
朱增伟,程明霄*,张 亮,孔德鸿
(南京工业大学自动化与电气工程学院,南京210009)
为了提高在线喇曼光谱仪在芳烃装置的组分检测中的实时性和精度,采用偏最小二乘法(PLS)结合粒子群算法(PSO)建立了预测模型。对一定的芳烃样品进行试验。先通过光谱仪获得芳烃成分的喇曼光谱,再运用PLS算法对喇曼数据进行主因子提取,从而降低数据间的冗余性,然后应用PSO算法对芳烃组分含量进行快速搜索,找到最优解,最后将样品的真实值与预测值进行相关性分析。结果表明,与传统方法相比,喇曼光谱结合PSO算法和PLS算法的模型具有精确度高、分析速度快的特点。该研究为芳烃装置中组分的检测提供了新方法。
光谱学;偏最小二乘;粒子群优化;芳烃
在大型芳烃(aromatic hydrocarbon,AH)装置生产过程中,实时地了解其组成成分非常重要。目前,国内芳烃装置在线分析环节大都利用工业色谱仪、气相色谱仪等分析芳烃成分,但在实际生产中,由于测定时间延迟的存在,对物料的分析不具有实时性,并且精度和稳定性无法满足要求[1]。因此,急需一种检测精度高、响应速度快的在线分析仪器来检测芳烃装置中芳烃各组分的含量。
喇曼光谱技术是一种新型的检测方法,能直接联系分子结构的振动谱相,光谱能够非常敏感地反映物质结构的任何微小变化,因此能够研究物质的物理化学等方面的性质。由于用化学计量学方法来分析喇曼谱图数据的应用广泛,而应用最广泛的有小波变换、免疫算法和偏最小二乘法[2](partial least squares method,PLS),其中,常将偏最小二乘法用来建立检测芳烃组分模型,但PLS需对谱图的每个点采取数据加权,因而会有耗时长的缺陷[3-4];粒子群优化算法(particle swarm optimization,PSO)是一种模拟鸟类觅食行为的仿生算法,能够以最大的概率快速找到全局最优解,但是遇到冗余度高的数据时,算法存在收敛性差或早熟收敛的问题,从而无法保证全局最优解。为此,本文中提出了应用在线喇曼光谱仪测定光谱数据,将PSO和PLS相结合的建模方法,利用PLS在不丢失原来信息的基础上对数据进行处理、消除冗余,从而提高了PSO的收敛速度,再通过PSO进行快速搜索,得到各芳烃的质量分数。通过实验证明了该方法的可行性[5]。
1.1 在线喇曼光谱仪
喇曼光谱有谱峰清晰的特点,除了像红外光谱具有无需对样品预处理、分析速度快、对样品无损分析外,还能实现微量探测、进行多组分测量,所以远远优于其它光谱的分析手段,更适合于对在线芳烃装置中组分的在线检测。
本文中使用南京灼徽检测公司研制的360型喇曼光谱仪进行芳烃组分的检测,仪器主要由三部分组成:信号的采集模块,由532nm的激光光源照射样品产生喇曼散射光,由光纤探针采集,并由光纤将信号传递给分析模块;样品分析模块,单色仪对喇曼信号光进行分光,CCD图像检测器的功能是采集信号并实现光电转换;计算机处理模块,接收从CCD检测器传递过来的数据,并抽取1024个像素传到上位机进行谱图显示。图1为光谱仪的结构示意图。
Fig.1 Chart of Raman spectrometer
1.2 PLS
偏最小二乘与主成分分析法很相像,描述Y变量因子的同时是否也用于描述X[6]是两者的主要区别。为了实现这一点,在算法上用X的列也参与矩阵Y因子的计算,同时,Y的列也去参与矩阵X因子的计算,其数学模型为:
式中,T和U为X和Y的得分矩阵;P和Q为X和Y的载荷矩阵;E和F为拟合X和Y所引进的误差。
当X和Y同时确定因子时,X和Y的因子T和U具有如下关系:ui=biti+e,ui和ti分别是U和T的第i列,pi和qi分别是P的Q的第i列,bi表征ui和ti间的内在关系,e为残差矩阵。
为了使因子T既可描述X矩阵,也可描述Y矩阵,因此需要采取折中的方法,即将T进行坐标旋转,在矩阵Y分解U时引入T的信息和从矩阵X分解T时引入U的信息。具体实现方法为在迭代中以T代替U计算QT,以U替代T计算PT,最后得到新因子(t,u)能同时最大表达X与Y。
1.3 PSO
重叠喇曼光谱信号可以表示成各个组分信号的线性叠加,PSO算法是一种基于迭代模式的优化算法,在连续的空间坐标系中,粒子群迭代的描述如下:在D维空间中,假设粒子群体的规模为N,对于第i个粒子,xi=[xi1xi2…xid]T表示当前位置,vi=[vi1vi2…vid]T表示粒子在空间中的当前速度[7],它所经历的最好位置为li=[li1li2…lid]T,群体中所有粒子g所经历的最好位置pg=[pg1pg2…pgd]T,若已知第i个粒子第t次迭代的速度vi,t及位置xi,t,则第(t+1)次迭代第i个粒子的速度和位置优化为:
式中,ki为自适应惯性权重因子,用来调整全局搜索和局部搜索的比重;c1,c2分别为粒子自身加速度权重系数和群体加速度权重系数,是用来调整自身经验和群体经验作用的参量,一般在0~2之间取值;ri1,ri2为[0,1]上的相互独立的随机数。优化搜索正是在这样随机初始化的粒子组成的种群中,用迭代的方式进行的,与其它方法相比,粒子群算法具有更强的全局优化能力,最重要的是在迭代过程中,PSO基于上一次的速度和位置信息,调整权值的自适应,加快了收敛的速度。因此,本文中对石脑油中芳烃组分预测进行建模采用的是自适应的PSO算法。
2.1 材料的准备
用来实验的样品有苯(benzene,B)、甲苯(meth-ylbenzene,MB)、乙基苯(ethylbenzene,EB)、间二甲苯(meta-xylene,MX)、邻二甲苯(o-xylene,OX)、对二甲苯(paraxylene,PX)、邻二乙基苯(o-diethylbenzene,ODEB)、间二乙基苯(m-diethylbenzene,MDEB)、对二乙基苯(p-diethylbenzene,PDEB)按不同的体积分数配置的混合物共95组,样品的配置采用数字滴定器,在室温下操作(25℃),精度达到0.01mL,在样品中取85组为校正样品集,用它们测得的光谱数据来建立校正模型,余下的10组作为验证集,用来对用PLS和PSO建立的校正模型的精度进行评估。
2.2 光谱数据的采集
在实验室温度与湿度符合标准后,为了避免背景光的干扰和避免产生失真的喇曼光谱图,光谱数据的采集应在封闭的弱自然光条件下进行。设定CCD数据检测器的曝光时间为60s,每个样品的喇曼光谱数据进行连续检测10次,最后的实验数据为最后2次数据的平均值,仪器开机后需等待20min自冷却,再进行操作。
通过实验检测,选择具有良好相似度的85组训练样品集和10组测试集的喇曼光谱数据。
2.3 喇曼光谱数据的预处理
因为在线喇曼光谱仪使用CCD检测器,因此在输出的喇曼光谱中必然受到噪声的影响,同时还包括荧光背景和杂散信号。这些信号使得真实的喇曼谱线发生畸变,从而建立的预测模型的精度受到影响,因此,在建模之前必须先对检测的喇曼光谱数据进行预处理,从而尽可能地消除荧光及噪声的影响,提高预测模型的精度[8]。
Fig.2 a—original Raman signal b—Raman spectra after pretreatment
在进行建模之前,先应用小波包预处理技术,将喇曼光谱图分解为高频与低频部分,根据一定的阈值将代表噪声的高频和荧光的低频部分去掉,然后再进行重构,以消除噪声的干扰,图2为消噪和去荧光背景的对比图。
2.4 PLS+PSO算法模型的建立
运用PSO算法将预处理后的混合芳烃光谱数据矩阵与芳烃的各组成成分的喇曼光谱数据矩阵之间进行建模,最后要得到的数学模型如下式所示:
式中,d为芳烃样本的喇曼光谱数据矩阵,di为芳烃样本中各组成成分的喇曼光谱数据矩阵,d0i为各组成成分在单位质量分数下的喇曼光谱数据矩阵,wi为芳烃样品中各个组成成分的质量分数数据矩阵,n表示各芳烃成分的总数目,e为残差矩阵。
在线喇曼光谱仪获得的喇曼光谱数据是由CCD图像检测器检测的1024个像素点组成的[9],由这些数据元素组成的列向量:J=[x1x2x3…x1022x1023x1024]T,85个样品喇曼光谱数据构成了喇曼光谱数据矩阵d=[J1…J85],大小为1024×85。其中的苯、甲苯、乙基苯、间二甲苯、邻二甲苯、对二甲苯、邻二乙基苯、间二乙基苯、对二乙基苯共9个标准样品的喇曼光谱数据表示为S=[d01d02…d08d09],大小为1024×9。样品对应的各个含量质量分数表示为wi1,…wi8,wi9;样品的详细组成成分预测向量矩阵为wi=[wi1…wi9]T,wi表示第i个样品组成的质量分数数据矩阵。选取训练样品集中85个芳烃样品的详细组成成分预测向量矩阵为[w1…w84w85],大小为9×85。
图3为芳烃样品的喇曼光谱图。
Fig.3 Raman spectra of aromatic hydrocarbons samples
从图中可以看出,由于测试的喇曼组分数目多、光谱仪采样的数据点数为1024个点,这就造成了取得的喇曼数据中必然存在共线性、重叠的喇曼光谱,因此,本文中运用PLS算法对喇曼数据进行主成分因子的提取,对数据进行降维,从而提高粒子群算法的速度和预测模型的精度。图4为经过PLS分析后的喇曼谱图。
Fig.4 Raman spectra after PLS treatment
经过PLS处理后的喇曼光谱数据采用PSO算法进行建模,最终得到的数学模型如下所示:
式中,h1,h2,h3,…,hn组成代表经过偏最小二乘后的得分矩阵,n为芳烃总数目,e为残差矩阵。若分别以每一个石脑油样本建立模型,建立的数学模型用公式描述为fi=Hwi+e,fi表示第i个样品经PLS处理后的光谱数据矩阵,H为9个标准样品S经PLS算法得到的得分矩阵,H=[h1h2…hn]T,wi为第i个样品中各组分质量分数向量矩阵。这样将每个训练样品的喇曼光谱数据对应9个标准样品的喇曼光谱数据,代入自适应PSO算法模型,并以真实值与预测值之间的方差为目标函数进行迭代运算,最后用验证集喇曼光谱数据对石脑油组成预测模型进行验证评价。
必须选择一个合适的目标函数来运用粒子群算法建立芳烃组成成分预测模型,可以是方差、偏方差,标准差、本文中选择方差作为目标函数,f=将芳烃组成的预测建模过程转化成一个以真实值dreal与预测值dcount间方差为目标函数的优化问题[10]。其它参量的选择为:惯性权重ki采取自适应调整策略;粒子自身加速度权重系数和群体加速度权重系数c1=c2=2;群体规模N=20;维数空间D=9,且搜索的速度控制在一定的范围内。根据以上的数学模型,求解目标为w1,w2,w3,…,wn一组随机数组成的矩阵,自适应搜索通过粒子群算法进行,并通过目标函数计算得出w1,w2,w3,…,wn的全局最优解[11],即得到芳烃组成成分的质量分数。图5为用PLS和PSO算法建模的具体流程图。
首先对采集的喇曼光谱数据进行预处理,消除噪声和荧光背景的干扰,然后对芳烃样品的原始喇曼光谱数据矩阵进行偏最小二乘分析,计算出主成分得分矩阵,再以主成分得分矩阵替代原始变量矩阵,由其建立新的PSO算法模型,并根据验证集芳烃样品检测模型的准确性和精密性。
为了验证预测模型的准确性,减少试样中的组分数,按表1试样中的质量分数配比由甲苯、乙基苯、邻二甲苯、对二甲苯4组分所组成的试样,并将实测的喇曼光谱数据带入模型,所预测的各组分的质量分数如表2所示。
Fig.5 Modeling flowchart of PLS and PSO algorithm
Table 1 Nine components of actual value and predictive value
Table 2 Four components of actual value and predictive value
对比表1与表2可以发现,用建立的模型预测少组分溶液的质量分数时,试样的甲苯、乙基苯、邻二甲苯、对二甲苯4组数据的绝对误差与相对误差反而减小了,其中甲苯的预测精度提高了约48.1%,乙基苯的预测精度提高了约29.9%,邻二甲苯的预测精度提高了约24.1%,对二甲苯的预测精度提高了约27.4%,4组数据的精度平均提高了约32.4%,这是因为模型中因子数减少了,所以可以使结果更稳定,从而也更近一步说明了建立模型的有效性。
2.5 仿真结果分析
应用训练集建立的仿真模型对10组预测集的数据进行各组分质量分数的预测,表1为某一样品的预测结果。从表1中可以看出,通过预测模型求出的预测值与真实值之间的绝对误差在±1.5%以内,最大绝对误差为1.44%,达到工业需求的最大绝对误差小于2%,相对误差在±0.3%以内;结合10组预测集数据,绝对误差在±2%以内,最大绝对误差为±1.83%。
图6为表中预测值和真实值的相关性分析图,从图中可以看出,样品的真实值和模型的预测值之间基本成线性关系,模型预测的相关系数为R2=0.9737更进一步说明了模型预测的线性相关性好,属于显著性相关,模型预测的精度高,能够满足工业上实时监测的要求。
Fig.6 Data correlation of PLS and PSO model
Fig.7 Predictive residual figure
图7 是线性拟合的残差图,从图中可以明显地看出线性拟合的残差在-1到2之间,说明了预测的误差在±2%以内,达到工业现场质量监控的精度最大绝对误差小于2%的要求,也间接地说明了模型预测的线性度高。
由于传统的方法在实时检测芳烃装置组分含量过程中存在精确度不高、时间长的现状,本文中提出了应用PLS和PSO相结合的方法,建立了快速检测芳烃组分含量的预测模型,并将其应用于喇曼光谱仪中。实验数据表明:采用喇曼光谱仪结合PLS和PSO测定芳烃组分体积分数是可行的,模型的运算效率高、预测精度准确、满足了工业现场的预测要求;从而为生产过程中实时、快速检测芳烃装置中各芳烃的含量提供了一种新方法,在石油化工行业中有着广阔的应用前景。
[1] LIG L,SONG G J.The application of Raman spectrometer in the process[J].Guangdong Chemical,2008,35(5):106-109(in Chinese).
[2] DING Y,CHENG M X,ZHU Q,et al.Research of prediction method of naphtha based on the on-line Raman spectrometer[J].Sensor and Micro System,2012,30(12)69-72(in Chinese).
[3] CHENG G X.The principle and application of Raman brillouin scattering[M].Beijing:Science Press,2003:35-36(in Chinese).
[4] XU L,SHAO X G.Chemometrics methods[M].Beijing:Science Press,2004:130-163(in Chinese).
[5] ROGGO Y,CHALUS P,MAURER L,et al.A review of near infrared spectroscopy and chemometrics in pharmaceutical technologies[J].Journal of Pharmaceutical and Biomedical Analysis,2007,44(3):683-700.
[6] YU ZW,CHENG M X,CAO L Y.Research of online Raman spectrometer determine naphtha PONA value[J].Control and Instruments In Chemical Industry,2011,46(11):45-48(in Chinese).
[7] LIU R.Research of adaptive particle swarm algorithm and its application in multi-objective optimization[D].Guangzhou:South China University of Technology,2008:9-10(in Chinese).
[8] CAO L Y,CHENG M X,YU ZW,et al.Application of online Raman spectrometer in aromatic plantand fluorescence background processing[J].Control and Instruments in Chemical Industry,2011,46(10):36-39(in Chinese).
[9] YAN Y,CHENGM X,LIN JG,et al.The simulation algorithm of online Raman spectrometer measuring distillation range of petroleum products[J].Computer Simulation,2010,26(9):286-290(in Chinese).
[10] COOPER JB,WISE K L,GROVES J,et al.Determination of octane number and reid vapor pressure of commercial petroleum fuels using FT-Raman spectroscopy and partial least-squares regression analysis[J].Analytical Chemistry,1995,4(10):674-964.
[11] CHEN C Y,YE Y C.To solve the nonlinear equations based on particle swarm algorithm[J].Computer Applications and Software,2006,22(5):137-139(in Chinese).
Detection of components of aromatics hydrocarbons unit based on Raman spectrometer
ZHU Zengwei,CHENG Mingxiao,ZHANG Liang,KONG Dehong
(School of Automation&Electrical Engineering,Nanjing University of Technology,Nanjing 210009,China)
In order to enhance the real-time and improve the accuracy of on-line Raman spectrometer during the testing of composition of aromatic hydrocarbon unit,the prediction model was created based on partial least square(PLS)algorithm and particle swarm optimization(PSO)algorithm.Some samples of aromatic hydrocarbons were tested.Firstly,Raman spectroscopy of aromatic composition was gotten by spectroscopy.Then,the main factors of Raman data were extracted by means of PLS algorithm in order to reduce the redundancy between data.The quick search of composition content of aromatics hydrocarbons were made by PSO algorithm to find the optimal solution.Finally,the correlation of actual values and predictive values of samples was analyzed.The results show that,compared with the old method,the new created model(Raman spectrum with PSO and PLS)has high precision and quick analysis speed.It provides a new method for detection of components of aromatic hydrocarbons unit.
spectroscopy;partial least square;particle swarm optimization;aromatic hydrocarbons
TH744.1
A
10.7510/jgjs.issn.1001-3806.2014.06.025
1001-3806(2014)06-0839-06
国家八六三高技术研究发展计划资助项目(2009AA04Z161)
朱增伟(1989-),男,硕士研究生,现主要从事分析仪器的研究。
*通讯联系人。E-mail:cmx5045@njut.edu.cn
2013-12-18;
2014-01-28