基于最小二乘支持向量机的改进型在线NOx预测模型

2019-01-25 06:04:12丁续达金秀章
热力发电 2019年1期
关键词:向量精度机组

丁续达,金秀章,张 扬



基于最小二乘支持向量机的改进型在线NOx预测模型

丁续达,金秀章,张 扬

(华北电力大学控制与计算机工程学院,河北 保定 071003)

本文提出了一种基于预测误差的在线更新最小二乘支持向量机(LSSVM)的NOx预测模型。LSSVM模型以预测精度作为在线更新的目标,在保证预测精度的前提下,选取影响NOx排放的输入参数,模型输入数据的更新由总体误差决定,并由个体样本的误差指导数据选取,克服了原在线更新LSSVM模型中的单步更新计算量随时间增加、更新算法参数选取困难等问题。利用模拟实验和电厂分布式控制系统(DCS)实际数据对本文提出算法模型和原算法模型进行仿真,结果表明本文提出模型预测精度和计算速度均能够达到现场运用的要求。与原算法模型相比,在保持相同精度的前提下,计算速度是原算法模型的3.24倍,使用方法更简单,更适合现场使用。

软测量;LSSVM;NOx监测;在线预测模型;超低排放;SCR

随着对环境污染和节能减排的日益关注,清洁高效地利用煤炭发电已成为我国一项重要课题。燃煤污染物之一的NO不仅是雾霾的主要来源,也可引发肺气肿、支气管炎、哮喘等心肺疾病,而且会形成对臭氧层有害的化合物[1]。

燃煤发电是NO的主要来源,各国严格控制NO的排放量。我国燃煤发电的NO排放质量浓度限制在50 mg/m3以下,几乎是美国的一半[2]。因此,监测控制燃煤机组NO排放质量浓度十分必要。

目前燃煤机组NO监测广泛使用烟气自动监控系统(CEMS),但CEMS有许多缺点:1)需要定期离线维护,成本相对较高,但这仍不能保证实际运行中测量值始终精确有效;2)测量时需要较长的时间。因此控制系统难以使用滞后的CEMS测量值来控制NO排放[3]。

近年来,基于数据驱动的间接软测量方法被提出,其中基于人工智能技术的测量模型是目前最有效的模型,如人工神经网络(ANN)和支持向量机(SVM)模型。这类模型也称为黑箱模型,它们不需要关于燃煤机组机理的基本知识[4-6],但是需要相当多的数据来建立和训练模型。过去由于缺乏数据,黑箱模型很难完成训练,但随着分布式控制系统(DCS)在火电机组的应用,现在大量的运行数据记录并存储在数据库中,可用于构建数据驱动黑箱模型[7-8]。

SVM是一种基于统计学习理论的机器学习算法,其主要思想是通过非线性映射将输入数据映射到高维空间并进行回归[9]。因此,SVM被广泛用于模式分类和回归估计,但SVM计算相对复杂。为此,Suykens在1999年提出了基于SVM的最小二乘支持向量机(LSSVM)[10]。LSSVM的本质是将二次规划问题转化为求解线性方程组,从而加速问题求解,提高计算的收敛性。现在,LSSVM已被广泛用于可靠性分析、时间序列预测等领域[11-14]。

在实际应用中,虽然LSSVM能够较好地拟合历史数据,但由于缺乏在线学习能力,泛化能力很大程度上依赖于初始建模样本,并且提高支持向量的稀疏性及降低复杂度也是一个权衡问题。文献[5]提出了一种利用数据相似度筛选更新输入数据的在线学习方法,但是存在计算量大的问题,不适合现场应用。

本文从测量精度评价指标——预测误差出发,提出了一种基于预测误差在线更新的LSSVM预测模型。以某600 MW机组选择性催化还原(SCR)烟气脱硝系统入口NO质量浓度为研究对象,使用实际运行数据,通过机理和相关性分析,确定NO质量浓度在软测量模型中的辅助变量,建立LSSVM在线软测量模型,并与文献[5]的在线更新模型进行对比,在保证预测精度的前提下使模型快速对NO质量浓度进行在线软测量,满足火电厂NO质量浓度软测量的要求。

1 理论基础

1.1 最小二乘支持向量机

SVM的基本原理是通过非线性映射函数(·)将输入空间中的样本映射到特征空间()=(1(),2(), …,())。最小二乘支持向量机函数为

式中:为法向量,;为位移项,;e为误差,ex为训练样本,=1, 2, …,。

根据结构风险最小原则,并引入最小二乘法,式(1)必须满足

式中,e为误差,为正则化参数。

使用拉格朗日法,式(2)可改写为

式中(=1, 2, …,)为拉格朗日因子。

定义核函数(,x),该核函数应是一个满足Mercer约束条件的任意对称函数。则软测量模型为

式中=1, 2, …,。

核函数的选择对支持向量机的回归分析有一定影响。但目前没有选择核函数的成熟理论,通常使用的核函数有径向基函数(RBF)、多项式函数、函数和线性函数等。

通过计算式(3)中4个参数的偏导数为0,消除参数和后,得到式(5)的线性方程组

式中:=[1,2, …,y];1=[1, 1, …, 1];=[1,2, …,];=(x,x),=1, 2, …,,=1, 2, …,,为测试样本数量,为训练样本数量。式(5)中模型的项数为训练样本数加1,若训练样本数较多,则模型规模巨大,影响模型的应用。

1.2 在线预测最小二乘支持向量机

在实际应用中,由于缺乏在线学习能力,LSSVM的预测精度在很大程度上依赖于初始建模的样本选择。当运行条件变化引起数据波动时,离线LSSVM预测精度会降低,不能满足需要。本文借鉴了文献[5]的在线更新数据的思路,提出一种基于预测误差的在线更新预测模型,即根据预测误差抛弃冗余数据增加新数据来更新训练样本[15-16]。这个预测模型同时满足实时性和预测精度。

定义预测误差为预测值和实际值之间的偏差

模型总预测误差为

式中为模型训练样本数。

建立一个滑动数据窗口,由式(7)计算的总预测误差来确定模型参数是否更新。若总预测误差大于阈值需要更新时,插入滑动窗口中误差大于阈值的组训练样本,删除拉格朗日值(式(3))最小的组训练样本,更新模型参数,生成新的预测模型,该方式可避免删除训练数据中的重要样本。在线预测模型数据更新示意如图1所示。

图1 模型数据更新示意

与文献[5]相比,本文模型更新是由总体误差决定,并由个体样本的误差指导数据的选取,更加适合软测量模型的精度要求;模型的数据量始终不变,模型的矩阵规模不变,有利于计算机的稳定运行;在建模的过程不需要对每组输入的新数据进行计算,降低了计算成本。

在线预测LSSVM模型如图2所示。

图2 在线预测LSSVM模型

2 模拟实验

2.1 基准函数

采用MATLAB软件以典型的非线性正弦函数为基准验证本文提出的模型数据更新算法,该函数的表达式如下:

2.1.1 初始训练数据

在(–8,10]区间内,每隔0.2生成一组数据,共有90组数据。使用其中前25组数据构建初始训练矩阵,即采用(–8,–3]区间内的数据构建初始模型。

2.1.2 测试数据

使用(–3,10]区间内的65组数据对模型进行测试。本次实验采用2种方法作为对比:1)使用传统无更新LSSVM方法;2)使用文献[5]提出的更新方法(LSSVMUP1)。

为模拟实际现场,测试样本将会依次输入模型中。使用均方根误差(RMSE)来评估预测精度,其定义如下:

LSSVM模型均使用RBF作为核函数,使用5-fold交叉验证对核函数参数和正则化参数进行寻优。

2.2 结果与讨论

不同模型的预测结果如图3所示。图中LSSVM、LSSVMUP1和LSSVMUP2分别代表离线模型预测值、文献[5]中的在线模型预测值和本文提出的在线模型预测值。表1为不同模型相关参数。

图3 不同模型预测结果

表1 不同模型相关参数

Tab.1 Relevant parameters of different models

文献[5]算法中的更新策略1会通过增加样本而增加模型映射矩阵的维度,更新策略2在剔除旧样本的同时引入同样多的新样本。因此,LSSVM的映射矩阵维度会随更新策略次数的增加而增大,最后必然导致计算时间增长,不利于现场应用。本文提出的方法在引入误差大的数据的同时删除拉格朗日值小的原数据,不改变映射矩阵的维度,避免删除有效原始数据,保证了预测精度。

3 NOx软测量

3.1 机组概况

本文对内蒙古某600 MW燃煤机组SCR烟气脱硝系统入口NO质量浓度进行软测量。该机组为亚临界锅炉,6台中速磨煤机将燃料送入炉膛。燃烧方式为四角切圆,6层一次风(A、B、C、D、E、F)和8层二次风(AA、AB、BC、CC、DD、DE、EF、FF)交替分布在炉壁,6层循环风(A、B、C、D、E、F)围绕燃烧器喷嘴分布以提供充足的空气,4层燃尽风(UA、UB、UC、UD)安装在炉膛顶部以补充空气。

3.2 选取辅助变量

本文机组与文献[5]的机组情况相似,因此采用相同的方法选取辅助变量,即选取20组辅助变量,包括机组负荷、利用PCA方法从一次风率(A—F)、循环风风率(A—F)和给煤率(A—F)中提取的6组变量、8组二次风率(AA—FF)、4组燃尽风风率(UA—UD)及烟气含氧量。模型结构如图5所示。

图5 实际机组模型结构

3.3 建立模型

从电厂DCS中导出共50 000 s实际数据,每隔10 s选取1组数据。为模拟真实情况,在模型更新环节,更新数据一一传入,且NO质量浓度的实际值延迟50 s送入模型中(即相隔5组)。使用最初的300组数据对初始模型进行训练,数据在送入模型前使用统一的零均值归一化进行数据预处理,采用10-fold验证的方式对LSSVM参数寻优。

采用均方根误差与平均相对误差(MRE)对模型精度进行评价,计算公式为

使用本文提出的更新算法进行实验,作为对比,使用传统LSSVM和文献[5]提出的算法对相同的数据进行实验。预测结果如图6所示,统计数据结果见表2。

从图6a)可以看出,不更新的LSSVM由于初始样本未覆盖到后续数据,因此不能输出合适的预测结果;本文提出的算法在不同负荷下,预测精度极佳,但由于参数设置的太小,因此更新次数多,计算时间长,4 700组更新数据更新了4 352次,使用了4 279.7 s,近似输入1次更新1次,且每次计算时间为1 s,虽然均方根误差为3.18 mg/m3,平均相对误差为0.82%,但是计算用时较高。

图6b)中使用文献[5]更新方法的预测曲线精度较好,更新次数仅2 328次,但计算时间达到 4 417.2 s。其原因为更新过程中不断往模型计算矩阵中引入新数据,增加了单次更新计算时间。在本次实验模拟完成的时候,模型计算矩阵规模达到了528维,是初始矩阵的1.76倍,理论计算时间上,是初始矩阵的3.10倍。

表2 预测结果统计

Tab.2 Statistic results of the prediction results

本文提出的更新算法和文献[5]提出的更新算法总体误差在1.7%左右,其预测结果的个体误差分布如图7所示。由图7可以看出:相对误差超过20%均有8组,数量不多;能达到工业标准相对误差为5%的样本数目,文献[5]提出的算法有4 201组(共 4 700组),本文提出的算法有4 394组(共4 700组),说明本文算法针对误差进行更新的思路更符合现场的需要。

图7 总体误差在1.7%左右的2种算法的个体误差分布情况

在图6b)中,文献[5]更新算法的预测曲线在第600—940组数据时变化幅度不大。图8为2种更新算法更新情况。由图8可见:在第600—940组数据时,由于输入新数据相似度变化不大,因此模型或许未更新,导致这一时间内模型输出不变;而由图8b)可知,模型在该时间段仍在更新,其深层原因是一些和输出变量相关的变量未输入到模型中。

4 结 论

1)本文提出了一种基于预测误差的在线矫正LSSVM模型,并通过模拟实验对算法的可靠性进行验证。将该模型用于实际电厂50 000 s的DCS数据进行预测。结果表明该模型具有良好的预测精度与快速的预测速度,适用于现场SCR脱硝反应器入口NO质量浓度在线预测。

2)在计算速度上,当预测平均相对误差在1.7%左右时,本文模型计算速度是前文献提出模型的3.27倍;在计算精度上,本文模型通过改变参数,在可接受的计算时间内,可达到0.82%的平均相对误差;在误差分布上,当预测平均相对误差在1.7%左右时,本文模型有更多样本点的相对误差在5%,更符合现场需求;在模型更新上,本模型持续更新,不存在长时间间断,这样可以保证预测的质量。

3)本模型在避免预测精度下降的同时,解决了前文献中模型计算矩阵规模随更新次数增大的问题;而且,采用了直观的预测精度参数来控制模型的预测精度,更为实用。

[1] SKALSKA K, MILLER J S, LEDAKOWICZ S. Trends in NOabatement: a review[J]. Science of the Total Environment, 2010, 408(19): 3976-3989.

[2] 解然, 杨昆, 石峰. 推动我国环保标准“走出去”的思考与建议—以火电行业为例[J]. 环境保护, 2017, 45(5): 71-74.

XIE Ran, YANG Kun, SHI Feng. Consideration and suggestion on the global strategies of China’s environmental standards: a case study of the thermal power industry[J]. Environmental Protection, 2017, 45: 71-74.

[3]KORPELA T, KUMPULAINEN P, MAJANNE Y, et al. Indirect NOmathContainer Loading Mathjax, emission monitoring in natural gas fired boilers[J]. Control Engineering Practice, 2017, 65: 11-25.

[4] KADLEC P, GABRYS B, STRANDT S. Data-driven soft sensors in the process industry[J]. Computers & Chemical Engineering, 2009, 33(4): 795-814.

[5] LV Y, YANG T, LIU J. An adaptive least squares support vector machine model with a novel update for NOemission prediction[J]. Chemometrics & Intelligent Laboratory Systems, 2015, 145: 103-113.

[6] GRBIC R, SLISKOVIC D, KADLEC P. Adaptive soft sensor for online prediction and process monitoring based on a mixture of Gaussian process models[J]. Computers & Chemical Engineering, 2013, 58: 84-97.

[7] SLISKOVIC D, GRBIC R, HOCENSKI Z. Methods for plant data-based process modeling in soft-sensor development[J]. Automatika, 2012, 52: 306-318.

[8] SLISKOVIC D, GRBIC R, HOCENSKI Z. Adaptive estimation of difficult-to-measure process variables[J]. Automatika, 2013, 55: 166-177.

[9] VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1995: 85-86.

[10] SUYKENS J, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Process Lett 1999, 9: 293-300.

[11] ZHAO H B, RU Z L, CHANG X, et al. Reliability analysis of tunnel using least square support vector machine[J]. Tunneling and Underground Space Tech- nology, 2014, 41: 14-23.

[12] YU L, CHEN H, WANG S, et al. Evolving least squares support vector machines for stock market trend mining [J]. IEEE Transaction on Evolutionary Computation, 2009, 13: 87-102.

[13] ZHENG H B, LIAO R J, GRZYBOWSKI S, et al. Fault diagnosis of power transformers using multi-class least square support vector machines classifiers with particle swarm optimisation[J]. Electric Power Applications Iet, 2011, 5(9): 691-696.

[14] YARVEICY H, MOGHADDAM A K, GHIASI M M. Practical use of statistical learning theory for modeling freezing point depression of electrolyte solutions: LSSVM model[J]. Journal of Natural Gas Science & Engineering, 2014, 20(2): 414-421.

[15] 张英堂, 马超, 李志宁, 等. 基于快速留一交叉验证的核极限学习机在线建模[J]. 上海交通大学学报, 2014, 48(5): 641-646.

ZHANG Yingtang, MA Chao, LI Zhining, et al. Online modeling of kernel extreme leaning machine based on fast leave-on-out cross-validation[J]. Journal of Shanghai Jiao Tong University, 2014, 48(5): 641-646.

[16] 方必武, 刘涤尘, 王波, 等. 基于小波变换和改进萤火虫算法优化LSSVM的短期风速预测[J]. 电力系统保护与控制, 2016, 44(8): 37-43.

FANG Biwu, LIU Dichen, WANG Bo, et al. Short-term wind speed forecasting based on WD-CFA-LSSVM model[J]. Power System Protection and Control, 2016, 44(8): 37-43.

An improved online NOxprediction model based on LSSVM

DING Xuda, JIN Xiuzhang, ZHANG Yang

(School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China)

On the basis of least square support vector machine (LSSVM), a nitrogen oxide (NOx) prediction model using prediction error for online updating was proposed. The LSSVM model considers prediction accuracy as the target of online updating. On the premise of ensuring high prediction accuracy, the input parameters affecting the NOx emission are selected. The updating of the input data depends on the total error, and the error of individual samples guides the selection of data, which overcomes the problem that the single-step updating calculation complexity accumulates with the time and the parameter selection of the updating algorithm is difficult. The simulation test and actual DCS data of the power plant are used to verify the reliability and advancement of the model, and the results show that, both the prediction accuracy and calculation speed can meet the requirement of actual field application. With the same prediction accuracy, the improved model’s computation speed is 3.24 times faster than the original method, and is simpler and more suitable for field use.

soft sensor, LSSVM, NOx monitoring, online prediction model, ultra-low emission, SCR

National Key Research and Development Program (2016YFB0600701)

丁续达(1994—),男,硕士研究生,主要研究方向为工业机器学习与数据挖掘,williamding@icloud.com。

TK313

A

10.19666/j.rlfd.201803023

丁续达, 金秀章, 张扬. 基于最小二乘支持向量机的改进型在线NOx预测模型[J]. 热力发电, 2019, 48(1): 61-67. DING Xuda, JIN Xiuzhang, ZHANG Yang. An improved online NOx prediction model based on LSSVM[J]. Thermal Power Generation, 2019, 48(1): 61-67.

2018-03-28

国家重点研发计划项目(2016YFB0600701)

金秀章(1969—),男,博士,硕士生导师,主要研究方向为先进控制策略在大型电力机组的控制,jxzsys@163.com。

(责任编辑 杜亚勤)

猜你喜欢
向量精度机组
向量的分解
660MW亚临界机组清洁疏水系统节能改造
聚焦“向量与三角”创新题
基于DSPIC33F微处理器的采集精度的提高
电子制作(2018年11期)2018-08-04 03:25:38
向量垂直在解析几何中的应用
GPS/GLONASS/BDS组合PPP精度分析
向量五种“变身” 玩转圆锥曲线
改进的Goldschmidt双精度浮点除法器
350MW机组DEH控制系统的优化
自动化博览(2014年9期)2014-02-28 22:33:32
TNG系列多功能提取浓缩回收机组
机电信息(2014年35期)2014-02-27 15:54:33