陈向俊,傅军平,陈栋栋,李 科,李黎苹,吕林锋
(1.浙江省特种设备科学研究院,浙江 杭州 310020;2.浙江省特种设备检验技术研究重点实验室,浙江 杭州 310053)
截至2020年12月,我国国内电梯总量将达到了850万台,中国的电梯产销量和电梯数总量在世界上依旧保持第一。但随着电梯市场和需求的日益扩大,电梯的安全问题越来越严峻[1]。
电梯钢丝绳是关系到电梯正常运行的重要部件之一,易发生腐蚀磨损和疲劳断裂。2019年7月14日,上海市嘉定区某电梯维护作业人员徐某在进行电梯钢丝绳更换作业时,在刚更换了一根钢丝绳后,其余所有的钢丝绳(6根)全部断裂,徐某被上方脱落的链条打中。后经调查发现,该电梯的钢丝绳已经严重磨损,处于一碰即断的临界点,从而引发了此次安全事故。
随着电梯曳引钢丝绳的广泛使用,钢丝绳的安全防护问题非常值得关注,除了要经常对其进行润滑之外,对曳引轮槽表面磨损情况、轮槽尺寸都需要进行定期检查,以保证电梯的安全运行[2]。因此,钢丝绳磨损量的预测对于提高钢丝绳的使用寿命和电梯安全性能是非常重要的。
通过文献检索发现,国内现有针对电梯钢丝绳磨损的研究并不多见。陈海龙[3]在对起重机钢丝绳磨损进行了研究,结果表明,直径的减少是起重机钢丝绳磨损报废的直接原因,并提出了一种通过测量钢丝绳直径的减少来值判断钢丝绳磨损量的方法;但他的研究中,实验的样本量太少,且其研究仅针对钢丝绳直径对磨损量的影响,不够全面。王平等人[4]应用绳索振动理论结合BP(back propagation)神经网络的方法,对钢丝绳磨损与张力偏差之间的关系进行了研究,并设计了实验对该方法的实用性进行了验证;但是其研究也仅针对张力与磨损量的关系,同样不够全面。王晔[5]研究了不同因素对钢丝绳磨损量的影响,但是他仅从理论方面进行了阐述,并未用实验对此进行验证。任洁[6]分析了钢丝绳实际磨损的图片,并得到结论,即多数钢丝绳磨损为人为安装因素引起,不涉及到钢丝绳自身的因素。
因此,目前对电梯钢丝绳磨损量预测的研究存在明显的局限和不足。
为了解决这个问题,笔者以梯度提升回归(gradient boosting regression,GBR)算法为基础,围绕影响钢丝绳磨损的4个主要因素[7]采集实验数据,利用经过贝叶斯优化的极端梯度提升模型(BO-XGBoost)进行训练和验证,预测钢丝绳在不同情况下的磨损量,并将其与实际磨损量进行比较。
梯度提升算法本质上是一种监督学习方法。对于许多复杂的数据集而言,它是一种非常可靠的方法[8,9]。GBR就是一种弱学习器的回归算法,最后得到强学习器,它可以用于回归和分类的问题。在梯度提升过程中,先找到一个预测准确性比较弱的模型Fm(x),得到其预测值与实际y值之间的差异,即残差R(x)。
GBR不会改变Fm(x),而是通过增加估计器h(x)构建新的模型,逐步减小残差。当满足下式时,效果最好:
h(x)=y-Fm(x)
(1)
极端梯度提升算法是以梯度提升算法为基础的一种优化算法[10,11],沿用了梯度提升的框架,因此同样是一种监督算法。XGBoost在目标函数的损失函数中新加入一个正则化项,它能过渡最终学习到的权重比,防止过拟合现象。
接下来笔者介绍XGBoost的理论框架。
(2)
式中:Γ—回归树空间;K—回归树的数量;xi—样本i对应的特征。
目标函数是机器学习问题中最基本的表达方式[12],其提升的过程会一直进行,直到目标函数变得最简且最优。笔者将模型中采用的函数集做近似化处理,并定义正则化的目标函数为:
(3)
(4)
由于需要在损失函数中优化目标,笔者在此处将式(4)按二阶泰勒展开做近似处理,即:
(5)
式中:gi—损失函数的一阶梯度统计量;hi—损失函数的二阶梯度统计量。
gi的具体表达式如下式所示:
(6)
hi的具体表达式如下式所示:
(7)
在迭代过程步骤k中去除掉常数项,得到以下近似目标值:
(8)
用叶子的分数向量和样本映射到叶子j的索引映射函数来定义树,这个过程可以表示为:
(9)
同时式(8)可以改写为:
(10)
(11)
(12)
式(12)可以看作是一个评估函数,用于衡量给定的叶子评分向量的合适程度,其值越小越好。为了避免陷入无尽的树结构,在实际应用中,笔者采用贪心算法来寻找最优的树结构。
超参数是指在机器学习过程中需要提前设置值的参数,超参数对模型的预测准确性有显著影响。在机器学习实践中调整超参数通常采用网格搜索(grid search,GS)和随机搜索(random search,RS)方法。由于GS容易受到维数约束的影响,维数越多则花费时间指数增长,这已被证明对于XGBoost是不可行的方法[13,14]。RS通过尝试超参数的随机组合来选择最佳超参数配置的方法,但RS的缺点在于不必要的高方差。
贝叶斯优化(Bayesian optimization,BO)通过目标以前的评估结果重新构建概率模型[15,16],寻得最小化目标函数的值,被广泛应用于机器学习超参数调优。贝叶斯超参数优化是一种为序列模式模型提供的求全局优化的方法[17],序列化模型全局优化(sequential model-based optimization,SMBO)是把贝叶斯优化的一个形式化的定义。
SMBO伪代码流程如表1所示。
表1 SMBO伪代码
整个循环一共需要进行T次。首先每次先根据已有的历史试验集合找出一个更可能拥有更小损失函数的超参数集合λ,之后计算实际的损失函数L的值,加入历史集合后更新S。
由于贝叶斯优化是优化目标函数的首选,笔者提出的基于贝叶斯超参数优化的极端梯度提升算法(BO-XGBoost)对应的流程如图1所示。
图1 BO-XGBoost算法流程
为了准确地研究电梯钢丝绳在使用过程中的磨损情况,笔者采用自制的疲劳试验机来对钢丝绳的磨损过程进行实验模拟。模拟过程为先将钢丝绳绕在曳引轮和导向轮上,并张紧(两轮间相对位置可调,以适应不同的包角);加载模式为气压加载,通过电控并给定其一定的频率,使其来回反复运动。
疲劳试验机的设计图和实物图如图2所示。
图2 疲劳试验机设计图1—反折轮导向装置;2—反折轮;3—试验轮驱动装置;4—绳头夹具计数装置;5—包角调节装置;6—控制系统;7—导向轮
疲劳试验机分为机械部分和电控部分:(1)机械部分。由伺服电机带动试验轮正反转运行,以此来拖动钢丝绳进行疲劳寿命试验。实验轮和导向轮为可拆卸结构,用来测试不同直径的钢丝绳,载荷力通过加载轮来调节其大小;(2)电控部分。主要为人机界面,在设定试验频率、试验次数以及包角等参数后,即开始进行疲劳试验。
整个试验在曳引比1:1的情况下进行。当PLC通讯正常时,系统会跳转到参数设置界面来设置相关实验参数。参数设置界面如图3所示。
图3 参数设置界面
目前一般以钢丝绳直径的磨损率来考察钢丝绳的失效程度。磨损率涉及到的因素较多,钢丝绳的磨损率主要受载荷力、曳引轮直径、运动频率、包角的影响较大。笔者将上述4个因素作为实验考察的因素,将数据实验测得的磨损率记录下来,用于创建机器学习模型。
由于钢丝绳疲劳实验流程很长,笔者采用130组数据作为训练数据;且模型训练完毕后,再用20组新数据作为测试之用,故总共采集150组数据。测试模型的数据如表2所示。
笔者在MATLAB上编写4种模型的程序,并导入表2中的数据,分别运行后得到模型的建模结果分析图和回归效果分析图。各模型的预测结果如图4所示。
表2 测试模型试验数据集
图4 不同模型预测结果曲线
由图4(a~h)可以发现,BO-XGBoost模型的预测值与目标值更接近。因此,不难看出BO-XGBoost模型的模拟效果最好,RF和SVM模型其次,MLR模型最差。
在算法原理上,RF对异常值不敏感,且对训练集一视同仁,且每棵树分裂特征随机;采用MLR算法处理复杂问题时,存在较大的局限性;SVM虽然有一定的泛化能力,但核函数的选取非常困难,同时对缺失数据也很敏感;BO-XGBoost对代价函数进行了二阶泰勒展开,同时考虑一阶与二阶导数,支持自定义代价函数(二阶可导),在超参数问题上加以贝叶斯优化后,其优势很大。
为了评估预测模型的可靠度,笔者计算每个模型结果的平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(R2)。MAE是评估回归模型预测误差的最常用方法之一,它是方程中给出的预测误差的平均绝对值,如下式所示:
(13)
式中:PM—预测的磨损量;AM—实际的磨损量;
对于预测误差,笔者利用RMSE来验证预测的有效性,即:
(14)
评估参数R2被广泛称为确定系数,用于确定预测值与实际值的接近程度,即:
R2=
(15)
如前所述,MAE和RMSE的值越低表示该模型的效率越高,R2值在0~1之间,且越接近1表示模型的预测精度越好。
4种模型的MAE、RMSE、R2值如表3所示。
表3 钢丝绳磨损结果预测
通过表3,并结合前文的图4可以看出:在此次试验中,BO-XGBoost模型比其他3个模型效果都要好;具体表现为BO-XGBoost的MAE与RMSE均要小于MLR、SVM和RF,且BO-XGBoost的R2值较高,达到了0.991,与图4反映的结果类似,即MLR显示的预测性能最低,RF和SVM其次,BO-XGBoost的预测效果最优。
针对目前对电梯钢丝绳磨损量预测的不足,笔者采用基于极端梯度提升(XGBoost)算法的机器学习方法,对电梯钢丝绳磨损率的预测进行了研究。笔者基于自制的钢丝绳疲劳试验机,对钢丝绳磨损的4个主要因素的数据进行采集,并用基于贝叶斯超参数优化的极端梯度提升回归算法BO-XGBoost来预测钢丝绳疲劳磨损率;同时将BO-XGBoost与多元线性回归(MLR)、随机森林(RF)以及支持向量机(SVM)算法进行了比较。
研究结果表明:
(1)BO-XGBoost模型对多因素影响下钢丝绳磨损率的预测效果最佳,模型的泛化能力最好,其预测可靠度优于MLR、RF、SVM等模型;
(2)对于电梯钢丝绳磨损,采用基于极端梯度提升回归模型算法,其预测精度达到了99%以上,预测值基本等于实际磨损值;将其用于钢丝绳磨损程度的参考,在不同工况下选择合适的曳引轮直径、载荷力、频率和包角,有利于降低钢丝绳的磨损率,提高特种设备的安全。
在后续的工作中,笔者将研究钢丝绳的磨损量与其使用寿命之间的规律,以进一步提高钢丝绳使用的安全性。