马 欢,廖 燕
(1.武汉理工大学 汽车学院,湖北 武汉 430070;2.现代汽车零部件技术湖北省重点实验室(武汉理工大学),湖北 武汉 430070;3.汽车零部件技术湖北省协同创新中心,湖北 武汉 430070)
城市物流系统为区域经济发展和城市各项功能的正常运转提供了保证。物流需求预测是城市物流系统规划的前提,是物流行业合理配置物流资源和制定发展规划的重要依据。因此,及时而准确的物流需求规模预测有利于城市物流系统的优化和完善,有助于物流企业进一步降低成本、提升效率。
目前用于物流需求预测的理论方法较多,主要包括回归分析法、时间序列法、灰色预测、人工智能算法等。武进静等[1]选取与物流需求相关性较高的经济指标作为自变量,建立物流需求和相关经济因素的多元回归预测模型,对此后10年的江苏省货运量进行预测,总体反映了未来的物流需求量。Yavuz Acar[2]认为在供应链管理中,预测是经营业绩的重要影响因素,采用集成指数平滑法优化和仿真实际的日常需求建立供应链模型,实验表明,预测方法的选择会对经营业绩产生显著差异。刘源[3]认为交通运输系统没有物理原型以及内部机理不明确,因此将其视作灰色系统,使用GM(1,1)模型对河南省历史货运数据建立预测模型并进行外推,灰色模型可以在数据有限的情况下进行比较准确的预测。贾素琴等[4]利用ARIMA模型对影响物流的经济指标进行预测,将各指标的预测值作为输入,货运量作为期望建立RBF神经网络预测模型,具有较好的精度。
综合上述文献,以回归分析和时间序列为代表的传统预测方法无法应对物流需求量突发性和随机性的情况,灰色系统预测模型没有考虑物流需求的多个影响因素,人工神经网络虽然具有很强的非线性拟合特性,但其容易陷入局部最优和输出不稳定。
支持向量回归机(Support Vector Regression,SVR)适用于解决小样本、非线性和高维数据空间计算问题,并且得到的解为全局最优[5]。针对区域物流需求非线性和波动性的特征,SVR能够最大限度地挖掘隐含于物流需求历史数据中的信息[6],在预测方面更具优势。但在实际应用中SVR对参数选择的依赖性很大,实验证明不同的核函数参数、惩罚参数及损失函数都会影响最终的预测性能[7]。传统的SVR模型参数确定方法以人工选择法和网格搜索法为主,存在主观性大、运算量大和耗时长的问题。遗传算法(Genetic Algorithm,GA)是一种借鉴生物进化过程自然选择和遗传理论的一种全局优化搜索算法,具有群体搜索和内在启发式随机搜索的特性,不易陷入局部最优,非常适用于大规模并行计算[8]。基于此,将遗传算法与支持向量回归算法相结合,充分发挥二者的优势,利用GA寻优的特性得到SVR模型中的关键参数,进而建立物流需求预测模型,得到精确的结果。
支持向量回归是利用支持向量的思想和拉格朗日乘子式的方式对数据拟合回归的一种方法。其基本思想是,对于给定训练数据集,通过一个非线性映射φ(x)把样本向量从原空间映射到高维特征空间,在高维空间构造决策函数:
ω是权值向量,b是偏置量。根据风险最小化原则,引入松弛因子 ξi、ξi*和不敏感损失系数ε,SVR问题转化为:
引入Lagrange乘子α、α*,转化为该问题的对偶问题:
求解上述问题,得SVR的决策函数:
核函数选取RBF核函数,表达式为:
支持向量回归的预测精度很大程度上依赖于核函数及其中的参数选取,核函数的引入避免了复杂计算[9]。其形式与参数变化会隐式地改变从函数的映射关系,进而改变映射特征空间的复杂程度,从而影响支持向量回归机的性能。RBF核函数的关键参数是σ即核的宽度,它控制着函数的径向作用范围。惩罚参数C在模型复杂度和训练误差之间起平衡调节的作用,C值越大,表示对超出损失函数的数据惩罚越大,影响模型的推广能力。损失函数ε表示训练数据和真实数据的逼近精度,若数值过小,则回归精度较高,但有可能导致模型过于复杂,推广能力差;若过大则模型简单,导致学习精度不够。目前还没有确定的理论来指导支持回归机的参数选择,针对该问题将参数选择看作多变量组合优化问题。
遗传算法对SVR参数优化的基本思想是:把生物进化原理引入优化参数(C,σ,ε)形成的编码串联群体中,按照所选择的适应度函数,通过遗传中的选择、交叉和变异对个体进行迭代,直至满足终止条件,达到智能寻优的目的。
遗传算法优化SVR预测模型的实现流程如下:
(1)获取物流需求量数据,并且对其进行预处理,确定训练样本集和测试样本集。
(2)设置GA参数及对SVR参数进行编码。染色体以{x1,x2,x3}形式表示,其中x1,x2,x3分别代表C,σ,ε,以实数编码方式进行染色体编码,即每个染色体用一个实数串表示。
(3)计算每个个体的适应度。适应度计算采用K-交叉验证后的均方误差平均值作为适应度值,衡量选取参数的优劣,计算方法如下:
(4)判断是否满足迭代条件。若不满足则进行选择、交叉和变异操作。
选择操作采用轮盘赌法筛选适应度值高的种群进入下一代,个体Xi的适应度值为f(Xi),则被选取为下一代的概率为:
交叉操作采用线性组合的方式,以某概率p(p∈[0,1])对两个染色体进行交叉操作,即:
变异操作采用均匀变异方式,即对于要变异的个体X=(x1,x2,···,xn),随机产生一个随机数k∈[1,n],产生新的后代 X=(x1,x2,···,xk’,···,xn),其中 xk’是[lk,uk]中服从均匀分布的一个随机数。
如果满足条件则输出SVR参数。
(5)构造SVR预测模型,将遗传算法寻优最终得到的参数代入SVR预测模型中进行仿真预测。
具体流程如图1所示。
图1 GA-SVR预测建模流程
现阶段关于物流需求量的统计没有一个明确的指标,考虑数据的可得性及完整性,一般把货运量作为物流需求规模的指标。综合物流需求相关研究结论[10-11],将物流需求影响因素分为经济总量类、产业结构类、人口发展类、固定投资类、进出口贸易类。利用灰色关联分析法,选取关联度大的因子建立武汉市物流需求影响因素指标体系,最终确定与货运量关联度最高的8个因子为影响武汉市物流需求变化的驱动因子,包括人口规模X1(万人)、地区生产总值X2(亿元)、第一产业产值X3(亿元)、第二产业产值X4(亿元)、第三产业产值X5(亿元)、固定资产投资总额X6(亿元)、进出口贸易总额X7(亿美元)、居民人均可支配收入X8(元)等生产或经济指标作为因变量,自变量为货运量Y(万t)。
数据来源于《武汉统计年鉴》,选取2006-2016年货运量及其影响因素数据作为研究对象,进行物流需求的预测分析,具体数据见表1。
表1 物流需求及经济指标统计数据
由于原始变量数据的单位不统一以及数据间量级相差过大,为提高数据训练效率和预测模型精度,需要对原始数据进行归一化处理,转化为无量纲的数据。归一化公式如下:
其中xi为初始值,xi*为归一化值,xmin,xmax表示变量的最大值和最小值。
将经过归一化处理的2006-2014年数据作为样本训练集数据,利用RBF核函数建立SVR物流需求预测模型。模型的参数设置如下:选用ε-SVR,惩罚因子C的取值范围为[0,100],RBF核函数参数σ的取值范围为[0,1 000],遗传算法最大的进化代数为100,种群最大数量为20,交叉概率为0.4,变异概率为0.01,交叉验证参数设置为5。
根据已确定的最优惩罚参数、核半径、不敏感损失参数,建立SVR物流需求预测模型。将2006-2014年的数据作为训练数据,再将2015-2016年的数据作为测试数据,对GA-SVR模型的推广能力进行测试。仿真结果如图2,可以看出模型对于训练集的拟合性能较好。
利用建立的模型对测试集数据进行预测,同时,分别采用网格搜索SVR模型、BP神经网络预测模型对武汉市2015-2016年物流需求量进行对比预测,各模型预测结果见表2。
图2 GA-SVR模型对训练集的拟合效果
表2 3种模型预测结果对比
使用均方根误差(RMSE)和平均绝对误差百分比(MAPE)作为评价指标,定义如下:
其中y∧i代表预测值,yi代表真实值,n为预测样本数。
表3 3种模型误差对比
使用RMSE和MAPE衡量模型预测结果的优劣,两个指标的值越小,预测结果越精确。从表3可以看出GA-SVR预测模型RMSE和MAPE均优于未经优化的SVR和BP神经网络预测模型,预测精度较好。未经优化的SVR模型次之,神经网络模型效果最差。
SVR具有人工智能算法强大的非线性拟合特性,同时克服了其输出结果不稳定的缺点,在处理小样本情况下复杂非线性规律的问题时具有优良的特性,但其在实际应用中存在参数值难以确定的问题。通过将遗传算法和支持向量回归相结合,利用优化的参数建立SVR预测模型并对武汉市物流需求数据进行实例验证,结果表明预测模型具有良好的预测精度。通过与网格搜索SVR模型和BP神经网络模型相比,GA-SVR模型能够更为准确地预测物流需求量,为物流需求预测提供了一种新的参考方法。
[参考文献]
[1]武进静,韩兴勇.基于多元线性回归模型对江苏省物流需求的预测分析[J].上海农业学报,2015,31(4).
[2]Acar Y,Gardner E S.Forecasting method selection in a global supply chain[J].InternalJournalofForecasting,2012,28(4):842-848.
[3]刘源.基于灰色预测模型的物流需求分析[J].物流技术,2012,31(6).
[4]贾素琴,杨家其.基于ARIMA—RBF模型的区域物流需求预测[J].物流技术,2016,35(4).
[5]汪海燕,黎建辉,杨风雷.支持向量机理论及算法研究综述[J].计算机应用研究,2014,31(5).
[6]王霞,王占岐,金贵,等.基于核函数支持向量回归机的耕地面积预测[J].农业工程学报,2014,30(4).
[7]朱霄珣,徐博超,焦宏超,等.遗传算法对SVR风速预测模型的多参数优化[J].电机与控制学报,2017,21(2).
[8]马永杰,云文霞.遗传算法研究进展[J].计算机应用研究,2012,29(4).
[9]邓乃扬,田英杰,数据挖掘中的新方法—向量机[M].北京:科学出版社,2004.
[10]胡小建,张美艳,卢林.物流需求预测模型构建[J].统计与决策,2017,(19).
[11]陈海英,张萍,柳合龙.人工鱼群算法优化支持向量机的物流需求预测模型研究[J].数学的实践与认识,2016,46(2).