河北金融学院 柳凌燕 王宪明
河 北 大 学 胡继成
商业银行作为金融体系的核心,对国民经济的稳定起着极为重要的作用。信用风险是商业银行面临的主要风险,加强信用风险的管控也是世界各国金融监管机构的重要工作。诺贝尔奖获得者、美国经济学家默顿米勒曾指出,在某些方面,信用风险是引起金融危机的三个风险中最关键因素。全球经济一体化,资本跨境流动更为频繁,由信用风险所引发的银行倒闭和金融危机的发生频率上升,周期缩短。1995年以来,日本曾有多家商业银行和信用社因信用风险敞口暴露而导致企业倒闭。2007年爆发的美国次贷危机,迅速蔓延至全球金融领域,导致部分大型跨国金融集团、商业银行和投资银行等金融机构损失惨重,部分甚至破产清算或业务重组。此次金融危机的发生使人们深刻意识到信用风险问题不仅影响商业银行的自身稳健经营,而且还会严重冲击宏观经济的正常运行,甚至引发全球性的金融海啸或经济衰退。
近年,我国商业银行陆续完成股份制改造,在法人治理结构和风险管理方面取得了长足进步。但由于资本市场开放程度不高,以及隐性存款保险的支持,使得国内商业银行的风险管理水平存在较大差距,尤其在信用风险管理仍然存在诸多不足。随着我国加入世界贸易组织进程的不断深化和我国金融业务的逐渐放开,外资银行和投资机构涌入我国金融市场,并获得与国内银行平等竞争的权利。与此同时,我国的商业银行也会逐步开拓海外金融市场,所以我们即将面临的是来自全球范围内的商业银行和投资机构之间的激烈竞争。如何提高我国的商业银行的信用风险评估水平成为我们亟待解决的问题。
国外研究者从事商业银行信用风险评估方面研究始于20世纪60年代,根据评估方法的不同大致可分为五大类,即多元判别分析法、多元非线性回归分析法、人工智能、组合信用风险评估建模以及信用风险内部评估。多元判别分析法是研究多个元素之间相互关系的一组统计方法。在信用风险评估方面的研究最早始于1966年,是除美国以外其他国家应用最为广泛的信用风险评估方法。其中最具代表性的是Z-score模型、ZETA模型和logit回归模型。该种方法的不足之处是必须以大量、可靠的历史统计数据为基础,这在发展中国家是难以具备的前提条件。20世纪80年代提出了多元非线性回归分析法,其中最常用的是Logistic模型和Probit模型,该类方法的提出是由于多元线性回归模型在实际应用中存在一定的局限性,即无法解决违约与影响因素之间存在非线性关系的问题。到20世纪80年代后期,随着人工智能技术的在各个领域的广泛应用,人工神经网络和支持向量机成为了人工智能方法在信用风险评估领域的代表模型。其中人工神经网络模型由于强大的非线性处理能力和良好的鲁棒性,在破产预测和银行信用风险方面比多元判别分析法具有更显著的优势;支持向量机方法具有较强的操作性和适合解决有限样本问题两方面的特点,在应用于解决财务危机预警方面取得了良好的预测效果。组合信用风险评估建模是在资本市场的发展和信用风险复杂化的背景下提出的,最具代表性的是KMV公司推出的CMM信用监测模型,是当前最著名的信用风险度量模型之一。内部评级法(IRB)是于2001年巴塞尔委员会在推出《新巴塞尔资本协议草案》征求意见稿中推出的。到2003年,美国货币监理署(OCC)确定了内部评级系统的特征和关键组成部分,进一步细化了银行内部评级系统的要求。
我国学者从1998年开始关注信用风险评估方法的研究,主要研究成果大多是关于国外信用风险研究的介绍,深入系统的理论及应用方法研究较少,且早期的研究大多注重对银行信用风险理论基础和模型框架的介绍与分析,近年开始进行实证研究。陈忠阳对信用风险评估的理论、模型和方法进行了较为全面地介绍。王春峰等人对信用风险评估进行了分析,并通过实证分析证明了神经网络相对于判别分析法具有较高的预测精度。方先明等人建立基于Hopfield神经网络的信用风险评价模型,取得了较好的实验效果。姜琳等人利用DEA方法评估我国商业银行信用风险管理的相对有效性。杨雨等人构建了基于人工免疫机制的个人信用风险模型,通过实验证明该方法优于逻辑回归模型的预测水平。
由于BP神经网络在风险评估中的可行性及优越性,在20世纪80年代以来得到广泛应用,在相关研究中也得到了验证。传统的BP网络在训练中存在收敛速度慢,且BP网络的参数设置在一定程度上影响着训练的结果。针对BP网络的以上不足,本研究将改进后的免疫规划算法引入BP神经的训练过程,并应用到商业银行信用风险评估建模中。实验选取了国内16家上市商业银行近6年的财务指标和监管指标中与信用风险评价结果相关19项指标数据作为样本,通过分析银行数据指标的特点,采用了融合双变异算子的免疫规划算法应用于BP神经网络的训练过程,减少神经网络的训练效果受参数及初始值的影响。
免疫规划算法于2000年提出,其基本原理是对生物学的免疫的概念和原理进行人工模拟的过程。该算法的主要工作包括初始种群的构建、免疫疫苗的提取、适应度函数和变异算子的构造、疫苗接种和免疫选择六个环节。其中免疫规划算法的核心工作在于免疫疫苗的提取和免疫算子的构造方面,而免疫算子的构造又包括接种疫苗和免疫选择两个部分。该算法在一定程度上可以抑制进化规划算法在随机迭代搜索过程中产生的早熟、种群多样性减少等退化现象以及收敛速度慢等问题。但该算法在变异算子的构造方面仍存在改进的空间,这主要源于原算法其变异算子局限于使用高斯变异,高斯变异在局部搜索方面优势明显,但在全局搜索方面存在不足,从而在一定程度上限制了算法的搜索空间。本文结合考虑了柯西变异在全局搜索以及高斯变异在局部搜索方面的优势,对原免疫规划算法的变异操作进行改进,在搜索前期设计采用柯西变异算子,在搜索后期采用高斯变异算子,改进后的免疫规划算法描述如下:
(1)初始种群的产生及其编码,生成初始种群A0。
(2)根据先验知识抽取疫苗H。
(3)进行适应度的计算,判断是否满足停机条件。
(4)退火选择,选用模仿赌轮法。在父代群体Ak=(c1,……,cN)中个体ci以概率为:
进入新的父代群体。上式中,Tk是单调递减趋于0的退火温度控制序列。
(5)设计采用双变异算子对当前父代群体Ak进行变异操作生成子代群体Bk。在前期采用柯西变异算子进行全局搜索,后期采用高斯变异算子进行局部搜索相结合的方式。种群Ak中的父代(xi,σi)生成子代 Bk(x'i,σ'i)。在前期柯西变异算子的作用下,x'i和σ'i如下所示:
其中,i=1,2,…,n 为 Ak种群的数量;j=1,2,…m,m为目标解的维数;Aj(0,1)为对分量j产生一个比例参数为1的柯西随机变量;σi的初始值 σ0=ξ1×Lj,Lj为各目标解区间的长度;affxi为抗体xi的亲和度,affave为当代种群所有抗体的平均亲合度,affmax和affmin分别为当代种群的最大和最小亲和度。
在后期高斯变异算子的作用下,x'i和σ'i如下所示:
其中,Nj(0,1)为分量j的标准正态分布的随机变量;σi的初始值为 σ0=ξ2×Lj;μ为比例系数,0<μ≤0.1控制步长在很小的范围内变化;k为进化代数。
(6)对群体Bk进行接种疫苗操作,得到种群Ck。
(7)对群体Ck进行免疫选择操作,得到新一代父代Ak+1,并转至步骤(2)。
上述算法的状态转移可用如下的随机过程来表述:
其中,下标k表示种群进化的代数。对相对固定的k来说,从Ak到Ck的状态转换构成了一个完整的马尔可夫链。
以上算法对原免疫规划算法的变异操作进行了改进,结合了柯西变异全局范围搜索能力和高斯变异的局部范围搜索能力,以期提高算法的局部逃逸能力,避免出现早熟和种群退化等问题,使算法逐渐逼近全局最优解,即提高风险评估结果的准确性。
本文所提出的融合双变异算子的免疫规划算法主要应用于对BP网络进行训练,主要考虑到BP网络的训练效果受初始值和参数影响较大的缺点。在使用改进后的免疫规划算法进行神经网络的训练前需要确定BP网络的基本结构,并对传输函数进行选择。神经网络的信息处理能力正比于网络的隐层数,一般情况下BP网络的隐层数设计不会超过三层。这是由于Kolmogorov定理证明了具有三个隐层的BP网络可以解决任意复杂的模式分类问题。本文选择了三层的BP网络,即包含一个输入层,一个输出层和一个隐层。隐层的传输函数选择log-sigmoid函数如公式(6)所示:
在神经网络的训练前还需要确定免疫规划算法中的抗体的编码方式和适应度函数。编码方式一般为二进制和十进制(实数编码)两种。由于本实验选用的数据量大,为了减少进制转换所带来的巨大工作量,避免“维灾数”,决定采用基于实数的编码。在适应度函数构造方面,首先假设神经网络的输入节点为M个,输出节点为P个,训练样本个数为N,则学习样本的误差E为:
其中dkp为期望输出,ykp为实际输出。由于本文主要对风险评价结果进行预测,即输出节点为1,则学习样本的误差E为:
改进后的免疫规划算法构造的适应度函数如下:
其中,η为内部调节因子。
神经网络的具体训练过程如下:
(1)初始种群的产生及其编码。将神经网络的权值和阈值作为免疫规划的一组抗体进行实数编码,每组抗体的编码代表一个解;
(2)利用往年的风险评估值进行模糊决策,确定商业银行风险的安全区域即解空间,在解空间内随机生成初始解,并组成初始种群A0;
(3)将种群Ak中的每个个体作为神经网络的权值和阈值,通过计算得出神经网络的实际输出 YkN=(yk1,yk2,…,yki,…,ykn);其中,yki为经过公式(6)计算得出的一组实际输出值其维数与训练集的样本数相等,Ak种群的个体总数为N;
(4)根据先验知识从已构建好的知识库中抽取疫苗H;
(5)对抗体组YkN中的每一个体Yki进行公式(9)的适应度的计算,判断是否满足已设定停机条件,若满足则执行步骤(10),否则继续执行后序操作;
(6)退火选择,采用模仿赌轮法;
(7)采用双变异算子对当前父代群体Ak进行变异操作生成子代群体Bk。采用前期柯西变异算子进行全局搜索和后期高斯变异算子进行局部搜索相结合的方式。父代种群Ak中的(xi,σi)变异成为子代种群 Bk(x'i,σ'i);
(8)对群体Bk进行接种疫苗操作,得到种群Ck;
(9)对群体Ck进行免疫选择操作,得到新一代父代Ak+1,并转至步骤(3);
(10)在满足停止条件的第k代选取适应度最大的抗体,即为最优解。
新算法首先对神经网络的权值和阈值进行实数编码,使种群中的个体直接逼近最优解,避免了采用二进制编码所带来的巨量的工作量以及转换过程中精度下降的问题,提高了算法的执行效率和实验数据的精度。其次,综合历年的风险评估结果,通过推理方式形成疫苗。最后,采用双变异算子的变异操作结合了柯西变异的大范围搜索能力和高斯变异的局部空间搜索能力两方面的优势,提高了算法的局部逃逸能力,使算法逐渐逼近全局最优解,提高风险评估结果的准确性。
(一)数据采集和预处理。
为保证数据的真实性,所用的指标数据为16家上市商业银行2007年至2012年共6年的年报数据,该数据均出自 Wind金融数据库。2007~2011年的风险评价结果源自《金融蓝皮书:中国商业银行竞争力报告》。本文选择了指标数据中与风险评估相关性最大的8项财务指标和11项风险监管指标,即19项指标作为构建信用风险评价模型的数据集。
为保证所涉及的数据的准确性和完整性,在数据预处理阶段需要对有缺失的指标进行剔除操作。对于监管指标数据发生数据缺失的现象可能性较大:即数据不存在或现有的数据不符合规范,对于以上两类缺失数据的处理可以通过手工补缺、用全局常量替换丢失值和用特征平均值替换丢失值的方法进行补全。将2007~2011年指标数据的75%作为训练样本,25%作为检测样本。表1以浦发银行2007年至2011年的数据为例,列出19项财务指标数据和信用风险的评估结果。其中,信用风险评价结果的范围介于0至1之间,值越大说明信用风险越小。通过浦发银行2007~2011年度数据导入,得出结论如表1所示:
(二)实验仿真。
本实验采用三层BP网络,其中输入节点19个,输出节点1个,传递函数采用logsig函数。利用MATLAB仿真传统BP网络的训练过程,将未参加训练的测试集数据输入网络进行结果预测。在训练过程中,选择学习速率设置为0.7,动量因子设置为0.8,训练集目标误差设定为0.0005,训练次数3000次,模型的传递函数采用logsig函数。模型训练函数选择traingdm,即带有动量的梯度下降法。其中梯度下降法是利用负梯度方向决定每次迭代的新方向,在每次迭代后使待优化的目标函数逐步逼近。经MATLAB仿真后,得到系统训练集误差变化曲线如图1所示。
表1 浦发银行2007~2011年指标
图1 训练集误差曲线图
由图1可以看出,在经过1612次迭代之后,神经网络达到预期的训练要求。再使用新的融入双变异算子的免疫规划算法对BP神经网络进行训练,两种方法在训练后的预测值与测试集的实际风险结果进行比对得出表2的结果。
从训练集的期望输出值和实际输出值进行对比可以看出,融合了改进后的免疫规划算法的神经网络训练效果优于传统的BP神经网络。从以上结果可以看出,两种算法产生的误差大于神经网络训练设定的目标误差0.0005,这主要是由于:一方面,测试集选取的数据均来自2011年的数据,训练集数据则来自于2007~2010年,由于选取年份的不同可能会导致训练结果有一定的偏差;另一方面,《金融蓝皮书:中国商业银行竞争力报告》中所给出的风险评估值在评价指标的选取上与Wind金融数据库中的指标数据有一定的出入,所以也会导致对测试集的预测结果与实际结果之前存在一定的偏差。但通过对比结果我们还是可以看出融合了免疫规划的神经网络在训练效果上优于传统的BP网络,因此,该模型已经基本达到训练的预期效果,可以使用2012年的指标数据进行信用风险评价结果的预测。本实验将为未给出风险评估值的2012年16家银行的数据指标,输入训练好的融合了免疫规划的神经网络模型,得出了如表3所示的结果。
表2 测试集结果对比(2011年)
依据2012年的指标数据经训练好的模型进行预测得出的表3的结果中,华夏银行、交通银行和民生银行的信用风险相对较大,而中国银行、兴业银行和北京银行的信用风险相对较小。
表3 商业银行风险预测结果(2012年)
本文通过对商业银行金融风险管理,尤其是信用风险评估方法与模型横向比较后,根据商业银行信用风险评价依据的指标数据的具有高维、复杂、非线性等特点,确定以改进后的BP网络构建信用风险评估模型,发挥BP网络在解决高维、非线性问题方面的优势。针对传统的BP网络在训练效果上依赖于初始值以及训练参数的设定,且具有收敛速度慢,易陷入局部极小值等缺点,设计了柯西变异和高斯变异的双变异算子加入到免疫规划算法中,并将改进后的免疫规划算法应用到神经网络的训练过程,充分发挥了免疫规划算法在寻求全局最优解方面的优势,可达到快速搜索最优权值的目标,同时还克服了传统的BP神经网络收敛速度慢的缺点,提高了网络的收敛速度及预测精度。对16家上市商业银行风险评估的结果也验证了融合免疫规划算法的BP神经网络在信用风险评价上的有效性,为金融风险领域评估方法研究提供了一定的参考与借鉴。
[1]Beaver W H.Financial ratios as predictors of Failure[J].Journal of accounting research,1966:71-111.
[2]陈忠阳:《信用风险量化管理模型发展探析》,载于《国际金融研究》,2000年第10期,第14~19页。
[3]王春峰、万海晖、张维:《商业银行信用风险评估及其实证研究》,载于《管理科学学报》,1998年1月,第68~72页。(部分参考文献略)