基于灰色马尔可夫Verhulst模型的因特网访问人数预测分析

2014-08-03 01:06:10许宏科
计算机工程与科学 2014年7期
关键词:因特网马尔可夫灰色

赵 玲,许宏科

(1.西安邮电大学通信与信息工程学院,陕西 西安 710121;2.长安大学电子与控制工程学院,陕西 西安 710064)

Abstract:In order to predict the Internet access population accurately, a forecasting method based on Gray Markov Verhulst model is proposed. The method uses historical data to construct gray Verhulst model, gets the expression of time response series of the Internet access population by determining coefficients, and obtains the development sequences of the Internet access population in the near future. Based on the Markov chain, the sequence states are divided into three parts, the state probability and medium prediction value are obtained by determining the state transition matrix, and further the modification values of each sequence are obtained. Finally, the Internet access population from December 2006 to June 2012 is used as original data to establish the forecasting model so as to predict the number of Internet users from December 2012 to June 2014. The results show that the prediction accuracy of the gray Markov Verhulst forecasting model has fewer errors and better prediction precision, gives the fluctuation range and the probability of the prediction results, and provides the decision-making basis for network construction and management.

Keywords:Internet;population prediction;Gray Markov;Verhulst model;prediction accuracy

1 引言

互联网自1994年进入中国以来,经过20年的快速发展,取得了令人瞩目的成绩。网络规模不断扩大,上网人数跃居世界第二,信息资源开发水平不断提高,互联网已经成为社会重要的信息基础设施。分析、预测我国互联网用户人数的统计信息,可以使国家和企业掌握互联网在我国的动态发展情况,为网络建设及管理提供决策依据。

目前,互联网发展的预测方法很多,如回归分析法、RBF神经网络预测法、Bass模型法和灰色理论预测法等[1~6]。回归分析法需要大量样本数据才能得出相对准确的预测模型,即它依赖于历史数据的完备程度。RBF神经网络法涉及神经网络的建立和训练过程,过程较为复杂,运算量偏大。文献[2]运用Bass模型预测互联网人数,但Bass模型法的缺点是其参数的确定比较麻烦,选用不同的方法确定模型参数对于预测的精度有很大的影响。文献[3]基于灰色灾变原理将GM(1,1)模型和一元线性回归模型结合来解决数据跳变问题,但跳变点的选取凭肉眼观察判断可能会造成误差。文献[4]在GM(1,1)模型基础上建立残差修正GM(1,1)后才取得较好的预测精度,其缺点是运算过程复杂。文献[5,6]均采用灰色Verhulst模型预测因特网访问人数,实例表明其具有理论可靠、方法简单、预测精度高等优点。马尔可夫理论在描述动态系统的状态转移方面独具优势,经常和灰色理论相结合用于预测长期的、波动性大的预测问题,并在诸多领域获得了广泛应用[7,8]。

然而,互联网用户人数的分析、预测与我国人口数量、受教育水平、GDP指标及网络建设情况等许多因素有关,其时间序列正是该系统内部各因素之间相互制约、相互影响与协调发展的结果。要全面考虑所有相关因素建立因特网访问量发展趋势的准确预测模型是不现实的。近年来发展起来的灰色理论为各类“小样本”、“贫信息”的不确定问题提供了解决思路,它通过信息覆盖来寻求现实现象中存在的规律。

本文针对近几年互联网访问人数这种综合灰色量挖掘有用信息,以灰色理论为基础,结合Verhulst模型和马尔可夫链的各自优点,提出灰色马尔可夫Verhulst模型用于因特网访问人数预测,用Verhulst模型来揭示因特网访问人数的总体趋势,用马尔可夫链模型修正结果的波动范围并给出不同范围的出现概率,试图寻找和揭示网络访问量发展趋势的内在规律,提高因特网访问人数的预测精度,为政府和企业制定出科学合理的互联网发展目标提供参考依据。

2 灰色马尔可夫Verhulst模型的构建

2.1 灰色Verhulst模型

灰色Verhulst模型主要是用来描述非单调的摆动发展序列或具有饱和状态的S型序列。自从2000年以来,我国互联网上网人数一直保持着比较强劲的增长势头,并在一定时间段上是呈部分“S”型变化的, 所以在一定程度上互联网上网人数的变化情况可以通过建立灰色 Verhulst 模型进行预测。建模原理如下:

对X(0)作紧临均值生成序列:

k=0,1,…,n-1

(1)

2.2 马尔可夫模型建立

2.2.1 状态划分

⊗i=[⊗i1,⊗i2],

(2)

其中,i=1,2,…,n,Ai、Bi均依据对象和原始数据而定。

2.2.2 计算状态转移概率矩阵

设Nij(n)为由状态⊗i经过n步转移到状态⊗j的原始数据样本数;Ni为处于状态⊗i的原始数据样本数,称Pij(n)=Nij(n)/Ni为由状态⊗i到状态⊗j的n步状态转移概率。则构造n步状态转移概率矩阵为:

(3)

状态转移概率矩阵P(n)反映了系统各状态之间的转移规律。通过状态转移概率矩阵和初始状态,就可以确定未来的发展趋势。通过考察一阶状态转移矩阵P(1)即可确定预测对象的下一步转移状态。当矩阵P(1)中某行有两个或两个以上相同或相近时,可以参考P(2)或P(m)来确定状态的未来转向。

2.2.3 计算预测值

未来的转移状态⊗i确定之后,也就确定了预测值的变动区间[⊗i1,⊗i2],预测值为区间中点,即:

(4)

3 因特网访问人数的预测分析实例

互联网的发展问题是近年来信息经济学中的热点问题。1997年11月,中国互联网信息中心(CNNIC)第1次发布《中国互联网络发展状况统计报告》受到了普遍关注,于是CNNIC从1998年7月开始,每隔半年就发布一次《中国互联网络发展状况统计报告》,公布我国因特网上网计算机数、用户人数、用户分布、信息流量分布、域名注册等方面情况的统计信息。本文选取CNNIC于2012年7月发布的第30次《中国互联网发展状况统计报告》的最新统计数据(见表1),以我国上网用户人数为例,用上述介绍的方法进行应用分析。

Table 1 China’s Internet access numbers from December 2006 to June 2012表1 2006年12月~2012年6月我国因特网访问人数 万

注:数据来源于2006年12月~2012年7月CNNIC发布的《中国互联网络发展状况统计报告》。

3.1 我国上网人数的灰色Verhulst预测

为了减少计算机运算产生的舍入误差,首先将表中数据缩小1 000倍,通过参数计算,可以建立如下灰色Verhulst预测模型:

(5)

其中,a=-0.2896,b=-0.004719。将预测后得到的结果乘以1 000倍,计算结果如表2所示。

为和Verhulst模型比较,笔者也用原始数据建立了灰色GM(1,1)模型,模型预测结果如表2所示。

Table2 Actual value-predicted value list of China’s Internet access numbers )表2 我国因特网访问人数实际值—预测值一览表

当前经济环境下,企业财务管理仍然需要在传统基础上做进一步的创新和优化,包括财务管理工具运用、财务管理制度体系完善等。其中比较重要的是关注企业员工的行为规范,建立更加完善科学的财务内控制度,增强企业内部控制,充分发挥“人”这一企业生产中最灵活、最有价值的要素的作用。在结合《会计法》、《企业内部控制规范》等相关财务法律法规及企业内控监管要求的同时,也需要加强企业自身的资金管理和项目管理,完善财务分析、效益分析、收支管理等工作内容,更加全面、细致、准确的反应企业财务信息,辅助企业科学决策,实现企业管理规范,全面促进企业管理创新进程。

3.2 状态划分和转移矩阵的建立

根据马尔可夫链分析方法的实际应用经验[10,11],根据表2中灰色Verhulst预测结果的相对误差,可以将因特网访问人数预测结果(2007/06月~2012/06月)划分为三个状态:

根据表2中的数据,结合上述状态划分,可获得2007/06~2012/06统计时段因特网访问人数的状态转移情况,如表3所示。

Table 3 Markov state transition表3 马尔可夫状态转移情况

根据转移的样本数与原始状态样本数的比值可以得到一步状态转移矩阵为:

3.3 近期因特网访问人数预测

现用马尔可夫链修正用灰色Verhulst模型预测出的2012/12~2014/06的因特网访问人数,具体数值及计算结果如表4所示。表4中,预测区间一列是根据实际有效的三种状态的划分界限求得的;预测中值一列是预测区间上下限的均值;由一步状态转移矩阵P(1),可得到从2012/06统计时段转移至2012/12~2014/06的2步、3步、4步转移矩阵,故易得转移至统计时段各状态的概率。

由于2012/06统计时段的互联网上网人数处于状态⊗2,从状态转移矩阵P(1)可以看出,系统从状态⊗2转移到状态⊗2的概率远远超过转移到其它两个状态的概率,即近几年因特网访问人数处于相对稳定的可能性很大。

Table 4 Predicted value of Internet access numbers from December 2012 to June 2014表4 2012/12~2014/6因特网访问人数的预测值

3.4 结果分析及建议

因特网的发展也会经历从启动期、成长期、成熟期到饱和期的发展趋势, 我国2003年~2009年因特网访问人数处于成长期,这和Internet的刚兴起以及政府的大力推广等因素有关,2010年~2012年因特网访问人数的发展逐步过渡到成熟期,未来几年访问人数会逐渐趋于饱和,这一现象符合事物的发展规律。

4 结束语

本文研究思路避开了自然环境、社会经济条件和政策导向等因素,采用以灰色系统理论和马尔可夫链相结合的方法,对近期的因特网访问人数进行预测。用Verhulst模型揭示因特网访问人数的总体趋势,利用马尔可夫链模型预测出结果的波动范围及结果修正。通过理论研究及实例应用,总结如下:

(1)灰色Verhulst模型适合描述具有饱和态的“S形”过程预测,近年来我国因特网访问人数已逐渐趋向饱和,故本文用Verhulst预测因特网访问人数,理论可靠,方法简单,值得推广。

(2)通过建立状态转移概率矩阵可确定因特网访问人数位于不同区间的可能性,通过综合考虑区间预测中值与区间发生概率可更加准确地把握未来上网人数发展趋势。

(3)由于灰色系统注重新数据,故选取2006/6~2012/6统计时段的数据进行建模。实际应用中,应根据不断得到的新数据对预测模型进行不断的修正,以此提高预测精度。

[1] Dang Yue-chen, Xu Juan. Research on the number of internet users forecast model based on Matlab[J]. Journal of Beijing Institute of Technology(Social Sciences),2010,12(2):47-49.

[2] Chen Jing-jing,Mao Qian,Liu Guo-hui. Study on forecast of internet users in China[J]. Study on Optical Communications,2007(1):1-3. (in Chinese)

[3] Ding Jie.Prediction model of internet users based on grey disaster theory[J]. Intelligence Theory and Practice,2005,28(5):482-484. (in Chinese)

[4] Lian Fei. Gray prediction of China’s internet users based on GM (1,1) model[J]. Statistics and Consulting,2008(4):28-29.(in Chinese)

[5] Bai Yan,Zhu Miao-miao,Ma Guang-si.The prediction and analysis of the Internet access population based on the Grey Verhulst model[J]. Computer Engineering & Science,2008,30(10):19-21. (in Chinese)

[6] Zhu Miao-miao,Niu Guo-feng,Le De-guang.Prediction of the number of people using the internet based on the gray Verhulst dynamic model[J]. Microcomputer & Its Applications,2011,30(23):91-93. (in Chinese)

[7] Qian Wei-dong,Liu Zhi-qiang. Road traffic accident forecast based on Gray-Markov model[J].China Safety Science Journal,2008,18(3):33-36. (in Chinese)

[8] Zhang Zong-guo.The research on forecast method and application of Markov Chain[D].Nanjing:Hohai University,2005. (in Chinese)

[9] Liu Si-feng,Dang Yao-guo,Fang Zhi-gen.Grey system theory and application[M].Beijing:Science Press,2004. (in Chinese)

[10] Li Dong,Su Xiao-hong,Ma Shuang-quan. Stock price prediction algorithms based on grey Markov model[J]. Journal of Harbin Institute of Technology,2003,35(2):244-248. (in Chinese)

[11] Zhao Xiao-mei,Gai Mei.Urban water consumption forecasting in Dalian based on equal dimensional and new information grey Markov forecasting model[J].Journal of China Hydrology,2011,31(1):66-69. (in Chinese)

附中文参考文献:

[2] 陈晶晶,毛谦,刘国辉.我国互联网用户数预测研究[J].光通信研究,2007(1):1-3.

[3] 丁洁. 基于灰色灾变原理的互联网用户人数预测模型[J]. 情报理论与实践,2005,28(5):482-484.

[4] 连飞. 基于GM(1,1)模型的我国互联网上网人数灰色预测[J]. 统计与咨询,2008(4):28-29.

[5] 白燕,朱苗苗,马光思.基于灰色Verhulst模型的因特网访问人数预测分析[J].计算机工程与科学,2008,30(10):19-21.

[6] 朱苗苗,牛国锋,乐德广.基于灰色Verhulst的互联网上网人数动态预测模型[J]. 微型机与应用,2011,30(23):91-93.

[7] 钱卫东,刘志强.基于灰色马尔可夫的道路交通事故预测[J].中国安全科学学报,2008,18(3):33-36.

[8] 张宗国. 马尔可夫链预测方法及其应用研究[D]. 南京:河海大学,2005.

[9] 刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社, 2004.

[10] 李东,苏小红,马双全.基于新维灰色马尔科夫预测模型的股价预测算法[J].哈尔滨工业大学学报,2003,35(2):244-248.

[11] 赵晓梅,盖美.基于等维新息灰色马尔可夫模型的大连城市用水量预测[J].水文,2011,31(1):66-69.

猜你喜欢
因特网马尔可夫灰色
浅灰色的小猪
灰色时代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色时髦观
Coco薇(2017年2期)2017-04-25 17:57:49
上网
保费随机且带有红利支付的复合马尔可夫二项模型
感觉
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测
我爱因特网
小主人报(2015年5期)2015-02-28 20:43:23
认知无线网络中基于隐马尔可夫预测的P-CSMA协议
电视技术(2014年19期)2014-03-11 15:38:07