范红岗, 侯 轩
(1. 中国人民大学 信息学院, 北京 100872; 2. 北方自动控制技术研究所, 山西 太原 030006)
实证研究时, 为估计部分信息不可观测模型(即模型中有部分变量的数据不可观测), 计量经济学家通常采用边际极大似然估计法或矩估计法进行估计. 然而, 由于在不同的假设下, 边际极大似然函数和矩条件的复杂程度不同, 理论上难以明确两者的有限样本性质, 进而无法比较两者优劣. 本文将基于Bootstrap抽样方法[1-4]重点分析两种估计的有限样本性质, 并给出了实践中选择这两种方法的具体建议.
目前, Bootstrap抽样技术在计量经济和统计方法的研究中, 主要应用集中于假设检验和参数或方差难以估计的问题研究中: Dufour et al.与Davidson et al.把该技术应用于异方差和ARCH效应的检验中[5-6]. Hong和Li把数值Bootstrap技术应用于参数不可微问题的推断中, 这是对数值Bootstrap技术应用的一个有意义的探索[7]. Lubke et al. 把Bootstrap技术应用于评价模型选择不确定性问题中, 证明了Bootstrap选择率可以为AIC和BIC选择标准提供额外的有意补充[8]. Trucíos et al.把Bootstrap 技术应用到GARCH收益和波动率的密度估计中, 具体而言, 该文借助稳健的参数估计量构造了GARCH收益和波动率的Bootstrap密度, 从而使得对这类模型估计更加稳健[9]. 但是鲜有文献把Bootstrap抽样技术应用于对部分信息不可观测模型估计量的小样本性质的分析中. 因此, 本文的分析是一个有意义的探索.
本文在一个经典的部分信息模型框架下, 首先推导出估计该模型的边际极大似然估计量或矩估计量, 然后使用Bootstrap抽样技术生成样本, 并在此基础上分析两个估计量的小样本性质.
假设Xt为二元时间序列 (取0或1),Yt为连续时间序列Yt,t=1,2,…,T, 且满足条件:
ii)P(Xt=j|Xt-1=i,Xt-2…)=P(Xt=j|Xt-1=i)=Pij, 其中i,j取0或1, 且P00=P11=θ;P01=P10-1-θ,θ∈[0,1];
当Xt和Yt均可观测时, 我们称上述模型是完全信息模型; 当Yt可观测而Xt不可观测时, 我们称上述模型是部分信息不可观测模型.
下面, 本文以(y2,y1,y0)的联立密度函数为例说明其似然函数复杂原因.
由全期望公式, 可得
f(y2,y1,y0)=f(y2,y1,y0,Z1=1)+f(y2,y1,y0,Z1=0)=f(y2|y1,y0,Z1=1)·
f(Z1=1|y1,y0)f(y1y0)+f(y2|y1,y0,Z1=0)f(Z1=0|y1,y0)f(y1,y0).
根据全期望公式以及分布函数与密度函数间的关系, 可得
易知f(Z1=0|y1,y0)有相似表达式. 当T较大时,f(yT,yT-1,…,y2,y1,y0)非常复杂, 不易获得参数的极大似然估计值. 本文将讨论部分信息不可观测模型两种可行的估计方法, 并基于Bootstrap抽样重点分析两种估计方法的优缺点.
本节讨论部分信息不可观测模型两种可行的估计方法: 边际极大似然估计法和矩估计法.
由上节讨论, 可知由于f(yT,yT-1,…,y2,y1,y0)的公式比较复杂, 故难以使用极大似然估计, 因此, 本文将推导其他有关Yt的密度函数来获得三个未知参数的估计值. 通过推导, 本文发现
对应的极大似然函数为
(2)
可通过对式(2)求最大值来获得参数估计值, 这一方法称为边际极大似然估计法[10-12].
矩估计法的关键在于找到合适的矩条件. 由期望的线性和伽马分布的数字特征值可得
由此, 可获得三个矩条件
(3)
通过求解矩条件获得参数估计值的方法称为矩估计法. 通过求解(3)来获得参数的矩估计值的方法就是本文所使用的矩估计方法.
基于大样本, 容易证明上节所讨论的边际极大似然估计值和矩估计值均收敛于真实值, 即两种估计均是一致的. 由于在不同的假设下, 边际极大似然函数和矩条件的复杂程度不同, 故从理论上难以明确两者的有限样本性质, 进而无法比较两者优劣. 下面, 本文基于Bootstrap抽样方法重点分析两种估计的有限样本性质, 并讨论两者的优缺点.
步骤一, 使用上述样本生成B个Bootstrap样本(本文中B=100);
步骤三, 计算参数估计值的样本偏差和样本方差.
通过比较, 可以发现:
1) 边际极大似然估计量的样本偏差和方差在数值上, 均小于矩估计量的样本偏差和方差, 表明边际极大似然估计量的有限样本精度高于矩估计量.
表 1 两个估计量的方差
2) 从计算耗时来看, 边际极大似然法远高于矩估计法. 在我们的计算过程中, 矩估计法的计算过程耗时仅2分钟, 而边际极大似然估计法耗时达7小时;
3) 图 1为两个估计量的直方图和经验CDF, 通过比较可发现三个参数的极大似然估计量更集中于真实值. 这一结果表现为: 极大似然估计量的直方图更窄, 经验CDF图横坐标值的跨度范围更小.
图 1 直方图和经验CDFFig.1 Histogram and empirical CDF
基于Bootstrap抽样的有限样本性质表明: 相对于矩估计, 边际极大似然估计法的精度更高, 但耗时较长. 因此, 对于拥有高性能计算机的研究人员, 边际极大似然估计法是一个较好的选择; 而在时间或计算设备有限的情况下, 矩估计法也是一个可以选择的方法.
[1] Efron B. Bootstrap methods: another look at the Jackknife[J]. Annals of Statistics, 1979, 7: l-26.
[2] Efron B. Estimating the error rate of a prediction rule: improvement on cross-validation[J]. Journal of the American Statistical Association, 1983, 78: 316-331.
[3] Horowitz J L. Bootstrap-based critical values for the information matrix test[J]. Journal of Econometrics, 1994, 61(2): 395-411.
[4] Horowitz J L. The Bootstrap[C]∥Heckman J J, Leámer E E. In Handbook of Econometrics. The Netherlands: North-Holland Publishing Co, 2001.
[5] Dufour J M, Lynda K, Jean-Thomas B. Simulation-based finite-sample tests for heteroskedasticity and ARCH effects[J]. Journal of Econometrics, 2004, 122(2): 317-347.
[6] Davidson R, Flachaire E. The wild bootstrap, tamed at last[J]. Journal of Econometrics, 2008, 146(1): 162-169.
[7] Han Hong, Jessie Li. The numerical delta method and bootstrap[EB/OL]. https:∥economics.stanford.edu/sites/default/files/jobmarketpaperli.pdf, 2016-01-83.
[8] Lubke G H, Campbell I, Dan M A, e al. Assessing model selection uncertainty using a bootstrap approach: an update[J]. Structural Equation Modeling A Multidisciplinary Journal, 2017, 24(2): 230.
[9] Trucíos C, Hotta L K, Ruiz E. Robust bootstrap forecast densities for GARCH returns and volatilities[J]. Journal of Statistical Computation & Simulation, 2017, 87(16): 3152-3174.
[10] Amemiya Takeshi. Advanced econometrics[M]. Cambridge: Harvard University Press, 1985.
[11] Gourieroux C, Trognon A. A general approach to serial correlation[J]. Econometric Theory, 1985, 1(45): 315-340.
[12] Hamilton J D. A new approach to the economic analysis of nonstationary time series and the business cycle[J]. Econometrica, 1989, 57(2): 357-84.