随机游走(random walk)过程是一种特殊的自回归过程,它是a=1的滞后1期自回归过程。
随机游走过程是过去和现在的每一期的白噪声的加总。
自相关系数a=l表示在历史上每发生的一件事都会在接下来的每个时期产生相同的影响,这个影响并不会随着时间的流逝而减弱。
随机游走过程的无条件期望为0,方差随着时间的延续而不断加大: 由上可见,随机游走过程的无条件方差并不会随着‘增大而收敛。相反,方差会随着t增大变得越来越大。这意味着未来可能出现的情况会越来越不确定。这个特点会使得未来的发展趋势变得更加不可预测。
如果我们要在第t-1期时预测第t期简单地说,如果价格走势遵循随机游走过程,那么对于下一期的价格的最佳预测值就是今天的收盘价格;对于更远期的价格走势判断都将会随着时间间隔的扩大变得更加不可能。
平稳的时间序列和非平稳的时间序列
当时间序列的每期数据都具有相同的概率分布时,我们称这个时间序列是平稳的。如果时间序列的概率分布是随着时间变化而变化的,那么这个时间序列就是不平稳的。检查时间序列的概率分布是否相同往往比较困难,因此我们通过一个简单的方法来判断时间序列的平稳性。如果时间序列具有相同的概率分布,那么序列的期望和方差将相同,不会随着时间变化而变化。很明显,除了随机游走过程,我们上面所介绍的白噪声、移动平均和a<1的自回归过程是平稳的时间序列。随机游走过程是一个不平稳的时间序列,因为它的方差随着时间的变化而变化。
在统计分析时,一个时间序列是否平稳可以通过观察它的自相关系数进行判断。如果它的自相关系数随着滞后期的增加迅速收敛于0附近,这个时间序列就很可能是平稳的。如果它的自相关系数随着滞后期的增加虽然逐渐减小,但减小幅度很小,很长时间也没收敛到0附近,那么这个时间序列就很可能是不平稳的。从前面的自相关系数表中,我们可以明显地看出,招商银行的收盘价和沪深300指数的收盘价的自相关系数下降的速度很慢,滞后7期的收盘价与当期的收盘价的相关系数都仍在0.92以上,那么收盘价的时间序列就很有可能不是一个平稳的时间序列;而招商银行的收益率和沪深300指数的收益率的自相关系数在滞后一期以后就迅速下降到了0附近,也就是说每期的收益率除了与自己是完全相关的,与其他期的收益率是不相关的。通过对自相关系数的观察我们可以得到一个大概的估计,但这不是一个严谨的科学结论或统计学结论。
在统计学中,判断一个时间序列是否平稳是一个有关统计检验的学术问题。关于平稳性的检验,最常用的方法是两位美国统计学家迪基(D. A. Dickey)和富勒(W. A. Fuller)在20世纪70年代提出的单位根方法,也就是判断自相关系数是否等于1的方法。经过学术界近30年的研究,这一方法最终被归纳为增广迪基富勒(Augmented Dickey-Fuller)检验法,简称ADF检验。目前大多数统计软件(如Eviews,SAS,SPSS等)都附带有ADF检验功能。通过运行ADF检验可以得到检验统计二值和其对应的检验概率的P值。通过将二值与对应的临界值比较,当它大于临界值时,我们就接受这是一个平稳的时间序列的假设。r值对应的P值则表示这个时间序列是非平稳的概率,也就是P值越接近0,序列越可能是平稳的。一般情况下,当P值小于0.05或0.1时,我们就认为这是一个平稳的时间序列。
我们对招商银行和沪深300指数在2007年的收盘价和收益率进行检验,得到如下结果(见表7.5)。
当表中的滞后为0时,表示没有滞后项,在无截距项模型中就只剩下随机扰动项εt了,在有截距项模型中就只剩下了截距项a和随机扰动项εt了,在有趋势项模型中就只剩下截距项a和随机扰动项εt了。当滞后为1,2和3时表示模型中最大滞后期,一般检验到滞后3期就足够了。表当用这些模型来检验时间序列都得不到平稳的结果时,就可以认为这个时间序列是不平稳的。从上表的结果我们可以看出,招商银行和沪深300指数的收盘价时间序列在所有的模型中,二值比较小、P值很大,说明这是一个不平稳的时间序列;而招商银行和沪深300指数的收益率时间序列在所有的模型中,r值比较大、P值很小,说明收益率是一个平稳的时间序列。再看前面它们的图,我们可以发现,平稳的时间序列的图基本上在一条水平线的上下波动,而不平稳的时间序列的图则会大起大落,长时间的远离任一条水平线。