时间序列的预处理是对一个观察值序列的纯随机性和平稳性进行检验,根据检验结果可以将此序列分为不同的类型,纯随机序列也称为白噪声序列,是没有任何信息可以提取的平稳随机序列。
通过预处理将序列分成不同类型之后我们就可以根据各种序列类型的特点使用不同的模型建模,常见的平稳时间序列建模模型为ARMA(可以分为AR、MA和ARMA三类),此模型是使用线性模型来拟合平稳序列。非平稳的序列分析可以建立的模型有ARIMA以及残差自回归模型等等。
ARMA模型,如下结构可以简记为ARMA(p,q):
xt=α0+α1xt−1+α2xt−2+⋯+αpxt−p+εt+β1εt−1+β2εt−2+⋯+βqεt−q当q=0时,是AR(p)模型:
xt=α0+α1xt−1+α2xt−2+⋯+αpxt−p+εt当p=0时,是MA(q)模型:
xt=μt+εt+β1εt−1+β2εt−2+⋯+βqεt−q自相关系数(ACF):
平稳模型的自相关系数:
ρk=ρ(t,t−k)=cov(Xt,Xt−k)/σtσt−k其中 σt 为观测序列在时间t的标准差
偏自相关系数(PACF): 对于一个平稳AR(p)模型,求出滞后k自相关系数 ρk 时,实际上得到并不是 Xt 与 Xt−k 之间单纯的相关关系。因为 Xt 同时还会受到中间k-1个随机变量 Xt−1 、 Xt−2 、……、 Xt−k+1 的影响。 为了能单纯度量 Xt−k 对 Xt 的影响,引进偏自相关系数(PACF)的概念: 对于平稳时间序列{ Xt },在剔除了中间k-1个随机变量量 Xt−1 、 Xt−2 、……、 Xt−k+1 的干扰之后, Xt−k 对 Xt 影响的相关程度。
拖尾和截尾: 拖尾是系数随着k的增大衰减,但始终有非零取值,截尾是k增大到一定大小时系数取零值。
对一个时间序列经过预处理,若被判定为平稳非白噪声序列,则可以计算ACF和PACF,根据上述两个系数选取合适的模型,并且为模型定阶。
模型自相关系数(ACF)偏自相关系数(PACF)AR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾