一般用box-jenkins建模方法,但pandit-wu建模方法更簡單。
用樣本的均值作為過程均值的估計,建模前先用樣本資料減去這個均值,然後對所得的序列進行建模
把樣本均值作為模型的乙個未知引數進行估計
三類平穩序列的自相關函式和偏自相關函式具有如下統計特性,用作判斷序列模型的依據
模型ar(p)
ma(q)
arma(p,q)
自相關函式
拖尾截尾
拖尾偏自相關函式
截尾拖尾
拖尾1) 如果序列的自相關函式在q步截尾( k>q時,\(\rho_k=0\) ),而偏自相關函式被負指數函式控制收斂到零,則可判斷序列為ma(q)序列.
可以證明, 當 k>n時, \(\phi_k\) 漸近於正態分佈,即
\[ \hat_k \sim n[0, \frac(1+2\sum_^ \rho_i^2)]\]
對於每乙個k>0,分別考察
\(\hat _,\hat _,\hat _,\cdots \)
中滿足\[ |\hat_| \le \frac(1+2\sum_^m \hat_j^2)]^, i=1,2,....,m\]
(m一般取 n/10或 \(\sqrt)\)
的比例是否達到了68.3%, 若k=1,2,...,m-1,都未達到,而在k=m達到了,我們就說\(\rho_k\)在m步截尾.
2) 如果序列的偏自相關函式在p步截尾,並且自相關函式被負指數函式控制收斂到零,則可判斷序列為ar(p)序列.
可以證明,當k>n時, \(\phi_\)的分布漸進於 n(0,1/n),
\[p|\hat_|>1/\sqrt)=31.6\%,p|\hat_|>2/\sqrt)=4.5\%\]
3) 如果序列的自相關函式和偏自相關函式均不截尾,但都被負指數函式控制收斂到零,則序列很可能是arma(p,q)序列
三. 模型定階方法
1. 殘差方差圖定階方法
殘差的方差\(\hat^2=/\), 故從殘差方差圖中可以估計出模型階數(引數個數)
ar(p)模型:
\(\hat^2\)
=殘差平方和/[(n-p)-(p+1)] = 殘差平方和/(n-2p+1)
ma(q)模型:
\(\hat^2\)
=殘差平方和/(n-q-1)
arma(p,q)模型:
\(\hat^2\)
=殘差平方和/(n-2p-q-1)
判斷原則: 殘差方差小, 相應的模型階數合理
2. f檢驗定階法
arma(p,q)模型的殘差平方和 q0, arma(p-1,q-1)模型的殘差平方和q1. 用f檢驗來確定兩個模型是否有顯著性差異.
h0:
兩個模型沒有顯著性差異
統計量\[f=\frac}} \sim f(2,n-2p-q)\]
3. 準則函式定階法
即確定乙個準則函式,建模時按照該準則函式的取值大小確定模型的優劣,使準則函式達到極小值的就是最佳模型階數.
主要是殘差序列的獨立性檢驗
1. 相關函式法
樣本數充分大時,\(\hat_k \sim n(0,1/n)\), 如果\(|\hat_k| \le 1.96\sqrt\),就可以在5%的顯著水平下接受\(\rho_k=0\)
2. \(\chi^2\)檢驗法
box-pierce統計量 \[q=n\sum_^\hat_k^2,m=n/10 或 \sqrt\]
如果\(q \le \chi^2_(m-p-q)\)就認為模型是合適的.
ljung-box-pierce統計量
\[q=n(n+2) \sum_^\hat_k^2/(n-k)\]
從一階開始,逐漸增加模型階數,擬合ar(2n,2n-1)模型,即二階地增加模型階數,直到f檢驗表明增加模型階數而殘差平方和不再顯著減小為止,也即模型沒有差異性.
時間序列x(t)可能有趨勢因素,有季節因素,有異常因素,有異方差情形。如有趨勢因素,要得到平穩的序列有如下方法
1. box-jenkins建模方法是差分,再用adf檢驗,不行就再差分,再用adf檢驗,直到通過adf檢驗。
2. pandit-wu建模方法樣本減去平均值,
如有季節因素,就用hegy檢驗,在季節差分。得到平穩的序列
如有異常因素,就就用異常值檢驗。
如有異方差(用ljung-box q統計量檢驗),就用arch,或garch模型
來自為知筆記(wiz)
理解 時間序列的平穩性
為什麼要平穩?原因一 時間序列資料的資料結構與傳統的統計資料結構不同。最大的區別在於,傳統隨機變數可以得到多個觀測值 比如骰子點數,可以反覆擲得到多個觀測值,忽略時間的差異 而時間序列資料中,每個隨機變數只有乙個觀測值 比如設 價為研究的隨機變數,每天只有乙個 價,不同日子的 服從的分布不同,即考慮...
python時間序列平穩性 時間序列d的平穩性
我正在嘗試使用python中的arima建模來建模時間序列資料。我對預設資料序列使用函式statsmodels.tsa.stattools.arma order select ic,得到p和q的值分別為2,2。如下dates pd.date range 2010 11 1 2011 01 30 da...
時間序列學習筆記(2)平穩性
平穩性檢驗 非平穩序列確定性分析 加權平滑法 指數平滑法 純隨機檢驗 幾個定義點 確定趨勢or隨機趨勢,這裡隨機趨勢是很不好把把握的,認為不是隨機散亂的,便認為存在一種趨勢,而確定趨勢是可以找尋具體函式的。趨勢,迴圈,在一段時間內有規律的運動,像我們理解中的一年四季 隨機因素 除趨勢和季節因素 引起...