如果乙個時間序列經過平穩性檢驗後得到是乙個平穩非白雜訊序列,那麼該序列中就蘊含著相關性的資訊。
在統計學中,通常是建立乙個線性模型來擬合該時間序列的趨勢。其中,ar、ma、arma以及arima都是較為常見的模型。
ar是線性時間序列分析模型中最簡單的模型。通過自身前面部分的資料與後面部分的資料之間的相關關係(自相關)來建立回歸方程,從而可以進行**或者分析。下圖中展示了乙個時間如果可以表示成如下結構,那麼就說明它服從p階的自回歸過程,表示為ar(p)。其中,ut表示白雜訊
,是時間序列中的數值的隨機波動,但是這些波動會相互抵消,最終是0。theta表示自回歸係數。
所以當只有乙個時間記錄點時,稱為一階自回歸過程,即ar(1)。
通過將一段時間序列中白雜訊序列進行加權和,可以得到移動平均方程。如下圖所示為q階移動平均過程,表示為ma(q)。theta表示移動回歸係數。ut表示不同時間點的白雜訊。
自回歸移動平均模型是與自回歸和移動平均模型兩部分組成。所以可以表示為arma(p, q)。p是自回歸階數,q是移動平均階數。
從式子中就可以看出,自回歸模型結合了兩個模型的特點,其中,ar可以解決當前資料與後期資料之間的關係,ma則可以解決隨機變動也就是雜訊的問題。
同前面的三種模型,arima模型也是基於平穩的時間序列的或者差分化後是穩定的,另外前面的幾種模型都可以看作arima的某種特殊形式。表示為arima(p, d, q)。p為自回歸階數,q為移動平均階數,d為時間成為平穩時所做的差分次數,也就是integrate單詞的在這裡的意思。
具體步驟如下:
獲取被觀測系統時間序列資料;
對資料繪圖,觀測是否為平穩時間序列;對於非平穩時間序列要先進行d階差分運算,化為平穩時間序列;
經過第二步處理,已經得到平穩時間序列。要對平穩時間序列分別求得其自相關係數acf 和偏自相關係數pacf,通過對自相關圖和偏自相關圖的分析,得到最佳的階層 p 和階數 q
由以上得到的d、q、p,得到arima模型。然後開始對得到的模型進行模型檢驗。
arima的詳細可以參考:
時間序列分析
協方差矩陣和相關係數主要研究兩個連續變數的相似程度 相關性 協方差公式 協方差矩陣 相關係數 cov x,y var x var y 相關係數矩陣 可以使用ljung box方法進行檢驗。即box.test data,type ljung box lag num 來檢驗,當p value大於0.05...
時間序列分析
時間序列資料分為平穩 寬平穩 和非平穩兩種。平穩序列中也包括隨機序列,即序列資料之間沒有任何相關性或記憶性,純隨機的,這種序列沒有挖掘分析的必要。純隨機序列也稱為白雜訊序列。序列中的隨機變數之間的相關係數r k 0,k不為 0 經過預處理若發現序列是平穩非隨機序列,則可用的模型為arma。ar模型是...
時間序列分析
觀察變數動態的變化,我們需要動態序列,也即是我們的時間序列。時間序列的要素是時間 資料,所要解決的問題即是時間序列所帶來的序列相關性的問題。四種變動 長期變動趨勢 季節變動趨勢 週期變動趨勢 不規則變動趨勢 第一種想象為單增的曲線 第二三種可以想象為週期變化的折線 第四種想象為白雜訊 疊加模型 四種...