關於時間序列

2021-09-28 17:12:09 字數 1584 閱讀 1217

如果畫圖之後,時間序列不是平穩的,那麼用拆分法將其處理成平穩的時間序列。

資料平穩:

平穩性要求序列的均值和方差不發生明顯變化,在擬合曲線之後,在未來的一段時間內仍能順著現有的形態」慣性」的延續下去。

嚴平穩:表示分布不隨時間的改變而改變。

弱平穩:期望與相關係數不變,未來某時刻的t的值xt就要依賴於它的過去資訊,需要依賴性。

差分法:時間序列資料在t與t-1時刻的差值,依次類推:

自回歸模型:(ar)

p階的自回歸過程,表示為ar§

描述當前值與歷史值之間的關係,用自身變數的歷史時間資料對自身進行**。

自回歸模型必須滿足平穩性的要求,n階自回歸過程的公式定義:

其中,p是階數(幾階拆分), 是常數項係數, 是誤差項係數, 是自相關係數,i是拆分項。

自回歸模型的限制:

自回歸模型是用自身的資料進行**的;

必須具有平穩性;

必須具有自相關性,如果自相關係數小於0.5,則不宜採用;

自回歸只適用於**與自身前期相關的現象。

移動平均模型(ma):

q階移動平均過程,表示為ma(q)

移動平均模型關注的是自回歸模型中的誤差項的累加;

q階自回歸過程的公式定義:

其中,q是移動平均項數。

移動平均法能有效地消除**中地隨機波動;

自回歸移動平均模型(arma):

arma(p, q)。p是自回歸階數,q是移動平均階數。【其實arima和它差不多,只是多了個d,當然arma也可以是arma(p,d,q),親測可行】

公式定義:

i是將時間序列處理成平穩時所做地拆分次數。

將非平穩地時間序列轉化為平穩時間序列,然後對因變數的知否值以及隨機誤差項的現值和滯後值進行回歸所建立模型。

一、引數選擇:

自相關函式(acf):

有序的隨機變數序列與自身相比較,自相關函式反映了同一時序在不同時序的取值之間的相關性。

公式:cov是相關函式。

偏自相關函式: (pacf)

對於乙個平穩ar(p階)模型,求出滯後k的自相關係數 時,實際上得到的並不是 與 之間的單純的相關關係。

同時還會受到中間k-1個隨機變數 的影響,而這k-1個隨機變數又都和 具有相關關係,故而自相關係數裡實際上摻雜了其他變數對 與 的影響。所以,引進偏自相關係數pacf嚴格了 與 兩個變數之間的相關性,其剔除了中間k-1個隨機變數的干擾。

對於模型中如何選擇p值和q值:【畫圖!!!】

基於acf和pacf來確定p和q。

截尾:落在置信區間內(95%的點都符合該規則,就是<0.95)

第幾階落在置信區間上就取值多少。

時間序列分析

協方差矩陣和相關係數主要研究兩個連續變數的相似程度 相關性 協方差公式 協方差矩陣 相關係數 cov x,y var x var y 相關係數矩陣 可以使用ljung box方法進行檢驗。即box.test data,type ljung box lag num 來檢驗,當p value大於0.05...

時間序列分析

時間序列資料分為平穩 寬平穩 和非平穩兩種。平穩序列中也包括隨機序列,即序列資料之間沒有任何相關性或記憶性,純隨機的,這種序列沒有挖掘分析的必要。純隨機序列也稱為白雜訊序列。序列中的隨機變數之間的相關係數r k 0,k不為 0 經過預處理若發現序列是平穩非隨機序列,則可用的模型為arma。ar模型是...

時間序列python

平穩性檢測 平穩性的定義 圍繞乙個常數上下波動且波動範圍有限,即有常數均值和常數方差。如果有明顯的趨勢或者週期性,那它通常不是平穩序列。檢測方法有三種 1 時序圖檢測 2 自相關係數和偏相關係數 通過spss 截尾 就是在某階之後,係數都為0 拖尾 就是有乙個緩慢衰減的趨勢,但是不都為0 2.不平穩...