時間序列學習筆記之理論基礎(一)

2021-08-22 10:09:49 字數 1948 閱讀 6578

我們可以將資料分為兩種維度來看,某個時間點的橫截面方向的資料和以時間為序列的資料。這個也很容易理解,因為隨著時間的推移,資料本身也會發生變化,如果我們只拿某一時刻的資料出來做分析,就是橫截面資料,我們最常接觸的眾多機器學習演算法實際上分析的都是這種資料,因為在其情景下,不需要時間這個特殊的維度。但是另外一種時間序列資料,加入了一種非常特殊的維度,也就是時間,描述的是某乙個維度隨著時間的變化而變化的情況,時間序列分析常用來做金融二級市場的分析或者其他時間**性的分析,例如分析趨勢等等。

時間序列的特點

時間序列的常用模型

時間序列建模基本步驟

獲取被觀測系統時間序列資料;

對資料繪圖,觀測是否為平穩時間序列;對於非平穩時間序列要先進行d階差分運算,化為平穩時間序列;

經過第二步處理,已經得到平穩時間序列。要對平穩時間序列分別求得其自相關係數acf 和偏自相關係數pacf ,通過對自相關圖和偏自相關圖的分析,得到最佳的階層 p 和階數 q

檢驗模型的有效性。如果擬合模型通不過檢驗,轉向步驟3,重新選擇模型再擬合。

模型優化。如果擬合模型通過檢驗,仍轉向步驟2,充分考慮各種可能,建立多個擬合模型,從所 有通過檢驗的擬合模型中選擇最優模型。

利用擬合模型,**序列的將來走勢。

時間序列預處理

我們在拿到乙份時間序列資料的時候,同樣地,首先也是要對資料做預處理。其目的有兩個:

隨機性檢驗(白雜訊檢驗)

進行隨機性檢驗的目的很簡單,就是因為純隨機資料沒有分析的價值。假設我們研究前一時刻的資料和現在時刻有什麼關聯的時候,如果是純隨機資料的話,這個相關性就是0。當然在實際情況下,肯定不是完全是0,但是會很接近。

隨機資料又稱為白雜訊資料,隨機性檢查也會被稱為白雜訊檢驗。我們可以通過lb檢驗(ljung-box test)來檢查資料的隨機性,通過該檢驗,我們會得到乙個p值,如果p值大於顯著性水平,則說明需要接受序列是隨機的原假設,那麼可以停止分析了。

平穩性檢驗

如果乙份時序資料是平穩的,那麼它們滿足以下三點:

關於平穩性的檢查目前常用的方法有三個:

單位根檢驗的主要方法為adf檢驗,其原假設為資料序列有單位根(非平穩的)

單位根檢驗

平穩性處理

平穩性是時間序列分析的前提。故需要對非平穩序列進行平穩性處理。處理的方法有:

差分(下面介紹)

對數變換。主要是減小資料的振動幅度,使線性規律更加明顯。 注意:變換的序列需要大於0。

平滑法 。平滑法具體分為移動平均法和指數平均法。移動平均即利用一定時間間隔內的平均值作為某一期的估計值,指數平均則是用變求權的方法來計算均值。 差分

如果我們在平穩性檢驗中得出資料是非平穩的這樣的結論,那麼我們就需要差分來消除在時序資料中的季節性趨勢,時序趨勢等趨勢性資料。我們採用特定時間點和其前乙個時間的結果的差值來消除趨勢的影響。分別對季節性和趨勢進行建模,並將其從原始的時序資料中分離出來,分離後得到殘差,再對殘差進行平穩性檢驗看是否變成了平穩性資料

差分的實質

差分運算的實質是使用自回歸的方式提取確定性資訊。

差分方式的選擇

根據序列不同特點擊擇合適的差分方式:

- 序列蘊含著顯著的線性趨勢,1階差分就可以實現趨勢平穩。

- 序列蘊含著曲線趨勢,2階或3階差分就可提取出曲線趨勢的影響。

- 蘊含固定週期的序列,選擇步長為週期長度的差分運算可以較好地提取週期資訊。

時序模型擬合

自回歸過程是從本身,移動平均過程是從殘差來對資料進行不同角度的**。將這個兩個過程合併起來就是arma,自回歸移動平均過程。

arma過程達到了一種特定的統計均衡狀態,特徵不隨著時間的變化而變化。

對於乙個ma過程,ma的多項式的所有根的絕對值大於1

接下來需要找到三個引數:

Linux學習總結筆記(一) 硬體理論基礎

cd rom rom dev cdrom usb裝置 dev usb ide硬碟 dev hd a d scsi sata usb硬碟和u盤 dev sd a p 當前滑鼠 dev mouse ide硬碟 每個ide扁平電纜可以連線2個ide硬碟,ide1介面的硬碟為hda hdb,ide2介面的硬...

svm學習筆記 svm 理論基礎3

回顧一下上文的思路,對於線性可分問題,我們可以用超平面將訓練樣本分開。但是通常超平面有很多個,我們選擇距離兩類樣本點幾何間隔最大的那個,這樣能夠使得模型錯誤率的 上界 最小。而這個問題,有進一步的轉化為求超平面法向量 w 的值最小的問題。好,今天就從這裡開動。線性可分問題 之 問題轉化 之 凸二次規...

深度學習的理論基礎

在 1989 年提出通用近似定理以來,至少我們有了最基本的乙個理論基礎,即神經網路有潛力解決各種複雜的現實問題。mit 教授 tomaso poggio 曾在他的系列研究中 1 表示深度學習理論研究可以分為三大類 表徵問題 representation 為什麼深層網路比淺層網路的表達能力更好?最優化...