今天看了一下唐宇迪的時間序列分析,對時間序列有了初步的認識。
首先時間序列即以時間未變化(x軸)的一系列資料。
這個資料可能變化的情況非常劇烈,所以不便於分析,我們希望它能反應出穩定的變化趨勢,這時候便有了arima模型,這個模型主要反映的還是資料的以時間為橫軸的差分變化情況,一階差分即將t時刻資料值減去t-1時刻資料值得到的資料,這樣得到的資料會更穩定,二階差分即在一階差分的基礎上再次進行差分,一般都是1-2階差分。
然後是滑動視窗,這個類似於卷積的視窗,不斷從過去以某個長度的視窗向右滑動,這個視窗內的值可以取平均值,也是使資料變得平穩,這裡的滑窗的功能和資料競賽中的滑窗的功能雖然有所區別,但是核心思想都是一樣的。
arima模型其實就是一種**時間序列變化趨勢的模型,同sklearn中模型使用方法類似,在對資料進行處理(平滑)後進行fit,然後predict.一般都是predict數值,如果是分類,建議呼叫tsfresh庫進行時間序列特徵提取,然後用傳統機器學習模型進行分類。
時間序列簡單介紹
births birthstimeseries月度資料就設定frequency 12,季度資料就設定frequency 4 start 引數來指定收集資料的第一年和這一年第乙個間隔期。接下來我們用plot函式繪製時間序列圖 plot.ts birthstimeseries 可以看到這個時間序列在一定...
時間序列統計總結
時間序列統計總結 1.時間序列可以簡單通過以時間視窗為key的聚合,比如10秒為乙個時間視窗,那10秒發生的所有事件都聚合為乙個。2.以某個維度做聚合,維度資訊可以記錄下來。比如以時間 ip為維度進行聚合,ip是可以儲存的。4.如果乙個維度只聚合不需要按照條件進行查詢,可以不新建維度。舉個例子,pv...
時間序列分析實驗報告總結 時間序列分析實驗報告
圖9 原序列和 序列線圖 圖10 計算 誤差 圖11 對 誤差序列進行單位根檢驗 adf檢驗值結果 如圖單位根統計量adf 4.860624都小於eviews給出的顯著性水平1 10 的adf臨界值,所以拒絕原假設,該學是平穩的,說 明模型對趨勢擬合的效果不錯 圖12 未來5年降雪量的 69 73 ...