** python 資料分析與資料探勘
目的:確定資料序列是否有隨機趨勢或確定趨勢,防止偽回歸
如果不平穩,則對其進行差分處理一直到平穩為止
**:
#平穩性檢測
from statsmodels.tsa.stattools import adfuller as adf
diff = 0
adf = adf(data['cwxt_db:184:d:\\']) #取得平穩性檢測指標
while adf[1] > 0.05:#當不平穩的時候
diff = diff + 1#差分數比如原始序列1,2,3 差分一次為2-1=1,3-2=1,差分兩次為1-1=0
adf = adf(data['cwxt_db:184:d:\\'].diff(diff).dropna())#diff 表示差分,引數為次數,dropna表示去除na值 缺失值
print(u'原始序列經過%s階差分後歸於平穩,p值為%s' %(diff, adf[1]))
資料的平穩性
一 資料平穩性 李子奈曾指出,一些非平穩的經濟時間序列往往表現出共同的變化趨勢,而這些序列間本身不一定有直接的關聯,此時,對這些資料進行回歸,儘管有較高的r平方,但其結果是沒有任何實際意義的。這種情況稱為稱為虛假回歸或偽回歸 spurious regression 他認為平穩的真正含義是 乙個時間序...
理解 時間序列的平穩性
為什麼要平穩?原因一 時間序列資料的資料結構與傳統的統計資料結構不同。最大的區別在於,傳統隨機變數可以得到多個觀測值 比如骰子點數,可以反覆擲得到多個觀測值,忽略時間的差異 而時間序列資料中,每個隨機變數只有乙個觀測值 比如設 價為研究的隨機變數,每天只有乙個 價,不同日子的 服從的分布不同,即考慮...
時間序列學習筆記(2)平穩性
平穩性檢驗 非平穩序列確定性分析 加權平滑法 指數平滑法 純隨機檢驗 幾個定義點 確定趨勢or隨機趨勢,這裡隨機趨勢是很不好把把握的,認為不是隨機散亂的,便認為存在一種趨勢,而確定趨勢是可以找尋具體函式的。趨勢,迴圈,在一段時間內有規律的運動,像我們理解中的一年四季 隨機因素 除趨勢和季節因素 引起...