時間序列資料python庫彙總

2021-10-04 18:25:41 字數 1083 閱讀 8859

由於我熱衷於機器學習在時間序列中的應用,特別是在醫學檢測和分類中,在嘗試的過程中,一直在尋找優質的python庫(而不是從頭開始編寫**)去實現我對於資料處理的需求。以下是我在處理時間序列資料(time series data)。我希望其中一些對你也有用!

這個庫可以幫助你建立時間序列資料,特別是在使用延遲(lag)或者滑窗(sliding window)進行回歸、分類這些監督學習的演算法的時候。另乙個值得注意的點是你可以快速計算一系列的資料特徵,例如峰度,絕對能量,均值,中位數,波形長度,斜率變化等等。有了這個庫,你可以隨意的將這些特徵放入輸入或者輸出中去。在回歸演算法中,你可能不希望直接使用資料點進行運算,那麼你可以直接呼叫函式計算中值之後再輸入到模型中去。有了它,你可以很輕鬆的進行資料的預處理和特徵轉換。

這個庫似乎用的比較多,之後我也會更一期來專門講解這個庫的運用。這個庫可以使用的方法有聚類,svm,k-均值等等。如果你使用的是非監督學習的話,這會極大的減輕你的計算壓力。

這個庫的精華在於他有很多的概念和方法可以使用。例如再離散化方法中,可以實現sax,paa和weasel等。這個庫也提供了gramian angular field,recurrent plots這樣的視覺化工具。還有多種用於預處理或轉換資料集的實用介面,例如離散傅利葉變換,合併等。基於此,使用它內建的頻譜分析功能對時間序列進行分解和去噪也是乙個不錯的選擇。使用它提供的資料集快速上手或許是個不錯的選擇。

nolitsa這個庫已經很久沒有更新了,但是對於非線性資料的處理,這絕對值得一試。針對於數學和物理學中的非線性時間序列問題(很多實際問題也是非線性的),它使用動態方法去處理延遲、視窗函式。在進行動態系統重建,估計相關維度還有計算時間序列的最大李雅普諾夫指數上,nolitsa都提供了很大的便利。

這是這幾個中較小的乙個庫,當然小也有小的好處。對於具體資料,它可以很好地實驗樣本熵、lyapunov指數的計算(不單單是最大指數)。此外,他也可以提供了計算hurst指數和detrended fluctuation analysis的工具。

它允許使用者根據輸入選擇不同的延遲和回歸函式。我還沒有深入體驗,據說隨機森林、xgb之類都是可以的。

最後,我在推薦github的乙個專案叫做awesome time series in python。相信我,你值得擁有!

Python處理時間序列資料

初償用python處理時間序列的資料,碰到一些坑。以此文記錄一下,希望後來者可以少走彎路。背景說明 我是用乙個已有的csv資料表作為原材料進行處理的。目的 實現時間序列的視覺化,及週期性的視覺化。1 碰到的第乙個坑是,匯入到時間資料,預設的是字串的資料型別。因此,在視覺化的時候,會出現沒有按時間先後...

時間序列資料

出生 gdp溫度 時間要素 年 季度 月 周 日 數值要素 長期變動趨勢 相當長的一段時間,受長期趨勢影響 持續上公升 下降 不規則變動 隨機擾動項 含白噪音 迴圈變動 市場經濟的商業週期 或者整個國家的經濟週期 1 資料具有週期性才能使用時間序列分解,例如資料是月份資料,季度資料,如果是年份資料則...

python序列資料 Python資料序列之字典

目標 字典的應用場景 建立字典的語法 字典常見操作 字典的迴圈遍歷 一.字典的應用場景 思考1 如果有多個資料,例如 tom 男 20,如何快速儲存?答 列表 list1 tom 男 20 思考2 如何查詢到資料 tom 答 查詢到下標為0的資料即可。list1 0 思考3 如果將來資料順序發生變化...