當我們在對時序資料進行特徵提取時,常常用到的方法包括滑動平均,指數平滑等等,tsfresh可以為我們提供幾十至幾百個統計特徵,包括時序訊號的能量等等,只需要一次操作即可。
以下內容來自tsfresh的文件,先通過乙個例項來認識一下這個快速有效的工具:
1. 首先載入資料
2. 看一下資料的形式
特徵向量:
標籤:
該資料集中每個id包含15個時間點的資料,也就是說,f_x~t_z 這6列,對於每個id都有15個資料點。
接下來並沒有多餘的操作,直接呼叫該模組中的方法進行特徵抽取:
1. 抽取特徵
可以看出,呼叫extract_features()方法之後,返回的仍是乙個dataframe,列數由原來只有幾列增加到幾千列。
返回的結果中,每一行表示對乙個物件抽取特徵後的結果,為了方便理解,我們以id=1作為說明。原來id=1的物件在f_x特徵上有15個時序資料,我們將這15個資料平方求和,得到的乙個值做為id=1這個物件的第乙個新特徵,即f_x_abs_energy;再對這15個時序資料做其他操作,比如求均值、方差等等,得到的結果依次往後排開,直到計算完最後一列t_z的特徵後,屬於id=1這個物件的特徵向量也就生成了。id=2、id=3...同理。
2. 特徵過濾
由上一步操作得到的特徵中存在空值(nan),這些沒有意義的值需要去掉,選擇有用的特徵進行保留。從結果可以看出,資料的維度減少了很多。
3. 特徵抽取與過濾同時進行(一步到位,省去多餘計算)
可以看出結果與分兩步進行的結果是一致的。
以上就是tsfresh的簡單應用,下次補上輸入資料形式以及引數的含義。
使用Docker對時延影響幾何
本文講的是使用docker對時延影響幾何,編者的話 本文通過介紹azul systems的技術副總裁兼首席技術官 聯合創始人gil tene對docker時延特性的分析,說明了針對docker時延的關鍵影響因素 cpu 記憶體 io 進行改善提高,認為時延對docker的影響是乙個 無關緊要 問題。...
自己寫的對時間操作的工具
時間格式換算 param time num 毫秒數 將微秒數轉變成,時,分,秒 return 00 00 00 格式 const formattime function time num else if time num second time num minute else if time num...
使用datetime對時間進行操作
import re,time from datetime import timedelta,datetime list u 10分鐘前 u 2小時前 u 22小時前 u 昨天 14 55 u 08 18 u tue jun 12 15 49 08 0800 2018 u 剛剛 for i in li...