時序資料特徵提取方法

2021-10-21 05:55:34 字數 2139 閱讀 7734

在對如感測器資料等時間序列資料進行機器學習時,特徵提取是非常重要的一環,本文主要介紹時序資料特徵提取的幾種方法。

時域和頻域是訊號的基本性質,這樣可以用多種方式來分析訊號,每種方式提供了不同的角度。解決問題的最快方式不一定是最明顯的方式,用來分析訊號的不同角度稱為域。時域頻域可清楚反應訊號與互連線之間的相互影響。

時域(time domain)是描述數學函式或物理訊號對時間的關係。例如乙個訊號的時域波形可以表達訊號隨著時間的變化。是真實世界,是惟一實際存在的域。因為我們的經歷都是在時域中發展和驗證的,已經習慣於事件按時間的先後順序地發生。而評估數字產品的效能時,通常在時域中進行分析,因為產品的效能最終就是在時域中測量的。

頻域(frequency domain)是描述訊號在頻率方面特性時用到的一種座標系。在電子學,控制系統工程和統計學中,頻域圖顯示了在乙個頻率範圍內每個給定頻帶內的訊號量。頻域,尤其在射頻和通訊系統中運用較多,在高速數字應用中也會遇到頻域。頻域最重要的性質是:它不是真實的,而是乙個數學構造。時域是惟一客觀存在的域,而頻域是乙個遵循特定規則的數學範疇,頻域也被一些學者稱為上帝視角。正弦波是頻域中唯一存在的波形,這是頻域中最重要的規則,即正弦波是對頻域的描述,因為頻域中的任何波形都可用正弦波合成。這是正弦波的乙個非常重要的性質。然而,它並不是正弦波的獨有特性,還有許多其他的波形也有這樣的性質。

時域分析與頻域分析是對模擬訊號的兩個觀察面。時域分析是以時間軸為座標表示動態訊號的關係;頻域分析是把訊號變為以頻率軸為座標表示出來。一般來說,時域的表示較為形象與直觀,頻域分析則更為簡練,剖析問題更為深刻和方便。訊號分析的趨勢是從時域向頻域發展。然而,它們是互相聯絡,缺一不可,相輔相成的。

動態訊號從時間域變換到頻率域主要通過傅利葉級數和傅利葉變換實現。週期訊號靠傅利葉級數,非週期訊號靠傅利葉變換。時域越寬,頻域越短。

基於基本統計方法,我們可以提取均值、方差、極值、波段、功率譜等特徵。時域方面,可提取均值、方差、極值、過零點、邊界點、波段長短峰值等特徵;頻域方面,可提取功率譜,功率密度比,中值頻率,平均功率頻率等特徵。

肌電訊號(emg):過零點數,積分肌電值,方差;emg功率譜的平均功率頻率和中值頻率;

心電圖(ecg): rr間隔均值、熵值、變化值、功率譜密度;

腦電訊號(eeg):峰值、熵值、非線性能量、qrs波的峰值、波長等、qt間隔、st間隔等統計特徵;

基於模型的特徵提取, 是指用模型刻畫時間序列資料,提取的模型係數作為特徵向量。

常用模型: arma、ar、mar、arch、svar

平穩時間序列:arma

ecg, emg:ar

金融時序資料:arch, svar

選擇合適的模型進行特徵提取, 產生的模型係數作為特徵向量. 針對這類特徵向量, 往往採用簡單的判別函式即可達到理想的分類效果. 最常用的當屬二次判別函式(qdf). 有時也用到最大似然的判斷規則進行分類.

2.3.1 基於時頻變換

時頻變換是將訊號從時域變換到頻域的一種手段. 時間序列資料在特徵提取中常採用傅利葉變換倒譜係數等時頻變換方法.

傅利葉變換:時域訊號轉化為頻域訊號。將時序資料進行傅利葉變換, 然後選擇它的係數作為特徵向量, 若選擇前面的係數, 則代表了訊號的低頻特性, 選擇較大的係數, 則代表了訊號的能量特性。

倒譜係數:倒譜分析又稱為二次頻譜分析, 它分為實倒頻譜和復倒頻譜. 其中實倒譜又為功率倒頻譜, 它是先將時序訊號進行離散傅利葉變換, 然後取自然對數,再實行離散傅利葉反變換. 復倒譜是將時序訊號通過z 變換以後取對數,再求反 z 變換而得到的.

2.3.2 基於線性變換

線性變換中有很多特徵提取方法頗為經典, 特別是pca小波變換.

pca:主成分分析

小波變換

分形是指具有: 無限精細、非常不規則、無窮自相似結構和非整數的點集.在大自然中, 海岸線、雪花, 雲霧這些不規則形體都屬於分形, 即部分與整體有自相似性.

分形理論用於特徵提取時, 主要是針對非線性訊號, 是用它的定量分析指標分維數作來特徵向量.

邊緣特徵提取方法

邊緣檢測是圖形影象處理 計算機視覺和機器視覺中的乙個基本工具,通常用於特徵提取和特徵檢測,旨在檢測一張數字影象中有明顯變化的邊緣或者不連續的區域,在一維空間中,類似的操作被稱作步長檢測 step detection 邊緣是一幅影象中不同屈原之間的邊界線,通常乙個邊緣影象是乙個二值影象。邊緣檢測的目的...

邊緣特徵提取方法

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!邊緣檢測是圖形影象處理 計算機視覺和機器視覺中的乙個基本工具,通常用於特徵提取和特徵檢測,旨在檢測一張數字影象中有明顯變化的邊緣或者不連續的區域,在一維空間中,類似的操作被稱作步長檢測 step detection 邊緣是一幅影象中不同屈原之間的邊...

特徵工程 特徵提取

特徵提取 將任意資料 如文字或影象 轉換為可用於機器學習的數字特徵 注 特徵值化是為了計算機更好的去理解資料 字典特徵提取 作用 對字典資料進行特徵值化 dictvectorizer.get feature names 返回類別名稱 from sklearn.feature extraction i...