目的:白化處理是為了去除訊號的相關性,設白化矩陣為v,則對中心化的資料x用v做線性變換,得到的新的訊號滿足不相關且為單位方差。
v的求解過程:
1.獲得x和x轉置矩陣的點積a。
2.求解a的特徵值d和特徵向量e。
3.構造對角矩陣(左上右下)d2,對角線上的元素為d的值。
4.白化矩陣v就是矩陣d2的平方根與e的轉置矩陣的點積。
5.求得v與x的點積就為x白化處理的矩陣。
示例:其中x為2*500的矩陣
x_mean = x.mean(axis=-1)x -= x_mean[:, newaxis]
#whiten
a = dot(x, x.transpose())
d , e = linalg.eig(a)
d2 = linalg.inv(array([[d[0], 0.0], [0.0, d[1]]], float32))
d2[0,0] = sqrt(d2[0,0]); d2[1,1] = sqrt(d2[1,1])
v = dot(d2, e.transpose())
return dot(v, x), v
python資料標準化處理 資料標準化處理
正態分佈跟標準分數之間的關係 python版本 3.5 標準分數 標準分數 standard score,又稱z score z分數或標準化值 是將集合中的單個數與集合的均值相減的結果除以集合的標準差得到標準化的結果,該方法類似於正態分佈的標準化轉換,轉換函式為 式中x為需要被標準化的原始值,為均值...
歸一化處理資料 python
源自 machine learning in action 1.原因 例如在用 knn 演算法處理資料時,比如有兩個特徵,乙個特徵的取值範圍為0 1,另乙個取值範圍為1w 以上,那麼用歐式距離計算的話第乙個特徵的影響幾乎就會微不足道,為了解決這個問題,在處理資料的時候對資料進行歸一化處理。2.def...
Python資料標準化處理
歸一化,z socre法 import numpy as np import pandas as pd import copy import jenkspy 逆向指標 defminmaxnormalization x x np.max x x np.max x np.min x return x 正...