馬氏距離與異常點檢測

2022-06-13 01:15:15 字數 967 閱讀 9616

馬氏距離的定義相關資料太多了,我這裡直接截圖維基百科上的定義。

馬氏距離具有以下特點:

馬氏距離與歐氏距離的主要區別點在於:

上面的內容,很多部落格也總結過了。其實看完後對馬氏距離並沒有乙個很直觀的認識。這裡總結一下馬氏距離的意義和解釋為什麼馬氏距離比歐式距離更好的檢測異常點。這裡的內容主要總結自如何理解馬氏距離,多維mahalanobis距離是否要用到「互相關張量」來進行描述?

歐式距離是定義在兩個點之間,維度的多少,不會使得歐式距離更複雜。歐氏距離認為多維空間是各向相同的,往哪個方向走,意義都一樣。

馬氏距離認為各向是異向的。而各向異性的具體引數,由乙個協方差矩陣表示。可以把直觀協方差矩陣當成乙個多維正太分布的協方差陣,那麼這個分布的密度函式的等高線,就是等高線常見的橢圓。從橢圓中心到橢圓上各個方向的點的馬氏距離,都是相等的。

其中,橢圓的各個軸的方向,是協方差矩陣的特徵向量。各個軸的長度正比於協方差矩陣的特徵值的平方根。

下面用乙個圖來說明一下。

左下角在二維空間中由乙個分布產生的方塊樣本,這個分布的一條等高線如虛線的橢圓框所示,圖中還有乙個不屬於該分布的圓圈樣本。這是是乙個典型的歐式距離會把分布外樣本算的更近的例子,比如把綠色和藍色樣本單拎出來,就是左上角的圖,藍色小圓圈和中心的綠色方塊更近了,這是因為單純的歐式距離無法反應方塊的分布。這種情況下,考慮用馬氏距離。這裡預設方塊的分布可以由協方差矩陣很好描述。這樣計算出的距離就像說的一樣不再是各向同性,對於方塊的分布而言有個良好性質是分布的等高線上到中心的馬氏距離相等了,因為馬氏距離包含了方塊本身分布的資訊。

進一步來理解,馬氏距離可以表示為下面這樣:

其實等效於做了個線性變換,然後在變換後的空間中求了下歐式距離。

RX異常點檢測演算法(馬氏距離)

異常檢測演算法目的在於從影像中將目標資訊 異常資訊 從影響背景和雜訊中分離出來。rx異常檢測演算法為一種區域性目標檢測演算法,演算法的監測視窗包括目標視窗和背景視窗,且後者遠大於前者。rx演算法假設資料空間白化且服從高斯分布,在此基礎上通過分析視窗的統計量 均值和方差 並與設定的閾值比較判斷是否為異...

馬氏距離與歐式距離

1 歐式距離 2 標準歐式距離 3 馬氏距離 4 測試 構造資料,構建乙個長軸為2短軸為1的橢圓 測試兩個點到質心的距離綠色的點x1 1,0 和黃色的點x2 0,0.8 通過計算歐式距離發現x2距離質心更近一些,但是計算馬氏距離和標準歐式距離卻又是x1距離的更近些 很直接的原因就是長軸的方差比較大,...

馬氏距離詳解

三 例項認知 四 公式推導 致謝從下往上的一段50公尺長的坡道路,下面定乙個a點,上面定b乙個點。假設有兩種情況從a到b a 坐手扶電梯上去。b 從手扶電梯旁邊的樓梯爬上去。兩種情況下我們分別會產生兩種不同的主觀感受,坐電梯輕鬆愉快,感覺很快就從a到了b a與b真近 走樓梯爬的氣喘吁吁很累,感覺走了...