馬氏距離通俗解讀

2021-09-20 18:59:50 字數 669 閱讀 3072

**

基礎知識:

假設空間中兩點x,y,定義:

歐幾里得距離,

mahalanobis距離,

不難發現,如果去掉馬氏距離中的協方差矩陣,就退化為歐氏距離。那麼我們就需要**這個多出來的因子究竟有什麼含義。

例子:如果我們以厘公尺為單位來測量人的身高,以克(g)為單位測量人的體重。每個人被表示為乙個兩維向量,如乙個人身高173cm,體重50000g,表示為(173,50000),根據身高體重的資訊來判斷體型的相似程度。

我們已知小明(160,60000);小王(160,59000);小李(170,60000)。根據常識可以知道小明和小王體型相似。但是如果根據歐幾里得距離來判斷,小明和小王的距離要遠遠大於小明和小李之間的距離,即小明和小李體型相似。這是因為不同特徵的度量標準之間存在差異而導致判斷出錯。

以克(g)為單位測量人的體重,資料分布比較分散,即方差大,而以厘公尺為單位來測量人的身高,資料分布就相對集中,方差小。馬氏距離的目的就是把方差歸一化,使得特徵之間的關係更加符合實際情況。

圖(a)展示了三個資料集的初始分布,看起來豎直方向上的那兩個集合比較接近。在我們根據資料的協方差歸一化空間之後,如圖(b),實際上水平方向上的兩個集合比較接近。

馬氏距離詳解

三 例項認知 四 公式推導 致謝從下往上的一段50公尺長的坡道路,下面定乙個a點,上面定b乙個點。假設有兩種情況從a到b a 坐手扶電梯上去。b 從手扶電梯旁邊的樓梯爬上去。兩種情況下我們分別會產生兩種不同的主觀感受,坐電梯輕鬆愉快,感覺很快就從a到了b a與b真近 走樓梯爬的氣喘吁吁很累,感覺走了...

距離度量之馬氏距離

用來度量乙個樣本點 與資料分布為 的集合的距離。假設樣本點為 資料集分布的均值為 協方差矩陣為 則這個樣本點 與資料集合的馬氏距離為 馬氏距離也可以衡量兩個來自同一分布的樣本x和y的相似性 當樣本集合的協方差矩陣是單位矩陣時,即樣本的各個維度上的方差均為 馬氏距離就等於歐式距離相等。當協方差矩陣是對...

距離度量之馬氏距離

用來度量乙個樣本點 與資料分布為 的集合的距離。假設樣本點為 資料集分布的均值為 協方差矩陣為 則這個樣本點 與資料集合的馬氏距離為 馬氏距離也可以衡量兩個來自同一分布的樣本x和y的相似性 當樣本集合的協方差矩陣是單位矩陣時,即樣本的各個維度上的方差均為 馬氏距離就等於歐式距離相等。當協方差矩陣是對...