手推公式 馬氏距離

2021-09-05 11:45:11 字數 1278 閱讀 9177

距離用於評價點與點遠近關係的數值。常用的距離公式有歐式距離曼哈頓距離馬氏距離余弦距離等。採用不同的公式計算的遠近關係的數值會有所不同。這些不同也體現了不同距離公式的運用場景的不同。

最近遇到一些問題,主要是一些特徵單位不統一,傳統的歐氏距離不能很好反應它們之間遠近關係了,於是希望找到一種消除單位影響的距離評價方法,於是馬氏距離出來了:

例子:(例子取自 )

如果我們以厘公尺為單位來測量人的身高,以克(g)為單位測量人的體重。每個人被表示為乙個兩維向量,如乙個人身高173cm,體重50000g,表示為(173,50000),根據身高體重的資訊來判斷體型的相似程度。

我們已知小明(160,60000);小王(160,59000);小李(170,60000)。

注:這裡可以看出距離公式的一些必要條件

1.同一性:小明-小明的距離=0

2.對稱性:小明-小王=小王-小明

3.直遞性:小明-小王 <= 小明-小李 + 小王-小李

4.非負性

值得注意的是:計算出數值越**明在**該公式(模型)**中距離近

問題通過歐氏距離計算小明-小李距離最近,但我們發現該計算完全沒有考慮單位的影響,常識告訴我們在評價人這個場景裡身高的數值cm遠小於體重g,這意味著身高的權重降低了很多。未解決這一問題馬氏距離出來了

1.計算均值

計算身高、體重的均值為

2.計算樣本與均值的差值

3.計算差值的協方差矩陣

4.計算差值的協方差矩陣的逆

5.計算馬氏距離

3×2 2×2 2×3 三個矩陣相乘最後為3×3

最後發現距離都是2。。。(需要開方)

注:這裡也可以看到馬氏距離服從距離的必要條件

值得注意的是:

1.當協方差矩陣為單位矩陣時,馬氏距離就是歐式距離

2.馬氏距離通過協方差矩陣的逆計算消除單位的作用

3.比較奇特的是小王-小李距離也是2,這一點我也沒太理解,歡迎各位補充。。。

馬氏距離詳解

三 例項認知 四 公式推導 致謝從下往上的一段50公尺長的坡道路,下面定乙個a點,上面定b乙個點。假設有兩種情況從a到b a 坐手扶電梯上去。b 從手扶電梯旁邊的樓梯爬上去。兩種情況下我們分別會產生兩種不同的主觀感受,坐電梯輕鬆愉快,感覺很快就從a到了b a與b真近 走樓梯爬的氣喘吁吁很累,感覺走了...

距離度量之馬氏距離

用來度量乙個樣本點 與資料分布為 的集合的距離。假設樣本點為 資料集分布的均值為 協方差矩陣為 則這個樣本點 與資料集合的馬氏距離為 馬氏距離也可以衡量兩個來自同一分布的樣本x和y的相似性 當樣本集合的協方差矩陣是單位矩陣時,即樣本的各個維度上的方差均為 馬氏距離就等於歐式距離相等。當協方差矩陣是對...

距離度量之馬氏距離

用來度量乙個樣本點 與資料分布為 的集合的距離。假設樣本點為 資料集分布的均值為 協方差矩陣為 則這個樣本點 與資料集合的馬氏距離為 馬氏距離也可以衡量兩個來自同一分布的樣本x和y的相似性 當樣本集合的協方差矩陣是單位矩陣時,即樣本的各個維度上的方差均為 馬氏距離就等於歐式距離相等。當協方差矩陣是對...