我們已經知道了如何通過樣本間的距離來評估簇間的距離,本節只剩下最後乙個問題了,如何計算樣本間的距離,假設樣本是n維,常用的距離計算方法有:
1)尤拉距離(euclidean distance):
2)平方歐式距離(squared euclidean distance):
3)曼哈頓距離(manhattan distance):
4)切比雪夫距離(chebyshev distance):
5)馬氏距離(mahalanobis distance):
其中s為協方差矩陣。
對於文字或非數值型的資料,我們常用漢明距離(hamming distance)和編輯距離(levenshtein distance)表示樣本間的距離。
不同的距離度量會影響簇類的形狀,因為樣本距離因距離度量的不同而不同,如點(1.1)和(0,0)的曼哈頓距離是2,歐式距離是sqrt(2),切比雪夫距離是1。
機器學習中常用距離的小結
設有兩個n維向量a x11,x12,x1n 和b x21,x22,x2n 1 曼哈頓距離 曼哈頓距離也稱為城市街區距離,數學表示式為 2 歐氏距離 歐氏距離就是我們熟悉的l2範數,數學表示式為 3 閔可夫斯基距離 閔可夫斯基距離可以看作歐氏距離的一種推廣,數學表示式為 可以看到,當p值取1時,閔可夫...
常見距離計算方法
不能直接走兩點連線的直線,紅 藍 黃距離一樣長 西洋棋中,國王走一步可以移動到相鄰8個方格中的任意乙個,如下圖。a到b的距離為紅色線,需要走4步,和綠色線距離是相同的。閔氏距離不是一種距離,而是一組距離的定義,是對多個距離度量公式的概括性的表述。兩個n維變數a x11,x12,x1n 與b x21,...
基於距離的計算方法
1.歐氏距離 euclidean distance 歐氏距離是最易於理解的一種距離計算方法,源自歐氏空間中兩點間的距離公式。1 二維平面上兩點a x1,y1 與b x2,y2 間的歐氏距離 2 三維空間兩點a x1,y1,z1 與b x2,y2,z2 間的歐氏距離 3 兩個n維向量a x11,x12...