余弦相似度和歐式距離的區別

2022-06-22 01:18:10 字數 513 閱讀 2494

余弦相似度:

\[\cos \left( \right) = \frac}_2}_2}}} = \frac^n \times } \right)} }}^n } \right)}^2}} }  \times \sqrt ^n } \right)}^2}} } }}\]

歐式距離:

\[dist\left( \right) = \right\|_2} = \sqrt ^n - } \right)}^2}} } \]

如果對向量模長進行歸一化,歐式距離和余弦相似度有如下計算關係:

\[ \right\|_2} = \sqrt \right)} \right)} \]

余弦相似度的取值範圍:[-1,1]

歐式距離取值範圍:[0, +∞)

余弦相似度計算的向量的夾角,它並不關心向量的絕對大小。

歐式距離體現的是數值上的絕對差異。

歐式距離 和 余弦相似度

都單位向量化後,再化簡後就是 兩者在歸一化為單位向量的時候計算相似度結果完全一樣。只不過余弦相似度是值越大月相似,歐式距離是值越小越相似 歐氏距離能夠體現個體數值特徵的絕對差異,所以更多的用於需要從維度的數值大小中體現差異的分析,如使用使用者行為指標分析使用者價值的相似度或差異。主要在乎的是值 余弦...

歐氏距離和余弦相似度

兩者相同的地方,就是在機器學習中都可以用來計算相似度,但是兩者的含義有很大差別,以我的理解就是 前者是看成座標系中兩個點,來計算兩點之間的距離 後者是看成座標系中兩個向量,來計算兩向量之間的夾角。前者因為是點,所以一般指位置上的差別,即距離 後者因為是向量,所以一般指方向上的差別,即所成夾角。如下圖...

歐氏距離和余弦相似度

參考自 歐氏距離與余弦相似度 歐氏距離和余弦相似度 在資料分析和資料探勘的過程中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是資料分析中的相關分析,資料探勘中的分類和聚類演算法,如k最近鄰 knn 和k均值 k means 來衡量兩者的差異的方法,主要分為距離度量和相似度...