深度學習理論方法 相似度計算

2021-10-22 14:08:31 字數 862 閱讀 1590

【公式1】:歐幾里得計算公式

作為計算結果的歐式值顯示的是兩點之間的直線距離,該值的大小表示兩個物品或者使用者差異性的大小,即使用者的相似性如何。如果兩個物品或者使用者距離越大,那麼相似性越小;反之,距離越小相似度越大。由於歐幾里得相似度計算中最終數值的大小和相似度成反比,因此在實際中常常使用歐幾里得距離的倒數作為相似度值,即1/d+1作為近似值。

【例子1】:歐幾里得公式的應用

物品1(特徵1)

物品2(特徵2)

物品3(特徵3)

物品4(特徵4)

使用者1113

1使用者212

32使用者3221

1如果計算使用者1和其他使用者之間的相似度,通過歐幾里得距離公式可以得出:

從結果可知,使用者1和使用者2的相似度為1.414。使用者1和使用者3的相似度是:

因此可以得到使用者2更加相似於使用者1(距離越小,相似度越大)

【公式2】:余弦相似度計算公式

兩條直線分別從座標原點出發,引出一定的角度。如果兩目標較為相似,那麼其線段形成的夾角較小。因此在使用余弦度量的相似度計算中可以用夾角的大小來反映目標之間的相似性。

余弦值一般為[-1,1],這個值的大小與余弦夾角的大小成正比。夾角越小,余弦值越小,兩目標越相似。

【例子2】:余弦相似度公式的應用

表1中使用者1和使用者2之間的相似性,結果如下:

使用者1和使用者3的相似性如下:

相對於使用者3,使用者2與使用者1更為相似。

歐幾里得相似度注重目標之間的差異,與目標在空間的位置直接相關。

余弦相似度是不同目標在空間中的夾角,更加表現在前進的趨勢上的差異。

mysql資料相似度演算法 相似度計算方法

相似度就是比較兩個事物的相似性。一般通過計算事物的特徵之間的距離,如果距離小,那麼相似度大 如果距離大,那麼相似度小。問題定義 有兩個物件x,y,都包含n維特徵,x x1,x2,x3,xn y y1,y2,y3,yn 計算x和y的相似性。閔可夫斯基距離 minkowski distance 曼哈頓距...

深度學習理論 AdaBoost演算法

整合學習分為boosting和bagging兩種,其中boosting演算法是使用同質的弱分類器集成為強分類其,bagging為使用異質的弱分類器集成為強分類器,而boosting的經典演算法就是adaboost演算法。adaboost演算法有使用迴圈迭代的方法更新兩個權重 乙個是每次迭代所訓練的濾...

深度學習理論 yolov3計算map

1.生成檢測檔案 darknet detector valid cfg voc.data cfg yolov3 voc.cfg backup yolov3 voc final.weights out 其中,類名要寫自己的類名,會生成乙個txt檔案在result裡。2.然後在python2的環境下執行...