度量學習 分類與檢索

2021-08-07 13:39:50 字數 512 閱讀 5025

以下純屬個人觀點,如有錯誤,請批評指正

最近用到距離度量學習了,於是乎思考了一下。

距離度量學習,最終學出的是m。監督的距離度量學習,最終根據類別標記,學習出乙個好的m,來度量同一類樣本之間的相似性。

這是乙個類與相似性之間的直接對應關係。因為對於分類器來說,有的是以距離作為分類標準的,距離近的就認為屬於同一類。但是有的並不是以距離作為分類標準,

比如svm是以支援向量機形成的兩個分介面作為標準的。距離近的未必是同一類。所以分類器和距離不是對等或者正比的關係。

所以度量學習,是學習出了類和相似性度量之間的直接對應關係。

而對於檢索任務來說,給定乙個query,我們要做的是要在資料庫中檢索到和query距離最近的樣本。這是基於距離的,是基於相似性度量的。

所以對於檢索任務,在訓練的過程中也要以距離度量作為標準。

所以,度量學習和檢索任務是可以相互關聯的。

當然檢索任務中,好的距離也不一定非得是通過距離度量學習到,也可能很明顯用歐式距離就可以,也可能還會有其他方式來表示。

機器學習分類與效能度量

資料集 訓練集 training set 驗證集 validation set 和測試集 test set 1 當模型無需人為設定超引數,所用引數都通過學習得到,則不需要驗證集。驗證集適合多個不同超引數訓練多個模型,通過驗證集,選擇最好的模型及其相應的超引數。2 監督學習 supervised le...

分類與檢索

以下純屬個人見解,如有理解錯誤,請批評指正 分類和檢索的區別 我感覺影象分類和影象檢索都可以分為兩部分 影象分類分為特徵學習 分類器學習,影象 檢索分為特徵學習 度量學習。最初的影象分類可能是自己設計認為對區分類別有幫助的 特徵,然後用分類器去分類,通過調整分類器的引數對影象進行分類。後來,也可以學...

分類效能度量

錯誤率是分類錯誤的樣本數佔總樣本數的比例 精度是分類正確的樣本數佔總樣本數的比例 查準率p 真正例 為正的樣本數 tp tp fp 是指挑出來的東西裡,有多少是好的。查全率r 真正例 實際為正的樣本數 tp tp fn 是指全部的好東西,挑出來了多大比例。p r圖 查全率為橫軸,查準率為縱軸,包線在...