1.true positive(tp) :被正確識別的 想要識別成的物體狗(比如說想測試的是狗)
false positive (fp) : 被錯誤的識別為 想要成為的物體狗
以上這兩個就是通過閾值識別出來的
precision = tp/(tp+fp)
true negative(tn): 正確的沒有被識別為狗
false negetive(fn): 錯誤的沒有被識別為狗
這兩個都是指沒有被檢測出來的
recall = tp/(tp+fn)
2.ap
如果僅僅通過上面有個指標評價乙個模型的好壞有些片面,比如通過進行閾值的調整便能單方面的控制某乙個指標的大小,因此需要乙個更加具有綜合性質的評價標準,這就是ap。
乙個模型好的標準:在recall rate很大時,準確率也保持在很高的值。
所以引出了presition-recall 的曲線,通過曲線下的面積大小來表示模型的好壞。
NDCG 評價標準
評價標準 效能良好的評分模型,應該能夠給予那些引起msg或click的候選會員更高的評分 排序靠前 從而推薦給指定會員。本次競賽的主要排名標準為normalized discounted cumulative gain ndcg 定義如下 這裡rank 1 click msgrec click re...
推薦系統評價標準
如果乙個智慧型系統的智慧型程度很弱的話,對於工業界來說,完全可以不用智慧型系統。假象你推薦給使用者的東西效果很差的話,還不如推薦給使用者一些比較hot的東西。那麼,如何來評價乙個推薦系統的效果呢?1 accuracy 準確性是乙個可以量化的指標,在學術界,評價乙個推薦系統最重要的指標就是看看你 的分...
模型評價標準 重要
jaccard similarity coefficient 傑卡德相似係數 兩個集合a和b的交集元素在a,b的並集中所佔的比例,稱為兩個集合的傑卡德相似係數 correlation coefficient 相關係數 準確率 召回 fscore 對於分類器,評價指標主要有precision,reca...