以下內容主要來自
wiki for evaluation of an information retrieval system
(precision = \frac\cap|})
簡言之,精確度就是檢索系統返回的文件中,與被查詢文件是相關的比例,越高越好
(recall = \frac\cap|})
簡言之,召回率就是所有相關文件中,被檢索系統返回的比例,越高越好
\cap|}}
如上,誤檢率就是所有不相關文件中,被檢索系統返回的比例,越低越好
安利乙個簡單的版本,它相當於精確度和召回率的平均
(f = \frac)
(precision-k = \frac\cap|})
簡言之,給定k,返回前k個結果中於被查詢文件相關的比例
(r-precision = \frac\cap|})
此處假設相關文件的篇數固定為r,除此之外,該定義與precision at k類似。
(map = \frac^**ep(q)})
這個名字的翻譯比較拗口哈。
NDCG 評價標準
評價標準 效能良好的評分模型,應該能夠給予那些引起msg或click的候選會員更高的評分 排序靠前 從而推薦給指定會員。本次競賽的主要排名標準為normalized discounted cumulative gain ndcg 定義如下 這裡rank 1 click msgrec click re...
推薦系統評價標準
如果乙個智慧型系統的智慧型程度很弱的話,對於工業界來說,完全可以不用智慧型系統。假象你推薦給使用者的東西效果很差的話,還不如推薦給使用者一些比較hot的東西。那麼,如何來評價乙個推薦系統的效果呢?1 accuracy 準確性是乙個可以量化的指標,在學術界,評價乙個推薦系統最重要的指標就是看看你 的分...
模型評價標準 重要
jaccard similarity coefficient 傑卡德相似係數 兩個集合a和b的交集元素在a,b的並集中所佔的比例,稱為兩個集合的傑卡德相似係數 correlation coefficient 相關係數 準確率 召回 fscore 對於分類器,評價指標主要有precision,reca...