這裡面有三個常用的概念:正確率,精確率,召回率。
正確率(precision,簡稱為p)定義為:p=返回結果中相關文件個數/返回結果的數目。
精確率(accuracy,簡稱為a)定義為:a=判斷結果正確的文件數目/所有文件數目。
召回率(recall,簡稱為r)定義為: r=返回結果中相關文件數目/所有相關文件數目。
實際相關文件數
實際不相關文件數
返回文件數(搜尋引擎認為相關)
tpfp
未返回文件數(搜尋引擎認為不相關)
fntn
p=tp/(tp+fp)
a=(tp+tn)/(tp+fp+fn+tn)
r=tp/(tp+fn)
出自:
評價推薦系統指標
評價指標 名稱符號 偏好是否依賴於推薦列表長度備註準 確度 評分準確度 平均絕對誤差 mae 小否 適用於比較關注精確的 評分的系統 平均平方誤差 mse 小均方根誤差 rmse 小 標準平均絕對誤差 nmae 小 評分關聯 pearson關聯 pcc 大適用於不關注精確 評分的系統,其中ndmp適...
搜尋評價指標 NDCG
概念 ndcg,normalized discounted cumulative gain 直接翻譯為歸一化折損累計增益,可能有些晦澀,沒關係下面重點來解釋一下這個評價指標。這個指標通常是用來衡量和評價搜尋結果演算法 注意這裡維基百科中提到了還有推薦演算法,但是我個人覺得不太適合推薦演算法,後面我會...
搜尋評價指標 NDCG
本文出自胖喵 的部落格 原文 概念 ndcg,normalized discounted cumulative gain 直接翻譯為歸一化折損累計增益,可能有些晦澀,沒關係下面重點來解釋一下這個評價指標。這個指標通常是用來衡量和評價搜尋結果演算法 注意這裡維基百科中提到了還有推薦演算法,但是我個人覺...