我們也可以得到乙個關於recommender問題的更寬廣的看法:對生產recommendations我們不用必須估計首選項值。沒必要總是對使用者提供估計的首選項值。在很多情況下,我們所想要的是乙個recommendations的從最好到最差的排序列表。事實上,在有些情況下,我們不是很關心列表的精確排序:一組有點好的recommendations是好的。
用更一般的看法,我們也可以把經典的資訊檢索測量應用到評估recommenders:精度和呼叫。這些專案代表性的應用於像搜尋引擎這樣的程式,這為許多可能結果的查詢返回一些最好的結果。
2.4.1 執行乙個recommenderirstatsevaluator
mahout提供了乙個簡單的途徑去計算推薦器的精度等值.
可以試著執行一下**
randomutils.usetestseed();
datamodel model = new filedatamodel(new file("intro.csv"));
recommenderirstatsevaluator evaluator =
new genericrecommenderirstatsevaluator();
recommenderbuilder recommenderbuilder = new recommenderbuilder()
}; irstatistics stats = evaluator.evaluate(
recommenderbuilder, null, model, null, 2,
genericrecommenderirstatsevaluator.choose_threshold,
1.0); a
system.out.println(stats.getprecision());
system.out.println(stats.getrecall());
推薦演算法 推薦系統的評估
其中 ep 是測試資料集合 rs ua i ualu lu u 待推薦的列表大小 離線測試,使用者 u在測試集中影片數量 未打分的影片數量 iu a 是 影片 a 在使用者推薦列表中的排名ap x i 1x pre dict ioni ch ange inre call i ap 2 p redi ...
用於推薦系統評估的概念與指標(2)
建立衡量日常生活級別新穎性的指標並非易事。新穎性等級1的衡量必須考慮系統上下文中的資訊,以便衡量使用者已知和未知的內容。系統級別的新穎性有許多定義。簡單來說,對使用者而言,新專案是指使用者不知道或者知道很少的專案。有人認為,新穎性是指推薦系統 使用者不知道且通過其他渠道也不會發現的專案。新穎性也被定...
分類器的評估與選擇
混淆矩陣 分析分類器的 能力。以二元分類為例 實際 y 1 陽 y 0 陰 合計y 1 tpfn py 0 fptn n其中 tp 真陽性 的個數,陽性為陽性 正確。tn 真陰性 的個數,陰性為陰性 正確。fp 真陽性 的個數,陰性為陽性 錯誤。fn 真陽性 的個數,陽性為陰性 錯誤。常用的評估分類...