1 auc :auc 表示隨機抽取乙個正樣本和乙個負樣本,分類器正確給出正樣本的score高於負樣本的概率,在所以標註樣本中,正樣本共t個,負樣本共f 個,如果隨機抽取乙個正樣本和負樣本,共有t*f 個pair,其實如果有s個pair 的正負樣本pair 滿足於正樣本的score 高於負樣本(權重為1),v個pair 正負樣本score 相同(權重為0.5),則auc就等於(s+0.5v)/(t*f).
1 根據定義,由梯形法計算roc 曲線下的面積,求auc
2 變數全部樣本,對正負pair 的數目計數,求auc。
3 從高到底依次將score 值作為閾值,當測試樣本屬於正樣本的概率大於或等於這個threshold 時,我們認為它為正樣本,否則為負樣本,每次選取乙個不同的threshold,就可以得到一組fpr和tpr,即roc曲線上的一點,這樣一來,我們一共得到了20組fpr和tpr的值,將它們畫在roc曲線。
2 pr 曲線
pr 曲線的橫座標是召回率,縱座標是準確率,對於乙個排序模型來說,其pr 曲線上的乙個點代表: 在某乙個閾值下,模型將大於該閾值的結果判定為正樣本,整條pr 曲線是通過將閾值從高到低移動而生成的。所以可以整體地比較在不同閾值下模型**的水平。
但是有個問題是離線評測資料集的資料分布往往跟線上環境的資料集分布不同,比如你的離線資料集正負樣本比例為1:1,線上樣本比例1:100,這是pr 曲線就不適用了,需要roc 曲線。
深度學習(一)深度學習學習資料
持續更新 一 學習清單 1 收集了各種最新最經典的文獻,神經網路的資源列表 2 計算機視覺學習清單 3 機器學習學習清單 二 訓練資料 人臉資料 1 香港中文大學訓練資料集 此資料庫包含了20w張人臉,每張標註了5個特徵點 以及幾十種屬性 是否微笑 膚色 髮色 性別等屬性 2 68個人臉特徵點 3 ...
深度學習系列 深度學習簡介
機器學習 使用計算機系統利用經驗改善效能,是人工智慧領域的分支,也是實現人工智慧的一種手段。表徵學習關注如何自動找出表示資料的合適方式,以便更好地將輸入變換為正確的輸出。深度學習 具有多級表示的表徵方法,在每一級 原始資料開始 通過簡單的函式將該級的表示變換為更高階的表示。可以將深度學習看作多個簡單...
深度學習auc 如何理解機器學習和統計中的AUC?
之前各位的回答從各個角度解釋了auc的意義和計算方法,但是由於本人實在愚鈍,一直沒能參透auc的意義和計算方法之間的聯絡,直到剛才突然有所頓悟,本著盡量言簡意賅 淺顯易懂的原則,在這裡記錄一下。首先,在試圖弄懂auc和roc曲線之前,一定,一定要徹底理解混淆矩陣的定義!混淆矩陣中有著positive...