roc(receiver operating characteristic curve):接收者操作特徵曲線。
auc(area under curve):上面曲線與x, y軸形成的最大面積。
如果你實在不理解roc的中文註解,那就簡單了解一下就行了, 點到為止吧!
步入正題
step1: roc
首先告訴你roc的作用,你就能大概知道這個曲線大概是啥了:它用來衡量你的模型分類結果有多準確。
在列舉幾個你比須明白且簡單的概率。
真_正例率(tpr, true positive rate):你**出的真的陽性數量(就是實際他是陽性,模型**也是陽性) / 所有陽性的數量
假_正例率(fpr, false positive rate):你**出的假的陽性數量(就是實際他是陰性,模型卻**是陽性) / 所有陰性的數量
在簡單一點理解,真_正例率(tp)指模型好!, 假_正例率(fp)指模型差!
roc就是用上面兩個值來繪製的曲線。看下圖
中間的虛線代表模型最不好, tp和fp相等,所以模型完全隨機分類, 紅色的線代表模型分類效果還可以,tp>fp,當然如果是直接向上的話模型最好。那抬個槓, 如果曲線在虛線下邊呢, 在下邊的話就反向**就ok了!
auc即圖示陰影面積, 當你讀完上面roc的原理時,其實auc面積所代表的東西你也懂了吧。
結束結束end! 要鑽研決策樹了! 再會!
瞎聊機器學習 PR曲線 ROC曲線 AUC
roc曲線經常作為評估二分類的重要指標,其起源於軍事領域,全稱叫做receiver operating characteristic curve。roc曲線是二維平面內的曲線,其橫座標為假陽性率 fpr 縱座標為真陽性率 tpr 他們的計算方法如下 上式中 舉個例子 假設有10個人疑似感冒了,其中有...
機器學習筆記(一)ROC與AUC的定義與概念
roc綜述為 受試者工作特徵 receiver operation characteristic 其對於組織分類器和將分類器的效能視覺化十分有用。它最先由二戰的電子工程師發明,用於偵測戰場上的敵軍載具,是訊號檢測理論的重要組成部分,最近經常用於機器學習和資料探勘研究,可以用於 1 選擇最優的分類模型...
機器學習和統計中的AUC
首先,在試圖弄懂auc和roc曲線之前,一定,一定要徹底理解混淆矩陣的定義!混淆矩陣中有著positive negative true false的概念,其意義如下 稱 類別為1的為positive 陽性 類別為0的為negative 陰性 正確的為true 真 錯誤的為false 偽 對上述概念進...