auc數值即為roc曲線下的面積。roc曲線從0點開始上公升越快,說明模型錯分正樣本的比例越小,模型對正樣本識別的能力越強。在roc曲線的基礎上,拋開閾值的調節,roc曲線下半部分的面積值就是auc值。auc值介於0到1之間,是一種概率值。本質上auc是在模型**的資料集中,比較正負樣本,評估正樣本分數排在負樣本之上的能力,進而估計模型對正樣本**的可信程度。
由於auc指標能較好地概括不平衡類別的樣本集下分類器的效能,因此成為很多機器學習系統中的最終判定標準。
基本目錄如下:
什麼是roc曲線?
1.1 roc曲線的歷史
1.2 roc曲線的定義
1.3 roc曲線的應用場景
如何繪製roc曲線?
2.1 roc曲線的繪製原理
2.2 roc曲線繪製的python實現
自從讀了吳軍老師的《數學之美》,我就想明白了一件事情,如果想要講明白一件事情,一定要把他的歷史淵源都講明白,這樣我們才能對其理解透徹,而不是單純學到會用就好~試想,有多少人在讀這篇文章之前,會想到roc曲線在軍事上的運用呢?接下來,我就當一回搬運工,把roc曲線的誕生淵源都捋一捋~
經過一番網上調查,roc曲線起源於第二次世界大戰時期雷達兵對雷達的訊號判斷。當時每乙個雷達兵的任務就是去解析雷達的訊號,但是當時的雷達技術還沒有那麼先進,存在很多雜訊(比如乙隻大鳥飛過),所以每當有訊號出現在雷達螢幕上,雷達兵就需要對其進行破譯。有的雷達兵比較謹慎
ROC曲線和AUC面積
本博文所有理論都是基於二分類,多分類問題其實與二分類問題相通。考慮乙個二分問題,如果一類定為正類 positive 那麼另一類就是負類 negative 注意和正樣本和負樣本概念不同,參考博文 真正類 true positive 例項是正類並且也被 成正類 假正類 false positive 例項...
ROC曲線和AUC指標
roc曲線的橫軸就是fprate,縱軸就是tprate,二者相等時表示的意義則是 對於不論真實類別是1還是0的樣本,分類器 為1的概率是相等的,此時auc為0.5 圖中藍色的線則是roc曲線,roc曲線和橫軸 縱軸圍成的面積就是auc指標。fpr fp fp tn from sklearn.metr...
關於ROC曲線和AUC的知識小記
很多分類器根據測試樣本產生乙個概率 然後將該 值與閾值進行比較,高於閾值則被分類為正類,低於閾值則被分為負類。auc值是評價分類器的乙個指標,全稱是area under curve,直譯就是曲線下的面積。什麼曲線呢,就是roc曲線。真實值和 值的混淆矩陣 值 值0 1真實值0tn fp真實值1fn ...