1、安裝scikit-learn
1.1 scikit-learn 依賴
分別檢視上述三個依賴的版本:
python -v
結果:python 2.7.3
python -c 'import scipy; print scipy.version.version'
scipy版本結果:
0.9.0
python -c "import numpy; print numpy.version.version"
numpy結果:
1.10.2
1 scikit-learn安裝
如果你已經安裝了numpy、scipy和python並且均滿足1.1中所需的條件,那麼可以直接執行sudo
pip install - u scikit - learn
執行安裝。
2、計算auc指標
import numpy as np
from sklearn.metrics import roc_auc_score
y_true = np.array([0, 0, 1, 1])
y_scores = np.array([0.1, 0.4, 0.35, 0.8])
roc_auc_score(y_true, y_scores)
輸出:0.75dnofcauus
3、計算roc曲線
import numpy as np
from sklearn import metricdnofcauuss
y = np.array([1, 1,&nbs程式設計客棧p;2, 2]) #實際值
scores = np.array([0.1, 0.4, 0.35, 0.8]) #**值
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2) #pos_label=2,表示值為2的實際值為正樣本
print fpr
print tpr
print thresholds
輸出:array([ 0. , 0.5, 0.5, 1. ])
array([ 0.5, 0.5, 1. , 1. ])
array([ 0.8 , 0.4 , 0.35, 0.1 ])
AUC的計算方法
在機器學習的分類任務中,我們常用許多的指標,諸如召回率 recall 準確率 precision f1值 auc等。相信這個問題很多玩家都已經明白了,簡單的概括一下,auc are under curve 是乙個模型的評價指標,用於分類任務。那麼這個指標代表什麼呢?這個指標想表達的含義,簡單來說其實...
AUC計算方法總結
auc area under the curve 是一種用來度量分類模型好壞的乙個標準,這裡不詳細敘述auc的定義及意義,詳見wiki。演算法1 如下圖是乙個分類器的結果,計算點形成的折線的面積就是auc的值 如下 public double aucalg1 if scores 1 contains...
AUC計算方法總結
一 roc曲線 1 roc曲線 接收者操作特徵 receiveroperating characteristic roc曲線上每個點反映著對同一訊號刺激的感受性。橫軸 負正類率 false postive rate fpr 特異度,劃分例項中所有負例佔所有負例的比例 1 specificity 縱軸...