在資料本身嚴重有偏的情況下,準確率很容易達到乙個很高的數值,因此需要尋找另外的效能評價方法。
混淆矩陣:將資料按待分的類別分組後,統計各組中模型分類或**結果的矩陣
)#可直接獲取鳶尾花資料集
plt.figure(figsize=(12
,15))
for n in
range(4
(n)for m in
range(3
):x=
(iris.data[m*
50:m*50+
50,n]
-iris.data[m*
50:m*50+
50,n]
.mean())
/ iris.data[m*
50:m*50+
50,n]
.std(
) plt.subplot(4,
3, n*
3+ m +1)
stats.probplot(x, dist=
'norm'
, plot=plt)
plt.text(-2
,2,iris.feature_names[n]
)if n ==0:
plt.title(iris.target_names[m]
)else
: plt.title('')
plt.xlim([-
2.5,
2.5]
) plt.ylim([-
2.5,
2.5]
) plt.plot([-
2.5,
2.5],[
-2.5
,2.5
],c=
'g')
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target,test_size=
0.2,random_state=0)
from sklearn.*****_bayes import gaussiannb
clf=gaussiannb(
)clf.fit(x_train, y_train)
y_pred=clf.predict(x_test)
y = pd.dataframe(np.transpose(
[y_test, y_pred]
), columns=
)from sklearn.metrics import confusion_matrix
(confusion_matrix(y_pred, y_test)
)from sklearn.metrics import classification_report
(classification_report(y_pred, y_test)
)
混淆矩陣評價指標 分類效果評價指標一混淆矩陣
1.混淆矩陣 判斷分類模型好壞 混淆矩陣是roc曲線繪製的基礎,同時它也是衡量分型別模型準確度中最基本,最直觀,計算最簡單的方法。一句話解釋版本 混淆矩陣就是分別統計分類模型歸錯類,歸對類的觀測值個數,然後把結果放在乙個表裡展示出來。這個表就是混淆矩陣。混淆矩陣是評判模型結果的指標,屬於模型評估的一...
多分類任務的混淆矩陣和評價指標
之前一直不明白多分類任務的混淆矩陣,今天研究了一下。拿乙個三分類任務來說 cat dog bird 有8個 結果 值 dog,dog,cat cat,cat,dog,bird,cat 真實值 dog,cat,cat,cat,bird,bird,cat,cat 要對每乙個類別做混淆矩陣。拿cat類來說...
分類器評估 混淆矩陣和ROC曲線
為正樣本 1 為負樣本 1 原正樣本 1 真陽 tp 假陰 fn 原負樣本 1 假陽 fp 真陰 tn 這裡以二分類問題來討論 很明顯,理想完美的分類器的對角線為0,即所有正樣本 為正樣本,所有負樣本 為負樣本。由混淆矩陣可以得出的一些引數 1 accuracy 模型的精度,模型 正確個數 樣本的總...