機器學習中分類模型的評估方法之 Kappa係數

2021-09-17 03:04:45 字數 513 閱讀 2842

k=(po−pe)/(1−pe)

其中,p0表示為總的分類準確度; 

pe表示為

pe=a1×b1+a2×b2+...+ac×bc/n×n

其中,ai代表第i類真實樣本個數,bi代表第i類**出來的樣本個數。

例子對於該表中的資料,則有:

po=(239+73+280)/664=0.8916

pe=(261×276+103×93+300×295)/664×664=0.3883

k=(po−pe)/(1−pe)=(0.8916−0.3883)/(1−0.3883)=0.8228

**用python語言來實現,則有:

其中,matrix是乙個方陣,若共有i個類別,則matrix.shape = (i,i). 

用下面的**進行測試:

import numpy as np

matrix = [

[239,21,16],

[16,73,4]

[6,9,280]]

**

機器學習 分類模型的評估

estimator.score 混淆矩陣 在分類任務下,結果與正確標記之間存在四種不同的組合,構成混淆矩陣 適用於多分類 貓 混淆矩陣 狗 混淆矩陣 評估標準 準確率 精確率和召回率。精確率 結果為正例樣本中真實為正例的比例 查的準 召回率 真實為正例的樣本中 結果為正例的比例 查的對,對正樣本的區...

機器學習模型評估方法

分類模型評價度量 概率輸出型 這個有邏輯回歸 隨機森林 梯度提公升 adaboost等演算法,都是以概率作為輸出的。要想把概率型輸出變為分型別輸出,只要為其設立乙個閾值即可。positive predictive value 陽性 值 or precision 精度 陽性 值被 正確的比例。nega...

機器學習之模型評估

準確率是指分類正確的樣本佔總樣個數的比例 accuracy frac n 為被正確分類的樣本個數,n 為總樣本的個數 準確率的侷限性 準確率是分類問題中最簡單也是最直觀的評價指標,但存在明顯的缺陷,當不同總類的樣本比例非常不均衡時,佔比大的類別往往成為影響準確率的最主要因素。比如 當負樣本佔99 分...