首先明白四個概念:
正樣本是指屬於某一類別的樣本,反樣本是指不屬於某一類別的樣本
比如說在做字母a的影象識別,字母a的樣本就屬於正樣本,不是字母a的樣本就屬於負樣本 。
由這四個概念,我們可以定義如下所示指標:
1、精確率(precision):
即:所有正樣本中有多少被正確**;p=t
ptp+
fp
p=\frac
p=tp+f
ptp
2、準確率(accuracy):
即:所有樣本中有多少被正確**;a=t
p+tn
tp+f
p+tn
+f
na=\frac
a=tp+f
p+tn
+fnt
p+tn
3、召回率(recall):
即:所有**為正確的樣本中有多少是真正正確的;r=t
ptp+
fn
r=\frac
r=tp+f
ntp
機器學習中的有監督學習,無監督學習,半監督學習
在機器學習 machine learning 領域,主要有三類不同的學習方法 監督學習 supervised learning 非監督學習 unsupervised learning 半監督學習 semi supervised learning 監督學習 通過已有的一部分輸入資料與輸出資料之間的對應...
有監督學習 無監督學習和半監督學習的區別
1 特徵 feature 資料的特徵。舉例 書的內容 2 標籤 label 資料的標籤。舉例 書屬於的類別,例如 計算機 圖形學 英文書 教材 等。舉例 把很多書交給乙個學生,培養他給書本分類的能力。4 分類 classification 定性輸出稱為分類,或者說是離散變數 舉例 明天是陰 晴還是雨...
隨機森林演算法(有監督學習)
一 隨機森林演算法的基本思想 隨機森林的出現主要是為了解單一決策樹可能出現的很大誤差和overfitting的問題。這個演算法的核心思想就是將多個不同的決策樹進行組合,利用這種組合降低單一決策樹有可能帶來的片面性和判斷不準確性。用我們常說的話來形容這個思想就是 三個臭皮匠賽過諸葛亮 具體來講,隨機森...