場景如下:
假設原樣本有兩類,true和false,其中:
1.總共有t個類別為true的樣本;
2.總共有f個類別為false的樣本;
分類**後:
1.總共有tt個類別為true的樣本被系統判為true,ft個類別為true的樣本被系統判為false,則tt+ft=t
2.總共有ff個類別為false的樣本被系統判為false,tf個類別為false的樣本被系統判為true,則ff+tf=f
指標計算:
精確度=tt/(tt+tf)--判斷正樣本中真正正樣本的比例
準確率=(tt+ff)/(t+f)--判斷正確的比重
召回率=tt/(tt+ft)--正確判斷正例的比重
漏報率=ft/(tt+ft)--多少個正例被漏判了
虛警率=tf/(tt+tf)--
反映被判為正例樣本中,有多少個是負例
靈敏度=tt/(tt+ft)
特異度=ff/(ff+tf)
【靈敏度=真陽性人數/(真陽性人數+假陰性人數)×100%。正確判斷病人的率。
特異度=真陰性人數/(真陰性人數+假陽性人數)×100%。正確判斷非病人的率。】
英文標示:
召回率 recall;
精確度precision;
準確率accuracy;
漏警概率(missing alarm);
虛警概率(false alarm);
資料探勘之分類
分類的定義 通過學習得到目標函式f 也叫 分類模型 把每個屬性集x對映到乙個預先定義好的類稱號y。相關定義 訓練集 屬性 類標號 模型 測試集 分類與聚類的區別 聚類 無指導的學習,事先沒有標籤,而通過某種成因分析找出事物之間存在聚集性原因的過程。面對一堆資料,將這堆資料分成幾類 分類 有指導的學習...
資料探勘之分類
分類是構造乙個分類模型,輸入樣本的屬性值,輸出對應的類別,將每個樣本對映到預先定義好的類別。分類的演算法分為以下兩步 1 學習步,通過歸納分析訓練樣本集,來建立分類模型,得到分類規則 2 分類步,先用已知的測試樣本集評估分類規則的準確率,如果準確率是可以接受的,則使用該模型對未知類標號的待測樣本集進...
資料探勘之分類演算法
分類是資料探勘 機器學習和模式識別中乙個重要的研究領域。單一的分類方法主要包括 決策樹 貝葉斯 人工神經網路 k 近鄰 支援向量機和基於關聯規則的分類等 還有用於單一分類方法的整合學習演算法,如bagging和boosting等。1 決策樹 主要用於分類和 的技術之一,是以例項為基礎的歸納學習演算法...