概念:規則前件;規則後件;覆蓋率;準確率
互斥規則:每條記錄至多被r中的一條規則覆蓋
窮舉規則:每條記錄都至少被r中的一條規則覆蓋
有序規則:規則集中的規則按照優先等級排序,有序的規則集被稱為決策表
無序規則:把記錄指派到得票最多的類
基於規則的排序方案:依據規則質量的某種度量對規則排序,確保每個記錄都由覆蓋他的最好的規則來分類。
基於類的排序方案:屬於同一類的規則在規則集中一起出現。
建立基於規則的分類器,關鍵是提取一組規則來識別屬性和類標號之間的關鍵聯絡。提取分類規則的方法兩大類:直接法和間接法
順序覆蓋演算法:規則基於某種評估度量以貪心的方式增長
1.learn-one-rule函式
learn-one-rule函式的目標是提取乙個分類規則,該規則覆蓋訓練集中的大量正例,沒有或僅覆蓋少量反例。由於搜尋空間呈指數大小,尋找計算開銷很大,.learn-one-rule函式通過一種貪心的方式的增長規則解決問題。產生初始規則,不斷對該規則求精,直到滿足某種終止條件。
規則增長策略:從一般到特殊和從特殊到一般。
規則評估:規則增長過程中,需要一種評估度量來確定應該新增或刪除哪個合取項。準確率or覆蓋率
(1)使用統計檢驗剪除覆蓋率較低的規則,計算似然比統計量
(2)考慮規則覆蓋率的評估度量
(3)考慮規則的支援度計數的評估度量
foil資訊增益:
五 分類 其它分類技術5
結構風險最小化理論 給出了線性分類器邊緣與其泛化誤差之間關係的形式化解釋 1.線性決策邊界wx b 0 2.線性分類器的邊緣 3.學習線性svm模型 拉格朗日乘子法 kkt條件 支援向量 對偶拉格朗日函式 軟邊緣,學習允許一定訓練錯誤的決策邊界 在優化問題的約束中引入正值的鬆弛變數 鬆弛變數提供了決...
五 分類和協議
分類和協議 有時候在處理類定義的時候,可能想要為其新增一些新方法,但是由不想通過新建很多子類來繼承並且增加新方法,這個時候分類就有了用處。相當於在使用的時候只要註明是哪個分類。下面用例子來說明 import fraction.h inte ce fraction tests void printft...
MachineLearning入門 1(分類)
機器學習的演算法分為兩大類 監督學習和無監督學習。監督學習 即在機器學習的過程中提供對錯指示。一般是在資料組中包含最終結果 0,1 通過演算法讓機器減少誤差。這一類學習主要應用於分類與 regression classify 監督學習從給定的訓練資料集中學習出乙個目標函式,當新的資料到來時,可以根據...