Weka機器學習 06 關聯

2021-10-10 07:27:18 字數 906 閱讀 7222

關聯規則反映了乙個物件與其他物件之間的相互依賴關係,如果多個物件之間存在一定的關聯關係,那麼,其中乙個物件就能夠通過其他物件進行**。

關聯規則通常需要根據覆蓋率和準確率進行修剪。覆蓋率也稱為支援度,支援度計數是應用規則後**正確的例項的數量,支援度是支援度計數與例項總數的比值。準確率也成為置信度,表示支援度計數與應用規則的例項數量的比值。

由於僅對高覆蓋量的關聯規則感興趣,因此關聯只尋找能夠達到預定的最小覆蓋量的屬性值對組合,這些組合稱為項集,其中的人乙個屬性值對稱為乙個項。

weka使用associate(關聯)標籤頁來處理關聯問題。

(1)apriori關聯規則

執行結果:

對於天氣資料集,利用apriori關聯規則,輸出結果為10條規則

規則採用「前件num.1==>結論num.2」的形式表示,前件後面的數字表示有多少個例項滿足前件,結論後面的數字表示有多少個例項滿足整個規則,這就是規則的支援度。

因為在所有10個規則中,這兩個數相等,所有每個規則的置信度都正好是1.

這部分表示,演算法的最小置信度為0.9,這是預設值,在輸出中已經顯示未minimum metric:0.9。輸出中還顯示number of cycles performed(執行的次數)為17,該值表明apriori演算法實際執行17次以產生這些規則。minimum support(最小支援度),所生成的輸出值為0.15(對應於0.15*14=2例項)

Weka學習之關聯規則分析

步驟 一 選擇資料來源 二 選擇要分析的字段 三 選擇需要的關聯規則演算法 四 點選start執行 五 分析結果 演算法選擇 apriori演算法引數含義 1.car 如果設為真,則會挖掘類關聯規則而不是全域性關聯規則。2.classindex 類屬性索引。如果設定為 1,最後的屬性被當做類屬性。3...

機器學習 淺嚐關聯規則

理解關聯規則 首先要感謝一下沃爾瑪 第乙個發現並挖掘出來了關聯規則 沃爾瑪對市場購物籃分析的結果是一組指定商品之間關係模式的關聯規則 乙個典型的規則可以表述為 第乙個關聯規則用通俗易懂的語言來表達就是 如果購買了花生醬和果醬,那麼也很有可能會購買麵包 第二個關聯規則也可以簡單的來表達 就是你把啤酒放...

機器學習實戰 關聯規則

資料探勘就是對資料進行處理,並以某種方式分析源資料,從中發現一些潛在的 有用的資訊,所以資料探勘又稱作知識發現。這裡的 某種方式 就是機器學習演算法。關聯規則作為經典機器學習演算法之一,搞懂關聯規則自然有著很重要的意義。顧名思義,關聯規則就是發現資料背後存在的某種規則或者聯絡。import nump...