資料探勘之關聯分析三(規則的產生)

2022-07-16 16:42:13 字數 879 閱讀 7217

忽略那些前件和後件為空的規則,每個頻繁k項集能夠產生\(2(2^k-1)\)個關聯規則。將頻繁項集y劃分為兩個非空子集x和y-x,使得\(x \to y-x\)能滿足置信度閾值,就可以得到滿足條件的規則。

在計算規則的置信度時並不需要再次掃瞄事務資料集,因為產生規則的頻繁項集和它們的子集也都是頻繁項集,我們在提取頻繁項集時,已經計算過它們的支援度計數,因而不需要再掃瞄所有的資料集。

置信度不像支援度那樣具有任何單調性。但是具有以下定理

定理:如果規則\(x \to y-x\)不滿足置信度閾值,則形如$ x' \to y-x'$的規則也一定不滿足置信度閾值,其中x'是x的子集。x'的支援度計數根據置信度計算公式可推理得到

apriori演算法使用一種逐層方法來產生關聯規則,其中層數對應於規則的構建中的項數。初始提取規則後件只有乙個項的所有高置信度規則,然後使用這些規則來產生新的候選規則。

如果$ \to \(和\) \to \(是兩個高置信度的規則,則通過合併兩個規則的後件產生候選規則,如果格中的任意結點置信度較低,則根據定理應該剪去該枝,假設\) \to a $具有較低的置信度,則根據定理的條件剪去左右子集的枝。

資料探勘之關聯分析一(基本概念)

資料探勘之關聯分析二(頻繁項集的產生)

資料探勘之關聯分析三(規則的產生)

資料探勘之關聯分析四(連續屬性處理)

資料探勘之關聯分析五(序列模式)

資料探勘之關聯分析六(子圖模式)

資料探勘之關聯分析七(非頻繁模式)

資料探勘之關聯規則分析

關聯規則分析也稱為購物籃分析,最早是為了發現超市銷售資料庫中不同的商品之間的關聯關係。用於尋找資料集中各項之間的關聯關係。根據所挖掘的關聯關係,可以從乙個屬性的資訊來推斷另乙個屬性的資訊。當置信度達到某一閾值時,可以認為規則成立。常用的關聯規則演算法 演算法名稱 演算法描述 apriori 關聯規則...

資料探勘之關聯規則

在資料探勘的知識模式中,關聯規則模式是比較重要的一種。屬於描述性模式,發現關聯規則的演算法屬於無監督學習的方法。關聯規則通過量化的數字描述物品甲的出現對物品乙的出現有多大的影響。一般用4個引數來描述關聯規則的屬性 1.可信度 子集 可信度是指出現了物品集a的事務t中,物品集b也同時出現的概率有多大。...

資料探勘 關聯規則挖掘

關聯規則 association rule 是資料中所蘊含的一類重要規律。關聯規則挖掘的目標是在資料專案中找出所有的併發關係 cooccurrence relationships 這種關係也稱為關聯 association 關聯規則挖掘的經典應用是購物籃 market basket 關聯規則挖掘並沒...