一、關聯規則簡介
關聯規則(apriori演算法),又稱為關聯分析。其目的是找出,一堆事物中具有關聯的事物。
關聯規則最經典的案例就是「啤酒與尿布」,沃爾瑪擁有世界上最大的資料倉儲系統,為了能夠準確了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。沃爾瑪資料倉儲裡集中了其各門店的詳細原始交易資料。在這些原始交易資料的基礎上,沃爾瑪利用資料探勘方法對這些資料進行分析和挖掘。碼字不易,喜歡請點贊!!!
乙個意外的發現是:"跟尿布一起購買最多的商品竟是啤酒!經過大量實際調查和分析,揭示了乙個隱藏在"尿布與啤酒"背後的美國人的一種行為模式:在美國,一些年輕的父親下班後經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布後又隨手帶回了他們喜歡的啤酒。
二、關聯規則
關聯規則最重要的就是支援度support和置信度confidence。
支援度的計算方法:
#下面式中x∩y表示x和y同時發生的次數,n表示總事物數
support(x
->y)
=x∩y
/n
置信度的計算方法:
confidence(x
->y)
=support(x
->y)
/support(x
)<=
>
#x∩y表示x和y同時發生的次數,x表示x發生的次數
confidence(x
->y)
=x∩y
/x
最終找到的規則,要滿足支援度和置信度即可。
三、關聯規則使用
關聯規則的使用可以看***這篇部落格,是乙個公司機器學習崗位的筆試題。
機器學習 淺嚐關聯規則
理解關聯規則 首先要感謝一下沃爾瑪 第乙個發現並挖掘出來了關聯規則 沃爾瑪對市場購物籃分析的結果是一組指定商品之間關係模式的關聯規則 乙個典型的規則可以表述為 第乙個關聯規則用通俗易懂的語言來表達就是 如果購買了花生醬和果醬,那麼也很有可能會購買麵包 第二個關聯規則也可以簡單的來表達 就是你把啤酒放...
機器學習實戰 關聯規則
資料探勘就是對資料進行處理,並以某種方式分析源資料,從中發現一些潛在的 有用的資訊,所以資料探勘又稱作知識發現。這裡的 某種方式 就是機器學習演算法。關聯規則作為經典機器學習演算法之一,搞懂關聯規則自然有著很重要的意義。顧名思義,關聯規則就是發現資料背後存在的某種規則或者聯絡。import nump...
機器學習 關聯規則與FP Tree
fp tree演算法只需要遍歷一次事務,然後可以建立fp tree樹形資料結構來表徵事務專案出現的關係。fp tree相比原始事務,將各個事務壓縮到乙個樹,儲存了專案之間的關係和出現頻數,但是規模小得多。我可以直接根據fp tree來獲取所有事務專案集合出現的次數。下面是初始化步驟 1 事務專案排序...