資料探勘演算法和實踐(九) 關聯規則 Apriori

2021-10-06 06:19:10 字數 402 閱讀 4935

幾個重要概念:支援度、置信度、提公升度

apriori 演算法的工作原理

在實際工作中,我們該如何進行關聯規則挖掘

舉乙個超市購物的例子,下面是幾名客戶購買的商品列表:

訂單編號

購買商品 1

牛奶、麵包、尿布

2可樂、麵包、尿布、啤酒

3牛奶、尿布、啤酒、雞蛋

4麵包、牛奶、尿布、啤酒

5麵包、牛奶、尿布、可樂

支援度是個百分比,它指的是某個商品組合出現的次數與總次數之間的比例。支援度越高,代表這個組合出現的頻率越大。

我們看啤酒出現了3次,那麼5筆訂單中啤酒的支援度是3/5=0.6。同理,尿布出現了5次,那麼尿布的支援度是5/5=1。尿布和啤酒同時出現的支援度是3/6=0.6。

它指的就是當你購買

資料探勘 關聯規則和Apriori演算法

1.1什麼是資料探勘?1.2從資料中發現知識的步驟 1.3資料探勘的任務 1.傳統資料探勘任務 2.網際網路時代的資料探勘任務 社交網路分析 商品推薦 網際網路搜尋排序 網際網路廣告 1.4相關領域 1.5 資料探勘的方法 資料探勘的方法有很多種,常見的有 監督學習 或者稱為分類 無監督學習 或者稱...

資料探勘 關聯規則挖掘

關聯規則 association rule 是資料中所蘊含的一類重要規律。關聯規則挖掘的目標是在資料專案中找出所有的併發關係 cooccurrence relationships 這種關係也稱為關聯 association 關聯規則挖掘的經典應用是購物籃 market basket 關聯規則挖掘並沒...

資料探勘之關聯規則挖掘(Apriori演算法)

一 概述 本篇博文主要闡述資料探勘相關的關聯規則挖掘的演算法 apriori演算法 主要介紹關聯規則的基本概念 apriori演算法原理和apriori演算法例項,文章末尾處附加apriori演算法源程式。二 關聯規則挖掘的基本概念 關聯規則挖掘發現大量資料中項集之間有趣的關聯關係。如果兩項或者多項...