資料探勘怎麼做關聯性分析呢?

2021-10-09 22:13:21 字數 1101 閱讀 8229

接下來我們以購物籃這個典型的應用來為大家介紹,在購物場景下,是如何做關聯分析,並幫助購物者更快速買到自己想要的東西。

全文講解中所用到的產品是由億信華辰提供的資料探勘平台豌豆dm。

整個過程分為以下幾個步驟:

應用目標:從訂單資料集中找出關聯度較高的商品。

下圖的資料集為某**的訂單資料集(1000條訂單號,20個商品類別)。

首先通過豌豆dm提供的資料探索功能,檢視資料是否存在缺失值,如果缺失應通過資料預處理功能,剔除缺失的資料。通過資料探索發現,該資料集的完整性較好,不需要做資料預處理。

然後建立關聯規則的挖掘過程,選擇fp-growth或apriori演算法來訓練模型,得到我們需要的關聯規則。下圖例子中,我們認為支援度大於10%,可信度大於60%的規則,是客戶經常同時購買的商品。如客戶經常就會將喜力啤酒、蘇打、餅乾一起購買。

這便是**當發現你購買了啤酒或蘇打,會推薦你購買餅乾的原因。

得到關聯規則模型結果後,我們可以發布該模型到模型庫,以供後續模型應用使用。

最後在模型應用介面,我們只需簡單的拖拽,即可完成模型應用的製作。模型應用以**和推薦圖的形式,展現了推薦商品的規則。當關聯規則較多的時候,我們也可以通過篩選輸入商品的引數,快速查詢該商品的推薦規則。

從上圖我們發現:

這就是豌豆dm關聯分析應用的魅力所在,讓不知不覺中為使用者提供了很大的便利。

資料探勘怎麼做

理解你的資料探勘要解決什麼業務問題 必須從商業或者從業者的角度去了解專案的要求和最終目的,去分析整個問題涉及的資源 侷限 設想,甚至是風險 意外等情況,從業務來到業務中去 重點 在業務理解的基礎上,對掌握的資料要有乙個清晰明確的認識 了解有哪些資料,那些可能對目標有影響的資料,哪些是冗餘資料 哪些是...

怎麼做資料的EDA分析?

探索性資料分析 exploratory data analysis,簡稱eda 我的理解是,所謂 探索 就是自己不受規則約束 用各種方法去找資料的特點 規律。首先要敢於假設,不設限。拿到一堆資料後,多少會有點猜想,那麼就可以去大膽嘗試和驗證 怎麼驗證猜想乃至挖掘出更多關係與規律呢?要多做圖,通過將資...

大資料時代的資料探勘是怎麼做的?

一 資料探勘在大資料時代,資料的產生和收集是基礎,資料探勘是關鍵,資料探勘可以說是大資料最關鍵也是最基本的工作。通常而言,資料探勘也稱為datamining,或知識發現knowledge discovery from data,泛指從大量資料中挖掘出隱含的 先前未知但潛在的有用資訊和模式的乙個工程化...