1)構建k-means聚類,lrftc優化模型對使用者價值識別
客戶價值識別演算法公升級:
模型目標就是對浙旅集團會員價值識別,即通過浙旅集團會員畫像資料識別出不同價值的客戶。識別會員價值應用最廣泛的模型是通過三個指標(最近消費時間間隔(recency)、消費頻率(frequency)和消費金額(monetary))來進行會員細分,識別出**值的會員客戶,簡稱rfm.
但是,針對浙旅集團lrftc模型,如果採用傳統的rfm模型分析的屬性分箱方法,如圖一所示,(它是依據屬性的平均值進行劃分,其中大於平均值的表示↑,小於平均值的表示為↓),雖然也能識別最有價值的客戶,但是細分的客戶群太多,提高了針對性營銷的成本。因此,我們對傳統模型進行改進,找到適用於集團客戶模型。通過對浙旅集團客戶價值的lrftc模型的五個指標進行k-means聚類,識別出最有價值會員客戶。
lrftc模型就是基於浙旅集團多模組業務特性優化而來,我們將會員關係長度l、消費間隔r、消費頻率f、會員與浙旅業務消費粘粘性t和購買服務累計金額c五個指標作為浙旅識別客戶價值指標(見下表)
表:指標含義模型
l r
f t
c 浙旅lrftc模型
會員註冊時間
距觀測視窗結束
的月數
會員最近一次購買產品&服務距觀測視窗結束的月數
會員在觀測視窗內購買浙旅旅遊服務&產品次數
客戶在觀測視窗期間涉及浙旅業務板塊數量(8+1)
會員在觀測視窗內累計花費金額
注:表中觀測視窗意思為某個固定時間段。如,7年5月至18年五月為觀察視窗
2)浙旅會員價值分析的總體流程如圖:
圖:浙旅會員資料探勘建模流程
3)客戶價值特徵分析
通過lrftc模型分析方法研究浙旅集團業務場景,對客戶的五個識別指標進行標準化處理,利用k-means聚類結果進行特徵分析,經過分析我們發現,每個客戶群都有顯著不同的表現特徵,基於該特徵描述,我們定義五個等級的客戶識別類別:重要客戶、重要發展客戶、重要挽留客戶、一般客戶、低價值客戶。
(ps:克麗緹娜改為浙旅,不會p圖)
根據每個客戶型別的特性,對各類客戶群進行客戶價值排名,其結果如下表所示。針對不同型別的客戶群提供不同的產品和服務,提公升重要發展客戶的價值、穩定和延長重要保持客戶的高水平消費、防範重要挽留客戶的流失並積極進行關係恢復。
客戶群
排名
排名含義
客戶群1 1
重要保持客戶
客戶群5
2 重要發展客戶
客戶群2
3 重要挽留客戶
客戶群4
4 一般客戶
客戶群3
5 低價值客戶
協同過濾推薦演算法主要的功能是**和推薦。演算法通過對使用者歷史行為資料的挖掘發現使用者的偏好,基於不同的偏好對使用者進行群組劃分並推薦品味相似的商品。簡單的說就是:人以類聚,物以群分。(ps:為了簡化演算法模型闡述,下面,我們統一將浙旅的服務產品稱為商品)
我們模擬了三個浙旅集團的使用者對4個集團業務產品**的的評分,來說明如何通過使用者對浙旅,不同業務**產品的態度和偏好尋找相似的使用者。
(將上圖產品product1-product4分別改為汽車租賃、康養醫療、酒店服務、旅遊投資)
圖中是為使用者c推薦的產品的協同過濾演算法結果,可以看出使用者c與使用者d、e皮爾遜係數接近於1,相似度非常高,再者在使用者相似度非常高的情況下,可以直**到,商品c的推薦指數最高,商品b的推薦指數最低。所以,為使用者c進行排序推薦(圖中的所得的推薦指數由指標加權得來)。
大資料 案例
個人認為bi其實就是報表 tableau 是一款極速開發和實現的bi工具,適用於非專業it技術人員 上手快 tableau財務的功能模組有五個 server desktop reader online moblie 其中前三個為我們最常用的模組 desktop為桌面版的開發工具,可以進行畫圖 做報表...
大資料公司挖掘資料價值的49個典型案例
對於企業來說,100條理論確實不如乙個成功的標桿有實踐意義,本文的主旨就是尋找 正在做 大資料的49個樣本。本文力圖從企業運營和管理的角度,梳理出發掘大資料價值的一般規律 一是以資料驅動的決策,主要通過提高 概率,來提高決策成功率 二是以資料驅動的流程,主要是形成營銷閉環戰略,提高銷售漏斗的轉化率 ...
大資料的資料探勘(1)
大資料的特徵 hace 原則 large volume,heterogeneous,autonomous sources with distributed and decentralized control,and seeks to explorecomplex and evolving relat...