案例 基於RMF的使用者價值度分析

2021-09-29 18:53:10 字數 1898 閱讀 8154

通過python實現rfm,並分析使用者價值度,最終給到運營做分析使用。

案例資料是某企業2023年的部分抽樣資料,資料**於銷售系統,主要是使用者訂單記錄。

檢視前5行資料,包含四個字段。

主要檢視資料概覽、缺失值情況、異常值情況

(1)通過describe()可檢視整體資料的基本描述性統計資訊,由於資料集中只有amountinfo欄位有檢視其資訊的必要,因此這邊只看訂單金額的情況。

根據上圖的結果可以看出:訂單金額最小值為0.5,而最大訂單金額達3w+,極值差距很大;標準差也很大,說明資料波動非常明顯;

#經過與業務方溝通後確認,最大訂單的訂單金額有效,為某使用者一次性購買多個大家電商品;而訂單金額為0.5元的訂單屬於**優惠券生成的訂單,這些訂單用來為使用者消費時提供優惠券,沒有實際意義,因此這些資料需要剔除。

(2)檢視空值情況

orderdate、amountinfo兩個字段含有空值記錄;

共有10條記錄含有空值情況,資料量小,因此可以直接剔除。

包括資料異常處理、格式轉換

資料型別轉換:

此處目的是為了實現後續的時間間隔的計算,因此需要進行轉換。

資料準備工作:

分別計算r、f、m三個原始變數的資料,主要通過groupby進行計算。

通過時間間隔是計算r的基礎,然後對r、f、m三個變數使用分數字法做區間劃分,使用pd.cut的方法,設定5份。

根據rfm的兩種得分方法分別計算出結果存入,具體如下:

#以下為本人自己的分析思路,僅供參考。

觀察以上資料發現rfm_score2(組合得分)的組合方式只有14種,因此想要知道這14種rfm得分的分布頻率如何;

觀察上圖結果得到:

(1)總體客戶消費狀態不太好,分布最多的五種rmf得分分別是:511、411、311、211、111,說明最近消費的客戶的消費頻率低、消費金額少。

(2)而我們觀察到三個方面表現都很好的得分為555只有乙個使用者,該使用者應該引起會員管理部門的重點關注。

基於rfm得分業務方得到這樣的結論

錄入資料庫的rfm得分資料已經應用到其他資料模型中,成為建模輸入的關鍵維度特徵之一。同時,該模型已經作為定時任何每週一早晨上班前執行一次。

———————————分隔符—————————————

結論中紅色部分是我沒看明白的部分,最後兩點不知是否是經過兩周的觀察得出的結論,希望有心人士可以為我解答一下。

基於Python的情感分析案例

情感極性分析的目的是對文字進行褒義 貶義 中性的判斷。在大多應用場景下,只分為兩類。例如對於 喜愛 和 厭惡 這兩個詞,就屬於不同的情感傾向。示例1 好評 示例2 差評 讀取文字檔案 def text f1 open e 工作檔案 情感分析案例1 good.txt r encoding utf 8 ...

基於自然語義分析的大綱近似度分析

工作中遇到這樣一種困惑,需要從幾個基地的碩大無比的excel檔案中比對對某個裝置的維修大綱是否一致。比如有的基地要求 在50 fp平台下修改gk引數 而有的基地同一件事情的描述是 修改gk引數 50 fp 用vlookup不太能解決這種問題。於是乎研究了下語義識別,使用tfidf演算法可以比較有效的...

基於資料探勘的客戶流失分析案例

客戶挽留在很多行業都是乙個備受關注的問題,比如電信 銀行 保險 零售等。要做客戶挽留就需要對客戶流失進行預警 客戶流失原因分析 客戶滿意度或忠誠度研究 客戶生命週期研究等相關問題進行深入而全面的分析。例如,對客戶的行為特徵進行分析,可以了解有多少客戶流失,客戶是什麼時候流失的,以及客戶是如何流失的等...