聚類分析(銀行客戶畫像)

2021-08-20 12:23:58 字數 2306 閱讀 8157

# cda 11 聚類分析(客戶畫像)

# 匯入資料

customer

names(customer)

customer1

names(customer1)

#### 11.2---銀行客戶 k均值/層次聚類----####

names(customer1)

#找到聚類數--pam演算法

pamkmd

pamkmd$nc

layout(matrix(c(1,2),1,2))

plot(pamkmd$pamobject)

# 結果:2類

#找到聚類數--輪廓係數

silhouette()

library(cluster)

result

for (i in 2:5)

result

# k=2時輪廓係數最高,k=3時候輪廓係數最小,但是從圖中看存在離群點,因此用聚類法5類來刪掉離群點

#選擇聚類5類,去掉離群值的類

#1.正規化後再聚類

library(clustersim)

customer2

kmd

plot(customer2,col=kmd$cluster)

table(kmd$cluster)

#去掉含有2個異常值的2個類

customer3

# #2.正規化後再聚類

# customer4

# kmd

# plot(customer4,col=kmd$cluster)

# table(kmd$cluster)

# #去掉第二類,因為樣本有2個異常值

# customer5

#3.正規化後再次尋找最優聚類數

customer6

write.csv(customer6,file = "d:\\桃子的資料\\cda\\11 聚類分析\\課件&**-11.客戶畫像\\data\\customer6.csv")

#找到聚類數--pam演算法

pamkmd

pamkmd$nc

layout(matrix(c(1,2),1,2))

plot(pamkmd$pamobject)

#聚類kmd

plot(customer6,col=kmd$cluster)

table(kmd$cluster)

#------ 找到三個類,特徵描述------#

plot(customer6,col=kmd$cluster)

points(kmd$centers,col=1:3,pch=8,cex=2)

table(kmd$cluster)

#對原始資料(未正規化但已經去掉異常值的資料)進行解釋

write.csv(customer3,file = "d:\\桃子的資料\\cda\\11 聚類分析\\課件&**-11.客戶畫像\\data\\customer3.csv")

clust

for (i in 1:3)

for (i in 1:3)

re1# re1$cluster

#資料每個類的均值

kmd$cluster

#rechart作圖

customer4

customer4$cluster

library(recharts)

png("d:\\桃子的資料\\cda\\cluster.png")

epoints(customer4[,c(2:4)],xvar =~income,yvar = ~age,series = ~cluster,

xlab.name = "income:千元",ylab.name = "age:歲",xlab.nameposition = "end",ylab.nameposition = "end",theme = 2)

dev.off()

資料預覽(前5行))

第一類:年老多金型,年齡均值為55歲,收入約9.6萬每年,這類人群財富有所積累,但可能思想保守,可推薦保本型投資的理財產品。

第二類:中年收入不高型,年齡均值為38歲,收入約4.5萬每年,這類人收入較低,可推薦保險。

第三類:富裕青年型,年齡均值為23歲,收入約8.3萬每年,年輕人思想比較開放,具有冒險精神,因此可推薦高獲利高風險的投資產品。

使用者畫像 聚類分析

本來我不打算說這個,但是覺得還是有必要提一句,收集到的資料很多都不能直接使用。需要對資料進行編碼和分類,還要去掉異常值和補全缺失值這些。我這裡將會用到的分析軟體是跟隨我五六年的spss 用了這麼多年依舊不是高手 我就假設這一步大家都做完了。知道了為什麼要因素分析,就談談因素分析的作用,因素分析就是把...

銀行客戶經理系統

2 系統功能特點 1 客戶主體模型的建立與資訊積累 2 高效的客戶經理平台,一目了然的客戶經理操作檯面,直接提供客戶經理各種待辦工作和工作環境,可以按照優先順序設定 3 客戶價值評估與客戶綜合分類,建立利潤貢獻模型,客戶事件的各種成本與費用分攤模型實現賬戶級的價值度計算,通過可設定的指標體系,實現客...

財務客戶聚類分析

coding utf 8 import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt from pandas import to datetime 引入sklearn框架,匯入k m...