# cda 11 聚類分析(客戶畫像)
# 匯入資料
customer
names(customer)
customer1
names(customer1)
#### 11.2---銀行客戶 k均值/層次聚類----####
names(customer1)
#找到聚類數--pam演算法
pamkmd
pamkmd$nc
layout(matrix(c(1,2),1,2))
plot(pamkmd$pamobject)
# 結果:2類
#找到聚類數--輪廓係數
silhouette()
library(cluster)
result
for (i in 2:5)
result
# k=2時輪廓係數最高,k=3時候輪廓係數最小,但是從圖中看存在離群點,因此用聚類法5類來刪掉離群點
#選擇聚類5類,去掉離群值的類
#1.正規化後再聚類
library(clustersim)
customer2
kmd
plot(customer2,col=kmd$cluster)
table(kmd$cluster)
#去掉含有2個異常值的2個類
customer3
# #2.正規化後再聚類
# customer4
# kmd
# plot(customer4,col=kmd$cluster)
# table(kmd$cluster)
# #去掉第二類,因為樣本有2個異常值
# customer5
#3.正規化後再次尋找最優聚類數
customer6
write.csv(customer6,file = "d:\\桃子的資料\\cda\\11 聚類分析\\課件&**-11.客戶畫像\\data\\customer6.csv")
#找到聚類數--pam演算法
pamkmd
pamkmd$nc
layout(matrix(c(1,2),1,2))
plot(pamkmd$pamobject)
#聚類kmd
plot(customer6,col=kmd$cluster)
table(kmd$cluster)
#------ 找到三個類,特徵描述------#
plot(customer6,col=kmd$cluster)
points(kmd$centers,col=1:3,pch=8,cex=2)
table(kmd$cluster)
#對原始資料(未正規化但已經去掉異常值的資料)進行解釋
write.csv(customer3,file = "d:\\桃子的資料\\cda\\11 聚類分析\\課件&**-11.客戶畫像\\data\\customer3.csv")
clust
for (i in 1:3)
for (i in 1:3)
re1# re1$cluster
#資料每個類的均值
kmd$cluster
#rechart作圖
customer4
customer4$cluster
library(recharts)
png("d:\\桃子的資料\\cda\\cluster.png")
epoints(customer4[,c(2:4)],xvar =~income,yvar = ~age,series = ~cluster,
xlab.name = "income:千元",ylab.name = "age:歲",xlab.nameposition = "end",ylab.nameposition = "end",theme = 2)
dev.off()
資料預覽(前5行))
第一類:年老多金型,年齡均值為55歲,收入約9.6萬每年,這類人群財富有所積累,但可能思想保守,可推薦保本型投資的理財產品。
第二類:中年收入不高型,年齡均值為38歲,收入約4.5萬每年,這類人收入較低,可推薦保險。
第三類:富裕青年型,年齡均值為23歲,收入約8.3萬每年,年輕人思想比較開放,具有冒險精神,因此可推薦高獲利高風險的投資產品。
使用者畫像 聚類分析
本來我不打算說這個,但是覺得還是有必要提一句,收集到的資料很多都不能直接使用。需要對資料進行編碼和分類,還要去掉異常值和補全缺失值這些。我這裡將會用到的分析軟體是跟隨我五六年的spss 用了這麼多年依舊不是高手 我就假設這一步大家都做完了。知道了為什麼要因素分析,就談談因素分析的作用,因素分析就是把...
銀行客戶經理系統
2 系統功能特點 1 客戶主體模型的建立與資訊積累 2 高效的客戶經理平台,一目了然的客戶經理操作檯面,直接提供客戶經理各種待辦工作和工作環境,可以按照優先順序設定 3 客戶價值評估與客戶綜合分類,建立利潤貢獻模型,客戶事件的各種成本與費用分攤模型實現賬戶級的價值度計算,通過可設定的指標體系,實現客...
財務客戶聚類分析
coding utf 8 import numpy as np import pandas as pd import matplotlib import matplotlib.pyplot as plt from pandas import to datetime 引入sklearn框架,匯入k m...