本來我不打算說這個,但是覺得還是有必要提一句,收集到的資料很多都不能直接使用。需要對資料進行編碼和分類,還要去掉異常值和補全缺失值這些。我這裡將會用到的分析軟體是跟隨我五六年的spss(用了這麼多年依舊不是高手)。我就假設這一步大家都做完了。
知道了為什麼要因素分析,就談談因素分析的作用,因素分析就是把n個資料先歸歸類,特別相同的就是一類的了,我們選其中一些資料就可以了。這樣因素分析就可以幫我們把n列資料減少到幾列資料。至於因素分析怎麼做,我也不在這裡廢話了。有乙個神奇的老師叫吳明隆,他有一本spss實操,那裡手把手教學。各位可以去自行查閱。
我們已經把資料n列減少到重要的幾個了。在開始聚類之前,還要做一件事就是看一下這些資料的相關性。一般我們選擇中等相關的資料。太相關不能用原因見上一條。太不相關了也別放進去了,畢竟個人收入的資料和隔壁老王的體重資料放在一起也沒什麼大用。相關分析怎麼做也請見吳老師的寶書。
好的,我們終於說到我們的主角了,聚類分析。我曾記得當初我做的時候乙個恩師姐姐建議我,聚類都做一遍。雖然我還不懂她在說什麼。但是就我現在的理解,給大家談一談。首先spss裡有三種聚類方式。見圖。
上面看到啦,這是spss裡的3中聚類方式。我會首先做一下兩步聚類。為啥呢,因為兩步聚類不需要動腦子。為什麼這麼說。就是你丟一堆資料進去,你不需要預設你要聚類成幾類。就是你可以不知道到底有幾類啊,看spss大大的心情啊。兩步聚類把資料型別分分開就可以了,別把連續的放在類別的裡面。就可以了。聚類之後你會得到這樣乙個結果。上圖。
然後到了第二次聚類,k均值聚類。第一步已經知道大概的聚類類別了。我這個是聚出了1類。k均值的時候有乙個聚類數需要你填寫。你就把兩步聚類裡的聚類數填進去就好啦。然後就得到了k均值聚類的結果。我們這樣不斷除錯刪除增加變數的原因是為了讓聚類結果更加穩定。
最後的最後,系統聚類。你可以看到乙個長得很酷的圖,然後可以看看結構什麼的。也是為了確定聚類結果的穩定性。具體操作也自行解決吧。
好啦。最後的結果如果穩定且驗證後效果良好。那你的使用者就真的畫完了。很多人在說每個標籤權重的事情。我個人是這麼理解的,看貴司使用者佔這些分類的多少比較重要。說的更直接點,加權重給每個畫像這個事情,我暫時還沒有知道要怎麼做。如果有牛人用r或者什麼統計軟體完爆我,我真的認真的說,請收我為徒。我真的很想要乙個老師。為了實現我做最好的用研的夢想。
聚類分析(銀行客戶畫像)
cda 11 聚類分析 客戶畫像 匯入資料 customer names customer customer1 names customer1 11.2 銀行客戶 k均值 層次聚類 names customer1 找到聚類數 pam演算法 pamkmd pamkmd nc layout matrix...
如何落地使用者畫像分析?
使用者persona的含義 p 代表基本性 primary research 指該使用者角色是否基於對真實使用者的情景訪談 e 代表移情性 empathy 指使用者角色中包含姓名 和產品相關的描述,該使用者角色是否引起同理心。r 代表真實性 realistic 指對那些每天與顧客打交道的人來說,使用...
如何落地使用者畫像分析?
舉個直觀的例子,通過使用者的行為資料,b使用者今天在蘋果官網購買了iphone6 反映出的使用者標籤可能是 果粉1 而 a使用者三天前在天貓收藏了iphone6 反映出的標籤可能只是 果粉0.448 這些可以給不同使用者打上不同的標籤和權重。有了標籤和權重後,這將在後續的營銷決策中發揮指導作用,比如...