使用者畫像 1

2022-06-28 13:57:06 字數 1466 閱讀 3796

1、什麼是使用者畫像?

使用者畫像是對使用者特徵資料的一種建模模型,通過調研、資料探勘了解使用者,洞察使用者,基於不同需求目標,將他們分為不同的型別,並對每種特徵屬性進行抽象,歸納,產出使用者特有的特徵標籤,幫助業務更好的理解使用者。

總結一句話:使用者資料特徵標籤化。

2、資料標籤化

基於資料的不同類別可以大致劃分為三類,策略挖掘、邏輯挖掘以及模型挖掘。

策略挖掘像外賣偏好、遊戲偏好以及有車一族等;

邏輯挖掘基於業務特定需求產出對應標籤,常見的消費屬性中的客單價、消費金額、消費頻次等,有統一的生成邏輯,只需基於業務上游資料進行加工即可。

模型挖掘:使用模型挖掘的標籤通常對標籤覆蓋有一定的要求,常見的諸如年齡、性別、收入水平,教育程度等。建模過程中涉及機器學習、資料探勘演算法,譬如監督學習(分類、回歸)、無監督學習(聚類、關聯分析等)以及神經網路對時序性資料建模,乃至增強學習演算法。

基於資料型別可以分為以下幾種:

人口屬性(基本屬性):年齡、性別;

興趣偏好:消費偏好,運動偏好,購物時間偏好等;

特徵人群:有車、有房、旅遊達人等;

使用者分級:消費能力、收入水平、消費水平等;

lbs屬性:常住地、工作商圈、家、公司等;

使用者行為:消費屬性(客單價、訂單金額等級等),瀏覽頻次、交易頻次等;

業務標籤:契合具體業務產出對應需求標籤。

3、標籤分析以及洞察

將挖掘好的標籤落盤到對應資料表,通過查詢對應id對應資料可以洞察該使用者在不同屬性下對應的特徵分布情況,可以更好地服務使用者,為業務推送以及引流、**人群分析,人群圈選等提供重要支援。

4、畫像資料探勘整體架構

資料收集--->資料清洗----->特徵工程------>標籤建模----->訓練**----->質量評估------->線上應用----->反饋優化;

資料收集:資料探勘的天花板是資料本身,常見的資料主要來自於日誌打點、通過埋點上報以及爬蟲技術收集,通常使用大資料形式進行資料儲存。

特徵工程:主要針對資料進行處理,涉及異常值過濾、資料易購轉同構、資料加工(歸

一、標準等)。

特徵維護:既方便當前標籤的正常迭代,也方便後續挖掘新的標籤,符合一定的通用普適性,對整體資料進行梳理:使用者資料大體上可以分為靜態賬號屬性資料,諸如註冊時間,等級,積分等,以及lbs資料(常住地以及活動區域型別等)以及動態的行為資料(購買、搜尋、收藏等),在此基礎上按照一定維度對資料進行劃分。

還可以考慮接入外部資訊例如常住地人群的平均消費水平,地段,**量等,解決資料稀疏問題。

機器學習模型:針對不同的業務需求使用不同模型進行訓練,常見的技術包括spark mllib、xgb、tensorflow等;

應用介面:標籤生成後,交付業務方使用,可以交付資料表形式以及建立畫像平台,通過平台直接調取顯示資料,減少上手成本。

5、困難與挑戰

標籤質量至關重要,這是乙個系統性工程,需要長期維護與優化;建立完善的實時資料流,及時有效捕捉使用者畫像特徵變化。

參考:美團機器學習實踐

使用者畫像資料開發 1

4 1 資料倉儲基礎表概覽 資料倉儲已經做好的工作 資料已經從源資料庫抽取裝載到bdm層 fdm層根據bdm層已經填入按天分割槽的資料 沒有每天的排程,也沒有輔助系統,都是手動生成的資料 資料是造的測試資料,只有dt 2015 01 01的 bdm層資料表 貼源的緩衝表 bdm b2c active...

使用者畫像 如何構建使用者畫像

1 使用者畫像是什麼 what 2 為什麼要構建使用者畫像 why 3 如何構建使用者畫像 how 下文將會對這三部分內容做詳細介紹。1 什麼是使用者畫像 使用者畫像是一種用來描述產品目標使用者特徵的使用者研究方法,在實際操作的過程中往往會以最為淺顯和貼近生活的標籤將使用者的屬性 行為與需求聯絡起來...

使用者畫像 使用者畫像之新使用者分類

使用者畫像的簡單介紹 使用者畫像是一種勾畫目標使用者 聯絡使用者訴求與設計方向的有效工具,利用使用者的基本屬性,訪問特徵,交易特徵,社交特徵及風險特徵等組合的資訊形成一些列的使用者標籤組合稱之為使用者畫像。構建使用者畫像的目的 使用者運營 活動運營過程中,制定策略,對使用者精準投放策略,促使平台引流...