你真的懂使用者畫像嗎?

2021-09-17 06:05:40 字數 2128 閱讀 9912

在移動網際網路時代,精細化運營成為企業重要的競爭力,此時,「使用者畫像」的概念也應運而生。使用者畫像是指,在大資料時代,我們通過對海量數字資訊進行清洗、聚類、分析,從而將資料抽象成標籤,利用這些標籤將使用者形象具體化,從而為使用者提供有針對性的服務。在下文中,我們將以個推使用者畫像產品為例,為你詳解「使用者畫像」的技術特點和使用價值。

使用者畫像的形成需要經歷四個過程,主要包括資料收集、資料清洗、資料建模分析、資料產出。其中,資料清洗和資料建模統稱資料處理,在經過資料處理之後,個推憑藉多年積累的大資料能力,以獨特的冷、熱、溫資料維度分析進行資料產出形成使用者畫像。

在資料處理階段,個推使用者畫像產品的大資料計算架構採用了kafka分布式發布訂閱訊息系統,這一系統具有高吞吐量、高穩定性的特點。資料清洗可利用hadoop、spark實現裝置唯一性識別、行為資料的清洗等,從而去除冗餘資料。這一過程支援互動計算和多種複雜演算法,同時,它還支援資料實時/離線計算。

在資料建模的過程中,主要用了機器學習中的聚類(無監督學習)和深度學習技術,這能讓模型對使用者行為資料主動學習,進行行為判斷,由此產出使用者標籤。

之後,資料的產出會形成冷資料畫像、溫資料回溯、熱資料場景和定製化標籤四種畫像。

冷資料畫像,是指基於大資料分析出使用者的屬性,改變概率較小的資料,如使用者的年齡段、性別等。

定製化標籤是將個推資料與第三方資料結合起來,共同建模得出具有價值的特徵標籤。總的來說,個推使用者畫像產品不僅能產出通用的標籤維度,也有定製化標籤的輸出能力。

(1)標籤體系設計。開發者需要先了解自身的資料,確定需要設計的標籤形式。

(4)使用者畫像特徵層構建,即將每乙個資料進行特徵化。

(5)畫像標籤規則+演算法建模,兩者缺一不可。在實際的應用中,演算法難以解決的問題,利用簡單的規則也可以達到很好的效果。

(6)利用演算法對所有使用者打標籤

(7)畫像質量監控。在實際的應用中,使用者畫像會產生一定的波動,為了解決這個問題,個推建設了相應的監控系統,對畫像的質量進行監控。

總之,個推使用者畫像構建的整體流程,可以概況為三個部分:

第三,畫像資訊表。表中應有四種資訊:裝置基礎屬性;使用者基礎畫像,包括使用者的性別、年齡段、相關消費水平等;使用者興趣畫像,即使用者更有興趣的方向,比如使用者更偏好拼團還是海淘;使用者其它畫像等。

在個推使用者畫像構建的過程中,機器學習佔據了較為重要的位置。機器學習主要應用在海量裝置資料採集、資料清洗、資料儲存的過程。

在這裡,我們需要解釋一下其中所涉及到的相似性建模技術。相似性建模可模擬於聚類建模,它是無監督學習中的一種,它指的是尋找資料中的特徵,把具有相同特徵的資料聚集在一組,賦予這些聚集在一起的資料相同的特徵標籤,從而給這些具有這些特性的使用者推送相同的內容。

此外,如上文所言,個推使用者畫像能夠結合第三方資料做定製化建模,通過雙方共同建模得出顯著價值和特徵標籤,依據不同標籤向使用者推送不同的內容。這樣不僅能保證推送的內容更精準,覆蓋面也更廣泛,而且標籤增補的方式,也可以很大程度上提公升流量價值。

個推使用者畫像sdk的接入主要有兩個方式:

你真的懂使用者畫像嗎?

在移動網際網路時代,精細化運營成為企業重要的競爭力,此時,使用者畫像 的概念也應運而生。使用者畫像是指,在大資料時代,我們通過對海量數字資訊進行清洗 聚類 分析,從而將資料抽象成標籤,利用這些標籤將使用者形象具體化,從而為使用者提供有針對性的服務。在下文中,我們將以個推使用者畫像產品為例,為你詳解 ...

你真的懂使用者畫像嗎?

在移動網際網路時代,精細化運營成為企業重要的競爭力,此時,使用者畫像 的概念也應運而生。使用者畫像是指,在大資料時代,我們通過對海量數字資訊進行清洗 聚類 分析,從而將資料抽象成標籤,利用這些標籤將使用者形象具體化,從而為使用者提供有針對性的服務。在下文中,我們將以個推使用者畫像產品為例,為你詳解 ...

你真的懂使用者畫像嗎?

在移動網際網路時代,精細化運營成為企業重要的競爭力,此時,使用者畫像 的概念也應運而生。使用者畫像是指,在大資料時代,我們通過對海量數字資訊進行清洗 聚類 分析,從而將資料抽象成標籤,利用這些標籤將使用者形象具體化,從而為使用者提供有針對性的服務。在下文中,我們將以個推使用者畫像產品為例,為你詳解 ...