1.概述
從使用者模型維度的劃分可以看出,
屬性和興趣維度的使用者模型都可以歸入使用者畫
像(user
profile)的範疇。所謂使用者畫像,簡單來說就是對使用者的資訊進行標籤
化。如圖
所示。一方面,標籤化是對使用者資訊進行結構化,方便計算機的識別
和處理;另一方面,標籤本身也具有準確性和非二義性,也有利於人工的整理、
分析和統計。
使用者資訊標籤化
使用者屬性
指相對靜態和穩定的人口屬性,例如:性別、年齡區間、地域、受教育
程度、學校、公司……這些資訊的收集和建立主要依靠產品本身的引導、調查、
第三方提供等。
微博本身就有比較完整的使用者註冊引導、
使用者資訊完善任務、
認證使用者審核、
以及大量的合作物件等,
在收集和清洗使用者屬性的過程中,
需要注意的主要是標籤的規範化以及不同**資訊的交叉驗證。
使用者興趣
則是更加動態和易變化的特徵,首先興趣受到人群、環境、熱點事件、
行業……等方面的影響,
一旦這些因素發生變化,
使用者的興趣容易產生遷移;
其次,使用者的行為(特指在網際網路上的行為)多樣且碎片化,不同行為反映出來的
興趣差異較大。接下來主要介紹一下微博畫像中興趣維度的構建方法。
微博 使用者畫像 微博的使用者畫像是怎樣構建的
1.概述 從使用者模型維度的劃分可以看出,屬性和興趣維度的使用者模型都可以歸入使用者畫像 user profile 的範疇。所謂使用者畫像,簡單來說就是對使用者的資訊進行標籤化。如圖1所示。一方面,標籤化是對使用者資訊進行結構化,方便計算機的識別和處理 另一方面,標籤本身也具有準確性和非二義性,也有...
目標客戶畫像 使用者畫像是什麼?怎麼做使用者畫像?
很多人說過 使用者虐我千百遍,我待使用者如初戀 然而,你真的待使用者如初戀了嗎?你知道使用者的年齡 學歷 喜好嗎?一 使用者畫像是什麼 簡而言之,使用者畫像是根據使用者社會屬性 生活習慣和消費行為等資訊抽象出的乙個標籤化的使用者模型。標籤化的使用者 根據不同產品 不同目的,使用者畫像又分 品類使用者...
爬取微博指定使用者的微博內容
使用python3爬取微博指定使用者的內容 import urllib.request import json 定義要爬取的微博大v的微博id id 5866810652 設定 ip proxy addr 192.168.1.101 定義頁面開啟函式 獲取微博主頁的containerid,爬取微博內...