使用者畫像大體流程
使用者畫像建設大體的流程如上圖所示,其中較為細節的內容還是結合實際的業務內容,下面針對使用者畫像的驗證主要還是集中在使用者畫像開發和使用者畫像更新的節點上。
使用者畫像分類
以下僅僅是較為粗略地分類
使用者畫像驗證
1.畫像開發過程中驗證
(1)模型驗證
此方法較多用於基礎資訊以及基於使用者行為的使用者畫像,在使用者標籤例如性別、年齡等能夠有相應的標註or真實結果時可以使用,通用的驗證指標為auc、ks、roc、confusion matrix等。
(2)抽樣驗證
在使用者量較大的前提下,可以採用隨機抽樣或者分層抽樣的方式進行驗證。
(3)交叉驗證
交叉驗證分畫像指標間的交叉驗證及外部資料的補充交叉驗證,外部資料例如第三方機構等。
2.畫像上線後驗證
(1)真實資料驗證
隨著業務發展,一些使用者畫像資訊會從無到有慢慢積累,毋庸置疑的是,將真實資料用於驗證畫像類指標是最準確的。
(2)a/b test
a/b test 是網際網路公司最常用的驗證方法,一般基於使用者畫像制定的策略在上線時都會進行嚴格的對比試驗,以測試畫像的準確性。
小思考在實際業務場景中還是存在有難以驗證的使用者標籤,與其一味的追求單個個體的標籤正確性,更應該將精力置於標籤上線後對實際業務的效果評估上,以業務效果來評定標籤的有效性個人覺得可能更適用一些,從效果上也能一定程度地反映標籤有無或者標籤演算法是否存在不同。
如何驗證 SQL 語句的正確性
定義你想要檢驗的sql語句 declare sql nvarchar max 正確的語句 set sql select from report test1 錯誤的語句 set sql select 1 from declare testsql nvarchar max result intset t...
驗證正確性的方法
驗證正確性的方法 1 bug和除錯 bug的 嗎?除錯,就是找出程式中的錯誤並改正 演算法錯誤 是指乙個演算法中引起該演算法不能實現其預定目標的熱病和錯誤。主要包括四種基本型別 二義性,語法錯誤,語義錯誤,邏輯錯誤 1.1二義性,演算法中比較容易消除的一類。一般體現在指令表達不準確或者不明確。1.2...
大資料如何做驗證資料正確性
最近在測試實時日誌檢索系統,有些服務日誌流量較大,頂峰有15w s的流量,日流有70億。如何驗證檢索資料的正確性呢?兩個方面,1 檢索結果中的資料格式檢驗 2 檢索結果中的資料量是否符合檢索條件 對於小流量服務的測試方案是通過http請求來構造日誌資料,結合grafana對http請求數的監控來實時...