小白學資料分析 什麼是活躍 I DAU

2021-09-06 07:04:16 字數 3308 閱讀 7554

最近和幾個人聊天,大家對於活躍都有著自己的看法,此外因為一些標準的問題,不熟悉分析術語的很多人把活躍,留存等很多資訊都搞混了.後來發現這是乙個很現實的問題。在一些我 看來不是問題的問題都變成了問題了,因此在此特地說說活躍的事,幫助更多從事遊戲資料分析的小白們成長。

究竟什麼是活躍?在日常與外界合作過程中,我們經常日活躍、周活躍、月活躍等等資訊,貌似聽起來比較簡單,但是真正如果自己實施操作統計資料時卻發現自己又不懂這些定義,因此作為一些分析師、甚至開發人員就會發現很難去操作。以下我將描述三個活躍的定義、使用方式、分析方法以及注意事項,限於篇幅今天就說說日活躍的分析使用。

日活躍統計標準

日活躍的統計標準有很多種,在rpg中有日活躍角色數和日活躍賬號數。這類遊戲由於存在建立角色的問題,所以一般會分成兩種統計方式。一般比較多見的是日活躍賬號數,可以認為就是日活躍使用者數。當然,很多遊戲室不存在這樣的多角色概念,因此通用日活躍賬號數來作為統計的標準為最佳。

當然,還有一種統計標準就是裝置的唯一標示,比如mac,這樣統計日活躍裝置數量,不過價值相對不大。

定義標準

統計日登入過遊戲的賬號數,此處要去重。

比如某日有1000個賬號登入過遊戲,總計登入次數為1600次(因為存在某些賬號重複登入遊戲),那麼該日的日活躍賬號數為1000。不要小看這個解釋,在實際操作中,經常會出現問題,例如我們在寫sql語句提取資料時就應該加上distinct 進行去重操作:

select count(distinct passportid) from playerlogintable

如果沒有加上distinct 統計的就是所有登入玩家的總計的登入次數,這樣就會出現大的問題。

日活躍能分析什麼?

單單一天的日活躍其實只能與前一日或者歷史同期做乙個環比或者同比的分析。但是日活躍的能發揮的作用遠遠超出你的想象。

核心使用者規模

核心使用者規模的衡量其實和產品週期結合起來來看,在大部分遊戲中,日活躍大概的構成可以分成以下的部分。

其中,新登使用者對於日活躍使用者的影響是最大的,一般新登佔比達到40%,而這個比例其實是可以判斷遊戲核心使用者規模的依據之一。

從上圖的構成來看,如果新登使用者在後續不斷轉化穩定的老使用者以後,那麼老活躍使用者的規模是在不斷增長的,同時,如果新登使用者的注入水平保持不變,這樣來看,遊戲的核心使用者有規模是在增長,並且新登使用者所佔的日活躍百分比是在下降的;如果新登使用者注入水平也在增長,且不斷轉化為老使用者,即核心使用者規模也在增長,那麼新登使用者所佔百分比會在乙個區間穩定的變化的。

剛才所提到的核心使用者規模,之所以使用日活躍使用者來衡量,原因在於,以每日作為乙個衡量的單位比較客觀反映使用者的遊戲積極性,以日作為統計長度,恰好符合使用者遊戲的最短的週期性迴圈。

那麼在日常的分析中,我們可以簡單計算乙個週期內,每日新登使用者和活躍使用者的關係比例,看乙個長期趨勢,一定程度上反映了目前核心使用者的規模增長情況。

那這裡有人會問,怎麼看待回流使用者的作用呢?

實際上,回流使用者對於日活躍使用者的貢獻比例是極低的,但是該部分的貢獻卻不能夠忽略,因為在重大節日、渠道推廣等各種營銷手段上線以後,會對於遊戲日活躍產生乙個很大的貢獻值。但是一般而言,該部分的貢獻比例比較低。

回流使用者:統計日登入遊戲,但是之前7天未登入過遊戲的歷史使用者(所謂歷史使用者就是非新登使用者,歷史上登入過遊戲的使用者)

老活躍使用者:如果粗略的計算,可以如下計算

日活躍使用者數-日新登使用者數-日回流使用者

當然如果要精確衡量老使用者規模,可以給予老使用者定義,例如:

統計日登入遊戲的使用者,在此之前7日內再次登入過遊戲(注意此處沒有嚴格區分新登使用者的情況,即也把新登使用者的次日登入的部分計算為老使用者,可按照實際需要提出此部分對於老使用者的影響)。

下面我們通過幾個曲線來簡單說明一下怎麼利用dau分析問題。

首先我們要得到劃定時間區段的dau和dnu的曲線圖,如下圖:

在該圖中,我們dau和dnu的走勢基本上是一致的,dnu對於dau的影響還是比較大的,但是隨著後期波動的減小,我們發現從106天到280天,兩條曲線是呈現緩慢的下滑趨勢的,但是這不足以說明問題,仔細觀察,我們發現夾在兩條曲線之間的面積是逐漸縮小的,而這部分面積就是dau中除去dnu的部分,即我們可以認定是老使用者的部分,這個面積的縮小,意味著使用者的流失加劇,活躍使用者的控制不得當,此外,也可能是新使用者在短期內留存率不高引起的,那就需要結合留存率來看問題了,這裡不討論。

在發現上述的情況後,我們可以使用dau-dnu的差值做一條曲線來進行分析這個問題。如下圖所示:

可以很明顯的看到,這個差值在逐漸走低,也就是說使用者的活躍度是在下滑的,這個下滑可以認定是後期渠道匯入使用者質量不高造成的,也可以是產品本身的使用者週期問題造成的。但是斷定一點的是,這個時期,需要緊急的拉動使用者規模增長,因此,可以看到,隨後進行了兩次相應的拉動,其規模有所提公升。

此外,我們還要看一下新使用者所佔的比例曲線,如上文所述,基本維持在40%的水平上,但是有乙個值得關注的是,當處於乙個相對的穩定期時,即使有大範圍的推廣和拉動新登增長,那麼這個比值的變化也不會太劇烈,唯一劇烈的原因就在於,原本遊戲的老活躍使用者規模就在下滑,流失較多。

當然了,使用者的流失、產品的粘性等等都可以通過對dau不同角度的解析獲得相應的資訊,這點也是要和其他資料結合來分析的,比如次日留存率,使用者流失率、啟動次數、登入時長分布等資料,找出來dau中的虛假使用者,例如1-3s使用者非常多,那麼在正常的網路和設計情況下,這種資料就可能是很多假使用者造成的,也就是作弊行為。

再比如的情況,我們可以通過事件管理,區分推廣和非推廣時期的使用者增長對dau的影響,比如自然增長時期的新登使用者對dau的影響,判斷dau的質量,渠道的質量;或者推廣時期的新登使用者對dau的影響情況分析。

如果需要的也可以結合使用者的登入習慣,比如登入次數,登入天數等等資料進行忠誠活躍使用者的閾值確定,以此來保證dau的質量。

其實在dau的背後,隱藏的問題和分析的要素很多,這個也是需要結合自己的業務需要來進行的,這裡只是給大家提供乙個分析的思路和方式。至於具體的問題,還要結合具體需求進行分析。不過話說回來,dau的解析離不開細分資料和其他資料的支援,但是也是不一定一直細分進行資料的分析。因為有一些因素不是靠細分資料就一定能夠得到的,還要經驗積累,有關這部分的分析參見:

小白學資料分析 什麼是活躍 I DAU

最近和幾個人聊天,大家對於活躍都有著自己的看法,此外因為一些標準的問題,不熟悉分析術語的很多人把活躍,留存等很多資訊都搞混了.後來發現這是乙個很現實的問題。在一些我 看來不是問題的問題都變成了問題了,因此在此特地說說活躍的事,幫助更多從事遊戲資料分析的小白們成長。究竟什麼是活躍?在日常與外界合作過程...

小白學資料分析 日活躍人數分析

從今天開始,特開闢乙個小專欄,題目暫定為小白學資料分析,鄙人不才,在資料分析的道路上走的崎嶇坎坷,同時資料分析本身是乙個多面和複雜的工作,要懂得理論 統計 概率 資料探勘 演算法 模型 更要懂得業務,懂得行業理論,還要有靈活多變的思維,想想還是很複雜和麻煩的,所講內容不但是理論,不僅是資料,盡量把這...

小白資料分析師學什麼

1理解需求 知道要什麼,才能考慮怎麼做 2獲取資料 資料庫sql技能 網路爬蟲 簡單的分析師做,複雜的技術部門 3資料預處理 缺失 異常 異構 excel 處理資料量不大,不能處理太多複雜字元結構 sql 資料量大結構簡單 python 結構複雜資料 大資料平台hadoop spark 資料量特別大...