小白學資料分析 ARPPU的誤區

2022-07-05 06:12:12 字數 1469 閱讀 6289

新年到來,該應該持續堅持寫下去,還是有很多人要來學習和進步的。

今天提到了乙個概念:arppu。

這個概念等同於之前大家認識的arpu(其實這句話我是很不願意說的),arppu是總收入除以總付費使用者數,得到的每個付費使用者的平均收益。今天說的誤區其實也就是大家乙個使用上或者是認識上的誤區,這個誤區被巧妙的利用了,以至於那些可能不會注意到細節的人被蒙蔽了。

arppu是乙個算數平均數,在均數的範疇中,概念很大,比如幾何平均,截尾平均,調和平均(主要用於在玩家公升級的平均速度方面的應用)等等。而恰恰因為arppu是算數平均數,所以,一些使用上的誤區或者認識是需要背去校正的。

算數平均數是描述資料分布的集中趨勢的統計指標,但是如果資料分布嚴重的偏態,那麼這個時候算數平均數算出來的結果其參考意義是有限的。從arppu來講,我們希望通過arppu的計算能夠代表整個付費群體的平均消費水平和收入貢獻,也是集中消費的趨勢。但,對一款遊戲而言,事實上並不是如同我們考慮的那般呈現所謂的正態分佈形式,其實,如果我們把每人收入貢獻繪製成頻數分布來看,這是乙個典型的冪律分布。小額付費群體多,但收入貢獻少,大額付費群體少,但貢獻收入多。而這時如果合併一起進行arppu的計算,顯然高估了小額群體的付費能力,低估了大額群體的消費能力。

從集中趨勢分析的角度來看

其實,多少年來,不是非常懂得精細化運營的人都是這麼粗略的看待這個指標進行分析的,而現在對於這樣乙個使用誤區,尤其當我們進行精細化運營後,需要更多的是跟多的群體細分,群體定位。當然,如果我們要從巨集觀把控整個遊戲的平均消費水平,一種辦法是去掉一些雜訊,比如截尾均數(按比例去掉兩端資料,在計算均數,如果和原來的均數相差不大,則說明極端值不存在,均數不受影響,一般是取5%),除了這種方法,這裡我們可以通過一種非常簡單的統計指標來分析,這就是中位數。

中位數:全體資料按大小排列,在數列中處於中間位置的那個值。中位數主要是位置平均數,所以不會受到極端值的影響,因此在評估arppu這類衡量平均水平,但是偏態分布嚴重的情況,中位數是很合適的,更加能夠代表其集中趨勢和平均水平。

從離散趨勢分析的角度去看

百分位數

我們知道遊戲中付費使用者群體我們劃分為三個部分,小魚使用者,海豚使用者,鯨魚使用者,三個群體我們可以通過對總的付費群體進行百分比劃分,這裡就是用了百分位資料,所謂百分位數就是乙個位置指標,我們可以把所有玩家的付費額從小到大排列,然後按照百分比劃分,比如從左向右50%為小魚,40%為海豚,10%為鯨魚。在此情況下,我們分別計算各個群體的arppu值,這個相對我們剛才的從巨集觀的得到arppu,會更加準確的分析不同群體使用者的消費能力。實際上剛才說到的中位數其實就是乙個特殊的百分位數。

當然了,從離散趨勢分析的角度,全距也都是可以去使用的,也是很簡單的,這個只是一種檢查而已,但是就方差,標準差等可能並不適合在遊戲中消費資料的分析,雖然說他們涉及我們要分析的每個變數,但是由於他們也受到極端值的影響,所以不適合去做這種分析,他們的合理使用範疇是在服從正態分佈的資料中。

總的來說,乙個arppu所代表的內容很多,但是我們在使用和分析中,要避免一些誤區產生。也要適當的使用統計學的一些靈活的方法重新審視和分析這些資料。

小白學資料分析 DNU DAU

行業指標觀察分析 dnu dau 寫在分析之前 一直以來,我們對於資料都是在做加法,也希望這個過程中,不斷蒐羅和變換出來更多的資料指標,維度等等。而在實際的分析中,我們發現,一如我們給使用者提供產品一樣,太多的時候,我們思考的是如何增加功能,而產品的核心功能和訴求,卻越來越遠。最近有幸和一些團隊在做...

資料分析 資料分析的誤區

在資料分析的過程中,我們難免會走一些彎路,但有些彎路是可以避免的,下面我將介紹幾個資料分析過程中常見的誤區 我們一定都聽說過二戰中的乙個經典示例 軍方為了提高戰鬥機飛行員的生還率,打算在飛機上增加裝甲的厚度,但不能在所有部位加厚,這樣會喪失戰機的靈活性,於是軍方請了統計學家來研究,這些專家在一開始就...

小白學 Python 資料分析(1) 資料分析基礎

人工植入廣告 ps 小編最近兩天偷了點懶,好久沒有發原創了,最近是在 csdn 開通了乙個付費專欄,用來發布去年寫的沒有出版的書稿,感興趣的同學可以去看下 已經上傳了一部分,第一章設定為了試讀章節 主要是講 springcloud 微服務方面的一些內容,整體排版下來如果是印在實體書上應該會超過 40...