從美團筆試題看廣告資料分析

2022-06-26 09:54:13 字數 3046 閱讀 8084

1、 如果讓你對這個業務進行抽象,你會抽象出哪些資料分析主題,並說出你這樣分的原因;

2、 請你根據問題1抽象的主題,進行主題模型設計,並說明設計的模型內容,以及模型之間的關係。

首先要明確分析目的,美團作為廣告投放平台方,流量、使用者資料是其最大的資源。而作為平台方,資料分析的最終目的在於利用本身資源獲得最大的收益。廣告資料分析就是對自身資源進行分析,分析各資源位的**、轉化以及經濟收益,以吸引更多的廣告主、獲得更高的收益。當前資訊流廣告主要是以rtb(公開競價)的方式售賣。

因此,如何優化廣告的轉化是廣告投放的重點。網際網路廣告的轉化路徑一般為:

廣告**-->使用者點選-->進入落地頁-->產品瀏覽、選擇-->提交訂單,完成支付

過程指標

**量: 即廣告展示在使用者端的數量;

點選率(ctr) :廣告點選與展現的比率成為;

到達率: 使用者點選之後到達落地頁(landing page)稱之為到達,成功到達落地頁和點選次數的比例;

轉化率(cvr):使用者最終完成下單稱之為轉化,轉化次數與到達次數的比例稱為轉化率(cvr, convesion rate)。在實際場景中,了能要經歷多次轉化,比如新使用者註冊等,是乙個轉化漏斗。

常用指標

cpm (cost per mile):千次展示結算。這種方式的收費與廣告主的收益無關,展示是否能帶來收益的風險由廣告主承擔。這種結算凡事適合選產品牌形象,提公升中長期購買率和利潤空間的廣告。

cpc(cost per click):按照點選結算。其中,廣告平台方,也就是題目中的美團,根據大量使用者行為資料來估計點選率,而每次點選的價值,則由廣告主進行估計,然後出價。

cpt (cost per time):按照展示時長結算。

然而以上收入指標,如cpc的點選量是無法提前知道的,只能事先估計,因此產生了更重要的指標:

ecpm(estimated/expected cost per mile):

ecpm = ctr * v * 1000

其中v代表點選價值,即單次點選可為廣告主帶來的收益。

v = 到達率 * 轉化率 * 客單價

實際收費:實際上最終的廣告收費並不是按照競價中的最高出價(獲得**的廣告主的出價),而是採用第二**機制。這是由於如果按照第一**原則,那麼競價者通常最多給出自己承受上限的**;而如果採用第二**機制,那麼競價競價者很可能會出到自己承受上限的**,因為最終**是自己出價的下一**。這樣的機制通常來說平台收益會更高。這種定價機制本質上來自於博弈論中的納什均衡理論。具體來說

\[cpc = \frac + 0.01

\]roi :投資回報率

影響廣告投放的因素很多,如廣告定向人群、廣告創意、廣告文案、廣告位置等等。在前文的競價廣告的競價原理裡也提到,通過提高預估ctr,可以提公升roi。因此,在廣告投放中需要找到最優的投放組合,提公升ctr或者轉化率,從而提公升roi。找尋最優的投放組合,目前用到最多的方法是ab測試,以及用樸素貝葉斯演算法預估轉化率比較高的人群定向投放組合。

本節通過乙個模擬場景來解釋各模型的使用方法。假設某廣告主在美團投放廣告有如下統計結果:

廣告定向

**量點選量

到達量轉化量

男1000

1009025女

80060

5815

android

1200

7059

16ios

60090

8524

1. 漏斗模型

轉化路徑

數量本層轉化率

累計轉化率

**180011

點選160

8.89%

8.89%

到達148

92.5%

8.22%

轉化40

27.03%

2.22%

從上表可以看到,從點選到到達的轉化率最高,說明落地頁的響應能力較好;而點選率很低,是整個轉化路徑中的瓶頸(實際上也不一定最低就是瓶頸,因為點選率本來就很低,要結合各路徑更精確分析),應當優化廣告展示,吸引使用者點選。

2. a/b測試

a/b test 一般有兩個目的,乙個是判斷哪個更好;另乙個是計算新功能或者新設計帶來的收益。在廣告投放優化中,一般用來判斷不同的投放物件組之間的差異。

以上述模擬場景資料,計算可得

廣告定向組

轉化率z值

性別組:男—女

0.89

作業系統組:android—ios

3.12

從上表可以看到,性別男和女的轉化率z值在-1.96~1.96之間,則接受原假設,即男女組之間轉化率沒有顯著差異。同時,作業系統之間有顯著差異。

3. 樸素貝葉斯

樸素貝葉斯是基於貝葉斯公式的一種演算法,可以通過先驗概率來計算後驗概率。由於他假設特徵之間是相互獨立的,所以稱之為樸素貝葉斯。在現實生活中,即使假設不成立,仍能取得較好的表現。貝葉斯公式:

\[p(a|b) = \frac

\]當特徵有多個時:

\[p(a|b) = \fracp(b^i|a)}(p(a^i)*\prod_p(b^i|a))}

\]通過樸素貝葉斯演算法,以及歷史轉化資料的使用者畫像分布,可以計算各個廣告定向組合下的轉化概率。

首先計算轉化率的使用者分布:

廣告定向

轉化=1

轉化=0

男0.625

0.554

女0.375

0.446

android

0.40.673

ios0.6

0.327

總體轉化率為0.022。

之後基於樸素貝葉斯公式計算廣告定向組合轉化的概率:

廣告定向組合

轉化概率

男+android

0.015

男+ios

0.044

女+android

0.011

女+ios

0.033

從以上組合轉化概率計算結果來看,男+ios的組合轉化概率最高,其次是女+ios的組合。因此應當將廣告優先投放給使用蘋果手機的男性。

從QC看資料分析 入門資料分析

在資料分析的道路上越走越遠 陰差陽錯的做了資料分析,而且一開始我還不知道自己在做的是資料分析,看了很多資料分析的書,也走了一些彎路,做了很多實踐專案,突然很想把自己作為乙個小白的資料分析之路的成長過程寫下來。因為最近恰好在了解qc相關的東西,然後發現qc的套路居然能對標資料分析的過程,尤其是qc中各...

新浪資料分析筆試題目

1 kmo值在 範圍內,因子分析才是有效的。解答 kmo檢驗統計量是用於比較變數間簡單相關係數和偏相關係數的指標,主要用於多元統計的因子分析。當所有變數的簡單相關係數的平方和遠遠大於偏相關係數的平方和時,kmo值越接近於1,原有變數越適合做因子分析。0.7 0.8適合,0.8 0.9很適合,0.9 ...

Python 美團資料分析師筆試的一些小題目

給出乙個正整數n和長度l,找出一段長度大於等於l的連續非負整數,他們的和恰好為n。答案可能有多個,我我們需要找出長度最小的那個。例如 n 18 l 2 5 6 7 18 3 4 5 6 18 都是滿足要求的,但是我們輸出更短的 5 6 7 輸入資料報括一行 兩個正整數n 1 n 1000000000...