資料分析的層級

2022-07-20 15:30:15 字數 2635 閱讀 6732

心理學研究有四個目的——描述、解釋、**、控制——本文藉以表述資料分析的4個層級。

第乙個層級是描述——可以理解為用資料來描述某個事物。

用資料來描述某個事物的第一步是量化——通過數值來描述或者衡量某個事物的某種屬性或狀態——最終得到的數值可以是通過某個公式計算到的,也可以是多個「專家」進行主觀評定的。

得到單個數值並不能說明什麼問題,要想讓數值產生價值,最簡單的操作就是對比——通過和某個參照值進行對比進而判斷表現的好壞。

為什麼需要對比?

假設小明考試考了90分(滿分100分),首先90分表示小明正確回答了90%的問題,不過90分到底好不好,需要比較後才能知道:

我們可以把關注的指標和參照值對比發現的gap值稱為δ值——可以將delta值理解為差異值或者變化值,更多可以可以參考前文《從「δ值」談資料分析》.

在「描述」這個層級,對應的資料分析的典型工作是報表開發

關於「描述」部分,小結如下

資料分析中經常需要應對的問題是指標的波動——如果將波動的指標命名為y,那麼此時就需要找出是哪些因素引發了\(\delta y\).

指標的波動時相對於歷史資料而言(縱向對比),另乙個典型的\(\delta y\)出現的場景是組間差異(橫向對比),比如在某些業務場景下,你可能發現兩個不同的使用者群在某指標上表現的差異很大,那麼你可能想知道導致這種差異的原因。

除此之外,以下場景也是和δy有關的高頻場景

我們用公式 \(\delta x \leftarrow \delta y\) 來表示針對變化量的歸因。

對於變化量的歸因,一般流程如下:

判斷波動的嚴重程度,需要設定對比的參照值和波動報警的閾值;

排除資料問題,比如底層表是不是有改動或者有人修改了報表中的指標規則,一般來說新上線的業務比較容易出現資料問題;

定位問題環節,將\(\delta y\)在更細的維度上拆解,時間維度上可以看是什麼時候開始的以及持續了多久,空間維度上可以從「人貨場」各維度拆分,看看是什麼使用者群、商品、業務場景問題最嚴重;

是否歷史有類似情況或者波動規律;

先查內因(渠道入口、轉化環節、人貨場);

再查外因(政策、市場、競品等);

這個順序也不是絕對的,總體來說的原則有兩點:

除了關注變化量δy外,我們還關注有哪些影響因素會影響業務上的關鍵指標。

這裡用 \(x \leftarrow y\) 來表示,注意箭頭的方向。

\(x \leftarrow y\) 和 \(\delta x \leftarrow \delta y\) 有一部分內容是重疊的,一般來說,對\(\delta y\) 有影響的因素也是對\(y\)有影響的。

不過\(x \leftarrow y\) 更強調找到影響關鍵指標\(y\)的影響因素x,並建立相應的函式 \(y = f(x)\).

這些\(x\)中就包含了在產品或運營上可操作可控制的因素。

e.g.訪問使用者數 * 下單率 * 客單價 = 銷售額,基於這個簡單的公式可以判斷,如果要提公升銷售額至少可以從三個角度來著手。

關於「解釋」,小結如下

這部分的內容,在文章《**的方法》中已有較詳盡的說明,請閱讀此文。

如上圖所示,**有3個角度。

對應「解釋」中\(x \leftarrow y\) 的逆操作——從已知的x來推導未知的y。

這個過程可以看做是evaluate,可以使用如下兩種方法:

相當於what if分析。

比如某個產品功能要改動,需要預估這個改動可能帶來的影響,比如影響的範圍(多少使用者,多少訂單等),以及對業務關鍵指標可能產生的波動範圍。

基於「時間序列」來預估未來的資料,相當於forecast,比如**走勢、業務發展趨勢、交易量預估等。

從心理學研究的角度來看,能控制改變人的認知和行為是最高層級——這樣看來,x教授的能力應該算是最強的了。

不過,從資料分析的角度來說就沒有那麼「科幻」了。

可以從兩個角度來看資料分析在「控制」這個層級的工作:

降本增效是商業的核心追求,資料則是要輔助這個目標的實現。

可以從3方面著手:

提公升收入(做加法),比如提公升每單位交易收入(客單價、arppu等)或者提公升交易基數(使用者量、訂單數等);

降低成本(做減法),減少人力、物力、資金的投入;

提公升效率(做乘法),提高單位時間的完成量或者周轉率等;

超越預設目標

\(g(cost, limit, way) \geq target\)

最大化目標函式

\(max\bigl( g(cost, limit, way) \bigr)\)

注:本小節小結如下

資料分析 資料分析的誤區

在資料分析的過程中,我們難免會走一些彎路,但有些彎路是可以避免的,下面我將介紹幾個資料分析過程中常見的誤區 我們一定都聽說過二戰中的乙個經典示例 軍方為了提高戰鬥機飛行員的生還率,打算在飛機上增加裝甲的厚度,但不能在所有部位加厚,這樣會喪失戰機的靈活性,於是軍方請了統計學家來研究,這些專家在一開始就...

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...

「資料分析」崗位分析

行業內公司的融資情況從一定程度上說明了選擇資料分析崗位的穩定性 佔比情況是所有職位累加在一起,未區分職位 不需要融資的公司佔比60 d輪以上的公司42 其實很多不需要融資的公司,規模也是很大的,可以結合公司規模來判斷公司的情況如何,是否值得去發展。提供資料類職位的公司,規模還算比較大的 500人以上...