方差分析 不同組間的差異真的顯著嗎

2021-06-27 12:54:00 字數 1393 閱讀 7643

在資料分析中,按照具體維度將資料分組進行組間比較是十分常見的,例如在零售業態中,按照性別、城市、收入水平將消費者進行分組進行對比分析。看似簡單,其實這其中經常伴隨著拍腦袋決策的危險。以下資料案例可以說明。原創案例資料、分析思路來自資料小宇軍《資料分析企業的賢內助》。

資料案例說明:

上表反映不同收入的使用者對a賣場品類方面的滿意度。我們是否能夠從表面上看,根據8.29>7.46>7.23,就斷定低收入者對a賣場的品類最滿意,而高收入者最不滿意呢?拍腦袋來看,這似乎十分合理。

不同組間對比,差異是否顯著,需要謹慎!

滿意度的得分差異來自兩個方面,即不同分組間可能的差異和同一組內誤差導致的可能差異。本案例中,不同組間差異是由於收入不同,所引起的使用者滿意度差異。同一組內是同樣的收入水平,可能由於其他抽樣誤差引起了使用者滿意度的差異。

而只有當滿意度差異來自收入水平(組間差異)的影響時,而不是其他因素,才可說收入影響品類滿意度,不同收入水平的使用者滿意度不同。

用方差分析來判斷組間差異

常用的顯著性檢驗有t檢驗和方差分析,t檢驗只適於兩組樣本,而方差分析則適於多組樣本,本例可採用方差分析來判斷。

1、首先我們對上表資料進行細化,找到每組內受訪者的具體滿意度打分數值,而不是這個彙總後的得分值。

2、spss方差分析:

分析:比較均值,單因素方差分析

因變數列表:品類滿意度

因子:收入

選項:方差同質性檢驗

3、資料是否適合做方差分析

方差分析之前,需要進行可行性檢驗,原假設,各分組方差無差異。根據同質性檢驗可知,sig值0.453,為大概率,原假設成立,即不同分組之間同質,沒有顯著差異,可進行方差分析。

4、方差分析結果

原假設,各分組之間無差異。方差分析sig值0.194,大於小概率值0.05,為大概率,原假設成立,即不同收入水平分組之間在品類滿意度上並不沒有不同。不存在顯著差異。

5、用視覺化圖來揭示原因

我們可以看到,每類收入者的滿意度得分都圍繞平均值上下波動,這表明不同收入者對品類的態度存在明顯差異,例如,同是高收入者,有的非常滿意,有的卻十分的不滿意。同組內的差異甚至高出不同收入者之間的差異,這一點可以通過方差分析中方差得以判斷。

因此說,收入水平並不是導致使用者對a賣場品類滿意度的關鍵因素。

可見,資料的表象往往迷惑人,尤其是綜合彙總後的平均值,通過對底層資料進行分組及方差分析則可以讓我們撥開雲霧,看到資料的本質。

同時,這個案例也告訴我們,在常規的報表分析當中,經常性的工作是對底層資料進行彙總分析,然後拿彙總資料用於決策,此時,非常容易就數字大小的對比而做出判斷,報表工作人員需要注意,需要養成用統計的理念和邏輯上報資料的結果。

組間方差分析球形檢驗

文章指出 球形檢驗的結果只是決定你將要用哪種輸出結果,單變數的還是多變數的。這裡特別要注意 球形檢驗的結果不是決定你是否使用重複測量的方差分析 這是在實驗設計時的事情 而是決定在重複測量方差分析之後你選擇哪種輸出結果。如果選擇單變數的,要麼它滿足球形檢驗,要麼你就必須對結果進行校正。通常,如果不滿足...

方差分析的數學原理與matlab實現

方差分析 analysis of variance,anova 又稱 變異數分析 1920年由波蘭數學家r.a.fisher發明,通常用於兩個以上的樣本引數差別的顯著性檢驗。統計學中的假設檢驗理論已經為樣本引數為兩個的顯著性檢驗提供了較為完備的理論。但是,生活中常常會遇到引數大於兩個的情況,例如 為...

單因素方差分析(ANOVA)的多重比較校正

如果anova結果顯示至少有兩組的均值不相等,那麼接下來要確定是哪兩組或哪些組的均值不相等,對差異的這個結果進行後續檢驗就叫做post hoc test,又叫做multiple comparison anlaysis test。1,the tukey method 優點是對所有組進行兩兩比較,計算簡...