方差分析 實踐

2022-07-15 09:57:08 字數 1698 閱讀 9744

一、案例:

有a、b、c、d四個地區,不同地區的銷售量不一樣,現抽取了不同時間段內每個地區的銷售量,試解決:

1、每個地區間的銷售量是否相同?

2、不同月份的銷售量是否相同?

3、不同時間與地區的銷售量是否相同?

二、資料:

問題1:

用單因素方差分析,先假設,再構造統計量,最後進行決策

(1)假設h0,即假設樣本a,b,c,d的均值相同,不同地區無顯著性影響。h1:樣本a,b,c,d均值不全相等,有顯著性影響。

​(2)構造統計量,因素為地區,水平為4,因變數為銷售量。

import

numpy as np

import

scipy.stats as stats

import

pandas as pd

#讀取資料

data=pd.read_excel("

銷售資料.xlsx")

print(data.describe()) #

統計數量、均值、標準差、上下四分位

print(data.mean().sum()/4) #

輸出對應的總體均值

總平方和sst=95533231.1875+61867762.1875+86597368.1875+36583242.6875

組間平方和ssa=57894573.5196352

組內平方和sse=222687030.727273

msa=ssa/(4-1)=19298191.17 , mse =sse/(n-k)=31812432.96,

檢驗統計量f=msa/mse=0.606624184 , 在給定顯著性水平a=0.05,在f分布表中查詢分子自由度df1=4-1=3,分母自由度df2=n-k=11-4=7,相應的臨界值fa(3,7)=4.347,f1)假設h0:各月的均值相等,即各個月份對銷售量無顯著影響;h1:各個月份均值不完全相同,即不同月份對銷售量有顯著影響。

(2)構造和計算統計量

(所有資料按照月份分組,2023年3月資料少4行,因此保留前12行分析資料)

1)計算總體均值:5898.5,水平為3

2)總平方和sst=205887565

3)組間平方和ssa=39687746

4)組內平方和sse=sst−ssa=205887565−39687746=166199819

5)msa=ssa/(3-1)=19843873

mse=sse/(n-k)=sse/(12-3)=18466646.56

6)f=msa\mse=1.074579131

(3)決策分析,f按照無互動作用的雙因素方差分析方法

(1)假設(2)構造統計量和計算(3)決策

(1)行因素:h0:假設日期對銷售量無顯著影響;h1:日期對銷售量有顯著影響;

列因素:h0:假設地區對銷售量無顯著影響h1:地區對銷售量有顯著影響列因素。

(2)構造統計量並計算:

(3)從上表中可以看出fr

雙因素方差分析 多因素方差分析

在前面我們講過簡單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡單的多因素方差分析。單因素分析就是只考慮乙個因素會對要比較的均值產生影響,而多因素分析是有多個因素會對均值產生影響。需要注意的是乙個因素可能會有不同的水平值,即不同的取值。比如要判斷某一款藥對某種...

python方差分析

目錄 一元方差分析 一元單因素方差分析 一元多因素方差分析 協方差分析 場景 5種不同畫素的數位相機 單因素 對銷量 研究的因變數 是否有顯著差異 g dc sales pixel unique args for i in list g 將pixel變數轉化為分類變數並為其值掛標籤 dc sales...

方差分析anova

參考 方差分析 analysis of variance,簡稱anova 方差分析 anova 又稱 變異數分析 或 f檢驗 是r.a.fister發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的資料呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是...