Python資料分析之方差分析

2021-09-20 00:15:55 字數 1486 閱讀 5540

設某苗圃對一花木種子制定了5種不同的處理方法,每種方法處理了6粒種子進行育苗試驗。一年後觀察苗高獲得資料如下表。已知除處理方法不同外,其他育苗條件相同且苗高的分布近似於正態、等方差,試以95%的可靠性判斷種子的處理方法對苗木生長是否有顯著影響。

做過方差分析的都知道,先做個假設h0:不同處理方法對苗木生長無顯著影響。

看下課程老師給的資料

copy出來的格式很不友好,我就寫了乙個python**進行轉化,**:

import csv

i = 0

f = open('c://users/administrator/desktop/方差分析.txt','r')

csvfile = open('c://users/administrator/desktop/方差分析.csv','wt',newline='',encoding='utf-8')

writer = csv.writer(csvfile)

for fs in f:

i = i+1

contents_1 = fs.strip()

contents = contents_1.split(', ')

for content in contents:

writer.writerow((content,i))

f.close()

csvfile.close()

可以把資料轉化為如下格式,方便在python的方差分析中執行:

df = pd.read_excel('c:/users/administrator/desktop/方差分析.xls',header=none,names=['value','group'])

d1 = df[df['group']==1]['value']

d2 = df[df['group']==2]['value']

d3 = df[df['group']==3]['value']

d4 = df[df['group']==4]['value']

d5 = df[df['group']==5]['value']

args = [d1,d2,d3,d4,d5]

f,p = stats.f_oneway(*args)

print(f,p)

結果如圖:

查表得f0.05(4,25)=2.76,因為f=sb2/sw2=4.38﹥f0.05(4,25)=2.76,所以推翻(或者說拒絕)假設h0,即不同的處理方法造成了苗木高生長的差異顯著。

python方差分析

目錄 一元方差分析 一元單因素方差分析 一元多因素方差分析 協方差分析 場景 5種不同畫素的數位相機 單因素 對銷量 研究的因變數 是否有顯著差異 g dc sales pixel unique args for i in list g 將pixel變數轉化為分類變數並為其值掛標籤 dc sales...

雙因素方差分析 多因素方差分析

在前面我們講過簡單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡單的多因素方差分析。單因素分析就是只考慮乙個因素會對要比較的均值產生影響,而多因素分析是有多個因素會對均值產生影響。需要注意的是乙個因素可能會有不同的水平值,即不同的取值。比如要判斷某一款藥對某種...

方差分析anova

參考 方差分析 analysis of variance,簡稱anova 方差分析 anova 又稱 變異數分析 或 f檢驗 是r.a.fister發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的資料呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是...