用Python檢驗幾組資料的方差是否相等

2021-10-13 07:35:38 字數 898 閱讀 5929

有時我們會遇到判定兩組資料的均值或方差是否相等,我們可以利用t-檢驗判斷均值是否相等(如何進行t-檢驗),而對於方差,我們同樣有檢驗方法,要比用t-檢驗判斷均值是否相等簡單的多。

我們用的就是scipy.stats.levene(),只需往裡輸入我們要檢驗的資料即可,不過必須是一維的。最後結果輸出檢驗統計量和p

pp值,如果p

pp值小於我們給定的α

\alpha

α閾值,那我們就能判定這幾組資料的方差並不相等。

import numpy as np

from scipy import stats

#先產生50個服從標準正態分佈的樣本和50個均值為0方差為4的資料

np.random.seed(

2020

)data_ran = np.random.normal(0,

1,50)

data_ran2 = np.random.normal(0,

2,50)

#檢驗兩組資料的方差是否相等(這兩組資料的方差並不相等,因此結果應該是拒絕原假設)

r1 = stats.levene(data_ran, data_ran2)

print

(r1)

輸出:leveneresult(statistic=14.941411312615362, pvalue=0.00019943084704952306)

從輸出的結果可以看出,p

pp值很小,哪怕我們將α

\alpha

α設為0.001

0.001

0.00

1,也仍然可以拒絕這兩組資料的方差並不相等(事實上也是如此,因為它們乙個來自方差為1的正態分佈,乙個來自方差為4的正態分佈)。

Python資料探勘學習6卡方檢驗

1.定義 一種用途很廣的計數資料的假設檢驗方法。它屬於非引數檢驗的範疇,主要是比較兩個及兩個以上樣本率 構成比 以及兩個分類變數的關聯性分析。2.基本思想 統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大 反之,...

Python統計分析 卡方檢驗

卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非引數檢驗的範疇,主要是比較兩個及兩個以上樣本率 構成比 以及兩個分類變數的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。卡方檢驗的基本思想 卡方檢驗是以 2 chi 2 2分布為基礎的一種常用假設檢驗方法,它的基...

資料篩選特徵方法 卡方檢驗法

coding utf 8 import numpy as np import pandas as pd from sklearn.feature selection import selectpercentile from sklearn.feature selection import chi2 ...