常用的統計量和抽樣分布

2021-09-26 11:51:20 字數 2512 閱讀 6235

一、統計量

樣本均值:即在總體中的樣本資料的均值,反映樣本資料的集中趨勢。

樣本方差:每個樣本值與全體樣本值平均數之差的平方值的平均數;方差是用來衡量隨機變數和其數學期望(均值)之間的偏離程度。

樣本變異係數:變異係數又稱為離散係數,定義為標準差與平均值之比,樣本變異係數即樣本資料的標準差與其均值之比。

樣本k階中心矩:在概率論中,矩是用來描述隨機變數的某些特徵的數字,即求平均值;隨機變數x的k階中心矩定義:對於正整數k,如果e(x)存在,

e[(x-e(x))^k] 《無窮大,

則 e[(x-e(x))^k] 為x的k階中心矩。

樣本偏度:常用作總體偏度的估計量和檢驗總體分布正態性的統計量,樣本三階中心距除以二階中心距的3/2次冪的商記為sk;而總體偏度是乙個描述總體分布不對稱性的數字特徵,正態分佈的偏度為0。

樣本峰度:常用以作為總體峰度的估計量,樣本的四階中心距除以樣本二階中心距平方的商再減去3,記為ku;正態分佈的峰度為0。

二、抽樣分布

中心極限定理:即不論總體服從什麼分布,只要從總體中抽取的樣本容量足夠大,這些樣本組成的樣本均值的抽樣分布都近似於正態分佈。

樣本方差的分布:作為隨機變數的函式,樣本方差本身就是乙個隨機變數,s^2服從卡方分布,

s 2σ

2(n−

1)

\frac(n-1)

σ2s2​(

n−1)

~ x (2

n−1)

x^2_(n-1)

x(2​n−

1)卡方分布

卡方統計量是乙個隨機變數,能夠表明樣本方差和總體方差之間對的比值關係,卡方統計量決定的抽樣分布就是卡方分布;

卡方統計量:χ2=

(n−1

)s2σ

2\chi^2=\frac

χ2=σ2(

n−1)

s2​

定義:若樣本量為n的所有可能樣本均取自方差為σ

2\sigma^2

σ2的正態分佈總體,計算每乙個樣本的卡方值(χ

2\chi^2

χ2),那麼這些卡方值將構成關於樣本方差和總體方差的卡方分布。卡方分布是乙個連續型該流程分布。

作用:卡方分布能夠用於從樣本方差到總體方差的推斷性分析;還能用於非引數檢驗(卡方檢驗)。

t分布

若已知待分析的總體服從正態分佈,從總體中抽取容量為n 的所有可能樣本,計算出每個樣本的t統計量,則所有的t統計量的值將組成乙個連續型概率分布,此分布為t分布。t分布能在部分已知條件下,用於總體均值的推斷分析。

對於t分布來說,如果總體服從正態分佈,總體標準差未知,當樣本容量小於30時,那麼樣本均值的抽樣分布服從t~t(n-1)的t分布;

若總體服從正態分佈,總體標準差未知,樣本容量大於等於30時,那麼樣本均值的抽樣分布不僅服從t~t(n-1)的t分布,而且還可以用z分布來近似表達。

f分布

f分布能通過兩個樣本之間的關係推導出兩個總體之間的關係,能用於推斷兩個總體方差之間的比值關係。

f統計量:兩個正態分佈總體,總體方差為σ12

\sigma^2_1

σ12​

, σ 22

\sigma^2_2

σ22​

,分別從總體中抽採樣本容量為n1,n2的樣本,樣本方差為s12

s^2_1

s12​

,s 22

s^2_2

s22​

,則f統計量為

f =s

12σ1

2s22

σ22=

s12σ

22s2

2σ12

f=\frac}}=\frac

f=σ22​

s22​

​σ12

​s12

​​​=

s22​

σ12​

s12​

σ22​

​ f分布有兩個自由度,分子自由度為v1=(n1-1),分母自由度為v2=(n2-1),因此,由f統計量組成的f分布可以表示為:

f統計量可看成是由兩個卡方統計量相除得到的,f分布也被成為方差比分布,假設兩個正態分佈總體的卡方統計量為χ12

\chi^2_1

χ12​

, χ 22

\chi^2_2

χ22​ χ12

/v12

χ22/

v2

2\frac

χ22​/v

22​χ

12​/

v12​

​~f(n1-1,n2-1)

下列統計量服從什麼分布 抽樣好懂,抽樣分布又在說啥

前面我們講解了正態分佈的重要知識點 戳此閱讀 一文搞懂 正態分佈 所有重要知識點 在文中,我們強調,理解正態分佈是搞懂 假設檢驗 和 置信區間 等內容的關鍵點。但關鍵的基礎並非只有 正態分佈 今天我們要談的 抽樣 和 抽樣分布 也是其中之一。抽樣,就是從研究的總體中抽取一部分個體作為我們真正的研究物...

t統計量和z統計量

z統計和t統計可以用來檢驗兩個平均數之間差異顯著的程度,z適合大樣本的情況 樣本數大於30 t適合小樣本的情況。z檢驗的步驟 h0 1 第二步 計算統計量z值,對於不同型別的問題選用不同的統計量計算方法,1 如果檢驗乙個樣本平均數 的差異是否顯著。其z值計算公式為 其中 2 如果檢驗來自兩個的兩組樣...

屬性和統計量

lmz 屬性是 的輸入量 統計量是 的輸出量 屬性本質上屬於程序的變數。變數一般寫在sv tv中。但是這樣寫的缺點在於不方便修改,每次修改都得深入程序模型。屬性的值一般都在init狀態下通過核心函式讀取,然後作為程序的變數使用。這樣我們就可以在 時不用深入底層就可以改變其值 屬性提公升 屬性中分 舉...