統計學二 假設檢驗與引數估計

2022-09-07 01:21:09 字數 1691 閱讀 7479

假設檢驗是推斷性統計的基石,也是統計學習中的難點。在本課節中,老師會用最簡明易懂的語言講透假設檢驗以及與其密切相關的置信區間的原理,幫助學員在使用樣本估計總體時能夠知其然並且知其所以然。

在現實問題中,我們難以直接對總體,如北京市所有區域每一時點的空氣質素指標進行統計分析,因此往往通過抽樣方式來推測真實情況。在本課節中,老師將通過案例模擬講解如何使用樣本統計量來估計總體引數。

本節課包含的知識點有:

為了知道樣本均值,一定要知道樣本是怎樣的分布;

假設有乙個正態總體:

上圖橫座標是樣本均值,曲線為樣本均值描繪出來的曲線;

樣本均值的分布,統計上也稱為抽樣分布;樣本均值是服從正態分佈的;

樣本均值的均值就是總體均值;

樣本均值的標準誤;—— 此時需要用樣本的標準差代替總體的標準差;

t分布:為了算面積,算概率;

假設檢驗的核心:

首先有乙個假定;

然後用樣本資料看這個假定的資料能否被推翻;

想要推翻就需要知道樣本均值的抽樣分布;

在樣本均值的抽樣分布下,需要算當原假設成立情況下拿到這個樣本或更極端情況下的概率;

這個概率是從正態分佈轉到標準正態分佈或者是t分布的過程來算;

置信區間:

把握程度:比如沒有很大把握確定女生的身高在1.5到1.6m的區間,但有很大把握女生的身高在1-2m之間;把握程度

常認為,把握程度為95%;

樣本均值的正態分佈:

雖然這個分布的中心點是我的總體均值,不知道它是什麼,但有把握一次拿到的樣本均值會落在某乙個範圍內;如果這個把握是95%的把握,那就可以知道它一定會落在正負1.96的標準差範圍內;

當理論上的假設過於嚴苛,用bootstrap方法估計;

樣本是有差異的,但我們要看的不是樣本有沒有差異,而是總體上有沒有差異;

樣本均值差的分布也是乙個正態分佈,而這個正態分佈的均值,正是那兩個總體均值的差;

t分布當樣本量很大時,是漸進正態分佈的;

統計學的假設檢驗

假設檢驗是一種規則,它根據資料樣本所提供的證據,指定是肯定還是否定有關總體的宣告。基本原理是先對總體的特徵作出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件 p 0.01或p 0.05 在一次試驗中基本上不會發...

統計學03 假設檢驗

假設檢驗本質是一種逆向思維的應用。用大白話講,就是假如你想證明自己能辦成一件事,可以先假設你辦不成這件事,通過證明辦不成這件事發生的概率非常小來論證這件事是可以辦成的。在統計學中,這個辦不成這件事的假設被稱為零假設,記為h 0h 0 h0 而你辦成這件事的假設 在事實發生之前同樣是假設 被稱為備擇假...

統計學的假設檢驗

上次寫了統計學裡面的置信度與置信區間以後,文章反響還不錯,這次再來試著寫寫統計學裡面的假設檢驗。假設檢驗的核心其實就是反證法。反證法是數學中的乙個概念,就是你要證明乙個結論是正確的,那麼先假設這個結論是錯誤的,然後以這個結論是錯誤的為前提條件進行推理,推理出來的結果與假設條件矛盾,這個時候就說明這個...