中心極限定理 講講中心極限定理

2021-10-12 18:14:55 字數 1103 閱讀 4006

今天我們來聊聊統計學裡面比較重要的乙個定理:中心極限定理,中心極限定理是指:現在有乙個總體資料,如果從該總體資料中隨機抽取若干樣本,重複多次,每次抽樣得到的樣本量統計值(比如均值)與總體的統計值(比如均值)應該是差不多的,而且重複多次以後會得到多個統計值,這多個統計值會呈正態分佈。還是直接來看例子吧。

import numpy as np

import pandas as pd

import seaborn as sns

data = np.random.rand(10000)

sns.distplot(data)

上面**是用來生成10000個隨機數的,並繪製分布圖。通過分布圖可以看出,這10000個隨機數基本是均等分布,也就是每個值出現的概率差不多。

現在我們從這10000個樣本中隨機抽取若干個樣本(30、50、100、500),重複抽取100次,會得到100個樣本均值,然後繪製樣本均值分布圖。

上面**是我們每次抽取的樣本量為:30、50、100、500,通過執行上面**可以得到每次抽取不同樣本量對應的樣本均值的分布結果:

可以看到,不同樣本量對應的均值分布均符合正態分佈。以上就是關於中心極限定理的思想。這裡需要弄清楚的一點是樣本均值符合正態分佈,而不是樣本本身符合正態分佈哦。

那這個定理有什麼用呢?還記得我們前面一開始說過的結論嗎?就是抽樣算出來的均值會接近總體的均值,所以基於這個定理的存在,我們可以用抽樣結果的均值來估計總體的均值。比如你要統計一下北京市的平均工資,那麼你就可以從北京全部人口這個總體中隨機抽取部分樣本,抽取若干次,把這若干次的均值再求均值以後,就可以作為北京市全部人口的平均工資。

中心極限定理

中心極限定理是統計學中又一非常重要的性質。什麼是中心極限定理,為了很直觀的理解它我就通過舉例的方式來進行說明。假設有乙個總體t,現在我從t中隨機抽取k個含有n個元素的樣本s,s1,s2,sk 每個樣本s1 x1,x2.xn s2 x1,x2,xn sk x1,x2,xn 每個樣本的均值為x1,x2,...

中心極限定理

中心極限定理指的是 給定乙個任意分布的總體。每次從這些總體中隨機抽取 n 個抽樣,一共抽 m 次。然後把這 m 組抽樣分別求出平均值。這些平均值的分布接近正態分佈。我們先舉個栗子 現在我們要統計全國的人的體重,看看我國平均體重是多少。當然,我們把全國所有人的體重都調查一遍是不現實的。所以我們打算一共...

中心極限定理

抽樣調查,通過抽樣檢測這家工廠生產的100塊雞胸肉的沙門氏菌我們就可以知道結論。問題是,我們一概而論的強大能力,到底是從哪來的?絕大部分來自中心極限定理,中心極限定理是許多統計活動的動力源泉,這些統計活動存在著乙個共同的特點,那就是使用樣本對乙個更大的資料集進行推理。那麼能夠體會出的要義就是 乙個大...