統計學(3) 資料抽樣方法的細節

2021-09-28 16:28:15 字數 1998 閱讀 4681

全面調查與抽樣調查是資料收集過程中最常用的2種方法。

1.全面調查:就是對調查物件逐個排查。

優點:得到的資料全面,可靠

缺點:耗費人力物力財力;調查時間長

適用範圍:範圍比較小;容易掌控;不具有破壞性;可操作性強

2.抽樣調查:是從總體中,抽取若干個體(即樣本)進行調查

優點:耗費的人力物力財力少;大量節約調查時間

缺點:需要具有足夠代表性的樣本;具有不穩定性,容易有所偏差

適用範圍:範圍廣,工作量大

3.總體,個體,樣本

總體:在統計學中,我們把所要考察的物件的全體稱為總體。

個體:其中的每個考察物件稱為個體。

樣本:研究中實際觀測或需要抽樣調查出來的那一部分個體稱為樣本。

樣本容量:樣本中包含的個體的數量

4.簡單隨機抽樣:在抽取樣本時,如果總體中的每乙個體都有同等機會被抽選到樣本中,這種抽樣稱為簡單隨機抽樣。這樣得到的樣本稱為隨機樣本。

5.總體和樣本的關係:如果總體是一碗八寶粥,隨機樣本則是充分攪拌後,八寶粥中的任意一勺。且攪拌越充分,樣本的代表性越好。

選取樣本的注意事項:樣本的選取直接影響分析結果。

一般情況下樣本容易出現的問題:(1)抽取的樣本量過少;【樣本與誤差的關係:資料抽取的樣本量越大,抽樣誤差越小,尤其是在樣本分佈不均時,樣本量過少會導致結果的可信度更低】

(2)選取的樣本主體不均勻

(3)樣本抽取的客觀環境不一致

1.抽樣誤差

如果總體是一碗八寶粥,隨機樣本則是充分攪拌後,八寶粥中的任意一勺。且攪拌越充分,樣本的代表性越好。然而,一勺八寶粥中的成分比例和整碗不一定相同,可能稍微多些或稍微少些。這是很正常的,這種差異不是錯誤,而是必然 會出現的抽樣誤差。抽樣誤差是由於抽樣方法所導致的系統誤差,在抽樣中不可避免。

2.未響應誤差:

在抽樣調查中,人們因為種種原因沒有對調查做出反應,這種誤差稱為未相應誤差。

3.響應誤差:

在抽樣調查中,一些人因為各種原因,並沒有真實反映他們的觀點,稱為響應誤差。

和抽樣誤差不一樣,響應誤差和未響應誤差是由於主觀因素導致的,他們都會影響對真實世界的了解。我們在設計調查方案和進行調查過程中要盡量避免。

首先,隨機樣本指的是每個個體都以同等的概率被抽到。在抽樣調查時,最理想的樣本就是隨機樣本,但隨機樣本有時候不是那麼容易獲取。

常用的抽樣方法有以下四種:

(1)隨機抽樣:是指將調查總體的觀察個體全部編號,再隨機抽取部分觀察個體,組成樣本。

優點:由於總體中每個單位都有同等機會被抽中,所以在樣本推論總體時,可用概率的方式客觀地判斷估計值的可靠程度。

缺點:總體較大時,難以一一編號。

(2)分層抽樣:是先把要研究的總體按照某些行政分類,再在各類中分別抽取樣本。比如:按照教育程度把感興趣的人群分成幾類,再在每一類中調查和該類成比例數目的人,以確保每一類都有相應比例的代表。

優點:樣本代表性好,抽樣誤差減小

缺點:抽樣過程繁雜

(3)整群抽樣:指先把總體分成若干群,再從這些群中抽取幾群,然後再在這些抽取的群中對個體進行簡單的隨機抽樣。

優點:便於組織,節省經費

缺點:抽樣誤差大於單純隨機抽樣

(4)系統抽樣:是先把總體中的每個單元編號,然後隨機選取其中之一,作為抽樣開始點進行抽樣。在選取開始點之後,通常從開始點開始控制編號,進行所謂等距抽樣。由於開始點隨機,如果編號隨機,所以系統抽樣類似於隨機抽樣。

優點:易於理解,簡便易行

缺點:總體有週期或者增減趨勢時,容易產生偏差。

(2)邏輯性

(3)明確性

(4)全面性

(5)非誘導性

統計學 變數 資料 抽樣

變數值是變數的取值 變數的型別 1.1 分類變數 1.2 順序變數 1.3 數值型變數 另,根據其取值不同又可分為 離散型變數 連續型變數 資料處理 將資料用圖表等形式展現出來 資料分析 選擇適當的統計方法研究資料,並從資料中提取有用資訊進而得出結論,具體方法有描述統計和推斷統計。推斷統計 如何利用...

統計學習(六) 重抽樣方法

重抽樣 resampling 主要用於以下三個目的 bootstrap 是評價統計精度的一種常見方法。它的基本思想是,利用樣本的重抽樣資料推斷總體。由於總體是未知的,因此,樣本統計量關於總體值的真實誤差也是未知的。在 bootstrap 重抽樣中,總體由樣本表示。設樣本 x1 x2,xn 來自某總體...

征服統計學06 統計模型 抽樣分布是什麼?

本文介紹統計模型和抽樣分布基本知識。統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型 模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離 我們用大量實驗資料去驗證模型是否健壯。實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究...