變數值是變數的取值
變數的型別
1.1 分類變數
1.2 順序變數
1.3 數值型變數
另,根據其取值不同又可分為:離散型變數、連續型變數
資料處理:將資料用圖表等形式展現出來;
資料分析:選擇適當的統計方法研究資料,並從資料中提取有用資訊進而得出結論,具體方法有描述統計和推斷統計。
推斷統計:
如何利用樣本資料來推斷總體特徵的統計方法。
截面資料
時間序列資料
統計量,根據樣本資料計算得出,是樣本的函式。
分類資料和順序資料,一般是由文本來表述,又被稱為定性資料和品質資料。
變數分類:
分類變數、順序變數、數值型變數。
概率抽樣:每乙個單位都有一定機會(已知的,可計算的非零概率)被抽到,可以以相等(等概率抽樣)也可以不相等(不等概率抽樣)。
特點:隨機原則抽取樣本;
概率抽樣可以依據調查結果,計算估計量誤差,從而得到對總體目標量進行估計的可靠程度。也可以按照要求的精確度,計算出必要的樣本數目。
概率抽樣的方式:
2.1. 簡單隨機抽樣:
從抽樣框(抽樣框包含所有總體單位的資訊,作用:提供備菜單位以供抽選,計算相應的概率)中進行;
從總體中的n個單位乙個乙個地抽取,每個單位都是相等的,是一種等概率抽樣;
是一種最基本的抽樣方式,是抽樣方式的基礎;
特點:簡單直觀,在抽樣框完整的時候,可以直接抽取樣本,由於抽選的概率相同,用樣本統計量對目標量進行估計及計算估計量誤差都比較方便
侷限性:當n很大時,抽樣框不宜選取;抽出的單位很分散;沒有利用輔助資訊提高估計的效率。
2.2 分層抽樣
先劃分不同層,然後從各層中抽取。
保證了樣本與總體結構相近。
2.3 整群抽樣
分組(把這樣的組稱為群),然後直接抽群,對群中的所有的單位實施調查。
優點:簡化了編制抽樣框的工作量,較為簡便。
缺點:估計精度比較差。
2.4 系統抽樣
對總體中的所有單位進行排序,選取初始單位,按照一定的規則確定其他樣本。
2.5 多階段抽樣
類似整群抽樣,區別是從抽出的群裡進行再次抽樣,依次推廣,即為多階段抽樣。
優點:樣本相對集中,節約調查費用。
在較大規模的抽樣調查中,多階段抽樣經常使用
非概率抽樣:
特點:抽取樣本不遵循隨機原則,而是根據研究目的對資料的要求,採用某種方法進行抽樣。有如下幾種:
3.1 方便抽樣
依據方便的原則,自行確定入菜單位。
容易實施,但不能將結果推廣到總體當中。
3.2 判斷抽樣
根據以往經驗,有目的的地選取樣本,主觀的。又可分為:重點抽樣、典型抽樣、代表抽樣。
3.3 自願抽樣
3.4 滾雪球抽樣
先對稀少群體調查,之後再請他們提供另外的調查物件,持續下去。
特點:適合對特定頂群體進行研究、搜取資料。
3.5 配額抽樣
類似於概率抽樣的分層抽樣,先分層、再在各層中進行方便抽樣、判斷抽樣等選取單位。
蒐集資料:
自填式、**式、面訪式、觀察式。
實驗資料:
隨機原則分配給實驗組和對照組。
匹配,情況相同的每隊單位分別分配給實驗組和對照組。
統計學(3) 資料抽樣方法的細節
全面調查與抽樣調查是資料收集過程中最常用的2種方法。1.全面調查 就是對調查物件逐個排查。優點 得到的資料全面,可靠 缺點 耗費人力物力財力 調查時間長 適用範圍 範圍比較小 容易掌控 不具有破壞性 可操作性強 2.抽樣調查 是從總體中,抽取若干個體 即樣本 進行調查 優點 耗費的人力物力財力少 大...
統計學 統計學基礎
五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...
征服統計學06 統計模型 抽樣分布是什麼?
本文介紹統計模型和抽樣分布基本知識。統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型 模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離 我們用大量實驗資料去驗證模型是否健壯。實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究...