統計學中抽樣調查和一些常用的方法

2021-09-07 05:27:18 字數 1718 閱讀 6508

抽樣調查的領域涉及如何用有效的方式得到樣本。這些調查都利用了問卷,而問卷的設計則很有學問。它設計如何用詞、問題的次序和問題的選擇與組合等等。涉及包括心理學、社會學等知識。問題的語言應該和被調查者的文化水平相適應。那麼抽樣調查的設計的目的之一是確保樣本對總體的代表性,以保證後續推斷的可靠性。然而每個個體可能的簡單隨機抽樣是乙個理想情況。

概率抽樣方法假定每個個體出現在樣本中的概率是已知的。這種概率相抽樣方法使得資料能夠進行合理的統計推斷。

非概率抽樣方法對從非概率抽樣得到的資料進行推斷,它依賴於具體的抽樣方案是如何設計的,也依賴於它是如何實施的。

那麼概率抽樣方法有哪些呢:

1、系統抽樣也成為每n個名字選擇方法(n-th name selection technique),這是先把總體中的每個單元編號,然後隨機選取其中之一作為抽樣的開始點進行抽樣。根據預定的樣本量決定"距離"→n,在選取開始點之後,通常從開始點開始按照編號進行所謂等距抽樣。 比如 起始點為5,"距離" n = 10,則下面的抽查物件為15號、25號等等。如果編號是隨機選取的,則這和簡單隨機抽樣就是等價的了。

2、分層抽樣是簡單隨機抽樣的乙個變種,先把要研究的總體分成相對相似或相對齊次的個體組成的類,再在各類中分別抽取簡單隨機樣本。然後把從各類中得到的結果彙總,並對總體進行判斷。這裡在每類中調查的人數通常是按照該類人的比例,但出於各種考慮,也可能不按照比例,也可能需要加權。(加權的概念:在求若干項的和時,對各項乘以不同的係數,這些係數的和通常為1)

3、整群抽樣是先把總體劃分成若干群,和分層抽樣不同之處在於,這裡的群是由不相似或異類的個體組成的,在單級整群抽樣中,先(通常是隨機的)從這些群中抽取幾群,然後再在這些抽取的群中對個體進行全面調查。在兩極整群抽樣中,先(通常是隨機地)從這些群中抽取幾個群,然後再在這些抽取的群中對個體做簡單隨機抽樣。適用於區域抽樣,比如對某縣的各個村子進行調查,顯然這些村子的情況差異不大,否則就會增大誤差。主要應用在於區域抽樣,群是以區域進行劃分的。

4、多級抽樣在群體很大時,往往在抽取若干群之後,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。 這個在每一級都可能再採用不同的抽樣方法,所以比較複雜,也稱為多級混合型抽樣。

非概率抽樣方法有哪些呢:

1、目的抽樣由研究人員主觀地選擇物件。那麼樣本多少依賴於與預先就有的知識。

2、方便抽樣通常用於初期的評估。比如,為了調查遊客的意見,可能選擇不同的時間和旅遊景點,隨意對願意停下的遊客進行調查。這看起來可能是隨機的,其實並不是。

3、判斷抽樣憑經驗來判斷選擇樣本,通常是方便抽樣的延伸。這種比如 研究各縣的情況,而研究人員僅在乙個縣中抽樣,那麼這個縣就具有代表性。

4、定額抽樣先是確定各類及比例(與分層抽樣類似),然後利用方便抽樣或判斷抽樣來按比例選取需要的個體數。

5、雪球抽樣用於感興趣的樣本特徵較稀有的情況,比如吸毒者,你想調查乙個和吸毒者有關的人,然後這個人就會介紹你找到相關的人,可能會產生較大誤差。 依賴於乙個目標推薦另乙個目標的方法。

6、自我選擇是讓個體自願參加調查。

總的來說,科學的資料抽樣方法很多,但是往往是各種抽樣方法的組合,因為既要考慮精度又要考慮方便性、可行性等。

day 1 心理統計中常用的一些概念和統計符號

總體 指具有某些共同的 可觀測的特徵的一類事物的全體,構成總體的每乙個基本單位稱為個體 樣本 從總體中選出來的個體集合 隨機取樣 從總體中取樣本,要求總體中的每乙個個體被抽取到的概率相同,用隨機取樣抽取的樣本叫隨機樣本 描述統計 指用來整理 概括 簡化資料的統計方法,側重於描述一組資料的全貌,表達一...

c 中FileStream一些常用的屬性和和方法

對流進行操作時要引用 using system.io 命名空間 filestream常用的屬性和方法 屬性 canread 判斷當前流是否支援讀取,返回bool值,true表示可以讀取 canwrite 判斷當前流是否支援寫入,返回bool值,true表示可以寫入 方法 read 從流中讀取資料,返...

python字串 元組和列表常用的一些方法

coding utf 8 the first method print n 尋找字串中第乙個出現可以用find 尋找由特定間隔符隔開的第乙個可以用find 需找特定間隔符隔開的第幾個,先用split分割,然後用下標找 判斷乙個元素是否在列表中,可以使用in很簡單 file object open c...