基於R統計分析 樣本與分布

2021-07-06 07:34:51 字數 1823 閱讀 5222

1 資料抽樣

(1) 簡單隨機抽樣

sample(x,size,replace=false,prob=null)
其中,x表示待抽取物件,一般情況下以向量形式表示;size為非負整數,表示想要抽取樣本的個數;replace表示是否為可放回抽樣,預設不放回;prob用於設定各個抽樣樣本的抽樣概率,預設等概率抽樣。

例子:

library(mass)

data

(insurance)

sub1=sample(nrow(insurance),10,replace=t)

sub2=sample(nrow(insurance),10)

sub3=sample(nrow(insurance),10,replace=t,prob=c(rep(0,nrow(insurance)-1),1))

#設定最後乙個樣本的抽樣概率為1,其他樣本被抽到的概率為0

備註:sample為自帶函式

(2) 分層抽樣

strata(data, stratanames=null, size, method=c

(「srswor」,」srswr」,」poisson」,」systematic」), description=false)

其中,data為待抽樣資料集;stratanames中放置進行分層所依據的變數名稱;size用於設定各層中將要抽出的觀測樣本數,其順序應該與資料集中變數各水平出現順序一致,且在使用該函式前,應當首先對資料集按照該變數進行公升序排列;method引數用於選擇抽樣方法,分別對應於無放回、有放回、泊松、系統抽樣,預設無放回;pik用於設定各層中各樣本的抽樣概率;description引數用於選擇是否輸出含有各層基本資訊的結果。

sub4=strata(insurance,stratanames="district",size=c(1,2,3,4),method="srswor")

#按照街區進行分層,且1~4個街區中無放回抽取1-4個樣本

(3) 整群抽樣

cluster(data, clustername, size, method=c

(「srswor」,」srswr」,」poisson」,」systematic」), description=false)

與分層抽樣稍微不同的是,clustername指用來劃分群的變數的名稱,而size不再為分層抽樣中的乙個向量,這裡僅為乙個正整數,表示需要抽取的群數。

備註:strata和cluster函式需要載入sampling包

2 概率分布

r中提供了18個分布函式

對於所給的分布名稱,加字首「d」(代表密度函式, density)就得到r的密度函式(對於離散分布, 指分布律); 加字首「p」(代表分布函式或概率, cdf)就得到r的分布函式; 加字首「q」(代表分位函式, quantile)就得到r的分位數函式; 加字首「r」(代表隨機模擬, random)就得到r的隨機數發生函式.

r語言與統計分析考試題 R語言與統計分析第四章答案

第四章習題 4.1 xhist x,main c 1000 個引數為 0.3的伯努利分布隨機數 4.2 xhist x,probability t,xlim c min x max x nclass max x min x 1,col lightblue main c 1000 個正態分佈隨機數 l...

統計分析 t分布

t 分布的圖形與特徵 以0為中心,左右對稱的單峰分布 t分布曲線是一簇曲線,其形態變化與自由度的大小有關。自由度越小,則t 值越分散,t分布曲線的峰部越矮而尾部翹得越高 說明尾部面積 概率p 就越大 與u分布曲線相比,t 分布低平 自由度逐漸增大時,t 分布逐漸逼近u 分布 標準正態分佈 當趨於 時...

R之基本統計分析

此部落格主要評述用於生成基本的描述性統計量和推斷統計量的r函式。library hmisc vars c mpg hp wt describe mtcars vars a describe mtcars vars 通過a 來獲取結果 a counts 1 即為觀測數量的值pastecs包中有乙個名為...