基於R統計分析樣本與分布

1 資料抽樣

（1）簡單隨機抽樣

sample(x,size,replace=false,prob=null)

其中，x表示待抽取物件，一般情況下以向量形式表示；size為非負整數，表示想要抽取樣本的個數；replace表示是否為可放回抽樣，預設不放回；prob用於設定各個抽樣樣本的抽樣概率，預設等概率抽樣。

例子：

library(mass)
data
(insurance)
sub1=sample(nrow(insurance),10,replace=t) 
sub2=sample(nrow(insurance),10)  
sub3=sample(nrow(insurance),10,replace=t,prob=c(rep(0,nrow(insurance)-1),1)) 
#設定最後乙個樣本的抽樣概率為1，其他樣本被抽到的概率為0

備註：sample為自帶函式

（2）分層抽樣

strata(data, stratanames=null, size, method=c
(「srswor」,」srswr」,」poisson」,」systematic」), description=false)

其中，data為待抽樣資料集；stratanames中放置進行分層所依據的變數名稱；size用於設定各層中將要抽出的觀測樣本數，其順序應該與資料集中變數各水平出現順序一致，且在使用該函式前，應當首先對資料集按照該變數進行公升序排列；method引數用於選擇抽樣方法，分別對應於無放回、有放回、泊松、系統抽樣，預設無放回；pik用於設定各層中各樣本的抽樣概率；description引數用於選擇是否輸出含有各層基本資訊的結果。

sub4=strata(insurance,stratanames="district",size=c(1,2,3,4),method="srswor")
#按照街區進行分層，且1~4個街區中無放回抽取1-4個樣本
（3） 整群抽樣
cluster(data, clustername, size, method=c
(「srswor」,」srswr」,」poisson」,」systematic」), description=false)
與分層抽樣稍微不同的是，clustername指用來劃分群的變數的名稱，而size不再為分層抽樣中的乙個向量，這裡僅為乙個正整數，表示需要抽取的群數。
備註：strata和cluster函式需要載入sampling包
2 概率分布 
r中提供了18個分布函式 
對於所給的分布名稱，加字首「d」(代表密度函式, density)就得到r的密度函式(對於離散分布, 指分布律); 加字首「p」(代表分布函式或概率, cdf)就得到r的分布函式; 加字首「q」(代表分位函式, quantile)就得到r的分位數函式; 加字首「r」(代表隨機模擬, random)就得到r的隨機數發生函式. 
				r語言與統計分析考試題 R語言與統計分析第四章答案
第四章習題 4.1 xhist x,main c 1000 個引數為 0.3的伯努利分布隨機數 4.2 xhist x,probability t,xlim c min x max x nclass max x min x 1,col lightblue main c 1000 個正態分佈隨機數 l...
				統計分析    t分布
t 分布的圖形與特徵 以0為中心，左右對稱的單峰分布 t分布曲線是一簇曲線，其形態變化與自由度的大小有關。自由度越小，則t 值越分散，t分布曲線的峰部越矮而尾部翹得越高 說明尾部面積 概率p 就越大 與u分布曲線相比，t 分布低平 自由度逐漸增大時，t 分布逐漸逼近u 分布 標準正態分佈 當趨於 時...
				R之基本統計分析
此部落格主要評述用於生成基本的描述性統計量和推斷統計量的r函式。library hmisc vars c mpg hp wt describe mtcars vars a describe mtcars vars 通過a 來獲取結果 a counts 1 即為觀測數量的值pastecs包中有乙個名為...

基於R統計分析 樣本與分布

r語言與統計分析考試題 R語言與統計分析第四章答案

統計分析 t分布

R之基本統計分析

相關推薦

基於R統計分析樣本與分布