1 資料抽樣
(1) 簡單隨機抽樣
sample(x,size,replace=false,prob=null)
其中,x表示待抽取物件,一般情況下以向量形式表示;size為非負整數,表示想要抽取樣本的個數;replace表示是否為可放回抽樣,預設不放回;prob用於設定各個抽樣樣本的抽樣概率,預設等概率抽樣。
例子:
library(mass)
data
(insurance)
sub1=sample(nrow(insurance),10,replace=t)
sub2=sample(nrow(insurance),10)
sub3=sample(nrow(insurance),10,replace=t,prob=c(rep(0,nrow(insurance)-1),1))
#設定最後乙個樣本的抽樣概率為1,其他樣本被抽到的概率為0
備註:sample為自帶函式
(2) 分層抽樣
strata(data, stratanames=null, size, method=c
(「srswor」,」srswr」,」poisson」,」systematic」), description=false)
其中,data為待抽樣資料集;stratanames中放置進行分層所依據的變數名稱;size用於設定各層中將要抽出的觀測樣本數,其順序應該與資料集中變數各水平出現順序一致,且在使用該函式前,應當首先對資料集按照該變數進行公升序排列;method引數用於選擇抽樣方法,分別對應於無放回、有放回、泊松、系統抽樣,預設無放回;pik用於設定各層中各樣本的抽樣概率;description引數用於選擇是否輸出含有各層基本資訊的結果。
sub4=strata(insurance,stratanames="district",size=c(1,2,3,4),method="srswor")
#按照街區進行分層,且1~4個街區中無放回抽取1-4個樣本
(3) 整群抽樣
cluster(data, clustername, size, method=c
(「srswor」,」srswr」,」poisson」,」systematic」), description=false)
與分層抽樣稍微不同的是,clustername指用來劃分群的變數的名稱,而size不再為分層抽樣中的乙個向量,這裡僅為乙個正整數,表示需要抽取的群數。
備註:strata和cluster函式需要載入sampling包
2 概率分布
r中提供了18個分布函式
對於所給的分布名稱,加字首「d」(代表密度函式, density)就得到r的密度函式(對於離散分布, 指分布律); 加字首「p」(代表分布函式或概率, cdf)就得到r的分布函式; 加字首「q」(代表分位函式, quantile)就得到r的分位數函式; 加字首「r」(代表隨機模擬, random)就得到r的隨機數發生函式.
r語言與統計分析考試題 R語言與統計分析第四章答案
第四章習題 4.1 xhist x,main c 1000 個引數為 0.3的伯努利分布隨機數 4.2 xhist x,probability t,xlim c min x max x nclass max x min x 1,col lightblue main c 1000 個正態分佈隨機數 l...
統計分析 t分布
t 分布的圖形與特徵 以0為中心,左右對稱的單峰分布 t分布曲線是一簇曲線,其形態變化與自由度的大小有關。自由度越小,則t 值越分散,t分布曲線的峰部越矮而尾部翹得越高 說明尾部面積 概率p 就越大 與u分布曲線相比,t 分布低平 自由度逐漸增大時,t 分布逐漸逼近u 分布 標準正態分佈 當趨於 時...
R之基本統計分析
此部落格主要評述用於生成基本的描述性統計量和推斷統計量的r函式。library hmisc vars c mpg hp wt describe mtcars vars a describe mtcars vars 通過a 來獲取結果 a counts 1 即為觀測數量的值pastecs包中有乙個名為...