#x為總體向量 n為樣本容量
#replace=f表示無放回抽樣 replace=t表示放回抽樣
#prob可以設定不等概率抽樣
#sample(x,n, replace = f, prob = null)
># 用r模擬擲硬幣 h表示正面 t表示反面 有放回抽樣
> sample(c('h','t'),10,replace=t)
[1] "h"
"t""t"
"t""t"
"h""t"
"h""t"
"t">
> a
> a
[1] "1 1"
"2 1"
"3 1"
"4 1"
"5 1"
"6 1"
"1 2"
"2 2"
"3 2"
[10] "4 2"
"5 2"
"6 2"
"1 3"
"2 3"
"3 3"
"4 3"
"5 3"
"6 3"
[19] "1 4"
"2 4"
"3 4"
"4 4"
"5 4"
"6 4"
"1 5"
"2 5"
"3 5"
[28] "4 5"
"5 5"
"6 5"
"1 6"
"2 6"
"3 6"
"4 6"
"5 6"
"6 6"
> sample(a,10,replace=t)# 模擬擲兩個骰子十次
[1] "5 3"
"2 3"
"1 3"
"4 4"
"6 1"
"5 1"
"2 1"
"6 4"
"1 5"
[10] "2 6"
>
> x
> y
> par(mfrow=c(1,2)) #設定繪圖視窗為 1 x 2
> hist(x,breaks=16,col=gray(.9),main='histogram of source data') #繪製原始資料直方圖
> hist(y,breaks=16,col=gray(.9),main='histogram of bootstrap example') #繪製bootstrap樣本直方圖
>
結果如下圖:
可以發現,bootstrap重抽樣之後的樣本繪製的直方圖較接近原始資料的直方圖
mR 隨機抽樣
1.問題由來 google曾經有一道非常經典的面試題 給你乙個長度為n的鍊錶。n很大,但你不知道n有多大。你的任務是從這n個元素中隨機取出k個元素。你只能遍歷這個鍊錶一次。你的演算法必須保證取出的元素恰好有k個,且它們是完全隨機的 出現概率均等 這道題的解法非常多,網上討論也非常熱烈。本文要討論的是...
MySQL隨機抽樣
最近由於需要大概研究了一下mysql的隨機抽取實現方法。舉個例子,要從tablename表中隨機提取一條記錄,大家一般的寫法就是 select from tablename order by rand limit 1。但是,後來我查了一下mysql的官方手冊,裡面針對rand 的提示大概意思就是,在...
hive 隨機抽樣
1.random sampling syntax select from distribute by rand sort by rand limit 2.bucket table sampling 該方式是最佳化取樣bucket表。rand 函式也可以用來取樣整行。如果取樣列同時使用了cluster...