連續型變數
統計功效與樣本量間資料視覺化
一般的研究設計中,臨床結局變數可分為連續性或二分型別,不同型別的設計往往對應不同的結局變數。樣本量計算方法也有所不同。
二分類結局是指結局為二分類且二者互斥,如實施某種**後,患者是否**況。服藥後病情是否改善。
給定組1(n=28)某事件發生概率為30%,組2(n=28)某事件發生概率為55%,計算該研究的統計功效。
power.prop.test(n=
28,p1=
0.3,p2=
0.55
)
two-sample comparison of proportions power calculation
n =28 p1 =
0.3 p2 =
0.55
sig.level =
0.05
power =
0.4720963
alternative = two.sided
note: n is number in
*each* group
結果解釋:power = 0.4720963,在每組樣本n=28,組1發生某事件發生概率為0.3,組2某事件發生概率為0.55的情況下,該試驗設計的統計功效為0.48。
給定組1某事件發生概率為30%,組2某事件發生概率為55%,計算要求統計功效達到80%所需樣本量。
power.prop.test(power=
0.8,p1=
0.3,p2=
0.55
)
two-sample comparison of proportions power calculation
n =60.18568
p1 =
0.3 p2 =
0.55
sig.level =
0.05
power =
0.8 alternative = two.sided
note: n is number in
*each* group
結果解釋:給定組1某事件發生概率為30%,組2某事件發生概率為55%,統計功效達到80%每組所需樣本量為61。
連續型變數指能取到範圍內任意值的變數,如bmi值,身高,體重,血壓,血糖等,可見絕大部分的生化指標,測量資料都屬於連續型變數。
給定組1(n=28),組2(n=28),二者結局指標之間均值差值為0.5,離散程度sd為0.28,計算該研究統計功效。
power.t.test(n=
28,delta=
0.5,sd=
0.28
,type=
"two.sample"
)
two-sample t test power calculation
n =28 delta =
0.5 sd =
0.28
sig.level =
0.05
power =
0.9999979
alternative = two.sided
note: n is number in
*each* group
能發現兩組間均值存在差異性的功效power = 0.9999979
給定組1,組2結局指標之間均值差值為0.5,離散程度sd為0.28,要使研究統計功效達到80%,需要多大的樣本量。
power.t.test(power=
0.8,delta=
0.5,sd=
0.28
,type=
"two.sample"
)
two-sample t test power calculation
n =6.052108
delta =
0.5 sd =
0.28
sig.level =
0.05
power =
0.8 alternative = two.sided
note: n is number in
*each* group
結果解釋:給定組1,組2結局指標之間均值差值為0.5,離散程度sd為0.28,要使研究統計功效達到80%,需要每組至少7個樣本量。
在上述例子中,我們已經知道power.prop.test
函式和power.t.test
函式能夠計算樣本量及統計功效,下述函式可繪製在給定兩組事件發生概率情況下的統計功效與樣本量的散點圖。
samplesizes
10,to=
200,by=10)
power.samplesizes
0.3,p2=
0.55
)$power
plot(samplesizes,
power.samplesizes,
xlim=c(0,
200)
, xlab=
"sample size"
, ylab=
"expected power"
, ylim=c(0,
1), type=
"b",
col=
"darkorange"
, lwd=
5,axes=
false
)axis(
1,at=c(0,
50,100,
150,
200)
)axis(
2,at=c(0,
0.25
,0.5
,0.75,1
),labels=paste(c(0,
25,50,
75,100)
,"%"
))
如圖所示
differences
0.1,to=
2,by=
0.1)
function
(d))
function
(d))
plot(differences,
samplesize.sd04,
xlim=c(0,
2), xlab=
"expected difference between groups"
, ylab=
"required sample size"
, ylim=c(0,
350)
, type=
"b",
col=
"darkblue"
, lwd=
5,axes=
false
)lines(differences, samplesize.sd03,col=
"turquoise"
,lwd=
5,type=
"b")
axis(
1,at=c(0,
0.2,
0.5,1,
1.5,2)
)axis(
2,at=c(
350,
100,50,
10,0)
)legend(x=
"topright"
,lwd=
5,bty=
"n",legend=c(
"sd=0.4"
,"sd=0.3"
),col=c(
"darkblue"
,"turquoise"
))
如圖所示 R語言 基礎統計學之樣本量計算
r語言 基礎統計學之樣本量計算 以下介紹基礎統計學關於樣本量計算的問題,主要解決實際問題中在已知一些統計特徵下,計算所必要的樣本量,共有三種方式 總體方差已知時,總體方差未知時 估計比例為p時的三種情況下的樣本量。若已知總體x的均值為 方差為 2 sigma 2 2,可以依據基本公式 n z1 2 ...
統計科學之最小樣本量計算
這一篇我們講講統計中的最小樣本量計算。大家先想想為什麼叫最小樣本量,而不是最大或者直接叫樣本量計算呢?這是因為最小樣本量這個概念主要用在抽樣統計中,抽樣統計為了研究某一事物的情況而從整體中抽取部分樣本來進行研究,並用抽取的樣本來代替整體的情況。比如要研究中學生的平均身高,你不太可能把全國的中學生身高...
SDRAM容量計算
行位址12位,列位址8位,資料16位,片內有四個組。那麼這塊晶元的容量大小是多少?怎麼計算的?具體計算如下 行位址12位,說明行數是2的12次方。列位址8位,說明列數是2的8次方。資料個數就有2的20次方,就是1mb。即bank大小為1mb。在1mb中,每個資料16位 bit 每位元組為8bit。所...