隨機變數
概率分布
均值方差
一般離散型變數p(
x)的表
、公式或
者圖∑x
xp(x
) ∑x
(x−μ
)2p(
x)二項分布p(
x)=c
xnpx
qn−x
(x=0
,1,2
,3⋅⋅
⋅,n)
npnp
q
泊松分布p(
x)=λ
xe−λ
x!(x
=0,1
,2,⋅
⋅⋅)
λ
λ
超幾何分布p(
x)=c
xrcn
−xn−
rcnn
nrn r(
n−r)
n(n−
n)n2
(n−1
)
均勻分布f(
x)=1
b−a(
a≤x≤
b)a+
b2b−
a12√
正態分佈f(
x)=1
σ2π√
e−(1
/2)[
(x−μ
)σ]2
μ σ2
標準正太分布f(
z)=1
2π√e
−(1/
2)z2
01指數分布f(
x)=1
θe−x
/θ(x
>0)
μ=θ σ=
θ
離散型隨機變數(discrete random variable):取值是可數的個值的隨機變數, 比如投擲一枚骰子的朝上的點數,可能是1,2,3,4,5,6;比如南京大學四食堂吃飯的人數,可能是0,1,2···。
連續型隨機變數(continuous random variable):取值是乙個區間中的任意一點(也就是不可數)的隨機變數,比如南京大學同學身高。
基本概念的公式表達
均值(期望值expected value):μ=
e(x)
=∑xp
(x)
方差(variance):σ=
e[(x
−μ)2
]=∑(
x−μ)
2p(x
)
標準差(standard deviation):σ=
σ2−−
√
其中,可以證明到e[
(x−μ
2)]=
e(x)
2−μ2
2. 二項分布
如果進行n次不同的實驗,每次試驗完全相同並且只有兩種可能的結果,這樣的實驗結果分布情況就是二項分布。最簡單的比如投擲一枚硬幣,不管進行多少次實驗,實驗結果都只有正面朝上或者反面朝上,這就是乙個簡單的二項分布。
二項概率分布:
p(x)
=cxn
pxqn
−x(x
=0,1
,2,3
⋅⋅⋅,
n)
其中:n代表n次實驗,x表示實驗結果為t的次數,q是實驗結果為t的概率,q=1-p,表示實驗結果為f的概率。
二項分布的均值:μ=n
p
方差:σ2=
npq
標準差:σ=
npq−
−−√
二項分布對於結果只有兩種情況的隨機事件有非常好的描述,屬於日常生活中最常見、最簡單的隨機變數概率分布,在知道某種實驗結果概率的情況下,能夠很好推斷實驗次數後發生其中某一結果次數的概率。
3. 泊松分布
泊松分布的概率分布,均值和方差:
p(x)
=λxe
−λx!
(x=0
,1,2
,⋅⋅⋅
) μ=
λ σ2
=λ4. 超幾何分布
超結合分布和二項分布比較相似,二項分布每次實驗完全一樣,而超幾何分布前一次的實驗結果會影響後面的實驗結果。簡單地講,二項分布抽取之後放回元素,而超幾何分布是無放回的抽取。
超幾何分布的概率分布,均值和方差: p(
x)=c
xrcn
−xn−
rcnn
μ=nr
n σ2
=r(n
−r)n
(n−n
)n2(
n−1)
特別的,當μ=
0且σ=
1 的正態分佈,被稱為標準正太分布(standard distribution),此時有: f(
z)=1
2π−−
√e−(
1/2)
z2標準正態分佈有對應的標準正態分佈表,通過該錶可以找到對應值累積的概率。
正太分布轉化為標準正態分佈:
正太分布x,
均值是μ
,標準差
是σ,z
定義為z
=(x−
μ)/σ
正態分佈來近似二項分布
當n足夠大的時候,正態分佈對於離散型二項分布能夠很好地近似。
評價正態分佈
如何來確定資料是否正態分佈,主要有以下幾種方法:
1. 圖形感受法:建立直方圖或者枝幹圖,看影象的形狀是否類似正太曲線,既土墩形或者鐘形,並且兩端對稱。
2. 計算區間x¯
±s,x
¯±2s
,x¯±
3s,看落在區間的百分比是否近似於68%,95%,100%。(切比雪夫法則和經驗法則)
3. 求iq
r和標準
差s,計
算iqr
/s,如
若是正態
分布,則
iqr/
s≈1.3.
4. 建立正態概率圖,如果近似正態分佈,點會落在一條直線上。
2. 均勻分布
均勻概率分布(uniform probability distribution)是指連續隨機變數所有可能出現值出現概率都相同。
均勻隨機變數x概率分布特徵:
概率密度函式:f(
x)=1
b−a(
a≤x≤
b)均值:μ=
a+b2
標準差:σ=
b−a12
√3. 指數分布
指數概率分布(exponential probability distribution),具有如下特徵:
概率密度函式:f(
x)=1
θe−x
/θ(x
>0)
均值: μ=
θ 標準差:σ=
θ
連續型隨機變數
1.對於乙個連續型隨機變數,它取任何固定值的概率都等於0。因此,對於連續隨機變數,下式成立 f a a f x dx p a f x dx df a da f a f a 可看作隨機變數取值於點a附近的可能性的乙個度量。3.連續型隨機變數的期望e x xf x dx,方差可根據var x e x2 ...
離散型隨機變數的分布函式的繪製
前言 繪製連續型的分布函式很容易,直接根據分布函式計算函式值即可。但是對於離散型隨機變數而言,沒有已知的分布函式,只能使用經驗分布函式或者說是累積分布函式進行近似。下文以離散分布中比較經典的二項分布 泊松分布以及幾何分布為例繪製它們的經驗分布函式。二項分布bin n,p n 50 二項分布引數n p...
連續型隨機變數 概率密度函式
注 本篇的表述大部分來自陳希孺先生著 概率論與數理統計 連續型隨機變數的概率分布不能用像離散型變數那樣去描述。原因在於,這種變數的取值充滿乙個區間,無法一一排出,在應用中求精確到某一點的概率是不可能的。實際上,計算連續型隨機變數的概率一般是求隨機變數在某個區間內取值的概率,而在理論和實用上較方便的方...