讀者可能會有這樣的感受,如果樣本空間
c 中的元素不是數的話,描述起來非常麻煩,現在我們就形式化乙個規則或者一組規則,根據這些規則,
c 中的元素
c 可以用數來表示。首先討論最簡單的情況,考慮擲硬幣的隨機試驗,樣本空間是c=
,t,h
分別表示尾與頭。
x 是乙個函式,如果c是
t ,那麼x(
c)=0
,如果c
是h,那麼x(c
)=1 ,因此
x 是定義在樣本空間
c上的實值函式,這就讓我們從樣本空間
c 變換到了實數d=
空間,現在我們形式化隨機變數與其空間的定義。定義
1:考慮樣本空間為
c 的隨機試驗,函式
x 給每個元素c∈
c只分配乙個數x(
c)=x
,我們稱其為隨機變數,
x 的空間或者值域是實數d=
的集合。
在我們的討論中,
d 一般是可數集合或者乙個實數區間,我們稱第一種型別的隨機變數為離散隨機變數,第二種稱為連續隨機變數。本篇先討論離散與連續隨機變數的例子,然後再分別詳細討論他們。
隨機變數
x 誘導出實數軸
r上的新樣本空間
d ,那麼與事件
b 和概率
p 相似的又是什麼呢?考慮x
是乙個離散隨機變數,且有乙個有限的空間d=
,這時候有
m 個事件由: ,i
=1,…
,m給定,因此,對於隨機變數,
d 上的
σ 域是由簡單事件d1
,…,d
m (
d 的集(所有子集集合)生成的,令
f 表示這個
σ 域。
從而我們有了乙個樣本空間與乙個事件集,那麼概率集合函式呢?對於
f 中的任何事件
b ,我們定義 px
(b)=
p(1)
我們需要說明px
滿足概率的三公理。
注意,首先px
(b)>
0 ,其次,因為
x 的定義域是
c,所以我們有px
(d)=
p(c)
=1,因此px
滿足概率的前兩個公理,對第三個公理得證明留給讀者。由此可知px
是d上的概率,我們稱px
是隨機變數
x 在
d上匯出的概率。
我們現在簡化上面的討論,因為
f 中的任何事件
b 是d=
的乙個子集,px
滿足 px
(b)=
∑di∈
bp因此,px
完全由函式 px
(di)
=px[
],fo
ri=1
,…,m
(2) 函式p
x(di
) 稱為
x 的概率質量函式,簡寫為pm
f,下面先給出一段批註,然後考慮乙個例項。注1
: 在等式1與2中,根據px
,px 中的下標
x 可以看出他們是隨機變數匯出的概率集合函式與pmf,我們會經常使用這種符號,尤其是討論多個變數的時候。另一方面,如果隨機變數很明顯,那麼我們就省略不寫。例1
:現在擲兩次骰子,令
x 表示兩次得到的數字之和,樣本空間是c=
,因為骰子每面朝上的概率是相等的,所以p[
(i,j
)]=1
/36,隨機變數
x 是x(
i,j)
=i+j
,x的空間是d=
2,…,
12,x 的pmf為
c上的概率空間的
σ 域由23
6 個子集組成,(
c 中元素子集的個數)但是我們感興趣的是隨機變數
x ,只有11個我們感興趣的事件;即事件x=
k,k=
2,…,
12。為了說明關於
x 的概率計算,假設b1
=,b2
=,那麼 px
(b1)
px(b
2)=∑
x∈b1
px(x
)=636
+236=
836=∑
x∈b2
px(x
)=136
+236+
136=4
36 其中p
x(x)
如表中所示。
對於連續隨機變數,考慮下面簡單的試驗:在區間(0
,1) 上隨機選擇乙個實數,令
x 表示選擇的數,此時
x的空間是d=
(0,1
) ,這不像上面的例子那樣可以容易的匯出px
的概率,但是有一些直觀上的概率,例如,因為數是隨機選擇的,所以我們感覺 px
[(a,
b)]=
b−a,
for0
<
a<
b<1
的分配方式比較合理。
對於連續隨機變數
x ,我們想要
x的概率模型是由區間概率確定的,因此我們取
r 上事件的類別為博萊爾σ域
b0,它是由區間匯出的。注意它也包含了離散隨機變數。例如,事件di
可以用取得的交來表示;例如=∩
n(di
−(1/
n),d
i]。定義2
: 令
x 是隨機變數,那麼它的累加分布函式,(c
df)定義為 fx
(x)=
px((
−∞,x
])=p
(x≤x
)(3) 注
2:回顧一下,
p 是樣本空間
c上的概率,所以等式3中右邊的項需要定義,我們定義為 p(
x≤x)
=p()
這是比較方便的縮寫形式,我們會經常使用這種寫法。
另外,fx(
x)經常稱為分布函式(d
f),然而,我們加上累加,以此來說明fx
(x) 累加了小於等於
x 的概率。
概率論與數理統計 小結2 隨機變數概述
注 對隨機變數及其取值規律的研究是概率論的核心內容。在上乙個小結中,總結了隨機變數的概念以及隨機變數與事件的聯絡。這個小結會更加深入的討論隨機變數。隨機變數的本質是一種函式 對映關係 在古典概率模型中,事件和事件的概率 是核心概念 但是在現代概率論中,隨機變數及其取值規律 是核心概念。隨機變數與事件...
統計類知識 隨機變數
概率 概率是描述在一次隨機試驗中的某個隨機事件發生可能性大小的度量。用0與1之間的數值來表明事件a在隨機實驗 現的可能性大小,通常記作 p a p a p a 隨機事件與基本事件 在一定條件下可能發生也可能不發生的事件,叫做隨機事件。試驗的每乙個可能的結果稱為基本事件。什麼是隨機現象?在給定的條件下...
概率統計 隨機變數與隨機事件
統計學之前的定義不再說,簡單,求概率之類的,值得一體的是條件概率和貝葉斯公式,可是機器學習中樸素貝葉斯的核心了哈哈哈 1.條件概率 條件概率 通俗點就是研究事件間關係,已知乙個事件發生的條件下考慮另乙個事件發生的概率規律有無變化以及如何變化,公式就是分母a的概率分子是ab同時發生的概率。2貝葉斯 貝...