第三部分 概率 3 多維隨機變數的分布

2022-08-09 12:09:12 字數 2384 閱讀 5856

可參見

多項分布是對二項分布的擴充套件,二項分布是單變數分布,而多項分布式多變數分布。

二項分布每次試驗試驗只有兩種結果,而多項分布每次試驗則會有多種可能性,那麼進行多次的試驗後,多項分布描述的就是每種可能發生次數的聯合概率分布。

首先說一下先驗概率和後驗概率的區別,然後再進行下面的步驟:

驗前概率就是通常說的概率;

驗後概率是一種條件概率,但條件概率不一定是驗後概率;

我們常用的貝葉斯公式

就是由驗前概率求延後概率的公式;

舉乙個簡單的例子:一口袋裡有3只紅球、2隻白球,採用不放回方式摸取,求:

⑴ 第一次摸到紅球(記作a)的概率;

⑵ 第二次摸到紅球(記作b)的概率;

⑶ 已知第二次摸到了紅球,求第一次摸到的是紅球的概率。

解:⑴ p(a)=3/5,這就是驗前概率;

⑵p(b)=p(a)p(b|a)+p(a逆)p(b|a逆)=(3/5)×(1/2)+(2/5)×(3/4) 

= 3/5

⑶p(a|b)=p(a)p(b|a)/p(b)=(3/5)×(1/2)/(3/5)=1/2,這就是驗後概率。

beta分布於dirichlet分布的定義域均為【0,1】,在實際生活中,beta分布描述的是單變數分布,dirichlet分布描述的是多變數分布。

於是乎,beta分布可以作為二項分布的先驗概率,dirichlet分布可以作為多項分布的先驗概率。

由於這兩個分布均用到了gamma函式,所以必須先了解gamma函式。

gamma函式的表示式為

其中,x>0

gamma函式有如下性質:

具體推導如下:

gamma函式在beta分布和dirichlet分布中起到了歸一化的作用。

1)beta分布

與連續隨機變數的分布不同,beta分布描述的是定義在區間【0,1】上隨機變數的概率分布,由兩個引數

其概率密度函式為

(1) 當

均 >1時,beta分布為上凸的單峰曲線;

(2)當

乙個大於1,乙個小於1時,beta分布為下凸的的單調函式;

(3)當

均 = 1時,beta分布為常數函式

beta分布的概率密度曲線如下所示:

說明:由於beta分布式定義在區間【0,1】上的,所以適合作為概率的分布(例如機器的維修率、市場的占有率等等)

beta分布的均值和方差分別為:

2)狄利克雷分布(dirichlet分布)

dirichlet分布的每乙個隨機變數的統計量如下:

說明:由於dirichlet分布描述的是多個定義在區間【0,1】上的隨機變數的概率分布,所以通常將其用作多項分布引數 的概率分布。

1)二維連續隨機變數

2)二維離散隨機變數

1)二維均勻分布

設g是平面上的有界區域,其面積為a,若二維隨機隨機變數(x,y)具有如下的概率密度函式,

向平面上有界區域g上任意投乙個質點,如果質點落在g內任意乙個小區域b的概率與小區域的面積成正比,與小區域b的形狀與位置無關,那麼質點的座標(x,y)在g上服從均勻分布。

2)二維正態分佈

說明:表示x和y之間的相關係數。

二維正態分佈的邊緣密度還是一維的正態分佈:

相互獨立的兩個一維正態構成的二位隨機變數是服從二維正態的。

劇本第三部分

第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...

第三部分 效能

索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...

sqlalchemy第三部分

1.復用。在我們用sqlalchemy運算元據庫時,有部分 可以重複使用,我們將這部分放到乙個模組中,後面使用就可以呼叫這個模組,匯入裡面的方法。python 1.連線資料庫 from sqlalchemy import create engine hostname 127.0.0.1 ip位址 p...