可參見
多項分布是對二項分布的擴充套件,二項分布是單變數分布,而多項分布式多變數分布。
二項分布每次試驗試驗只有兩種結果,而多項分布每次試驗則會有多種可能性,那麼進行多次的試驗後,多項分布描述的就是每種可能發生次數的聯合概率分布。
首先說一下先驗概率和後驗概率的區別,然後再進行下面的步驟:
驗前概率就是通常說的概率;
驗後概率是一種條件概率,但條件概率不一定是驗後概率;
我們常用的貝葉斯公式
就是由驗前概率求延後概率的公式;
舉乙個簡單的例子:一口袋裡有3只紅球、2隻白球,採用不放回方式摸取,求:
⑴ 第一次摸到紅球(記作a)的概率;
⑵ 第二次摸到紅球(記作b)的概率;
⑶ 已知第二次摸到了紅球,求第一次摸到的是紅球的概率。
解:⑴ p(a)=3/5,這就是驗前概率;
⑵p(b)=p(a)p(b|a)+p(a逆)p(b|a逆)=(3/5)×(1/2)+(2/5)×(3/4)
= 3/5
⑶p(a|b)=p(a)p(b|a)/p(b)=(3/5)×(1/2)/(3/5)=1/2,這就是驗後概率。
beta分布於dirichlet分布的定義域均為【0,1】,在實際生活中,beta分布描述的是單變數分布,dirichlet分布描述的是多變數分布。
於是乎,beta分布可以作為二項分布的先驗概率,dirichlet分布可以作為多項分布的先驗概率。
由於這兩個分布均用到了gamma函式,所以必須先了解gamma函式。
gamma函式的表示式為
其中,x>0
gamma函式有如下性質:
具體推導如下:
gamma函式在beta分布和dirichlet分布中起到了歸一化的作用。
1)beta分布
與連續隨機變數的分布不同,beta分布描述的是定義在區間【0,1】上隨機變數的概率分布,由兩個引數
其概率密度函式為
(1) 當
均 >1時,beta分布為上凸的單峰曲線;
(2)當
乙個大於1,乙個小於1時,beta分布為下凸的的單調函式;
(3)當
均 = 1時,beta分布為常數函式
beta分布的概率密度曲線如下所示:
說明:由於beta分布式定義在區間【0,1】上的,所以適合作為概率的分布(例如機器的維修率、市場的占有率等等)
beta分布的均值和方差分別為:
2)狄利克雷分布(dirichlet分布)
dirichlet分布的每乙個隨機變數的統計量如下:
說明:由於dirichlet分布描述的是多個定義在區間【0,1】上的隨機變數的概率分布,所以通常將其用作多項分布引數 的概率分布。
1)二維連續隨機變數
2)二維離散隨機變數
1)二維均勻分布
設g是平面上的有界區域,其面積為a,若二維隨機隨機變數(x,y)具有如下的概率密度函式,
向平面上有界區域g上任意投乙個質點,如果質點落在g內任意乙個小區域b的概率與小區域的面積成正比,與小區域b的形狀與位置無關,那麼質點的座標(x,y)在g上服從均勻分布。
2)二維正態分佈
說明:表示x和y之間的相關係數。
二維正態分佈的邊緣密度還是一維的正態分佈:
相互獨立的兩個一維正態構成的二位隨機變數是服從二維正態的。
劇本第三部分
第三部分劇本 場景一 女生宿舍,a趴在桌子上睡覺,電腦螢幕亮著,是vs 但是就寫了一行 小碼趴在a的胳膊上睡著。突然,a醒了,發現自己上課要遲到了,a 哎呀,完了完了,大中午的怎麼趴在這睡著了 邊說話邊收拾書包 轉頭看向小碼 a 把你放哪呢 說話的時候四周環視 算了,跟我去吧,我先把你放書包裡 說話...
第三部分 效能
索引管理 效能優化 效能監控 db.c1.find explain 查詢的詳細資訊列出來 db.c1.getindexkyes 所有索引的字段 db.c1.getindexes 所有索引的相關資訊 2 唯一索引 只需要在ensureindex命令中提定 uniqure true 即可建立唯一索引,如...
sqlalchemy第三部分
1.復用。在我們用sqlalchemy運算元據庫時,有部分 可以重複使用,我們將這部分放到乙個模組中,後面使用就可以呼叫這個模組,匯入裡面的方法。python 1.連線資料庫 from sqlalchemy import create engine hostname 127.0.0.1 ip位址 p...