理解概率分布函式和概率密度函式 筆記1

2021-10-05 06:37:09 字數 2118 閱讀 3032

本文梳理內容:在處理時序資料時,遇到(概率分布函式和概率密度函式,或者累計概率分布等等這些概念,很混亂)這一問題,根據這篇前輩文章梳理了下。

3 連續型隨機變數的「概率密度函式」,「概率分布函式」

為什麼關於」概率」的研究那麼重要?

在這裡,直接引用陳希孺老師在他所著的《概率論與數理統計》這本書中說的:

研究乙個隨機變數,不只是要看它能取哪些值,更重要的是它取各種值的概率如何!

在賈俊平老師的《統計學》教材中,給出了這樣的區分:

如果隨機變數的值都可以逐個列舉出來,則為離散型隨機變數。如果隨機變數x的取值無法逐個列舉則為連續型變數。

進一步解釋,離散型隨機變數是指其數值只能用自然數或整數單位計算的則為離散變數。例如,企業個數,職工人數,裝置台數等,只能按計量單位數計數,這種變數的數值一般用計數方法取得。反之,在一定區間內可以任意取值的變數叫連續變數,其數值是連續不斷的,相鄰兩個數值可作無限分割,即可取無限個數值。例如,生產零件的規格尺寸,人體測量的身高,體重,胸圍等為連續變數,其數值只能用測量或計量的方法取得。那麼土壤水分的觀測值取值區間在[0,1],是連續性隨機變數。

形象點來解釋:

畫一幅畫,左邊是梯子,右邊是斜坡。

像梯子一樣能說出有多少層的,可描述的,是離散型隨機變數;

像斜坡一樣不能說出有多少層階梯,不可描述的,是連續性隨機變數。

(在第一章中注意區分離散型隨機變數和連續性隨機變數,因此,第二章來寫離散型隨機變數,第三章來寫連續性隨機變數)

概率函式,就是用函式的形式來表達概率。

pi=p(x=ai)(i=1,2,3,4,5,6)

在這個函式裡,自變數(x)是隨機變數的取值,因變數(pi)是取值的概率。它就代表了每個取值的概率,所以順理成章的它就叫做了x的概率函式。從公式上來看,概率函式一次只能表示乙個取值的概率。比如p(x=1)=1/6,這代表用概率函式的形式來表示,當隨機變數取值為1的概率為1/6,一次只能代表乙個隨機變數的取值。

概率——的——分布!

這樣的列表被叫做離散型隨機變數的「概率分布」。這個列表,上面是全部可能的取值(一定一定是全部),下面是這個取值相應取到的概率,所以可以理解為叫「離散型隨機變數的值分布和值的概率分布列表」。

例子:一顆6面的骰子,有1,2,3,4,5,6這6個取值,每個取值取到的概率都為1/6。

我的理解就是「累積概率分布」。

看看下圖

連續型隨機變數的「概率函式」換了乙個名字,叫做「概率密度函式」。

為啥要這麼叫呢?在陳希孺老師所著的《概率論與數理統計》這本書中是如下定義的,

概率密度函式用數學公式表示就是乙個定積分的函式,定積分在數學中是用來求面積的,而在這裡,你就把概率表示為面積即可!如下圖:

(連續型隨機變數當然列不出來所有的取值,所以跳過概率分布,直接畫出來概率分布函式啦,下面右圖)

左邊是f(x)連續型隨機變數分布函式畫出的圖形,右邊是f(x)連續型隨機變數的概率密度函式畫出的影象,它們之間的關係就是,概率密度函式是分布函式的導函式。

兩張圖一對比,你就會發現,如果用右圖中的面積來表示概率,利用圖形就能很清楚的看出,哪些取值的概率更大!所以,我們在表示連續型隨機變數的概率時,用f(x)概率密度函式來表示,是非常好的!

但是,可能讀者會有這樣的問題:

q:概率密度函式在某一點的值有什麼意義?

a:比較容易理解的意義,某點的 概率密度函式 即為 概率在該點的變化率(或導數)。很容易誤以為 該點概率密度值 為 概率值.

所以, 概率也需要有個區間.

這個區間可以是x的鄰域(可以無限趨近於0)。對x鄰域內的f(x)進行積分,可以求得這個鄰域的面積,就代表了這個鄰域所代表這個事件發生的概率。

概率分布函式和概率密度函式

如果隨機變數的值可以都可以逐個列舉出來,則為離散型隨機變數。如果隨機變數x的取值無法逐個列舉則為連續型變數。通俗解釋 能夠用日常使用的量詞度量的取值,如次數,個數,塊數等都是離散型隨機變數。無法用這些量詞度量,且取值可以取到小數點2位,3位甚至無限多位的時候,那麼就是連續型隨機變數 如果微積分是研究...

均勻分布的概率密度函式 理解概率密度函式

概率密度函式是概率論中的核心概念之一,用於描述連續型隨機變數所服從的概率分布。在機器學習中,我們經常對樣本向量x的概率分布進行建模,往往是連續型隨機變數。很多同學對於概率論中學習的這一抽象概念是模糊的。在今天的文章中,sigai將直觀的解釋概率密度函式的概念,幫你更深刻的理解它。回憶我們在學習概率論...

概率分布函式, 概率密度函式與概率質量函式

p x p rob x p x prob x p x prob x x x x可以是連續的,也可以是離散的隨機變數.為連續隨機變數定義的 p x p x p x p x p x p x x 它本身不是乙個概率值,可以大於1.在x x x上積分後才是概率值.x x 在數學中,連續型隨機變數的概率密度函...