泊松分布和指數分布 10分鐘教程

2022-01-22 07:05:49 字數 1980 閱讀 8091

大學時,我一直覺得統計學很難,還差點掛科。

工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實很容易理解。

我舉乙個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。

我可以在 10 分鐘內,讓你毫不費力地理解這兩個概念。

一、泊松分布

日常生活中,大量事件是有固定頻率的。

它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生 3 個嬰兒,請問下乙個小時,會出生幾個?

有可能一下子出生 6 個,也有可能乙個都不出生。這是我們沒法知道的。

泊松分布就是描述某段時間內,事件具體的發生概率。

上面就是泊松分布的公式。等號的左邊,p 表示概率,n表示某種函式關係,t 表示時間,n 表示數量,1 小時內出生 3 個嬰兒的概率,就表示為 p (n(1) = 3) 。等號的右邊,λ 表示事件的頻率。

泊松分布的圖形大概是下面的樣子。

可以看到,在頻率附近,事件的發生概率最高,然後向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生 3 個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。

接下來兩個小時,乙個嬰兒都不出生的概率是 0.25%,基本不可能發生。

接下來乙個小時,至少出生兩個嬰兒的概率是 80%。

二、指數分布

指數分布描述事件發生間隔的概率。下面這些都屬於指數分布。

指數分布的公式可以從泊松分布推斷出來。如果下乙個嬰兒至少要間隔時間 t 才會出生,那就等同於時間 t 之內沒有任何嬰兒出生。

反過來,事件會在時間 t 之內發生的概率,就是 1 減去上面的值。

指數分布的圖形大概是下面的樣子。

可以看到,隨著間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生 3 個嬰兒,上面已經算過了,下乙個嬰兒間隔 2 小時才出生的概率是 0.25%,那麼間隔 3 小時、間隔 4 小時的概率,是不是更接近於0?

接下來 15 分鐘,會有嬰兒出生的概率是 52.76%。

接下來的 15 分鐘到 30 分鐘,會有嬰兒出生的概率是 24.92%。

三、總結

泊松分布和指數分布,都有乙個前提,那就是事件之間不能有關聯,必須是獨立事件,否則就不能運用上面的公式。

一句話總結:泊松分布是單位時間內獨立事件發生次數的概率分布,指數分布是獨立事件的時間間隔的概率分布。

[說明] 本文受到 nbviewer 文件的啟發。

(正文完)

泊松分布和指數分布 10分鐘教程

大學時,我一直覺得統計學很難,還差點掛科。工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實容易理解多了。我舉乙個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在10分鐘內,讓你毫不費力地理解這兩個概念。一 泊松分布 日常生活中,大量事件是有固定頻率的...

伽瑪分布與泊松分布 指數分布的關係

指數分布 要等到乙個隨機事件發生,需要經歷多久時間。伽瑪分布 要等到n個隨機事件發生,需要經歷多久時間。所以,伽瑪分布可以看作是n個指數的獨立隨機變數的加總。泊松分布 在特定時間裡發生n個事件的概率。2 從公式來看 x gamma 概率公式如下 將a 1時,1,代入到伽瑪公式,就變成了指數分布 ga...

指數分布與冪律分布定義及不同(泊松分布 伽馬分布)

1 冪律分布 pow law distribution 其概率密度函式形式如下,這種分布的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。y cx r其中x,y是正的隨機變數,c,r均為大於零的常數。對上式兩邊取對數,可知 lny與 lnx滿足線性關係 lny lnc rlnx 也即在雙對...