(1)冪律分布(pow law distribution),其概率密度函式形式如下,
這種分布的共性是絕大多數事件的規模很小,而只有少數事件的規模相當大。
y=cx
-r其中x,
y是正的隨機變數,c,
r均為大於零的常數。
對上式兩邊取對數,可知
lny與
lnx滿足線性關係
lny=lnc-rlnx
,也即在雙對數座標下,冪律分布表現為一條斜率為冪指數的負數的直線,這一線性關係是判斷給定的例項中隨機變數是否滿足冪律的依據。判斷兩個隨機變數是否滿足線性關係,可以求解兩者之間的相關係數;利用一元線性回歸模型和最小二乘法,可得
lny對lnx的經驗回歸直線方程,從而得到y與x之間的冪律關係式。
(2)指數分布
指數分布乙個重要特徵是無記憶性(memoryless property,又稱遺失記憶性)。這表示如果乙個隨機變數呈指數
分布,當s,t>0時有p(t>t+s|t>t)=p(t>s)。即,如果t是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。其概率密度函式和分布函式如下:
其中λ > 0是分布的乙個引數,常被稱為率引數(rate parameter)。即每單位時間內發生某事件的次數。指數分布的區間是[0,∞)。 如果乙個
隨機變數
x呈指數分布,則可以寫作:
x~ e(λ)
2、其他差異
通過資料擬合,發現兩者的不同可以用一句話概括,冪律比指數下降的更快。
參考:泊松分布:
伽馬分布:
伽瑪分布與泊松分布 指數分布的關係
指數分布 要等到乙個隨機事件發生,需要經歷多久時間。伽瑪分布 要等到n個隨機事件發生,需要經歷多久時間。所以,伽瑪分布可以看作是n個指數的獨立隨機變數的加總。泊松分布 在特定時間裡發生n個事件的概率。2 從公式來看 x gamma 概率公式如下 將a 1時,1,代入到伽瑪公式,就變成了指數分布 ga...
泊松分布和指數分布 10分鐘教程
大學時,我一直覺得統計學很難,還差點掛科。工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實很容易理解。我舉乙個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在 10 分鐘內,讓你毫不費力地理解這兩個概念。一 泊松分布 日常生活中,大量事件是有固定頻率...
泊松分布和指數分布 10分鐘教程
大學時,我一直覺得統計學很難,還差點掛科。工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實容易理解多了。我舉乙個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在10分鐘內,讓你毫不費力地理解這兩個概念。一 泊松分布 日常生活中,大量事件是有固定頻率的...