偏度(skewness)可以用來度量隨機變數概率分布的不對稱性。
公式:其中 是均值,
是標準差。
計算例子:
一組資料為1、2、2、4、1,均值為2,標準差約為1.22,所以偏度為
幾何意義:
偏度的取值範圍為(-∞,+∞)
當偏度<0時,概率分布圖左偏。
當偏度=0時,表示資料相對均勻的分布在平均值兩側,不一定是絕對的對稱分布。
當偏度》0時,概率分布圖右偏。
例如上圖中,兩個概率分布圖都是均值=0.6923,標準差=0.1685的,但是他們的形狀是不一樣的,左圖偏度=-0.537,形狀左偏,右圖偏度=0.537,形狀右偏。
峰度(kurtosis)可以用來度量隨機變數概率分布的陡峭程度。
公式:其中 是均值,
是標準差。
幾何意義:
峰度的取值範圍為[1,+∞),完全服從正態分佈的資料的峰度值為 3,峰度值越大,概率分布圖越高尖,峰度值越小,越矮胖。
例如上圖中,左圖是標準正太分布,峰度=3,右圖的峰度=4,可以看到右圖比左圖更高尖。
通常我們將峰度值減去3,也被稱為超值峰度(excess kurtosis),這樣正態分佈的峰度值等於0,當峰度值》0,則表示該資料分布與正態分佈相比較為高尖,當峰度值<0,則表示該資料分布與正態分佈相比較為矮胖。
[1] measures of shape: skewness and kurtosis
偏度和峰度
偏度這一指標,又稱偏斜係數 偏態係數,是用來幫助判斷資料序列的分布規律性的指標。在資料序列呈對稱分布 正態分佈 的狀態下,其均值 中位數和眾數重合。且在這三個數的兩側,其它所有的資料完全以對稱的方式左右分布。如果資料序列的分布不對稱,則均值 中位數和眾數必定分處不同的位置。這時,若以均值為參照點,則...
偏度和峰度
偏度 skewness 就是分布不對稱的程度。正態分佈是完全對稱的,所以正態分佈的偏度為零。但是現實中很多分布是不對稱的,有的偏向左邊,有的偏向右邊,所以就用偏度來衡量分布偏離的程度。偏度是離群值 outliers 導致的。離群值是那些正數中特別大或者負數中特別小的值,也就是絕對值特別大的值。從名字...
資料的偏度和峰度
我們一般會拿偏度和峰度來看資料的分布形態,而且一般會跟正態分佈做比較,我們把正態分佈的偏度和峰度都看做零。如果我們在實操中,算到偏度峰度不為0,即表明變數存在左偏右偏,或者是高頂平頂這麼一說。偏度是資料的不對稱程度。無論偏度值是 0 正數還是負數,都顯示有關資料分布形狀的資訊。圖 a 圖 b 對稱或...