作者:長行四分位距:四分位距(interquartile range),是一種衡量一組資料離散程度的統計量,用iqr表示。其值為第一四分位數和第三四分位數的差距。時間:2019.03.10
四分位距的計算公式如下:
i qr
=q3−
q1
iqr=q_3-q_1
iqr=q3
−q1
其中q
1q_1
q1為第一四分位數,q
3q_3
q3為第三四分位數
import math
data_test=[1
,2,3
,4,5
,6,7
,8,9
,10,11
,12]# 定義測試資料
#四分位數計算方法一(相當於excel的quartile.exc方法)
defquantile_exc
(data, n)
:if n<
1or n>3:
return false
data.sort(
) position =
(len
(data)+1
)*n/
4 pos_integer =
int(math.modf(position)[1
])pos_decimal = position - pos_integer
quartile = data[pos_integer -1]
+(data[pos_integer]
- data[pos_integer -1]
)*pos_decimal
return quartile
#四分位數計算方法二(相當於excel的quartile.inc方法)
defquantile_inc
(data, n)
:if n<
1or n>3:
return false
data.sort(
) position =1+
(len
(data)-1
)*n/
4 pos_integer =
int(math.modf(position)[1
])pos_decimal = position - pos_integer
quartile = data[pos_integer -1]
+(data[pos_integer]
- data[pos_integer -1]
)*pos_decimal
return quartile
# 測試
print
('iqr(1) ='
,quantile_exc(data_test,3)
-quantile_exc(data_test,1)
)print
('iqr(2) ='
,quantile_inc(data_test,3)
-quantile_inc(data_test,1)
)
結果 統計學 統計學基礎
五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...
pyhon常用統計學實現
對於python,經常被別人調侃不是一門適合做統計分析的語言,說起統計分析,最經常提到的是後sas or r,實際在python中也有相關的模組實現統計方面的功能。第一種是呼叫相關的包去呼叫r軟體,可以實現,這種方式在我前面的部落格裡面提到過,但是這種太過依賴於r,說到底還不是python自己的實現...
統計學 論統計學知識點
二 資料度量標準 三 概率分布 四 統計假設檢驗 五 相關和回歸 總結說明 統計學在資料分析的基礎上,研究如何測定,收集,整理,歸納和分析資料規律,以便給出正確訊息的學科。它在資料探勘,自然語言處理,機器學習中都被廣泛使用,比如博主之前的那篇關於規則與統計相結合的詞義消岐方法研究學習筆記,其中作者就...