statistics模組 統計分析

2021-10-03 09:53:04 字數 2330 閱讀 5622

1.計算平均值函式mean()

>>> import statistics

>>> statistics.mean([1,2,3,4,5,6,7,8,9]) #使用包含整數的列表作為引數

5>>> statistics.mean(range(1,10)) #使用range物件作為引數

5>>> import fractions

>>> x=[(3,7),(1,21),(5,3),(1,3)]

>>> y=[fractions.fraction(*item) for item in x]

>>> y

[fraction(3, 7), fraction(1, 21), fraction(5, 3), fraction(1, 3)]

>>> statistics.mean(y) #使用包含分數的列表作為引數

fraction(13, 21)

>>> import decimal

>>> x=('0.5','0.75','0.625','0.375')

>>> y=map(decimal.decimal,x)

>>> y

>>> statistics.mean(y)

decimal('0.5625')

2.中位數函式

median():偶數個樣本時讀取中間兩個數的平均數

median_low():偶數個樣本時讀取中間兩個數的較小值

median_high:偶數個樣本時讀取中間兩個數的較大值

median_grouped():

>>> statistics.median([1,3,5,7])

4.0>>> statistics.median_low([1,3,5,7])

3>>> statistics.median_high([1,3,5,7])

5>>> statistics.median(range(1,10))

5>>> statistics.median_low([3,5,7]),statistics.median_high([3,5,7])

(5, 5)

>>> statistics.median_grouped([3,5,7])

5.0>>> statistics.median_grouped([52,52,53,54])

52.5

>>> statistics.median_grouped([1,3,3,5,7])

3.25

>>> statistics.median_grouped([1,3,3,5,7],interval=2)

3.5

3.返回常見資料或出現次數最多的資料

>> statistics.mode([1,3,5,7])  #無法確定出現次數最多的元素

statistics.statisticserror: no unique mode; found 4 equally common values

>>> statistics.mode([1,3,5,7,5,5,3])

5'red'

4.pstdev():返回總體標準差

>>> statistics.pstdev([1.5,2.5,2.5,2.75,3.25,4.75])

0.986893273527251

>>> statistics.pstdev(range(20))

5.766281297335398

5.pvariance():返回總體方差或二次矩

>>> statistics.pvariance([1.5,2.5,2.5,2.75,3.25,4.75])

0.9739583333333334

>>> statistics.pvariance(range(20))

33.25

>>> x=[1,2,3,4,5,6,7,8,9,10]

>>> mu=statistics.mean(x)

>>> mu

5.5

6.variance()、stdev(),計算樣本方差和樣本標準差

>>> statistics.variance(range(20))

35.0

>>> statistics.stdev(range(20))

5.916079783099616

>>> _*_

35.0

>>> statistics.variance([3,3,3,3,3]),statistics.stdev([3,3,3,3,3])

(0, 0.0)

statistics 數學統計函式

statistics 數學統計函式 資源 位置 lib statistixs.py 該模組為數學 限定為實數 資料提供了計算數學統計量的函式。1.平均值與中位值測算 以下的函式可以用於計算總體或樣本的平均值或典型值。mean 資料的算數平均值 harmonix mean 資料的調和平均值 如果存在x...

最早的統計分詞

文章 richard sproat,a statistical method for finding word boundaries in chinese,1990 剛看了一篇2020年關於分詞的綜述,當中提到,最早使用統計方法進行分詞的是1990的一篇文章,看了一下作者名字,richard spr...

numpy統計分布顯示

計算鳶尾花花瓣長度的最大值,平均值,中值,均方差。import numpy asnp from sklearn.datasets import load iris data load iris iris data.data petal length iris 2 取所有行的第二列 print np....