statistics模組統計分析

1.計算平均值函式mean()

>>> import statistics
>>> statistics.mean([1,2,3,4,5,6,7,8,9])  #使用包含整數的列表作為引數
5>>> statistics.mean(range(1,10))  #使用range物件作為引數
5>>> import fractions
>>> x=[(3,7),(1,21),(5,3),(1,3)]
>>> y=[fractions.fraction(*item) for item in x]
>>> y
[fraction(3, 7), fraction(1, 21), fraction(5, 3), fraction(1, 3)]
>>> statistics.mean(y)  #使用包含分數的列表作為引數
fraction(13, 21)
>>> import decimal
>>> x=('0.5','0.75','0.625','0.375')
>>> y=map(decimal.decimal,x)
>>> y
>>> statistics.mean(y)
decimal('0.5625')

2.中位數函式

median():偶數個樣本時讀取中間兩個數的平均數

median_low()：偶數個樣本時讀取中間兩個數的較小值

median_high：偶數個樣本時讀取中間兩個數的較大值

median_grouped()：

>>> statistics.median([1,3,5,7])
4.0>>> statistics.median_low([1,3,5,7])
3>>> statistics.median_high([1,3,5,7])
5>>> statistics.median(range(1,10))
5>>> statistics.median_low([3,5,7]),statistics.median_high([3,5,7])
(5, 5)
>>> statistics.median_grouped([3,5,7])
5.0>>> statistics.median_grouped([52,52,53,54])
52.5
>>> statistics.median_grouped([1,3,3,5,7])
3.25
>>> statistics.median_grouped([1,3,3,5,7],interval=2)
3.5

3.返回常見資料或出現次數最多的資料

>> statistics.mode([1,3,5,7])  #無法確定出現次數最多的元素
statistics.statisticserror: no unique mode; found 4 equally common values
>>> statistics.mode([1,3,5,7,5,5,3])
5'red'

4.pstdev():返回總體標準差

>>> statistics.pstdev([1.5,2.5,2.5,2.75,3.25,4.75])
0.986893273527251
>>> statistics.pstdev(range(20))
5.766281297335398

5.pvariance():返回總體方差或二次矩

>>> statistics.pvariance([1.5,2.5,2.5,2.75,3.25,4.75])
0.9739583333333334
>>> statistics.pvariance(range(20))
33.25
>>> x=[1,2,3,4,5,6,7,8,9,10]
>>> mu=statistics.mean(x)
>>> mu
5.5

6.variance()、stdev(),計算樣本方差和樣本標準差

>>> statistics.variance(range(20))
35.0
>>> statistics.stdev(range(20))
5.916079783099616
>>> _*_
35.0
>>> statistics.variance([3,3,3,3,3]),statistics.stdev([3,3,3,3,3])
(0, 0.0)

statistics 數學統計函式

statistics 數學統計函式資源位置 lib statistixs.py 該模組為數學限定為實數資料提供了計算數學統計量的函式。1.平均值與中位值測算以下的函式可以用於計算總體或樣本的平均值或典型值。mean 資料的算數平均值 harmonix mean 資料的調和平均值如果存在x...

最早的統計分詞

文章 richard sproat,a statistical method for finding word boundaries in chinese,1990 剛看了一篇2020年關於分詞的綜述，當中提到，最早使用統計方法進行分詞的是1990的一篇文章，看了一下作者名字，richard spr...

numpy統計分布顯示

計算鳶尾花花瓣長度的最大值，平均值，中值，均方差。import numpy asnp from sklearn.datasets import load iris data load iris iris data.data petal length iris 2 取所有行的第二列 print np....

statistics模組 統計分析

statistics 數學統計函式

最早的統計分詞

numpy統計分布顯示

相關推薦

statistics模組統計分析