1.計算平均值函式mean()
2.中位數函式>>> import statistics
>>> statistics.mean([1,2,3,4,5,6,7,8,9]) #使用包含整數的列表作為引數
5>>> statistics.mean(range(1,10)) #使用range物件作為引數
5>>> import fractions
>>> x=[(3,7),(1,21),(5,3),(1,3)]
>>> y=[fractions.fraction(*item) for item in x]
>>> y
[fraction(3, 7), fraction(1, 21), fraction(5, 3), fraction(1, 3)]
>>> statistics.mean(y) #使用包含分數的列表作為引數
fraction(13, 21)
>>> import decimal
>>> x=('0.5','0.75','0.625','0.375')
>>> y=map(decimal.decimal,x)
>>> y
>>> statistics.mean(y)
decimal('0.5625')
median():偶數個樣本時讀取中間兩個數的平均數
median_low():偶數個樣本時讀取中間兩個數的較小值
median_high:偶數個樣本時讀取中間兩個數的較大值
median_grouped():
3.返回常見資料或出現次數最多的資料>>> statistics.median([1,3,5,7])
4.0>>> statistics.median_low([1,3,5,7])
3>>> statistics.median_high([1,3,5,7])
5>>> statistics.median(range(1,10))
5>>> statistics.median_low([3,5,7]),statistics.median_high([3,5,7])
(5, 5)
>>> statistics.median_grouped([3,5,7])
5.0>>> statistics.median_grouped([52,52,53,54])
52.5
>>> statistics.median_grouped([1,3,3,5,7])
3.25
>>> statistics.median_grouped([1,3,3,5,7],interval=2)
3.5
4.pstdev():返回總體標準差>> statistics.mode([1,3,5,7]) #無法確定出現次數最多的元素
statistics.statisticserror: no unique mode; found 4 equally common values
>>> statistics.mode([1,3,5,7,5,5,3])
5'red'
5.pvariance():返回總體方差或二次矩>>> statistics.pstdev([1.5,2.5,2.5,2.75,3.25,4.75])
0.986893273527251
>>> statistics.pstdev(range(20))
5.766281297335398
6.variance()、stdev(),計算樣本方差和樣本標準差>>> statistics.pvariance([1.5,2.5,2.5,2.75,3.25,4.75])
0.9739583333333334
>>> statistics.pvariance(range(20))
33.25
>>> x=[1,2,3,4,5,6,7,8,9,10]
>>> mu=statistics.mean(x)
>>> mu
5.5
>>> statistics.variance(range(20))
35.0
>>> statistics.stdev(range(20))
5.916079783099616
>>> _*_
35.0
>>> statistics.variance([3,3,3,3,3]),statistics.stdev([3,3,3,3,3])
(0, 0.0)
statistics 數學統計函式
statistics 數學統計函式 資源 位置 lib statistixs.py 該模組為數學 限定為實數 資料提供了計算數學統計量的函式。1.平均值與中位值測算 以下的函式可以用於計算總體或樣本的平均值或典型值。mean 資料的算數平均值 harmonix mean 資料的調和平均值 如果存在x...
最早的統計分詞
文章 richard sproat,a statistical method for finding word boundaries in chinese,1990 剛看了一篇2020年關於分詞的綜述,當中提到,最早使用統計方法進行分詞的是1990的一篇文章,看了一下作者名字,richard spr...
numpy統計分布顯示
計算鳶尾花花瓣長度的最大值,平均值,中值,均方差。import numpy asnp from sklearn.datasets import load iris data load iris iris data.data petal length iris 2 取所有行的第二列 print np....