在進行統計描述時,pandas對三個資料物件的軸引數規定如下:
series: 沒有軸引數
dataframe: 「index」 (axis=0, default), 「columns」 (axis=1)
panel: 「items」 (axis=0), 「major」 (axis=1, default), 「minor」 (axis=2)
統計描述引數如下:
function
description
描述count
number of non-null observations
觀測值的個數
sumsum of values
求和mean
mean of values
求平均值
madmean absolute deviation
平均絕對方差
median
arithmetic median of values
中位數min
minimum
最小值max
maximum
最大值mode
mode
眾數abs
absolute value
絕對值prod
product of values
乘積std
bessel-corrected sample standard deviation
標準差var
unbiased variance
方差sem
standard error of the mean
標準誤skew
sample skewness (3rd moment)
偏度係數
kurt
sample kurtosis (4th moment)
峰度quantile
sample quantile (value at %)
分位數cumsum
cumulative sum
累加cumprod
cumulative product
累乘cummax
cumulative maximum
累最大值
cummin
cumulative minimum
累最小值
cov()
covariance
協方差corr()
correlation
相關係數
rank()
rank by values
排名pct_change()
time change
時間序列變化
pandas彙總和計算描述統計
pandas 物件擁有一組常用的數學和統計方法。他們大部分都屬於簡約和匯 計,用於從series中提取單個值 如sum或mean 或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比,他們都是基於沒有缺失資料的假設而構建的。看例子 呼叫dataframe的sum方法將...
pandas入門 彙總和計算描述統計
from pandas import dataframe,series import numpy as np df dataframe 1.4,np.nan 7.1,4.5 np.nan,np.nan 0.75,1.3 index a b c d columns one two print df o...
Pandas 基礎 (4) 彙總和計算描述統計
pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯 計,用於從 series 中提取單個值 如 sum mean 或者從 dataframe 的行或列中提取乙個 series。in 144 df dataframe 1,np.nan 2,3 np.nan,np.nan 0,2 ...