import pandas as pd
import numpy as np
# 載入資料
detail = pd.read_excel(
'./meal_order_detail.xlsx'
)# print(detail)
# 列名
# print(detail.columns)
# 最大值
print
(detail.loc[:,
'amounts'].
max())
# 最小值
print
(detail.loc[:,
'amounts'].
min())
# 均值
print
(detail.loc[:,
'amounts'
].mean())
# 中位數
print
(detail.loc[:,
'amounts'
].median())
# 標準差
print
(detail.loc[:,
'amounts'
].std())
# 方差
print
(detail.loc[:,
'amounts'
].var())
# 最小值座標
print
(detail.loc[:,
'amounts'
].idxmin())
# 最大值座標
print
(detail.loc[:,
'amounts'
].idxmax())
# 眾數
print
(detail.loc[:,
'amounts'
].mode()[
0])# 非空資料的數量
print
(detail.loc[:,
'amounts'
].count())
# 分位數
q = np.arange(0,
1.25
,0.25
)print
(detail.loc[:,
'amounts'
].quantile(q=q)
)# 描述多個結果
print
(detail.loc[:,
'amounts'
].describe())
print
(detail.loc[:,
'dishes_name'
].describe())
detail.loc[:,
'amounts'
]= detail.loc[:,
'amounts'
].astype(
'category'
)print
(detail.loc[:,
'amounts'
].describe()[
['top'
,'freq']]
)# 統計某列各個元素出現的次數
print
(pd.value_counts(detail.loc[:,
'dishes_name'])
)
pandas的統計分析
import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...
pandas統計分析基礎(2)
pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...
pandas的資料累計統計分析
本文的主要內容是基於中國大學mooc 慕課 中的 python資料分析與視覺化 課程進行整理和總結。資料的累計統計分析是能夠對序列中的前n個數進行累計運算,對於一些大量的資料分析中,可以減少for迴圈的使用,也使得資料的運算變得更加靈活。pandas提供了一組資料累計統計分析函式,這些函式都適用於s...