pandas描述性統計方法的常見方法
方法統計含義
方法統計含義
min最小值
max最大值
mean
均值count
非空數目
median
中位數mode
眾數std
標準差var
方差cov
協方差ptp
極差skew
樣本偏度
kurt
樣本峰度
sem標準誤差
quantile
四分位數
describ
描述統計
mad平均絕對離差
drop刪除資料
date.drop(labels,axis=0,level=none,inplace=flase,errors=『raise』)
引數說明
axis代表操作的軸向,1表示列,0表示行,預設為0
inpalce表示操作是否對原資料起作用,預設為none
import pandas as pd
date=pd.read_excel(
'meal_order_detail.xlsx'
)import pandas as pd
date=pd.read_excel(
'meal_order_detail.xlsx'
)date1=date.drop(labels=
'counts'
,axis=1)
print
(date.shape)
print
('刪除一列後:'
)print
(date1.shape)
(2779, 19)
刪除一列後:
(2779, 18)
date2=date.drop(labels=
range(1
,11),axis=0)
print
('刪除10行後:\n'
,date2.shape)
刪除10行後:
(2769, 19)
amounts=date[
'amounts'
]#print(amounts)
print
('amounts的均值:'
,amounts.mean())
print
('amounts的最小值:'
,amounts.
min())
print
('amounts的最大值:'
,amounts.
max())
print
('amounts的標準差:'
,amounts.std())
print
('amounts的方差:'
,amounts.var(
))
amounts的均值: 45.33717164447643
amounts的最小值: 1
amounts的最大值: 178
amounts的標準差: 36.80855003545274
amounts的方差: 1354.8693557124277
呼叫describe方法實現數值型特徵的描述性統計print
('amounts的描述性統計:\n'
,amounts.describe(
))
amounts的描述性統計:
count 2779.000000
mean 45.337172
std 36.808550
min 1.000000
25% 25.000000
50% 35.000000
75% 56.000000
max 178.000000
name: amounts, dtype: float64
value_counts主要用於資料流對應的非空的數值的頻數統計print
(type
(amounts)
)print
(amounts.value_counts(
))
35 239
48 140
58 136
10 117
30 114
29 111
55 97
39 95
45 90
88 85
33 81
27 77
13 74
65 74
38 72
99 68
15 62
18 60
1 60
56 57
19 57
175 55
25 52
16 51
32 48
7 47
8 44
20 39
89 38
26 37
68 36
78 31
28 29
6 25
5 23
108 22
178 22
159 21
9 20
169 19
109 16
46 16
36 14
37 14
40 14
49 13
158 13
52 11
66 8
17 7
50 6
69 6
80 6
128 5
90 5
name: amounts, dtype: int64
pandas的統計分析
import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...
Pandas統計分析基礎之DataFrame
3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...
Pandas庫(2) 資料的統計分析
1.0 pandas 中的資料型別 series dataframe 一維二維的 型 每個元素都有各自的標籤 數字 字元 可儲存多個不同型別資料,每個軸都有標籤 可視為乙個由帶標籤的元素組成的 numpy 陣列 可視為乙個 series 的字典 2.0 適用於series和dataframe資料型別...