pandas統計分析基礎(2)

2021-09-27 09:22:37 字數 3293 閱讀 6663

pandas描述性統計方法的常見方法

方法統計含義

方法統計含義

min最小值

max最大值

mean

均值count

非空數目

median

中位數mode

眾數std

標準差var

方差cov

協方差ptp

極差skew

樣本偏度

kurt

樣本峰度

sem標準誤差

quantile

四分位數

describ

描述統計

mad平均絕對離差

drop刪除資料

date.drop(labels,axis=0,level=none,inplace=flase,errors=『raise』)

引數說明

axis代表操作的軸向,1表示列,0表示行,預設為0

inpalce表示操作是否對原資料起作用,預設為none

import pandas as pd

date=pd.read_excel(

'meal_order_detail.xlsx'

)import pandas as pd

date=pd.read_excel(

'meal_order_detail.xlsx'

)date1=date.drop(labels=

'counts'

,axis=1)

print

(date.shape)

print

('刪除一列後:'

)print

(date1.shape)

(2779, 19)

刪除一列後:

(2779, 18)

date2=date.drop(labels=

range(1

,11),axis=0)

print

('刪除10行後:\n'

,date2.shape)

刪除10行後:

(2769, 19)

amounts=date[

'amounts'

]#print(amounts)

print

('amounts的均值:'

,amounts.mean())

print

('amounts的最小值:'

,amounts.

min())

print

('amounts的最大值:'

,amounts.

max())

print

('amounts的標準差:'

,amounts.std())

print

('amounts的方差:'

,amounts.var(

))

amounts的均值: 45.33717164447643

amounts的最小值: 1

amounts的最大值: 178

amounts的標準差: 36.80855003545274

amounts的方差: 1354.8693557124277

呼叫describe方法實現數值型特徵的描述性統計
print

('amounts的描述性統計:\n'

,amounts.describe(

))

amounts的描述性統計:

count 2779.000000

mean 45.337172

std 36.808550

min 1.000000

25% 25.000000

50% 35.000000

75% 56.000000

max 178.000000

name: amounts, dtype: float64

value_counts主要用於資料流對應的非空的數值的頻數統計
print

(type

(amounts)

)print

(amounts.value_counts(

))

35     239

48 140

58 136

10 117

30 114

29 111

55 97

39 95

45 90

88 85

33 81

27 77

13 74

65 74

38 72

99 68

15 62

18 60

1 60

56 57

19 57

175 55

25 52

16 51

32 48

7 47

8 44

20 39

89 38

26 37

68 36

78 31

28 29

6 25

5 23

108 22

178 22

159 21

9 20

169 19

109 16

46 16

36 14

37 14

40 14

49 13

158 13

52 11

66 8

17 7

50 6

69 6

80 6

128 5

90 5

name: amounts, dtype: int64

pandas的統計分析

import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...

Pandas統計分析基礎之DataFrame

3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...

Pandas庫(2) 資料的統計分析

1.0 pandas 中的資料型別 series dataframe 一維二維的 型 每個元素都有各自的標籤 數字 字元 可儲存多個不同型別資料,每個軸都有標籤 可視為乙個由帶標籤的元素組成的 numpy 陣列 可視為乙個 series 的字典 2.0 適用於series和dataframe資料型別...