資料分析之pandas

2021-10-09 04:43:36 字數 1858 閱讀 9708

pandas是基於numpy構建的庫,擁有兩種資料結構:series和dataframe

series 就是一維陣列

dataframe 是二維陣列

series :

in [1]

:from pandas import series,dataframe

in [2]

:import pandas as pd

in [3]

: data = series([1

,2,3

,4],index =

['a'

,'b'

,'c'

,'d'])

in [4]

: data

out[4]

:a 1

b 2

c 3

d 4

dtype: int64

series可以看成類似字典的一維陣列,由數值和index組成,但是和字典的區別在於,字典是無序的,而series是有序的,字典的keys是不可變得,而index是可變的

data.index

data.values

data.isnull(

) data.notnull(

)

dataframe :

in [8]

: data =

in [9]

: df = dataframe(data)

in [10]

: df

out[10]

: a b c

01 we btc

12 you eos

23 they ae

data.index

data.values

data.columns

dataframe的索引:

index引數為行索引

column為列索引

獲取某一列:

df['列名'

]獲取某一行:

df.loc[

'行名'

]# 行標籤

df.iloc[值]

# 行號

獲取某些行:

df.loc['':

'']dataframe的常用操作:

增加列:

df['列名']=

'value'

增加行:

df.loc[

'行名']=

['',''

,''] 刪除列:

del df[

'列名'

] 刪除行:

df.drop(

[值], inplace=

true

) df.drop(

[值])

# 邏輯刪除

設定某一列為index:

df.set_index(

['列名'

], inplace=

true)

處理缺失值:

df.dropna(inplace=

true

)# 丟棄含有缺失值的行

df.fillna(

0, inplace=

true

)# 填充缺失值資料為0

資料合併:

pd.merge(data,data1,on=

'name'

,how=

'left'

)#以name為key進行左連線

資料的儲存和讀取:

df.to_csv('')

pd.read_csv(

'')

資料分析之Pandas

from pandas import series,dataframe import pandas as pd import numpy as np states california ohio oregon texas year 2000,2001,2002,2003 value 35000,71...

python資料分析之pandas

matplotlib inline import pandas as pd import numpy as np import matplotlib.pyplot as plt 1.建立dataframe dates pd.date range 20200401 periods 6,freq 2d ...

資料分析之Pandas(一)

首先匯入相關模組 1 import pandas as pd 2from pandas import series,dataframe 3import numpy as np series是一種類似與一維陣列的物件,由下面兩個部分組成 values 一組資料 ndarray型別 index 相關的資...