pandas是基於numpy構建的庫,擁有兩種資料結構:series和dataframe
series 就是一維陣列
dataframe 是二維陣列
series :
in [1]
:from pandas import series,dataframe
in [2]
:import pandas as pd
in [3]
: data = series([1
,2,3
,4],index =
['a'
,'b'
,'c'
,'d'])
in [4]
: data
out[4]
:a 1
b 2
c 3
d 4
dtype: int64
series可以看成類似字典的一維陣列,由數值和index組成,但是和字典的區別在於,字典是無序的,而series是有序的,字典的keys是不可變得,而index是可變的
data.index
data.values
data.isnull(
) data.notnull(
)
dataframe :
in [8]
: data =
in [9]
: df = dataframe(data)
in [10]
: df
out[10]
: a b c
01 we btc
12 you eos
23 they ae
data.index
data.values
data.columns
dataframe的索引:
index引數為行索引
column為列索引
獲取某一列:
df['列名'
]獲取某一行:
df.loc[
'行名'
]# 行標籤
df.iloc[值]
# 行號
獲取某些行:
df.loc['':
'']dataframe的常用操作:
增加列:
df['列名']=
'value'
增加行:
df.loc[
'行名']=
['',''
,''] 刪除列:
del df[
'列名'
] 刪除行:
df.drop(
[值], inplace=
true
) df.drop(
[值])
# 邏輯刪除
設定某一列為index:
df.set_index(
['列名'
], inplace=
true)
處理缺失值:
df.dropna(inplace=
true
)# 丟棄含有缺失值的行
df.fillna(
0, inplace=
true
)# 填充缺失值資料為0
資料合併:
pd.merge(data,data1,on=
'name'
,how=
'left'
)#以name為key進行左連線
資料的儲存和讀取:
df.to_csv('')
pd.read_csv(
'')
資料分析之Pandas
from pandas import series,dataframe import pandas as pd import numpy as np states california ohio oregon texas year 2000,2001,2002,2003 value 35000,71...
python資料分析之pandas
matplotlib inline import pandas as pd import numpy as np import matplotlib.pyplot as plt 1.建立dataframe dates pd.date range 20200401 periods 6,freq 2d ...
資料分析之Pandas(一)
首先匯入相關模組 1 import pandas as pd 2from pandas import series,dataframe 3import numpy as np series是一種類似與一維陣列的物件,由下面兩個部分組成 values 一組資料 ndarray型別 index 相關的資...