python呼叫pandas進行分析

2021-10-09 03:26:35 字數 3866 閱讀 2802

# 方式一

# pd.series帶標籤的陣列,index傳遞索引

t1=pd.series([1

,2,3

,4,2

,2],index=

list

('abcdef'))

print

(t1)

print

('*'

*100

)# 方式二

tem_dict=

t2=pd.series(tem_dict)

print

(t2)

# 變換資料型別

print

(t2.astype(

'float'))

# 取值,方法一索引來取

print

(t2[

'age'])

# 取值,方法二位置來取

print

(t2[1]

)# 取連續多行

print

(t2[:2

])print

('*'

*100

)# 取不連續行

print

(t2[[1

,2]]

)print

(t2[

['age'

,'name']]

)print

('*'

*100

)# 布林索引

print

(t1[t1>2]

)print

('*'

*100

)# 取索引

print

(t1.index)

print

('*'

*100

)# list強制型別轉行

print

(list

(t1.index)

)# 取前兩個

print

(list

(t1.index)[:

2])# 可遍歷

for i in t1.index:

print

(i)print

('*'

*100

)#獲取長度

print

(len

(t1.index)

)# values

print

(t1.values)

import pandas as pd

import numpy as np

print

(pd.dataframe(np.arange(12)

.reshape(3,

4)))

# index指定行索引,columns指定列索引

print

(pd.dataframe(np.arange(12)

.reshape(3,

4),index=

list

('abc'

),columns=

list

('wxyz'))

)d1=

t2=pd.dataframe(d1)

print

(t2)

# 行索引

print

(t2.index)

# 列索引

print

(t2.columns)

# 取值

print

(t2.values)

# 形狀

print

(t2.shape)

# 列資料型別

print

(t2.dtypes)

# 資料緯度

print

(t2.ndim)

import pandas as pd

import numpy as np

t3=pd.dataframe(np.arange(12)

.reshape(3,

4),index=

list

('abc'

),columns=

list

('wxyz'))

print

(t3)

print

(t3.loc[

'a',

'z']

)# 取整行

# 方法一

print

(t3.loc[

'a']

)# 方法2

print

(t3.loc[

'a',:]

)# 取整列

print

(t3.loc[:,

'y']

)# 取多行

print

(t3.loc[

['a'

,'c'],

:])# 取多列

print

(t3.loc[:,

['y'

,'z']]

)# 按位置取某一行

print

(t3.iloc[1]

)print

(t3.iloc[1,

:])# 按位置取某一列

print

(t3.iloc[:,

1])# 按位置取多列

print

(t3.iloc[:,

[1,2

]])# 按位置取多行多列

print

(t3.iloc[1:

,:1]

)

import pandas as pd

import numpy as np

t3=pd.dataframe(np.arange(12)

.reshape(3,

4),index=

list

('abc'

),columns=

list

('wxyz'))

# 判斷是否為nan

print

(pd.notnull(t3)

)t3.iloc[[1

,2],

[1,2

]]=np.nan

print

(t3)

print

('*'

*100

)# 篩選x那一列沒有nan的行,列上的篩選是行的座標

print

(t3[pd.notnull(t3[

'x'])]

)print

('*'

*100

)# 刪除nan的行,how預設為any,有nan就刪除,可以改為all全部為nan時才刪除

print

(t3.dropna(axis=

0,how=

'any'))

# 填充nan

print

(t3.fillna(0)

)# 填充nan,填充為均值

print

(t3.fillna(t3.mean())

)print

('*'

*100

)# 填充x列的nan,填充為x列的均值

print

(t3[

'x']

.fillna(t3[

'x']

.mean())

)

python重新命名列名 Pandas對列進行重新命名

在處理dataframe資料的時候,經常需要對列進行重新命名,我們現在看一下到底如何進行重新命名操作。首先生成乙個dataframe。import pandas as pd province pd.dataframe province idcode省份 01a廣東 12b廣西 23c福建 34d福建...

python 安裝pandas教程

python3 安裝pandas 如果使用python2需要安裝的話,可以用pip install pandas 如果使用python3需要安裝的話,可以用pip3 install pandas 會自動安裝依賴庫 呼叫包,看下是否安裝成功 python3 python 3.8 1 tags v3.8...

python資料科學 Pandas

學習筆記 pandas物件 資料的取值與選擇 pandas數值運算方法 缺失值的處理 層級索引 合併與連線資料集 累積與分組 pandas物件 pandas有三個基本資料結構 series dataframe和index 資料的取值與選擇 pandas數值運算方法 pandas是建立在numpy基礎...