pandas學習筆記 DataFrame(2)

2021-07-31 11:44:00 字數 1559 閱讀 9231

另一種常見的資料形式是巢狀字典(也就是字典的字典):

pop = ,

'ohio' :}

如果將它傳給dataframe,它就會被解釋為:外層字典的鍵作為列,內層鍵則作為行索引:

frame3 = pd.dataframe(pop)

print frame3

輸出結果

nevada ohio

2000

nan1.5

2001

2.41.7

2002

2.93.6

當然,也可以對該結果進行轉置:

print frame3.t
輸出結果

2000

2001

2002

nevada nan

2.42.9

ohio 1.5

1.73.6

內層字典的鍵會被合併、排序以形成最終的索引。如果顯式指定了索引,則不會這樣:

frame4 = pd.dataframe(pop,index=[2001,2002,2003])

print frame4

輸出結果

nevada ohio

2001

2.41.7

2002

2.93.6

2003

nannan

由series組成的字典差不多也是一樣的用法:

pdata = 

frame4 = pd.dataframe(pdata)

print frame4

nevada  ohio

2000

nan1.5

2001

2.41.7

如果設定了dataframe的index和column的name屬性,則這些資訊也會被顯示出來:

frame3.index.name = 'year'

frame3.columns.name = 'state'

print frame3

輸出結果

state nevada ohio

year

2000

nan1.5

2001

2.41.7

2002

2.93.6

跟series一樣,values屬性也會以二維ndarray的形式返回dataframe中的資料:

print frame3.values
輸出結果

[[ nan 1.5]

[ 2.4 1.7]

[ 2.9 3.6]]

如果dataframe各個列的資料型別不同,則值陣列的資料型別就會選用能相容所有列的資料型別

pandas批量讀取csv生成dataframe

此方法用來將資料集合並 import pandas as pd import glob import os pathr r d xx xx 批量檔案所在路徑 file sorted glob.glob os.path.join pathr,csv key lambda name int name 8...

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...

pandas學習筆記

1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...