另一種常見的資料形式是巢狀字典(也就是字典的字典):
pop = ,
'ohio' :}
如果將它傳給dataframe,它就會被解釋為:外層字典的鍵作為列,內層鍵則作為行索引:
frame3 = pd.dataframe(pop)
print frame3
輸出結果
nevada ohio
2000
nan1.5
2001
2.41.7
2002
2.93.6
當然,也可以對該結果進行轉置:
print frame3.t
輸出結果
2000
2001
2002
nevada nan
2.42.9
ohio 1.5
1.73.6
內層字典的鍵會被合併、排序以形成最終的索引。如果顯式指定了索引,則不會這樣:
frame4 = pd.dataframe(pop,index=[2001,2002,2003])
print frame4
輸出結果
nevada ohio
2001
2.41.7
2002
2.93.6
2003
nannan
由series組成的字典差不多也是一樣的用法:
pdata =
frame4 = pd.dataframe(pdata)
print frame4
nevada ohio
2000
nan1.5
2001
2.41.7
如果設定了dataframe的index和column的name屬性,則這些資訊也會被顯示出來:
frame3.index.name = 'year'
frame3.columns.name = 'state'
print frame3
輸出結果
state nevada ohio
year
2000
nan1.5
2001
2.41.7
2002
2.93.6
跟series一樣,values屬性也會以二維ndarray的形式返回dataframe中的資料:
print frame3.values
輸出結果
[[ nan 1.5]
[ 2.4 1.7]
[ 2.9 3.6]]
如果dataframe各個列的資料型別不同,則值陣列的資料型別就會選用能相容所有列的資料型別 pandas批量讀取csv生成dataframe
此方法用來將資料集合並 import pandas as pd import glob import os pathr r d xx xx 批量檔案所在路徑 file sorted glob.glob os.path.join pathr,csv key lambda name int name 8...
pandas學習筆記
import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...
pandas學習筆記
1 建立物件,瀏覽資料 建立物件,瀏覽資料 import pandas as pd import numpy as np import matplotlib.pyplot as plt 建立series s pd.series 1,2,4,6,np.nan,9,10 index list abcde...