在用pandas讀取dict和list的時候,依據結構和需求不同,我們可能需要生成不同格式的dataframe,這裡我總結了下我最近遇到的一些讀取操作
這裡我們以乙個字典為資料,看下不同操作的結果有何不同
data =
(1)直接呼叫dataframe進行讀取的話,生成的dataframe結構如下:
或者
pd.dataframe.from_dict(data)
需要說明的是:from_dict這個方法只有在pandas 0.23版本後才有,如果在早期的版本如0.19中呼叫會出現報錯
(2)如果我們想以a,b作為索引,以list中的每個值分別為一列怎麼操作呢?
如果進一步想讓a、b生成列的話,呼叫reset_index方法即可
(3)但是如果我們想把字典的key和value分別生成兩列,如何操作呢?
一種方法是:
還有一種方法依然是利用from_dict,不過就需要將value中的list提前轉化成字串,然後再進行操作即可
(1)一般讀取乙個list,生成的結果如下
(2)如果讀取的list中的每個元素都是乙個元組,會發生什麼呢?
如果忽略columns的話,第二個list的值不是列名,而是預設生成索引名,如下:
以上是最近遇到的一些常用的pandas操作,後面遇到了其他的情況繼續完善。
pandas中dict和dataFrame互轉
pd.dataframe dict a 使用df.to dict 缺省會把key和值分開 引數 dict 預設 list series split records index 如果是list dict 這種巢狀情況轉的df,迴轉需要使用records 拿上面的資料舉例,df b a b c 0 0 ...
Pandas 讀取和儲存檔案
1.讀取檔案 pandas可以讀取xlsx json csv sql等多種檔案格式 import pandas as pd 讀取檔案 file pd.read excel test.xlsx encoding utf 8 需要安裝xlrd模組 file pd.read csv file pd.rea...
pandas檔案讀取
改變工作路徑 import os print os.getcwd 列印當前工作目錄 print os.listdir os.chdir c users administrator import pandas as pd for price in dfs1 print price 讀取資料是指定乙個列...