當我們從複雜**提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。
而pandas.dataframe()容許的輸入有numpy ndarray (structured or homogeneous), dict, or dataframe這些;其中,我採用了從字典構建,最主要原因就是可以省去給每列填寫列名的步驟,dataframe能自動將字典的鍵轉化為對應的列名;最後,最重要的一點就是,dict can contain series, arrays, constants, or list-like objects,也就是說輸入的字典必須包含序列或陣列,我們現在要將一行資料報裝成dataframe,每列只有乙個元素,最簡單的方法,就是用中括號將值包起來,就轉化成了陣列了。如果你沒有將單獨的值包裝成陣列,在構建dataframe數,往往會報if using all scalar values, you must pass an index 這個錯。
具體**如下:
#經過一些列步驟得到,如下特徵和所對應的值
train = pd.dataframe()
dictionary =
train
輸出結果如下:
Pandas DataFrame用法總結
1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...
Pandas DataFrame常用方法
1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...
如何迭代pandas dataframe的行
from 在對dataframe進行操作時,我們不可避免的需要逐行檢視或運算元據,那麼有什麼高效 快捷的方法呢?import pandas as pd inp df pd.dataframe inp for x in xrange len df.index print df c1 iloc x 這似...