1、獲取列名
1.1.鍊錶推導式
語法:[col for col in df]
返回結果: [『cvr1』, 『cvr2』, 『cvr3』, 『cvr4』]
結果型別:list
1.2.通過columns屬性
columns屬性返回index,
columns.values屬性返回 numpy.ndarray,可通過 tolist(), 或者 list(ndarray) 轉換為list
print
(type
(df.columns)
)print
(type
(df.columns.values)
)print
(type
(df.columns.tolist())
,":"
+"\n"
,df.columns.tolist())
print
(type
(df.columns.values.tolist())
,":"
+"\n"
,df.columns.values.tolist(
))
1.3.直接使用 list ,返回乙個含有columnsd的list列表
print
(list
(df)
)
返回結果: [『cvr1』, 『cvr2』, 『cvr3』, 『cvr4』]
結果型別:list
2、讀取多個檔案,合併到乙個dataframe中
2.1 使用萬用字元讀取多個檔案
2.2 迴圈讀取單個檔案,然後concat到乙個dataframe中
train_data_df = pd.dataframe(
)for train_promotion_tag in promotion_list:
data_csv =
"features_for_.csv"
.format
(job_type=job_type)
print
("讀取檔案"
.format
(data_csv)
) tmp = pd.read_csv(data_csv)
train_data_df = pd.concat(
[train_data_df, tmp]
,ignore_index=
true
)
Pandas DataFrame用法總結
1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...
Pandas DataFrame 按行構建
當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...
如何迭代pandas dataframe的行
from 在對dataframe進行操作時,我們不可避免的需要逐行檢視或運算元據,那麼有什麼高效 快捷的方法呢?import pandas as pd inp df pd.dataframe inp for x in xrange len df.index print df c1 iloc x 這似...