以下為積累 python 常用資料處理方法,不定時更新。
1.遍歷某資料夾下所有檔案 :
files= os.listdir(path)
2.取消科學計數法:
np.set_printoptions(suppress=true), df[『a』].astype(『int64』)
3.判斷 dataframe 為空:
全部資料集 df.isnull()
為空的列 df.isnull().any()
挑選某一列為空的行 df[df[『a』].isnull().values == true]
某一元素為空:np.isnan(x), x is np.nan
(一件有意思的事情是,np.nan == np.nan, np.nan is np.nan, np.isnan(np.nan) 的結果是不同的
)6.list擷取:
list[m:n],顧頭不顧尾,末尾的值不被包含進來
資料處理常用
1,dataframe獲取列名稱 dataframe.columns.values.tolist 2,dataframe轉化為numpy dataframe.values 轉化為陣列後可以進行數值計算 3,numpy轉化為列表 list numpy.tolist 4,進行陣列運算時如果有字串 nul...
Python資料處理pandas常用方法
1 時間序列化 periodindex 2 變更列名 rename df.rename columns inplace true 3 對某列執行特定函式 agg df.groupby 貨主 英文列名.agg sum mean max min 4 排序 sort values ascending如果都...
Python 資料處理
將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...