資料處理常用

2022-07-19 02:57:14 字數 611 閱讀 8396

1,dataframe獲取列名稱

dataframe.columns.values.tolist()

2,dataframe轉化為numpy

dataframe.values

轉化為陣列後可以進行數值計算

3,numpy轉化為列表

list = numpy.tolist()

4,進行陣列運算時如果有字串(null),肯定會報錯str和list不能進行運算

通過以下辦法將空字串轉化為0

datas = pd.read_csv('negative.csv', encoding='utf-8', low_memory=false)

datas.loc[datas['dou_01'] == '(null)', 'dou_01'] = 0

datas['dou_01'] = datas['dou_01'].astype('float')

data11_dou_01 = datas['dou_01'].values

5,header=none設定是否使用檔案index為列名,使用這引數就表示不用,那列名就被認為是數值,將不能通過引用列名索引資料

6,重置列名,注意重置的列名要與data的列資料匹配上

Python 常用資料處理

以下為積累 python 常用資料處理方法,不定時更新。1.遍歷某資料夾下所有檔案 files os.listdir path 2.取消科學計數法 np.set printoptions suppress true df a astype int64 3.判斷 dataframe 為空 全部資料集 ...

資料處理常用方法

列值替換 data.trade type data.trade type 21 1 data.trade type data.trade type 22 0取消索引 wo.to csv szy.csv index false 檢視所有列的空缺值 data.isnull sum 檢視每列的值的數量 d...

python pandas常用資料處理方法

pandas 1 header 0 不同於 header none header 0 表示 第0行為列 header none 表示讀取的時候 認為沒有標題,全是資料 可以用 skiprows 1 跳過列名 2 pandas 獲取指定的行列資料 df.iloc 0 2,0,3 讀取 第 0,2 行的...