在機器學習中,有時會需要將資料集的某個特徵或多個特徵提取出來,以便進行訓練或對比,下面記錄一種拆分csv檔案中列(一般為特徵)的方法。
'''
以下**實現功能包括:
1.將'train.csv'檔案中的'id'、'saleprice'特徵提取到'train_price.csv'
2.將'train.csv'檔案中除'saleprice'的特徵(包括'id'特徵)提取到'train_no_price.csv'
''''''
此**用到的'train.csv'為某地區房屋基本資訊及銷售資訊等,為方便學習,此檔案全部內容已分享在文章末尾
'''import pandas as pd
train = pd.read_csv(
'train.csv'
)#讀取訓練集
train.iloc[:,
:].to_csv(
'train_price.csv'
, mode =
'w',
index_label =
'id'
, index =
none
#不新增新索引,若此處不設為none,會自動生成一列從0開始的索引
)#將'train.csv'複製到'train_price.csv'
train_price = pd.read_csv(
'train_price.csv'
)train_price.drop(train_price.iloc[:,
1:-1
],axis =1,
inplace=
true
#對原始物件進行修改
)#刪除特徵'id'及'saleprice'以外的所有特徵
train_price.iloc[:,
:].to_csv(
'train_price.csv'
, mode =
'w',
index_label =
'id'
, header =
true
, index =
none
)#以只包含'id'及'saleprice'特徵的csv檔案覆蓋原檔案
train.iloc[:,
0:-1
].to_csv(
'train_no_price.csv'
, mode =
'w',
index_label =
'id'
, header =
true
, index =
none
)#將'train.csv'檔案中除'saleprice'的特徵(包括'id'特徵)提取
CSV檔案拆分 行拆分
先要把csv文件儲存為utf 8格式 import os.path import osimport csvimport rewith open email.csv w newline encoding utf 8 as csvfile writer csv.writer csvfile with o...
Pandas讀取csv時如何設定列名
1.csv檔案自帶列標題 import pandas as pd df example pd.read csv pandas example read.csv 等同於 df example pd.read csv pandas example read.csv header 0 2.csv檔案有列標...
pandas如何提取指定行列的值
首先讀一下excel檔案,看一下資料長什麼樣子 import pandas as pd import numpy as np citydata pd.read excel c users xujinhua desktop test city.xlsx header none 如果上面不寫header...