pandas dataframe的增刪查改總結系列文章:
對於dataframe的修改操作其實有很多,不單單是某個部分的值的修改,還有一些索引的修改、列名的修改,型別修改等等。我們僅選取部分進行介紹。
dataframe的修改方法,其實前面介紹loc方法的時候介紹了一些。
1、 loc方法修改
loc方法實際上是定位某個位置的資料的,但是定位完以後就可以對此位置的資料進行修改,使用此方法可以對dataframe進行的修改如下:
對某行、某n行進行修改;
對某列、某n列進行修改;
對橫座標為某行或某n行,縱座標為某列或者某n列的資料進行修改;
可以看出基本用loc方法我們對dataframe可以進行任意修改了。
1.1 對某行、某n行進行修改
# 對第1行進行修改
test_dict_df.loc[1:1,('english','id','math','name')]=[90,2,100,'alice_m']
# 對第0行到第1行進行修改
test_dict_df.loc[0:1,('english','id','math','name')]=[[90,1,100,'alice_m'],[70,2,100,'bob']]
# 對第0行和第2行進行修改
test_dict_df.loc[0:3:2,('english','id','math','name')]=[[90,1,100,'alice_m'],[70,2,100,'bob']]
可以看出具體的方法就是用loc方法,對某行或者某n行進行定位,然後賦予合適的格式的值就可以了。
1.2 對某列、某n列進行修改
學會了使用loc方法對行的修改,那觸類旁通,對列的修改也很簡單了。對列修改也就是修改此列的所有行。
# 對第english列進行修改
test_dict_df.loc[:,('english')]=[90,80,70,90,90,59] #test_dict_df.loc[:,'english']=[90,80,70,90,90,59]
# 對第english列和id列進行修改,注意賦值的寫法
test_dict_df.loc[:,('english','id')]=[[90,1],[80,2],[80,2],[80,2],[80,2],[80,2]]
1.3 對某個區域的值進行修改# 對第1、2行的english列和 id列進行修改
test_dict_df.loc[1:2,('english','id')]=[[38,2],[23,2]]
1.4總結
可以看到loc方法就是,只要你能選到某個或者某個區域的值,然後就可以對此部分的值進行修改。但是要注意賦值部分的組織方式。
2、 iloc、at、iat方法修改
模擬於上面的方式,其實只要能選擇,都是可以修改的。選擇方法可以看pandas dataframe的查詢(選擇)篇。
1、直接全部更改
這種方法是對dataframe的列名進行重新賦值,比較暴力直接。
test_dict_df.columns=['english_new','id_new','math_new','name_new']
2、使用rename方法
這種方法是比較推薦的,通過rename方法,注意引數inplace=true的時候,才能真正的在原來的dataframe上進行修改。
test_dict_df.rename(columns=,inplace=true)
1、修改索引名稱
上面的rename方法,如果不寫columns=xx
就預設修改索引了 。
test_dict_df.rename(,inplace=true)
2、重置索引
通過reset_index()方法我們可以重置索引,drop引數為true時,直接丟棄原來的索引,否則原來的索引新生成一列名為'index'的列:
test_dict_df.reset_index(inplace=true,drop=true)
2、設定其他列為索引
當然我們也可以用其他列為索引,通過set_index()方法:
test_dict_df.set_index('id_new')
可以看到,所謂的修改首先要能選擇修改的位置,即定位,然後對確定好的位置進行重新賦值,所以我們學會了如何選擇資料,也就基本能修改此處的資料。
源**:github
Pandas DataFrame用法總結
1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...
Pandas DataFrame常用方法
1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...
Pandas DataFrame 按行構建
當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...