pandas DataFrame的修改方法

2022-08-15 02:39:12 字數 2455 閱讀 4391

pandas dataframe的增刪查改總結系列文章:

對於dataframe的修改操作其實有很多,不單單是某個部分的值的修改,還有一些索引的修改、列名的修改,型別修改等等。我們僅選取部分進行介紹。

dataframe的修改方法,其實前面介紹loc方法的時候介紹了一些。

1、 loc方法修改

loc方法實際上是定位某個位置的資料的,但是定位完以後就可以對此位置的資料進行修改,使用此方法可以對dataframe進行的修改如下:

對某行、某n行進行修改;

對某列、某n列進行修改;

對橫座標為某行或某n行,縱座標為某列或者某n列的資料進行修改;

可以看出基本用loc方法我們對dataframe可以進行任意修改了。

1.1 對某行、某n行進行修改

# 對第1行進行修改

test_dict_df.loc[1:1,('english','id','math','name')]=[90,2,100,'alice_m']

# 對第0行到第1行進行修改

test_dict_df.loc[0:1,('english','id','math','name')]=[[90,1,100,'alice_m'],[70,2,100,'bob']]

# 對第0行和第2行進行修改

test_dict_df.loc[0:3:2,('english','id','math','name')]=[[90,1,100,'alice_m'],[70,2,100,'bob']]

可以看出具體的方法就是用loc方法,對某行或者某n行進行定位,然後賦予合適的格式的值就可以了。

1.2 對某列、某n列進行修改

學會了使用loc方法對行的修改,那觸類旁通,對列的修改也很簡單了。對列修改也就是修改此列的所有行。

# 對第english列進行修改

test_dict_df.loc[:,('english')]=[90,80,70,90,90,59] #test_dict_df.loc[:,'english']=[90,80,70,90,90,59]

# 對第english列和id列進行修改,注意賦值的寫法

test_dict_df.loc[:,('english','id')]=[[90,1],[80,2],[80,2],[80,2],[80,2],[80,2]]

1.3 對某個區域的值進行修改
# 對第1、2行的english列和 id列進行修改

test_dict_df.loc[1:2,('english','id')]=[[38,2],[23,2]]

1.4總結

可以看到loc方法就是,只要你能選到某個或者某個區域的值,然後就可以對此部分的值進行修改。但是要注意賦值部分的組織方式。

2、 iloc、at、iat方法修改

模擬於上面的方式,其實只要能選擇,都是可以修改的。選擇方法可以看pandas dataframe的查詢(選擇)篇。

1、直接全部更改

這種方法是對dataframe的列名進行重新賦值,比較暴力直接。

test_dict_df.columns=['english_new','id_new','math_new','name_new']
2、使用rename方法

這種方法是比較推薦的,通過rename方法,注意引數inplace=true的時候,才能真正的在原來的dataframe上進行修改。

test_dict_df.rename(columns=,inplace=true)
1、修改索引名稱

上面的rename方法,如果不寫columns=xx就預設修改索引了 。

test_dict_df.rename(,inplace=true)
2、重置索引

通過reset_index()方法我們可以重置索引,drop引數為true時,直接丟棄原來的索引,否則原來的索引新生成一列名為'index'的列:

test_dict_df.reset_index(inplace=true,drop=true)
2、設定其他列為索引

當然我們也可以用其他列為索引,通過set_index()方法:

test_dict_df.set_index('id_new')
可以看到,所謂的修改首先要能選擇修改的位置,即定位,然後對確定好的位置進行重新賦值,所以我們學會了如何選擇資料,也就基本能修改此處的資料。

源**:github

Pandas DataFrame用法總結

1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...

Pandas DataFrame常用方法

1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...

Pandas DataFrame 按行構建

當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...