pandas 填充缺失值

2021-10-04 21:26:08 字數 1482 閱讀 4365

當資料中存在nan缺失值時,我們可以用其他數值替代nan,主要用到了dataframe.fillna()方法,下面我們來看看具體的用法:

1.先來建立乙個帶有缺失值的dataframe:

2.使用0替代缺失值(當然你可以用任意乙個數字代替nan)

df.fillna(

0)

3.用乙個字串代替缺失值

df.fillna(

'missing'

)

4.用前乙個資料代替nan:method='pad』

5.與pad相反,bfill表示用後乙個資料代替nan。這裡我們增加乙個知識點,用limit限制每列可以替代nan的數目,下面我們限制每列只能替代乙個nan

6.除了上面用乙個具體的值來代替nan之外,還可以使用平均數或者其他描述性統計量來代替nan

df.fillna(df.mean(

)

7.最後,我們還可以選擇哪一列進行缺失值的處理。df.fillna(df.mean()[『one』:『two』])

Pandas 缺失值填充的方法

重新載入原始資料 titanic df pd.read csv titanic.csv 計算所有人年齡的均值 age median1 titanic df.age.median 使用fillna填充缺失值,inplace true表示在原資料titanic df上直接進行修改 titanic df....

pandas處理,填充缺失資料

1 pandas使用浮點值nan表示浮點和非浮點陣列的缺失資料 對於乙個series可以用dropna方法或者通過布林型索引達到目的 2 對於dataframe丟棄全na 丟棄全為na的那些行 丟棄全為na的那些列 利用thresh,留下一部分觀測資料 thresh 3,表示在行方向上至少有3個非n...

python缺失值填充

對於特徵值缺失的一種常見的方法就是可以用固定值來填充。data 分數 data 分數 fillna 1 對於數值型的特徵,其缺失值也可以用未缺失資料的均值填充。data 分數 data 分數 fillna data 分數 mean 與均值類似,可以用未缺失資料的眾數來填充缺失值。data 分數 da...