pandas處理,填充缺失資料

2021-08-13 21:29:55 字數 1251 閱讀 2205

1、pandas使用浮點值nan表示浮點和非浮點陣列的缺失資料

對於乙個series可以用dropna方法或者通過布林型索引達到目的

2、對於dataframe丟棄全na

丟棄全為na的那些行

丟棄全為na的那些列

利用thresh,留下一部分觀測資料

thresh=3,表示在行方向上至少有3個非nan的項保留

填充缺失資料

用fillna的方法,將缺失值替換為常數值

通過乙個字典呼叫fillna實現對不同的列填充不同的值

對reindex有效的那些差值方法也可以用於fillna

fillna函式的引數

value

用於填充缺失值的標量值或者字典物件

method

插值方式,如果函式呼叫時未指定其他引數的話預設值fill

axis

待填充的軸預設值axis=0

inplace

修改呼叫這物件而不產生副本

limit

(對於前向和後向填充)可以連續填充的最大數量

pandas 填充缺失值

當資料中存在nan缺失值時,我們可以用其他數值替代nan,主要用到了dataframe.fillna 方法,下面我們來看看具體的用法 1.先來建立乙個帶有缺失值的dataframe 2.使用0替代缺失值 當然你可以用任意乙個數字代替nan df.fillna 0 3.用乙個字串代替缺失值 df.fi...

Pandas 處理缺失資料

import numpy as np import pandas as pd from pandas import series,dataframes series a b np.nan,c d pd.isnull s 0 false 1 false 2 true 3 false 4 false d...

pandas處理缺失資料

na處理方法 方法 說明 dropna 根據各標籤的值中是否存在缺失資料對軸標籤進行過濾,可通過閾值調節對缺失值得容忍度 fillna 用指定值或插值方法 如ffill和bfill 填充缺失資料 isnull 返回乙個含有布林值的物件,這些布林值表示哪些值是缺失值na,該物件的型別與源型別一樣 no...