一. 處理缺失資料
二. 濾除缺失資料
三. 填充缺失資料
方法說明
dropna根據各標籤的值中是否存在缺失資料對軸標籤進行過濾,可通過閾值調節對缺失值的容忍度
fillna用指定值或插值方法(如 ffill 或 bfill)填充缺失資料
isnull返回乙個含有布林值的物件,這些布林值表示哪些值時預設值 \ na,該物件的型別與源型別一樣
notnullisnull 的否定式
dropna()
1. series:dropna 返回乙個僅含非空資料和索引值的 series
2. dataframe:
行:dropna預設丟棄任何含有缺失值的行,傳入 how = 'all' 將值丟棄權威 na 的那些行。
列:傳入 axis = 1,如 data.dropna(axis = 1, how = 'all')
fillna()
1. df.fillna(0),用 0 填充空值
2. 通過字典呼叫 fillna,可以實現對不同的列填充不同的值:
df.fillna()
3. fillna 缺省會返回新物件,但也可以對現有物件進行就地修改:
_ = df.fillna(0, inplace = true)
以上整理自《利用python進行資料分析》。 Pandas缺失資料
一 缺失值的統計和刪除 缺失資訊的統計 資料處理中經常需要根據缺失值的大小 比例或其他特徵來進行行樣本或列特徵的刪除,pandas中提供了dropna函式來進行操作。dropna的主要引數為軸方向axis 預設為0,即刪除行 刪除方式how 刪除的非缺失值個數閾值thresh 非 缺 失 值 col...
pandas 缺失資料
檢視缺失的比例 全部缺失 df sub set.isna any 1 head 至少有乙個缺失 沒有缺失 資料處理中經常需要根據缺失值的大小 比例或其他特徵來進行行樣本或列特徵的刪除,pandas中提供了dropna函式來進行操作。dropna的主要引數為軸方向axis 預設為0,即刪除行 刪除方式...
Pandas 處理缺失資料
import numpy as np import pandas as pd from pandas import series,dataframes series a b np.nan,c d pd.isnull s 0 false 1 false 2 true 3 false 4 false d...