pandas的缺失值型別
應用replace實現資料的替換
應用dropna實現缺失值的刪除
應用fillna實現缺失值的填充
應用isnull判斷是否有缺失資料nan
判斷是否為空pd.isnull(df)--
---為空pd.notnull(df)--
--不為空
處理方式1、存在缺失值nan,並且是np.nan
a:刪除存在缺失值的:dropna(axis=
'rows'
) 注:不會修改原資料,需要接收返回值
b:替換缺失值:fillna(value,inplace=
true
) value:替換成的值
inplace:
true
:會修改原資料,false:不替換修改原資料,生成新的物件
2,不是缺失值nan,有預設標記的
電影資料檔案獲取:
movie = pd.read_csv(
"./data/....csv"
)
判斷缺失值是否存在pd.notnull(movie)
存在缺失值nan,並且是np.nan1
,刪除注意:pandas刪除缺失值,使用dropna的前提是,缺失值的型別必須是np.nan
movie = movie.dropna()2
,替換缺失值
替換填充平均值、中位數
movie[
'revenue (millions)'
].fillna(movie[
'revenue (millions)'
].mean(
), inplace=
true
)
不是缺失值nan,有預設標記的處理思路:
1,先替換「?」為np.nan
df.replace(to_replace=
,value=
) to_replace:替換前的值
value:替換後的值
wis = df.replace(to_replace=
'?', value=np.nan)
2,再進行缺失值的處理
wis = wis.dropna(
)
1,將特定欄位為空的索引獲取成列表形式
null_list = data[(data.school_name).isnull()].index.tolist()
2,刪除這些列表
data1 = data.drop(labels=null_list, axis=0, inplace=true)
pandas 高階處理 缺失值處理
存在缺失值nan,並且是np.nan 2 替換缺失值 fillna value,inplace true value 替換成的值 3如果缺失值沒有使用nan標記,比如使用 讀取電影資料 判斷是否全不為空,如果沒有空返回true,否則flase np.all pd.notnull movie 不修改原...
Pandas 缺失值處理
二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...
Pandas缺失值處理
判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...