Pandas中NaN缺失值處理

2021-10-07 16:00:58 字數 2572 閱讀 7364

三、小結

# 讀取電影資料

)

pandas刪除缺失值,使用dropna的前提是,缺失值的型別必須是np.nan

# 不修改原資料

movie.dropna(

)# 可以定義新的變數接受或者用原來的變數名

data = movie.dropna(

)

# 替換存在缺失值的樣本的兩列

# 替換填充平均值,中位數

movie[

'revenue (millions)'

].fillna(movie[

'revenue (millions)'

].mean(

), inplace=

true

)

fill_dict=

movie=movie.fillna(fill_dict)

資料是這樣的:

處理思路分析:

# 把一些其它值標記的缺失值,替換成np.nan

wis = wis.replace(to_replace=

'?', value=np.nan)

# 刪除

wis = wis.dropna(

)

dropna刪除np.nan標記的缺失值【知道】

fillna填充缺失值【知道】

replace替換具體某些值【知道】

Pandas 缺失值處理

二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...

Pandas缺失值處理

判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...

Pandas中的缺失值處理

相信大家在處理資料的時候經常會發現有一些資料的缺失,這個時候便會很頭大,因為有時候的缺失的資料是本來就沒有的,這些資料不管就好了,有的資料雖然沒有,但是也可以根據一些資料推算出來這個資料是多少然後給它填上,但是有的資料缺失是隨機缺失的完全不知道應該怎麼處理,所以呢今天我就帶大家了解一下資料中的缺失值...