存在缺失值nan,並且是np.nan:
2、替換缺失值:fillna(value, inplace=true)
value:替換成的值
3如果缺失值沒有使用nan標記,比如使用"?"
# 讀取電影資料
# 判斷是否全不為空, 如果沒有空返回true, 否則flase
np.all
(pd.notnull(movie)
)
# 不修改原資料
movie.dropna(
)# 可以定義新的變數接受或者用原來的變數名
data = movie.dropna(
)
# 替換存在缺失值的樣本的兩列
# 替換填充平均值,中位數
movie[
'revenue (millions)'
].fillna(movie[
'revenue (millions)'
].mean(
), inplace=
true
)
替換所有缺失值:
# 這段**很有用
for i in movie.columns:
if np.
all(pd.notnull(movie[i]))
==false
:print
(i) movie[i]
.fillna(movie[i]
.mean(
), inplace=
true
)
資料是這樣的:
以上資料在讀取時,可能會報如下錯誤:
urlerror:
833)
>
解決辦法:
# 全域性取消證書驗證
處理思路分析:
1- 、先替換『?』為np.nan
# 把一些其它值標記的缺失值,替換成np.nan
wis = wis.replace(to_replace=
'?', value=np.nan)
2、再進行缺失值的處理
# 刪除
wis = wis.dropna(
)
Pandas高階處理 缺失值處理
pandas的缺失值型別 應用replace實現資料的替換 應用dropna實現缺失值的刪除 應用fillna實現缺失值的填充 應用isnull判斷是否有缺失資料nan判斷是否為空pd.isnull df 為空pd.notnull df 不為空處理方式1 存在缺失值nan,並且是np.nan a 刪...
Pandas 缺失值處理
二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...
Pandas缺失值處理
判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...