# 這個類用來處理預設值
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pylab import mpl
# 設定顯示中文字型
mpl.rcparams["font.sans-serif"] = ["simhei"]
# 讀取電影資料
movie = pd.read_csv("../data/imdb-movie-data.csv")
# print(pd.notnull(movie))
# print(np.all(pd.notnull(movie)))
## 1、刪除
# pandas刪除缺失值,使用dropna的前提是,缺失值的型別必須是np.nan
# 不修改原資料 可以定義新的變數接受或者用原來的變數名
data = movie.dropna()
# print(data)
# 替換存在缺失值的樣本的兩列
# 替換填充平均值,中位數
# movie['revenue (millions)'].fillna(movie['revenue (millions)'].mean(), inplace=true)
# 替換所有缺失值:
for i in movie.columns:
if np.all( pd.notnull(movie[i])) == false:
# print(i)
movie[i].fillna(movie[i].mean(), inplace=true)
# 不是缺失值nan,有預設標記的
wis = pd.read_csv("")
# 全域性取消證書驗證
# 先替換『?』為np.nan
## df.replace(to_replace=, value=)
# to_replace:替換前的值
# value:替換後的值
# 把一些其它值標記的缺失值,替換成np.nan
wis = wis.replace(to_replace='?', value=np.nan)
# 刪除
wis = wis.dropna()
dropna刪除np.nan標記的缺失值【知道】
fillna填充缺失值【知道】
replace替換具體某些值【知道】
pandas對缺失值的處理
pandas對缺失值的處理 判斷是否為空 刪除or丟棄 填充空值 pandas使用這些函式處理缺失值 isnull 和 notnull 檢驗是否是空值,可用於series和df dropna 丟棄 刪除缺失值 axis 刪除行還是列,default 0 how 如果等於any則任何值為空都刪除,如果...
缺失值處理
pandas使用nan not a number 表示浮點和非浮點陣列中的缺失資料,python內建的none值也會被當做na處理,pandas物件上的所有描述統計都排除了缺失資料。na處理方法 方法 說明dropna 根據各標籤的值是否存在缺失資料對軸標籤進行過濾,可通過閾值調節對缺失值的容忍度 ...
缺失值處理
之前寫過一篇文章缺失值視覺化處理 missingno 主要介紹了缺失值的檢視,今天聊一下,出現了缺失值後我們要做的後續工作,就是缺失值的處理。首先附上幾個 data資料集 data.isnull 缺失值判斷 是缺失值返回true,否則範圍false data.isnull sum 缺失值計算 返回每...