#pandas對缺失值的處理(判斷是否為空、刪除or丟棄、填充空值)
#pandas使用這些函式處理缺失值:
#isnull 和 notnull :檢驗是否是空值,可用於series和df
#dropna:丟棄、刪除缺失值
#axis:刪除行還是列,,default 0
#how :如果等於any則任何值為空都刪除,如果等於all則所有值為空才刪除
#inplace: 如果是true則修改當前df,否則返回新的df
#fillna:填充空值
#value: 用於填充的值,可以是單個值,或者字典(key是列名,value是值)
#method : 等於ffill使用前乙個不為空的值填充forword fill;;等於bfill使用後乙個不為空的值填充backword fill
#axis : 按行還是列進行填充
#inplace: 如果是true則修改當前df,否則返回新的df
import
pandas as pd
#例項:特殊excel的讀取、清洗、處理
#步驟1 讀取excel的時候,忽略前幾個空行
studf = pd.read_excel("
檔案路徑
",skiprows=2) #
跳過前2個空行
#步驟2 檢測空值
studf.isnull()
studf["分數
"].isnull()
studf["分數
"].notnull()
#篩選沒有空分數的所有行
studf.loc[studf["分數"
].notnull(),:]
#步驟3: 刪除掉全是空值的列
studf.dropna(axis = "
columns
",how="
all",inplace =true)
#步驟4 : 刪除掉全是空值的行
studf.dropna(axis = "
index
",how = "
all",inplace=true)
#步驟5 : 將分數列為空的填充為0分
studf.fillna()
#等同於
studf.loc[:,"
分數"] = studf["分數"
].fillna(0)
#步驟6 將姓名的缺失值天填充
#使用前面的有效值填充,有ffill:forword fill
studf.loc[:,"
姓名"] = studf["
姓名"].fillna(method = "
ffill")
#步驟7 將清洗好的excel儲存
studf.to_excel("
儲存路徑
",index = false) #
去除索引
Pandas 缺失值處理
二 處理缺失值 首先拿到乙份資料,以dataframe提取後,要檢視缺失值的情況 import pandas as pd df pd.read csv df.isnull 獲得true,false的返回值 df.isnull sum 判斷缺失的數量常用此介面來快速判斷各特徵的缺失值情況!df.dro...
Pandas缺失值處理
判斷資料是否為nan pd.isnull df pd.notnull df 判斷缺失值是否存在 np.all pd.notnull data 返回false代表有空值 np.any pd.isnull data 返回true代表有空值處理方式 2 替換缺失值 fillna value,inplace...
Pandas的缺失值處理
處理方式 不是缺失值nan,有預設標記的 判斷資料是否為nan pd.isnull df pd.notnull df pd.isna df 讀取資料 movie pd.read csv date imdb movie data.csv 第一種 刪除 pandas刪除缺失值,使用dropna的前提是,...