python pandas處理空值與缺失值問題

2021-10-24 10:45:16 字數 808 閱讀 8970

空值與缺失值問題

df.info(

)

info檢視資料是否為空,有多少的空值,或者缺失值如果小於10%直接刪除,否則另作考慮

一、空值與缺失值

空值:在pandas中是』』

缺失值:在dataframe中為nan或者nat(缺失時間),在series中為none或者nan

df.dropna(axis=

0,how=

'any'

,thresh=none,subset=none,inplace=

false

)

引數:

df.fillna(axis=

0,value=

'haha'

,method=

none

,limit=

none

)

引數:

value:需要用什麼值去填充缺失值

axis:確定填充維度,從行開始或是從列開始

method:ffill:用缺失值前面的乙個值代替缺失值,如果axis =1,那麼就是橫向的前面的值替換後面的缺失值,如果axis=0,那麼則是上面的值替換下面的缺失值。backfill/bfill,缺失值後面的乙個值代替前面的缺失值。注意這個引數不能與value同時出現

limit:確定填充的個數,如果limit=2,則只填充兩個缺失值。

查詢是否空值

df.isna(

)

Python Pandas庫處理excel表

讀取 儲存excel表 data pandas.read excel filepath data.to excel filepath,index none index none表示不將dataframe的行索引存入excel讀取dataframe某行 列 讀取data中行索引為5 6,列索引為1 3...

Python pandas資料處理

pandas模組 更高階的資料分析工具 基於numpy構建 包含series和dataframe兩種資料結構,以及相應方法 呼叫方法 from pandas import series,dataframe import pandas as pd series 又像陣列又像字典 有序通常是同構的 元素...

python pandas消除空值和空格的混淆

在人工採集資料時,經常有可能把空值和空格混在一起,一般也注意不到在本來為空的單元格裡加入了空格。這就給做資料處理的人帶來了麻煩,因為空值和空格都是代表的無資料,而pandas中series的方法notnull 會把有空格的資料也納入進來,這樣就不能完整地得到我們想要的資料了,這裡給出乙個簡單的方法處...