空值與缺失值問題
df.info(
)
info檢視資料是否為空,有多少的空值,或者缺失值如果小於10%直接刪除,否則另作考慮
一、空值與缺失值
空值:在pandas中是』』
缺失值:在dataframe中為nan或者nat(缺失時間),在series中為none或者nan
df.dropna(axis=
0,how=
'any'
,thresh=none,subset=none,inplace=
false
)
引數:
df.fillna(axis=
0,value=
'haha'
,method=
none
,limit=
none
)
引數:
value:需要用什麼值去填充缺失值
axis:確定填充維度,從行開始或是從列開始
method:ffill:用缺失值前面的乙個值代替缺失值,如果axis =1,那麼就是橫向的前面的值替換後面的缺失值,如果axis=0,那麼則是上面的值替換下面的缺失值。backfill/bfill,缺失值後面的乙個值代替前面的缺失值。注意這個引數不能與value同時出現
limit:確定填充的個數,如果limit=2,則只填充兩個缺失值。
查詢是否空值
df.isna(
)
Python Pandas庫處理excel表
讀取 儲存excel表 data pandas.read excel filepath data.to excel filepath,index none index none表示不將dataframe的行索引存入excel讀取dataframe某行 列 讀取data中行索引為5 6,列索引為1 3...
Python pandas資料處理
pandas模組 更高階的資料分析工具 基於numpy構建 包含series和dataframe兩種資料結構,以及相應方法 呼叫方法 from pandas import series,dataframe import pandas as pd series 又像陣列又像字典 有序通常是同構的 元素...
python pandas消除空值和空格的混淆
在人工採集資料時,經常有可能把空值和空格混在一起,一般也注意不到在本來為空的單元格裡加入了空格。這就給做資料處理的人帶來了麻煩,因為空值和空格都是代表的無資料,而pandas中series的方法notnull 會把有空格的資料也納入進來,這樣就不能完整地得到我們想要的資料了,這裡給出乙個簡單的方法處...