約定:
import pandas as pd
import numpy as np
from numpy import nan as nan
濾除缺失資料
pandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用nan作為缺失資料的標記。
使用dropna使程式設計客棧得濾除缺失資料更加得心應手。
一、處理series物件
通過**dropna()**濾除缺失資料:
se1=pd.series([4,nan,8,nan,5])
print(se1)
se1.dropna()
**結果:
0 4.0
1 nan
2 8.0
3 nan
4 5.0
dtype: float64
0 4.0
2 8.0
4 5.0
dtype: float64
通過布林序列也能濾除:
se1[se1.notnull()]
**結果:
0 4.0
2 8.0
4 5.0
dtype: float64
二、處理dataframe物件
處理dataframe物件比較複雜,因為你可能需要丟棄所有的nan或部分nan。
df1=pd.dataframe([[1,2,3],[nan,nan,2],[nan,nan,nan],[8,www.cppcns.com8,nan]])
df1**結果:01
20
1.02.0
3.01
nannan
2.02
nannan
nan3
8.08.
nan預設濾除所有包brdepfhiiv含nan:
df1.dropna()
**結果:01
20
1.02.0
3.0傳入**how=『all'**濾除全為nan的行:
df1.dropna(how='all')
**結果:01
20
1.02.0
3.01
nannan
2.03
8.08.0
nan傳入axis=1濾除列:
df1[3]=nan
df1**結果:01
23
01.0
2.03.0
nan1
nannan
2.0nan
2nan
nannan
nan3
8.08.0
nannan
df1.dropna(axis=1,how="all")
**結果:
傳入thresh=n保留至少有n個非nan資料的行:
df1.dropna(thresh=1)
df1.dropna(thresh=3)
代程式設計客棧碼結果:01
20
1.02.0
3.01
nannan
2.02
nannan
nan3
8.08.0
nan本文標題: pandas之dropna濾除缺失資料的實現方法
本文位址:
Pandas詳解十之Dropna濾除缺失資料
約定 import pandas as pd import numpy as np from numpy import nan as nanpandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用nan作為缺失資料的標記。使用dropna使得濾除缺失資料更加得心應手。se1 ...
pandas之dropna()的用法
該函式目的是用於濾除缺失資料。如果物件是series,則返回乙個僅含非空資料和索引值的series,預設丟棄含有缺失值的行。物件.dropna dataframe則不一樣了 data.dropna how all 傳入這個引數後將只丟棄全為缺失值的那些行 data.dropna axis 1 丟棄有...
Dropna 濾除缺失資料 空字串處理
dataframe.dropna axis 0,how any thresh none,subset none,inplace false remove missing values.pd.dropna 函式 官方文件 用於過濾資料中的缺失資料.某次實驗過程用到了正則匹配替換 去停用詞,data f...