Pandas之Dropna濾除缺失資料的實現方法

2022-10-04 17:15:17 字數 1686 閱讀 6173

約定:

import pandas as pd

import numpy as np

from numpy import nan as nan

濾除缺失資料

pandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用nan作為缺失資料的標記。

使用dropna使程式設計客棧得濾除缺失資料更加得心應手。

一、處理series物件

通過**dropna()**濾除缺失資料:

se1=pd.series([4,nan,8,nan,5])

print(se1)

se1.dropna()

**結果:

0    4.0

1    nan

2    8.0

3    nan

4    5.0

dtype: float64

0    4.0

2    8.0

4    5.0

dtype: float64

通過布林序列也能濾除:

se1[se1.notnull()]

**結果:

0    4.0

2    8.0

4    5.0

dtype: float64

二、處理dataframe物件

處理dataframe物件比較複雜,因為你可能需要丟棄所有的nan或部分nan。

df1=pd.dataframe([[1,2,3],[nan,nan,2],[nan,nan,nan],[8,www.cppcns.com8,nan]])

df1**結果:01

20

1.02.0

3.01

nannan

2.02

nannan

nan3

8.08.

nan預設濾除所有包brdepfhiiv含nan:

df1.dropna()

**結果:01

20

1.02.0

3.0傳入**how=『all'**濾除全為nan的行:

df1.dropna(how='all')

**結果:01

20

1.02.0

3.01

nannan

2.03

8.08.0

nan傳入axis=1濾除列:

df1[3]=nan

df1**結果:01

23

01.0

2.03.0

nan1

nannan

2.0nan

2nan

nannan

nan3

8.08.0

nannan

df1.dropna(axis=1,how="all")

**結果:

傳入thresh=n保留至少有n個非nan資料的行:

df1.dropna(thresh=1)

df1.dropna(thresh=3)

代程式設計客棧碼結果:01

20

1.02.0

3.01

nannan

2.02

nannan

nan3

8.08.0

nan本文標題: pandas之dropna濾除缺失資料的實現方法

本文位址:

Pandas詳解十之Dropna濾除缺失資料

約定 import pandas as pd import numpy as np from numpy import nan as nanpandas的設計目標之一就是使得處理缺失資料的任務更加輕鬆些。pandas使用nan作為缺失資料的標記。使用dropna使得濾除缺失資料更加得心應手。se1 ...

pandas之dropna()的用法

該函式目的是用於濾除缺失資料。如果物件是series,則返回乙個僅含非空資料和索引值的series,預設丟棄含有缺失值的行。物件.dropna dataframe則不一樣了 data.dropna how all 傳入這個引數後將只丟棄全為缺失值的那些行 data.dropna axis 1 丟棄有...

Dropna 濾除缺失資料 空字串處理

dataframe.dropna axis 0,how any thresh none,subset none,inplace false remove missing values.pd.dropna 函式 官方文件 用於過濾資料中的缺失資料.某次實驗過程用到了正則匹配替換 去停用詞,data f...