pandas小筆記 去除資料中的NaN值

2021-10-12 10:01:59 字數 953 閱讀 3503

pandas 會為缺少的值分配 nan 值。我們可以選擇對這些nan值對應的行列進行刪除,也可以選擇填充。

data.dropna(how = 『all』) # 傳入這個引數後將只丟棄全為缺失值的那些行

data.dropna(axis = 1) # 丟棄有缺失值的列

data.dropna(axis=1,how=「all」) # 丟棄全為缺失值的那些列

data.dropna(axis=0,subset = [「age」, 「***」]) # 丟棄『age』和『***』這兩列中有缺失值的行

預設是原始dataframe不會改變。你始終可以在 dropna() 方法中將關鍵字 inplace 設為 true,就可以改變原始的data。

使用data.isnull()方法返回乙個大小和data一樣的布林型 dataframe,並用 true 表示具有 nan 值的元素,用 false 表示非 nan 值的元素。

data.fillna(method = 『ffill』, axis = 0) # 將通過前向填充 (ffill) 方法用同一列的前乙個數作為填充

data.fillna(method = 『ffill』, axis = 1) # 將通過前向填充 (ffill) 方法用同一行的前乙個數作為填充

data.fillna(method = 『backfill』, axis = 0) # 將通過前向填充 (ffill) 方法用同一列的後乙個數作為填充

data.fillna(method = 『backfill』, axis = 1) # 將通過前向填充 (ffill) 方法用同一行的後乙個數作為填充

data.interpolate(method = 『linear』, axis = 0) # 將通過 linear 插值使用同一列的中間值作為填充

data.interpolate(method = 『linear』, axis = 1) # 將通過 linear 插值使用同一行的中間值作為填充

去除陣列中的重複資料

去除陣列中的重複資料 乙個或多個陣列 protected string removeduplicate string arrinput return string nstr.toarray typeof string 去除陣列中的重複項 傳送資訊,新增手機重複問題 新增的號碼內部重複 新增的號碼和原...

去除陣列中不需要資料

刪除掉指定位置資料 splice 向 從陣列中新增 刪除專案,然後返回被刪除的專案 注釋 該方法會改變原始陣列 index 整數,規定新增 刪除專案的位置,使用負數可從陣列結尾處規定位置 必需 howmany 要刪除的專案數量 如果設定為 0,則不會刪除專案 item1,itemx 向陣列新增的新專...

js去除陣列的重複元素和去除陣列中相鄰的重複元素

去除陣列的重複元素 array.prototype.distinct function var o2 var o3 var o for var i 0 o i i else length 0 for o in o1 for o in o2 return o3 var obj var o1 obj,o...