今天在做特徵工程時,考慮給某列的缺失值,填充為該列的眾數。按照之前填補均值和最大最小值的方法:
import pandas as pd
df.mer_min_discount.fillna(df.mer_min_discount.mode(), inplace=true)
結果發現缺失值怎麼都填充不上,查閱資料後,恍然大悟,原來由於眾數可能存在多個,所以pandas返回的是乙個series,而不像mean()返回的是乙個值:
in: print(type(df.id.mode()))
in: print(type(df.id.mean()))
解決辦法:
df.mer_min_distance.fillna(df.mer_min_distance.mode()[0], inplace=true)
預設取第乙個眾數。 pandas中使用fillna函式填充NaN值
補充2.例項 2.2 使用inplace引數 2.3 使用method引數 2.4 使用limit引數 2.5 使用axis引數 取值 true false true 直接修改原物件 false 建立乙個副本,修改副本,原物件不變 預設預設 取值 default none pad ffill 用前乙...
fillna填充某一列 第三章 分組
一 sac過程 1.內涵 在該過程中,我們實際往往會遇到四類問題 整合 aggregation 即分組計算統計量 如求均值 求每組元素個數 變換 transformation 即分組對每個單元的資料進行操作 如元素標準化 過濾 filtration 即按照某些規則篩選出一些組 如選出組內某一指標小於...
python用均值填充空值 用平均值填充空值
我得到了乙個包含許多nan值的資料集,我想用每列的平均值填充空值。所以我嘗試了以下 def fill mean m df.columns.get loc c for c in df.columns if c in missing for i in m df df.columns i df df.co...