R語言學習缺失值處理

本文是個人學習筆記

學習了r語言中常用的缺失值處理方法，這裡涉及到的是mice包。

function

(x) sum(is.na(x)))

可以找到有缺失值的變數

> library(mice)
> init = mice(data, maxit=0)
> meth = init$method
> predm = init$predictormatrix

除了資料集的名稱，其他**都一致。

如果不想要某一變數作為**因子，則可以使用以下**：

> predm[
, c(
"name")]
=0

注：如果該變數有缺失值，並不會影響缺失值本身的插入，只是不作為**因子。

如果某一含有缺失值的變數不需要插入，則可以使用以下**：

> meth[c(
"age")]
=""

對於不同型別的變數，有不同的方法：

> meth[c(
"weight")]
="norm"
#連續》 meth[c(
"smoking")]
="logreg"
#二分》 meth[c(
"education")]
="polyreg"
#順序#可以加入多個變數

插入缺失值

> set.seed(
103)
> imputed = mice(data, method=meth, predictormatrix=predm, m=
5)

插入缺失值之後建立乙個新的資料集

> data_imputed <- complete(imputed)

function

(x) sum(is.na(x)))

R語言處理缺失值

在處理資料過程中，避免不了會產生一些缺失值，如未填寫資料或者編碼錯誤等原因，用na表示缺失值。在r語言中，is.na 函式可以判斷元素是否是缺失值，從而返回邏輯值 true false 所以該函式將會返回和元資料集一樣大小的資料集。在判斷缺失值的過程中，需要注意以下兩點既然缺失值可能無處不在，那麼...

R語言矩陣缺失值處理

缺失值處理一般包括三步 1.識別缺失資料 2.檢查導致資料缺失的原因 3.刪除包含缺失值的例項或用合理的數值代替插補缺失值。x is.na x 1 true is.nan x 1 false is.infinite x 1 false 函式complete.cases 可用來識別矩陣或資料框中沒...

R 缺失值處理

假設有一組資料集如下 data data.frame y c 1,2,3,na,5,6 x1 c 6,na,4,3,2,1 x2 c 1,3,6,9,12,na na 即表示缺失值。在r中輸入該資料。判斷缺失資料 is.na data 統計缺失值個數 sum is.na data 檢視每個樣本資料是...

R語言學習 缺失值處理

R語言處理缺失值

R語言矩陣 缺失值處理

R 缺失值處理

相關推薦

R語言學習缺失值處理

R語言矩陣缺失值處理