R語言處理缺失值

2021-10-02 21:08:50 字數 848 閱讀 7005

在處理資料過程中,避免不了會產生一些缺失值,如未填寫資料或者編碼錯誤等原因,用na表示缺失值。在r語言中,is.na()函式可以判斷元素是否是缺失值,從而返回邏輯值(true/false),所以該函式將會返回和元資料集一樣大小的資料集。在判斷缺失值的過程中,需要注意以下兩點:

既然缺失值可能無處不在,那麼在資料分析過程中可以採取如下的方法去除缺失值:

#方法一:使用數值函式自帶na.rm = true

x <-c

(1,2

,na,3

)sum

(x)#返回值為na

sum(x, na.rm=

true

)#返回值為6

mean

(x)mean

(x,na.rm =

true

)#方法二:使用na.omit()函式刪除一行

per <

- data.

frame

(name =c(

"張三"

,"李四"

,"王五"

,"趙六"),

q1 =c(

23,45,

34,1000),

q2 =c(

34,56,

23,43)

)per$q1

[per$q1

==1000]=

naper$q2

[per$q2

==1000]=

naper <

- na.

omit

(per)

#去掉第四行資料

per

R語言矩陣 缺失值處理

缺失值處理一般包括三步 1.識別缺失資料 2.檢查導致資料缺失的原因 3.刪除包含缺失值的例項或用合理的數值代替 插補 缺失值。x is.na x 1 true is.nan x 1 false is.infinite x 1 false 函式complete.cases 可用來識別矩陣或資料框中沒...

R 缺失值處理

假設有一組資料集如下 data data.frame y c 1,2,3,na,5,6 x1 c 6,na,4,3,2,1 x2 c 1,3,6,9,12,na na 即表示缺失值。在r中輸入該資料。判斷缺失資料 is.na data 統計缺失值個數 sum is.na data 檢視每個樣本資料是...

R語言 缺失值

資料集中往往存在缺失值,在進行資料分析前需要了解資料的缺失值情況。r語言中的一些基本函式可用於查詢缺失資料,另外還有一些第三方包可用於查詢和處理資料缺失。基本的缺失值查詢可以通過is.na 和complete.cases 函式,當存在缺失值na或者nan時is.na 返回true,complete....