在處理資料過程中,避免不了會產生一些缺失值,如未填寫資料或者編碼錯誤等原因,用na
表示缺失值。在r語言中,is.na()
函式可以判斷元素是否是缺失值,從而返回邏輯值(true/false),所以該函式將會返回和元資料集一樣大小的資料集。在判斷缺失值的過程中,需要注意以下兩點:
既然缺失值可能無處不在,那麼在資料分析過程中可以採取如下的方法去除缺失值:
#方法一:使用數值函式自帶na.rm = true
x <-c
(1,2
,na,3
)sum
(x)#返回值為na
sum(x, na.rm=
true
)#返回值為6
mean
(x)mean
(x,na.rm =
true
)#方法二:使用na.omit()函式刪除一行
per <
- data.
frame
(name =c(
"張三"
,"李四"
,"王五"
,"趙六"),
q1 =c(
23,45,
34,1000),
q2 =c(
34,56,
23,43)
)per$q1
[per$q1
==1000]=
naper$q2
[per$q2
==1000]=
naper <
- na.
omit
(per)
#去掉第四行資料
per
R語言矩陣 缺失值處理
缺失值處理一般包括三步 1.識別缺失資料 2.檢查導致資料缺失的原因 3.刪除包含缺失值的例項或用合理的數值代替 插補 缺失值。x is.na x 1 true is.nan x 1 false is.infinite x 1 false 函式complete.cases 可用來識別矩陣或資料框中沒...
R 缺失值處理
假設有一組資料集如下 data data.frame y c 1,2,3,na,5,6 x1 c 6,na,4,3,2,1 x2 c 1,3,6,9,12,na na 即表示缺失值。在r中輸入該資料。判斷缺失資料 is.na data 統計缺失值個數 sum is.na data 檢視每個樣本資料是...
R語言 缺失值
資料集中往往存在缺失值,在進行資料分析前需要了解資料的缺失值情況。r語言中的一些基本函式可用於查詢缺失資料,另外還有一些第三方包可用於查詢和處理資料缺失。基本的缺失值查詢可以通過is.na 和complete.cases 函式,當存在缺失值na或者nan時is.na 返回true,complete....