R語言factor型別轉numeric

2022-02-14 06:27:52 字數 654 閱讀 6403

r 語言中為了進行資料分析,比如回歸分析,這時候對於資料**中的factor型別的資料會帶來弊端,比如對因子的每乙個資料都進行一次回歸,這樣就顯得很複雜,且違背了我們的初衷,需要把factor轉換為numeric格式。

factor不能直接轉換為numeric格式,它會按照因子的大小順序依次取值1,2,3......

想要正確轉換為對應的數值,可以先把factor轉換為character格式,然後再轉換為numeric,就可以正確顯示數值

> data<- read.csv('

breast_cancer.csv');

> class(data$x6); #

這時候為factor

[1] "

factor

"> #

然後轉換factor為numeric

> data$x6<-as.numeric(as.character(data$x6));

> class(data$x6); #

這時候為numeric

[1] "

numeric

"

另外需要注意的是,如果你的資料中包含na值或者其他錯誤型別的值,那麼轉換為character型別會產生報錯,需要先刪去所有錯誤型別的值,方法詳見另一篇部落格  

zke

理解R語言中的factor

1.2.在r語言中,因子 factor 表示的是乙個編號或者乙個等級,即,乙個點。例如,人的個數可以是1,2,3,4 那麼因子就包括,1,2,3,4 還有描述協變數水平時,會用到高 中 低,也是因子,因為這些都是乙個點。與之區別的向量,是乙個連續性的值,例如,數值中有1,1.1,1.2 可以作為數值...

R語言 因子的構造 factor函式

參考內容 教程一,非數值型變數 類別變數和順序變數 在r語言中稱為因子,也稱為因子型變數。因子型變數內的所有非重複值,被稱為因子水平 levels 建立因子 在r語言中可以使用factor 函式和gl 函式來建立因子變數。1 使用factor 函式 factor 函式的語法格式為 f factor ...

R語言資料型別轉化

r語言資料型別轉化 有時候,對於一些問題,需要進行資料型別之間的轉換。r提供了基本型別轉換函式以解決資料型別轉換這個問題。常用的基本資料型別轉換函式彙總如下。函式一 as.character x 函式二 as.complex x 函式三 as.numeric x 或者as.double x 函式四 ...