以下面的資料框dclin為例:
id gender weight grade age
1 a9gs male 92 g2 58
2 a9gt male 122 g2 51
3 a9gu female 78 g2 55
4 a9gv female 85 g1 54
5 a9gw male 139 g2 64
6 a9gx male 104 g2 68
1、如果只用分兩組,可以使用ifelse語句進行分組:
#female為1,male為2。
dclin$group_gender<-ifelse(dclin$gender=="female",1,2)
2、如果要分成多組,使用cut方法進行即可:
#將age分成4個小組
dclin$grp_age<-as.numeric(cut(dclin$age,breaks = 4))
#將grade分成4個組
dclin$grp_grade<-as.numeric(cut(as.numeric(dclin$grade),breaks = 4))
R語言 變數
變數的命名規則 只能包含資料,字母,點,下劃線,僅能以字母或者點開頭,但是點後面不能直接跟數字。變數的賦值 可以使用等於,向左,向右賦值,可以用print或者cat 函式輸出。例子 var.1 c 1,2,3 var.2 c 4,5,6 var.3 c green red yellow print ...
R語言變數賦值
變數可以使用向左,向右且等於操作符來分配值。可以使用print 或 cat 函式列印變數的值。cat 函式將多個專案並成連續並列印輸出。assignment using equal operator.var.1 c 0,1,2,3 assignment using leftward operator...
通過R語言對資料進行聚類分析
聚類分析是將資料根據相似特徵分類到不同的類或簇,用以對資料進行區分。1.聚類 k means 通過資料中每個數值間的距離進行聚類,是一種縱向聚類,將樣本資料據成型別,用以對資料的特徵進行區分。1 讀取資料 data read.csv cludata data complete.cases data ...