r語言的儲存結構:
1.向量:注意一些函式的輸出格式,向量的單個元素的引用要用中括號;向量與標量做運算,標量會迴圈補齊。常見向量的生成函式:c()、:、seq()、rep()
向量的引用:x=1:8;x[c(2,3)]#把第二和第三個元素取出來;x[2]#把第二個元素取出來
邏輯向量:x[x>4]#邏輯值為t,就取出相應位置的元素。
2.矩陣x=matrix(1:9,3,3,byrow=t)#預設按列;引用:x[,1]#1列;x[3,2]#第3行第二列的元素#每列是相同的資料型別。
3.資料框:可以使用read.table() ,read.csv()讀取乙個文字檔案,返回的也是乙個data frame物件。讀取資料庫也是返回data frame物件。x=data.frame(a=1:3,b=c('liang','qi','bai'))#每行是乙個樣本,觀測;每列是乙個變數。引用:x$a;x[,1]#引用第一列;ab=x[1:2];ab=x[c('a','b')]#引用第1和2列#資料框每列都是一樣長度,可以是不同資料型別,列表可以是不同長度;用names函式可以檢視列名,修改行名,列名:rownames(x)=c('1行','2行','3行');colnames(x)=c('a','d'); attach函式,資料框的主要用途是儲存統計建模的資料,r的統計建模功能都需要以資料框為輸入資料,我們可以把資料框當成一種矩陣來處理。在使用資料框的變數時可以使用「資料框名$變數名」來獲取資料框的變數值。但是這種用法比較麻煩,r提供attach(x) 函式可以把資料框中的變數「連線」到記憶體中,這樣便於資料框資料的呼叫。往資料框裡新增新變數x$e=c(2:4);edit() 、fix()函式編輯修改函式。查詢:1.我們使用布林向量,配合which函式,可以實現對行的過濾。x[which(a=="2"),];指定d列,x[which(a=="2"),'d']。2.subset()函式。例子subset(student,gender=="f" & age<30 ,select=c("name","age"));3.使用sql語句查詢library(sqldf)
result<-sqldf("select name,age from student where gender='f' and age<30");連線/合併:result<-merge(student,score,by.x="id",by.y="sid");rbind的兩個data frame必須有相同的列,rbind(student,student2)。
4.列表。x$a;x[[1]]c#儲存一些函式的輸出。
R語言的資料結構
r擁有許多用於儲存資料的物件型別,包括標量 向量 矩陣 陣列 資料框和列表 1 標量 標量是只含乙個元素的向量,例如a 2 向量 r中的向量可以理解為一維的陣列,每個元素的mode必須相同.函式c,是組合函式,可以用建立陣列,如 x b x 2 訪問陣列中第2個元素。這裡沒有下標,從 1 開始計算距...
R語言的資料結構
r語言的資料結構包括六大類 標量 向量 矩陣 陣列 資料框 列表 其中標量是只含乙個元素的向量。數值型向量 a c 1,2,3,4,5,6 字元型向量 b c one two three 邏輯性向量 c c true,false,true,true 檢視向量 a 1 1 2 3 4 5 6 b 1 ...
R語言 資料結構
向量 my vector c 1,2,8,9,16 my vector 2 4 矩陣 矩陣行列命名,預設先排列 cells c 1,36,24,12 row names c r1 r2 col names c c1 c2 my matrix1 matrix cells,nrow 2,ncol 2,d...