---------------merge與subset 的使用
merge函式對資料框的操作,從兩個資料框中選擇出條件相等的行組合成乙個新的資料框
> df1=data.frame(name=c("aa","bb","cc"),age=c(20,29,30),***=c("f","m","f"))
> df2=data.frame(name=c("dd","bb","cc"),age=c(40,35,36),***=c("f","m","f"))
> mergedf=merge(df1,df2,by="name")
> mergedf
name age.x ***.x age.y ***.y
1 bb 29 m 35 m
2 cc 30 f 36 f
subset函式,從某乙個資料框中選擇出符合某條件的資料或是相關的列 (1
)單條件查詢
> selectresult=subset(df1,name=="aa")
> selectresult
name age ***
1 aa 20 f
(2
)指定顯示列
> selectresult=subset(df1,name=="aa",select=c(age,***))
> selectresult
age ***
1 20 f
(3
)多條件查詢
> selectresult=subset(df1,name=="aa" & ***=="f",select=c(age,***))
> selectresult
age ***
1 20 f
R語言與商業智慧型
1 使用window的貼上功能先複製excle中的資料x read.table clipboard 從貼上板讀取資料write.table x x,file clipboard sep t 把資料寫到貼上板,貼上到excle中就可以了2 儲存輸出 sink myresult.txt 吧以下結果存在m...
R語言 迴圈與條件
迴圈 for n in x expr r中最基本的是for迴圈,其中n為迴圈變數,x通常是乙個序列。n在每次迴圈時從x中順序取值,代入到後面的expr語句中進行運算。下面的例子即是以for迴圈計算30個fibonacci數。x c 1,1 for i in 3 30 例子1pv c 1,1,2,3,...
R語言與分類(2)
與舉例分析和fisher判別分析相比,貝葉斯判別分析考慮了不同總體類別的先驗概率,假如說有g1,g2,g3,g4四個p維總體,如果我們能預先得知這四個總體發生的概率,占得比例,那麼在得到新樣品時,就可以根據正態分佈密度函式和到各個總體先驗概率求出各個總體的後驗概率,找出最大的後驗概率對應的總體,即為...