工作找了個da但是卻在幹etl的活,r撿起來一看基本不會用了。趕緊複習複習。
1. 使用data.frame
>data4=data.frame(data1[,1],data1[,2]
> summary(data4)
data1...1. data1...2.
min. : 0.00 min. :0.000
1st qu.: 0.00 1st qu.:0.000
median : 31.00 median :0.000
mean : 29.48 mean :0.367
3rd qu.: 48.00 3rd qu.:1.0
可以看出列名丟失了,需要重新命名
> colnames(data4)=c('col1','col2')
> summary(data4)
col1 col2
min. : 0.00 min. :0.000
1st qu.: 0.00 1st qu.:0.000
median : 31.00 median :0.000
mean : 29.48 mean :0.367
3rd qu.: 48.00 3rd qu.:1.000
max. :108.00 max. :1.000
直接使用列名抽取,但是也有列名不對的問題
> data4=data.frame(data1[,'gender'],data1[,'age'])
> summary(data4)
data1....gender.. data1....age..
min. :0.000 min. : 0.00
1st qu.:0.000 1st qu.: 0.00
median :0.000 median : 31.00
mean :0.367 mean : 29.48
3rd qu.:1.000 3rd qu.: 48.00
max. :1.000 max. :108.00
2. 直接用列名選擇
> data.cut1=data1[,c('age','gender')]
> head(data.cut1)
age gender
1 36 0
2 73 1
3 30 0
4 49 1
5 47 1
6 47 0
3.使用dplyr的select等方法
>library("dplyr")
>select(my_data, sepal.length, petal.length)
mysql動態選取列 在mysql中選擇動態列
是否可以遍歷這樣的表 mysql select from stackoverflow results id type criteria id result 1 car env 1 2 car gas 3 car age 4 bike env 1 5 bike gas 6 bike age 1 7 b...
隨機選取演算法 有權重的記錄中選取
三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...
隨機選取演算法 有權重的記錄中選取
三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...