R 中選取多列並建立子集

工作找了個da但是卻在幹etl的活，r撿起來一看基本不會用了。趕緊複習複習。

1. 使用data.frame

>data4=data.frame(data1[,1],data1[,2]

> summary(data4)

data1...1. data1...2.

min. : 0.00 min. :0.000

1st qu.: 0.00 1st qu.:0.000

median : 31.00 median :0.000

mean : 29.48 mean :0.367

3rd qu.: 48.00 3rd qu.:1.0

可以看出列名丟失了，需要重新命名

> colnames(data4)=c('col1','col2')

> summary(data4)

col1 col2

min. : 0.00 min. :0.000

1st qu.: 0.00 1st qu.:0.000

median : 31.00 median :0.000

mean : 29.48 mean :0.367

3rd qu.: 48.00 3rd qu.:1.000

max. :108.00 max. :1.000

直接使用列名抽取，但是也有列名不對的問題

> data4=data.frame(data1[,'gender'],data1[,'age'])

> summary(data4)

data1....gender.. data1....age..

min. :0.000 min. : 0.00

1st qu.:0.000 1st qu.: 0.00

median :0.000 median : 31.00

mean :0.367 mean : 29.48

3rd qu.:1.000 3rd qu.: 48.00

max. :1.000 max. :108.00

2. 直接用列名選擇

> data.cut1=data1[,c('age','gender')]

> head(data.cut1)

age gender

1 36 0

2 73 1

3 30 0

4 49 1

5 47 1

6 47 0

3.使用dplyr的select等方法

>library("dplyr")

>select(my_data, sepal.length, petal.length)

mysql動態選取列在mysql中選擇動態列

是否可以遍歷這樣的表 mysql select from stackoverflow results id type criteria id result 1 car env 1 2 car gas 3 car age 4 bike env 1 5 bike gas 6 bike age 1 7 b...

隨機選取演算法有權重的記錄中選取

三類隨機問題 1.已有n條記錄，從中選取m條記錄，選取出來的記錄前後順序不管。實現思路按行遍歷所有記錄，約隔n m條取乙個資料即可 2.在1類情況下，還要求選取出來的m條記錄是隨機排序的實現思路給n條記錄，分別增加一列標記，值為隨機選取的1至n之間的不重複資料，實現參考博文將檔案內容按行隨機排...

R 中選取多列並建立子集

mysql動態選取列 在mysql中選擇動態列

隨機選取演算法 有權重的記錄中選取

隨機選取演算法 有權重的記錄中選取

相關推薦

mysql動態選取列在mysql中選擇動態列

隨機選取演算法有權重的記錄中選取

隨機選取演算法有權重的記錄中選取