R 中選取多列並建立子集

2021-08-20 21:17:16 字數 1470 閱讀 6303

工作找了個da但是卻在幹etl的活,r撿起來一看基本不會用了。趕緊複習複習。

1. 使用data.frame

>data4=data.frame(data1[,1],data1[,2]

> summary(data4)

data1...1.       data1...2.   

min.   :  0.00   min.   :0.000  

1st qu.:  0.00   1st qu.:0.000  

median : 31.00   median :0.000  

mean   : 29.48   mean   :0.367  

3rd qu.: 48.00   3rd qu.:1.0

可以看出列名丟失了,需要重新命名

> colnames(data4)=c('col1','col2')

> summary(data4)

col1             col2      

min.   :  0.00   min.   :0.000  

1st qu.:  0.00   1st qu.:0.000  

median : 31.00   median :0.000  

mean   : 29.48   mean   :0.367  

3rd qu.: 48.00   3rd qu.:1.000  

max.   :108.00   max.   :1.000  

直接使用列名抽取,但是也有列名不對的問題

> data4=data.frame(data1[,'gender'],data1[,'age'])

> summary(data4)

data1....gender.. data1....age..  

min.   :0.000     min.   :  0.00  

1st qu.:0.000     1st qu.:  0.00  

median :0.000     median : 31.00  

mean   :0.367     mean   : 29.48  

3rd qu.:1.000     3rd qu.: 48.00  

max.   :1.000     max.   :108.00  

2. 直接用列名選擇

> data.cut1=data1[,c('age','gender')]

> head(data.cut1)

age gender

1  36      0

2  73      1

3  30      0

4  49      1

5  47      1

6  47      0

3.使用dplyr的select等方法

>library("dplyr")

>select(my_data, sepal.length, petal.length)

mysql動態選取列 在mysql中選擇動態列

是否可以遍歷這樣的表 mysql select from stackoverflow results id type criteria id result 1 car env 1 2 car gas 3 car age 4 bike env 1 5 bike gas 6 bike age 1 7 b...

隨機選取演算法 有權重的記錄中選取

三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...

隨機選取演算法 有權重的記錄中選取

三類隨機問題 1.已有n條記錄,從中選取m條記錄,選取出來的記錄前後順序不管。實現思路 按行遍歷所有記錄,約隔n m條取乙個資料即可 2.在1類情況下,還要求選取出來的m條記錄是隨機排序的 實現思路 給n條記錄,分別增加一列標記,值為隨機選取的1至n之間的不重複資料,實現參考博文將檔案內容按行隨機排...