R語言筆記 用dplyr包處理資料框

2021-10-24 22:48:39 字數 1070 閱讀 4818

排列個案:``arrange()``

選擇特定變數構成新的資料框:``select``

幾個資料框拆分操作的簡單辨析

計算變數:``mutate``

計算統計量:``summarise``

拆分資料框:``group_by()``

傳遞符:``%>%``

dplyr包提供了統一形式的函式用於運算元據框,更為簡潔高效。

install.packages("dplyr") # 安裝該包

library(dplyr) # 將該包載入記憶體

search() # 檢查是否載入記憶體

最上層為「且」關係的邏輯表示式,彼此之間可以用逗號,連線

若變數需要以降序排列,在變數上施加函式desc()

若擬計算多個統計量,彼此之間以逗號,相連線

下面以mass包下的birthwt資料集為示例,演示%>%的用法。

> data(birthwt,package="mass") # 載入該資料集

> mutate(birthwt,race=factor(race,labels=c("white","black","other"))) # 將race變數因子化

%>%

group_by(race) # 將前一步輸出的資料集對race進行拆分

%>%

summarise(mean(bwt)) # 將前一步拆分出的tibble物件的bwt變數均值進行統計

`summarise()` ungrouping output (override with `.groups` argument)

# a tibble: 3 x 2

race `mean(bwt)`

1 white 3103.

2 black 2720.

3 other 2805.

R語言擴充套件包dplyr 資料清洗和整理

getting and cleaning data 也可以載入swirl包,載入課getting and cleaning data跟著學習。如下 library swirl install from swirl getting and cleaning data swirl 此文主要是參考r自帶的...

R語言擴充套件包dplyr 資料清洗和整理

getting and cleaning data 也可以載入swirl包,載入課getting and cleaning data跟著學習。如下 library swirl install from swirl getting and cleaning data swirl 此文主要是參考r自帶的...

R語言用mRMRe包實現mRMR演算法

這裡記錄一下 r語言mrmre包實現mrmr演算法進行特徵降維的操作。下面是r library mrmre mrmr feature train feature mrmr feature y train label 篩選的資料要加上y值 target indices which names mrmr...