dplyr 資料操作 常用函式(2)

2022-08-05 07:21:19 字數 1464 閱讀 3097

繼上一節常用函式,繼續了解其他函式

1、desc()

這個函式和sql中的排序用法是一樣的,表示對資料進行倒序排序。

接下來我們看些例子。

a=sample(20,50,rep=t)

a

desc(a)
在使用desc後是直接在資料前面加上乙個負號,一般情況下配合arrange()函式一起使用,功能強大。

2、distinct()

跟sql中distinct函式用法類似,提取重複資料中的唯一值,另外這個函式輸入資料只支援tbl資料格式,

先把上面的向量a轉化成tbl

可以看到資料由原來的50個數值,變成只有20個唯一值。

3、funs()

生成乙個函式列表,這個在進行資料描述統計時會比較經常用到。

可以一次性統計多個資料統計量。

4、groups()、group_by()、ungroup()、group_indices()、group_size()

group_by是對資料分組,groups 可以檢視分組物件,ungroup()移除資料分組,group_indices列出每個分組標籤,group_size計算分組資料量

資料按照id分成3組

group_by 後面的引數可操作較為靈活,可以多個變數或者變數間的運算。

groups(group_by(a,id))

ungroup(group_by(a,id))
資料分組被移除。

group_indices(mtcars, cyl)
列出cyl列資料4/6/8以對應標籤1/2/3的形式排列

group_size(a)
[1] 9 

求出分組資料量

dplyr 資料操作 常用函式(3)

接下了我們繼續了解dplyr中有用的函式 1 if else if else主要用於在資料做判斷用 x name c wang zhang li chen zhao song shuxue c 89,85,68,79,96,53 yuwen c 77,68,86,87,92,63 shengwu c...

04 4 dplyr包高階函式(二)高效資料清理

dplyr高階函式 join 資料集之間的鏈結 left join left join x1,x2,by name 保留全部x1表 inner join inner jooin x1.x2,by name 保留x2,x1的交集 semi join semi join x,y,by name 保留x1...

關於資料處理包dplyr的函式用法總結

dplyr專注處理dataframe物件,並提供更穩健的與其它資料庫物件間的介面。一 5個關鍵的資料處理函式 select 返回列的子集 filter 返回行的子集 arrange 根據乙個或多個變數對行排序。mutate 使用已有資料建立新的列 summarise 對各個群組彙總計算並返回一維結果...