R語言如何處理資料的列中存在多個元素的問題

2021-09-11 06:57:31 字數 956 閱讀 1625

我們拿到的資料有時可能是這樣的

而我們希望,所有的資料都應該是這樣(以上圖中chembl474208為例):

#分解復合元素,並擴充套件原始資料

library(data.table)

dtc

dtc_small

dtc_small

#judge函式:對需要分解的行進行標註

judge

else

}dtc_small$label

dtc_small_keep

dtc_small_modify

#分解函式,按行分解

decompose

#對目標資料進行處理,採用並行法進行加速

library(parallel) #並行處理包

cl.cores

cl library(dplyr)

res.df

dtc_small_keep

fin.df

#去除字串中前後多餘空格

library(stringr)

fin.df$target_id

#再次檢查一下,是否存在需要分解的行

fin.df$label

sum(fin.df$fin.df$label == 1) #檢查一下,是否存在需要分解的行

write.csv(fin.df, file = "fin.df.csv", col.names = f)#匯出資料

bind_rows函式:垂直合併多個資料框為乙個資料框

parallel並行處理包在向量化操作中的應用

R語言中如何處理時間格式

將字串轉換為時間 d as.date 2015 5 6 d 獲取月份 months d 獲取星期 weekdays d 結果 d 1 2015 05 06 months d 1 五月 weekdays d 1 星期三 如何提取季節,月份,使用lubridate包 年份 year datae 月份 m...

R語言 資料處理2列表

r語言中的列表與向量不同,在單個向量中所存放的資料型別必須一致,而列表卻不同,它可以組合多種不同型別的物件,且列表的每乙個元件可以是不同的長度。1.建立列表 通過list函式進行建立列表 2.列表的索引 在列表a中索引age這一列 a.通過列表 元件名進行索引 b.通過列表 元件名 進行索引 c.通...

如何處理Model中不存在的屬性 虛擬屬性

使用form for時,其中的字段必須是model有的屬性,那如果資料庫沒有這個欄位呢?這時候你依需要在model程式中加上訪問方法,例如 class event activerecord base def custom field 根據其他屬性的值或條件,來決定這個欄位的值 enddef cust...