目的:從3w條資料中找出count列絕對值大於等於0.57的說有資料
先把excel文件另存為csv檔案。
一:讀取資料到資料框
dat <
- read.csv(
"data.csv"
,header=true)
二:篩選資料
1.篩選資料框中count列的值大於等於0.57的資料;
positive <
- subset(dat, count >=
0.57
)
2.篩選資料框中count列的值小於等於-0.57的資料;
negative <
- subset(dat, count <=
-0.57
)
3.將1和2中得到的兩個資料框合併;
alldat = rbind(positive, negative)
三:將得到的絕對值大於等於0.57的資料出力到csv檔案
write.table(alldat,
"alldat057.csv"
,row.names=false,col.names=true,sep=
",")
excel中CONCATENATE函式用法
本人常用該函式在excel根據資料生成sql語句,很方便。還是例子比較直觀,下面的例子應該看一眼就很清楚了 concatenate update gusers db.gusers info set user mobile d2,where user mobile e2,and user id f2,...
使用R語言篩選資料中的重複行
在進行資料的預處理時,我們常常關注有無重複資料,如果兩行資料完全一致,則可能存在資料的重複錄入等情況,此時就要對這兩行資料進行核實。但這個過程如何用r語言實現?筆者近期對這個問題進行了探索。我們首先虛擬乙個資料,並將這個資料儲存為csv檔案,命名為 a.csv 資料如下圖 我們首先讀入資料,並檢視資...
excel中的資料匯入到R中
這裡使用rodbc包訪問excel 建立乙個excel檔案 data.xls,錄入資料,存放於c data.xls install.packages rodbc 2.引入rodbc包 library rodbc 3.獲取rodbc的連線物件 channel odbcconnectexcel c da...