參考之前寫過一篇r語言常用函式,見 r | 常用函式-1 最近用到r語言分析相關資料,故繼續這篇推文,把另外一些常用的函式進行相關總結!
mode
(house$price)
df[
order
(df[,4
],decreasing=t)
,] #按照第4列降序排序
df[order
(df[
,'score'
],decreasing=f)
,] #按照score列公升序排序
函式為:
paste(..
., sep =
" ", collapse =
null
)
詳情見:r語言中字串的拼接操作
判斷df[,1]中是否存在元素a:
a %
in% df[,1
]
在返回t 反之!
df[,1
]= na
data[is
.na(
data)]
<-0
# 全域性
data[is
.na(
data$price),3
]<-0
# 按列
mer$行業 <
- na.fill(mer$行業, '其他行業』)
# na.fill函式
data
= na.omit(
data
)
house[which(
is.na(house)),
]
df_na <
- df[which(
is.na(df$trans)),
]
mer <
- mer[complete.cases(mer[,7
]),]
# 刪去商戶號的缺失值之後還剩下7179個
identical(sort(df1$merchant_no)
, sort(df2$merchant_no)
)# 判斷是否一樣 技巧:先排序
options(scipen=
200)
# 注:如果數值過大,在原始資料框裡進行修改 然後變換縱軸的漢字表示即可
df$card_no <
- str_trim(df$card_no, side = c(
"both"
,"left"
,"right"))
# 刪空格 而且是有空格就刪
python:可以用nunique
r:先unique 然後算length
length(
unique
(p_trans$merchant_no)
)# 先unique然後length
df$card_no <
-format
(df$card_no,digits =
14)
R語言常用函式
sum max min which.max 返回x中最大元素的下標 in x x in c 2,3 0 包含於函式,1,2,3,4把x中的2,3替換成0 range 找出最大最小值 var 求方差 rev 對x中的元素取逆序1234 4321 sort 公升序排列 merge x,y,by samp...
日期常用函式(R)
日期變數常用函式函式 功能sys.date 返回系統當前時間 sys.time 返回系統當前的日期和時間 date 以字串形式返回系統當前的日期和時間 as.date x,format 將字串形式的日期值轉換為日期變數 format x,將日期變數轉化為指定格式的字串 strftime x,form...
R語言常用函式
統計 mean 平均數 sd standard deviation 標準差 var 方差 median 中位數 cov 協方差 cor 相關係數 環境ls objects rmhelp library 檢視可用package library help base search 檢視已裝載package...