r語言中字串處理函式(來自base包)
函式說 明
nchar(x)
計算x中的字元數量
substr()
提取或替換乙個字元向量中的子串
grep()
在字串中匹配某種模式
sub()
在字串中搜尋模式,並以另乙個文字替換
strsplit()
分割字串
toupper()
大寫轉換
tolower()
小寫轉換
(1)nchar()
x <- c(
'ab'
,'cde'
)length(x)[1
]2nchar(x)[2
]23
(2)
substr()函式
語法:substr(x, start, stop)
引數說明:提取或替換乙個字串中的子串,start為開始位置,stop為結束位置
x <-
'abcdefg'
substr(x,2,
4)# 提取子字串[1
]'bcd'
substr(x,2,
4)<-
'2'#替換子字串
#替換的字串個數大於要替換的字串個數,多於部分不變x[
2]'a2cdefg'
substr(x,2,
4)<-
'222'x[
3]'a222efg'
(3) grep()函式
語法:grep(pattern, x, ignore.case = false, fixed = false)
引數說明:在x中搜尋某種模式,若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串,返回值為匹配的下標。
grep(
'a', c(
'b',
'a',
'c'))[
1]2
(4)sub()函式
語法:sub(pattern, replacement, x, ignore.case = false, fixed = false)
引數說明:在x中搜尋pattern,並用文字replacement將其替換。若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串。ignore.case用於設定是否忽略大小寫
sub(
'abc'
,'#'
,'abcdefk')[
1]'#defk'
(5)strsplit()函式
語法:strsplit(x, split, fixed = false)
引數說明:在split處分割字元向量x中的元素。若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串。
strsplit(
'abc',''
)[1]
'a''b'
'c'
(6)toupper()和tolower()函式
x <-
'abcdabe'
tolower(x)[1
]'abcdabe'
toupper(x)[2
]'abcdabe'
字串處理函式 R語言
用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...
R語言處理字串
用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...
R語言中的字串處理函式
儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。字串分割函式 strsplit 字串連線函式 paste 計算字串長度 nchar 字串擷...