儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。
字串分割函式:strsplit( )
字串連線函式:paste( )
計算字串長度:nchar( )
字串擷取函式:substr( )及substring( )
字串替換函式:chartr( )
大小寫轉換函式:toupper( )、tolower( )及casefold( )
字串分割函式:strsplit( )
strsplit( )函式用於字串分割,其中split 是分割引數。所得結果以預設以list形式展示。
字串連線函式:paste( )
主要引數:paste(…, sep = " ", collapse = null)
paste( )函式用於字串連線,其中sep 負責兩組字串間的連線;collapse 負責一組字串內部的連線。
計算字串長度:nchar( )
nchar( )返回字串的長度。
字串擷取函式:substr( );substring( )
substr( )函式和substring( )函式是擷取字串最常用的函式,兩個函式功能方面是一樣的,只是其中引數設定不同。
substr( )函式:必須設定引數start和stop,如果缺少將出錯。
substring( )函式:可以只設定first引數,last引數若不設定,則預設為1000000l,通常是指字串的最大長度。
詳情見:
gsub()可以用於欄位的刪減、增補、替換和切割,可以處理乙個欄位也可以處理由欄位組成的向量。
具體的使用方法為:gsub(「目標字元」, 「替換字元」, 物件)
R筆記 R語言中的字串處理函式
內容概覽 儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。strsplit 函式用於字串分割,其中split是分割引數。所得結果以預設以l...
字串處理函式 R語言
用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...
R語言 字串處理函式
r語言中字串處理函式 來自base包 函式說 明 nchar x 計算x中的字元數量 substr 提取或替換乙個字元向量中的子串 grep 在字串中匹配某種模式 sub 在字串中搜尋模式,並以另乙個文字替換 strsplit 分割字串 toupper 大寫轉換 tolower 小寫轉換 1 nch...