內容概覽
儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。
strsplit( )函式用於字串分割,其中split是分割引數。所得結果以預設以list形式展示。
主要引數:paste(..., sep = " ", collapse = null)
paste( )函式用於字串連線,其中sep負責兩組字串間的連線;collapse負責一組字串內部的連線。
nchar( )返回字串的長度。
substr( )函式和substring( )函式是擷取字串最常用的函式,兩個函式功能方面是一樣的,只是其中引數設定不同。
substr( )函式:必須設定引數start和stop,如果缺少將出錯。
substring( )函式:可以只設定first引數,last
引數若不設定,則預設為1000000l,通常是指字串的最大長度。
例子如下:
chartr( )函式:將原有字串中特定字元替換成所需要的字元。
其中引數old表示原有字串中內容;new表示替換後的字元內容。
toupper( )函式:將字串統一轉換為大寫。
tolower( )函式:將字串統一轉換為小寫。
casefold( )函式:根據引數轉換大小寫。
本節只是為了說明每個函式的功能,所採用的呼叫形式都非常簡單,通常省略了許多可選引數,請動手查詢r的幫助文件獲取更多技術細節!來自為知筆記(wiz)
R語言中的字串處理函式
儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。字串分割函式 strsplit 字串連線函式 paste 計算字串長度 nchar 字串擷...
字串處理函式 R語言
用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...
R語言 字串處理函式
r語言中字串處理函式 來自base包 函式說 明 nchar x 計算x中的字元數量 substr 提取或替換乙個字元向量中的子串 grep 在字串中匹配某種模式 sub 在字串中搜尋模式,並以另乙個文字替換 strsplit 分割字串 toupper 大寫轉換 tolower 小寫轉換 1 nch...