R筆記 R語言中的字串處理函式

2022-07-17 10:00:14 字數 1534 閱讀 5413

內容概覽

儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。

strsplit( )函式用於字串分割,其中split是分割引數。所得結果以預設以list形式展示

主要引數:paste(..., sep = " ", collapse = null)

paste( )函式用於字串連線,其中sep負責兩組字串間的連線;collapse負責一組字串內部的連線。

nchar( )返回字串的長度。

substr( )函式和substring( )函式是擷取字串最常用的函式,兩個函式功能方面是一樣的,只是其中引數設定不同。

substr( )函式:必須設定引數startstop,如果缺少將出錯。

substring( )函式:可以只設定first引數,last

引數若不設定,則預設為1000000l,通常是指字串的最大長度。

例子如下:

chartr( )函式:將原有字串中特定字元替換成所需要的字元。

其中引數old表示原有字串中內容;new表示替換後的字元內容。

toupper( )函式:將字串統一轉換為大寫。

tolower( )函式:將字串統一轉換為小寫。

casefold( )函式:根據引數轉換大小寫。

本節只是為了說明每個函式的功能,所採用的呼叫形式都非常簡單,通常省略了許多可選引數,請動手查詢r的幫助文件獲取更多技術細節!

來自為知筆記(wiz)

R語言中的字串處理函式

儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。字串分割函式 strsplit 字串連線函式 paste 計算字串長度 nchar 字串擷...

字串處理函式 R語言

用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...

R語言 字串處理函式

r語言中字串處理函式 來自base包 函式說 明 nchar x 計算x中的字元數量 substr 提取或替換乙個字元向量中的子串 grep 在字串中匹配某種模式 sub 在字串中搜尋模式,並以另乙個文字替換 strsplit 分割字串 toupper 大寫轉換 tolower 小寫轉換 1 nch...